تعادل نش - ویکیپدیا، دانشنامهٔ آزاد
تعادل نش (به انگلیسی: Nash equilibrium) مفهومی در نظریه بازیها است که کاربرد فراوانی در اقتصاد پیدا کرده و نام آن از جان فوربز نش گرفته شدهاست.
در تئوری بازیها، تعادل نش (به نام جان فوربز نش، که آن را پیشنهاد کرد) راه حلی از نظریه بازی است که شامل دو یا چند بازیکن میشود. در این راه حل فرض بر آگاهی هر بازیکن به راهبرد تعادل بازیکنان دیگر است، بدون وجود هیچ بازیکنی که فقط برای کسب سود خودش با تغییر راهبرد یک جانبه عمل کند. اگر هر بازیکنی راهبرد را انتخاب کنند، هیچ بازیکنی نمیتواند با تغییر راهبرد خود در حالی که نفع بازیکن دیگر را بدون تغییر نگه داشته باشد عمل کند، سپس مجموعه انتخابهای راهبرد فعلی و بهرهمندی مربوطه، تعادل نش را تشکیل میدهد.
به بیان ساده، امی و فیل در تعادل نش است، اگر امی در حال انجام بهترین تصمیمگیری که او میتواند با توجه به تصمیمگیری فیل داشته باشد و همچنین فیل بهترین تصمیمی که میتواند با توجه به تصمیمگیری امی داشته باشد. به همین ترتیب یک گروه از بازیکنان در تعادل نش است. اگر هر یک در حال انجام بهترین تصمیمگیری باشند که آنها میتوانند با توجه به تصمیمات دیگران داشته باشند، با این حال، تعادلی که نش است لزوماً به معنای بهترین بهرهوری کل برای همه بازیکنان مربوطه نمیباشد زیرا در بسیاری از موارد ممکن است تمام بازیکنان بهرهوری خود را بهبود بخشند در صورتی که چگونه بتوانند به توافق بر روی راهبردهای مختلف از تعادل نش برسند. (به عنوان نمونه، شرکتهای تجاری رقابتی به منظور افزایش سود آنها تشکیل کارتل میدهد).
جنبه مهم تعادل نش این است که سود هر بازیکن نه تنها به راهبرد برگزیده خود بلکه به راهبرد برگزیده دیگر بازیکنان نیز ارتباط دارد.
کاربردها
[ویرایش]مفهوم تعادل نش برای تجزیه و تحلیل نتایج اثر متقابل راهبرد چندین تصمیم گیرنده استفاده می شود. به عبارت دیگر، این راهی برای پیشبینی اینکه اگر چند نفر یا چندین مؤسسه که در تصمیم گیریهای همزمان هستند و اگر پیامدهای آن وابسته به تصمیمهای دیگران است چه نتایجی را خواهد داشت. نگرش ساده و ایده اساسی جان نش این است که اگر ما تصمیمهای تصمیم گیرندگان مختلف را به صورت جداگانه تحلیل کنیم در نتیجه نمیتوانیم نتیجه انتخابهای آنان را پیشبینی کنیم. در عوض، ما باید بپرسیم آنچه که هر کدام از بازیکنان انجام میدهد، با در نظر گرفتن تصمیم گیریهای دیگران است.
تعادل نش برای تجزیه و تحلیل شرایط دشمنانه شبیه جنگ و مسابقه تسلیحاتی به کار گرفته شدهاست، همچنین در (معمای زندانی). همچنین نحوه درگیری ممکن است از طریق اثر متقابل تکرار شده تعدیل داده شود(این به جای آن). همچنین این تئوری برای مطالعه آنچه که اندازه افراد با ترجیحات متفاوت میتواند همکاری کنند استفاده شدهاست (Battle of the sexes). و اینکه آیا آنها خطراتی را برای دستیابی به نتایج مشارکتی خواهند گرفت(Stag hunt). این تئوری برای مطالعه تصمیمگیری در مورد استانداردهای فنی گرفته شدهاست، و همچنین رخداد اجرایی بانک و بحرانهای ارزی (بازی هماهنگ). برنامههای کاربردی دیگر شامل جریان ترافیک (Wardrop's principle).، نحوه سازماندهی مزایدهها (تئوری مزایده)، نتیجه اقدامات وارد شده توسط احزاب مختلف در فرایند آموزشی و حتی ضربات پنالتی در فوتبال (سکههای مطابق)
تاریخچه
[ویرایش]یک نسخه از مفهوم تعادل نش برای اولین بار توسط آنتونی آگوستین کورنو در نظریه خود در انحصار چند جانبه مورد استفاده قرار گرفت (۱۸۳۸). در تئوری کورنو آمده که بنگاهها برای بیشینه کردن سود خود چگونه میزان محصول بیشتر برای تولید را انتخاب میکنند. با این حال، بهترین محصول برای یک شرکت بستگی به محصولات دیگران دارد. تعادل کورنو هنگامی که هر بنگاه سود هر محصول خود را با توجه به محصولهای شرکتهای دیگر حداکثر میکند رخ میدهد.
مفهوم نوین تئوری بازی از تعادل نش بر حسب راهبردهای ترکیبی تعریف شدهاست. جایی که بازیکنان یک توزیع احتمال از اقدامات امکانپذیر را انتخاب میکنند. مفهوم راهبرد ترکیبی تعادل نش توسط جان فون نویمان و اسکار مورگسترن در کتاب سال ۱۹۴۴ خود با عنوان نظریه بازیها و رفتار اقتصادی معرفی شدهاست. با این حال، تجزیه و تحلیل آنها برای حالت خاصی از بازی با مجموع صفر محدود بود. آنها نشان دادند که راهبرد ترکیبی تعادل نش برای هر بازی مجموع صفر مجموعه متناهی از اقدامات وجود خواهد داشت. نقش جان فوربز نش در مقاله خود در سال ۱۹۵۱ با عنوان بازیهای غیر مشارکتی به تعریف یک راهبرد مختلط تعادل نش برای هر گونه بازی با یک مجموعه متناهی از اقدامات پرداخت و ثابت کرد که حداقل یک (راهبرد مختلط) تعادل نش باید در چنین بازی وجود داشته باشد.
از آنجایی که توسعه مفهوم تعادل نش را نظریه پردازان تئوری بازی کشف کردهاند در شرایط معینی پیشبینیهای گمراهکنندهای ایجاد میکند؛ بنابراین راه حل بسیاری از مفاهیم مرتبط پیشنهاد شده (همچنین اصلاحات تعادل نش) طراحی شده که برای غلبه بر نقص درک مفهوم نش میباشد. یک موضوع خیلی مهم این است که برخی از تعادلهای نش ممکن است مبتنی بر خطراتی باشد که معتبر نیست؛ بنابراین، در سال ۱۹۶۵ توسط راینهارد سلتن پیشنهاد شده که تعادل کامل با بازی فرعی به عنوان یک بهبود که به تعادل در تهدیدهای غیر معتبر بستگی دارد را حذف کند. ضمیمههای دیگر از مفهوم تعادل نش به این پرداخته که اگر یک بازی تکرار شدهاست یا چه چیزی اتفاقی میافتد اگر یک بازی در نبوداطلاعات کامل بازی شده باشد، با این حال پس از آن اصلاحات و ضمیمهها از مفهوم تعادل نش سهم دیدگاه اصلی مفهوم نش استوار بر همهٔ مفاهیم تعادل تجزیه و تحلیل گزینههایی خواهد شد که هر بازیکن به اعتبار تصمیم سازیهای دیگران میگیرد.
تعاریف
[ویرایش]تعریف غیررسمی
[ویرایش]به بیان غیر رسمی، به مجموعهای از راهبردها در صورتی که هیچ بازیکنی توسط راهبردی یک جانبهٔ در حال تغییر خود نمیتواند بهتر عمل کند تعادل نش میگویند. برای مشاهده در مورد این مفهوم، تصور کنید که هر بازیکن بیان کردهاست که راهبردهای دیگران را میگیرد. فرض کنید که سپس هر بازیکن از خودش میپرسد: دانستن راهبردهای بازیکنان دیگر، و بحث کردن در رابطه با راهبردهای بازیکنان دیگر به عنوان زیر بنا تعیین میشوند، آیا با تغییر راهبرد میتوانم بهرهمند بشوم؟ اگر پاسخ هر بازیکن "بله " باشد، پس آن مجموعه راهبردها تعادل نش نمیباشد. اما اگر هر بازیکن هر تغییری را که ترجیح نمیدهد (یا بیتفاوت است بین تغییر یا نه)، پس مجموعهای از راهبردهای تعادل نش میباشد. به این ترتیب، هر راهبرد در تعادل نش بهترین پاسخ به تمام راهبردهای دیگر در آن تعادل است. تعادل نش گاهی اوقات ممکن است غیر عقلایی در دیدگاه سوم شخص ظاهر میشود. دلیل این است که ممکن است که حالتی از تعادل نش که بهینه پارتو نیست رخ دهد. تعادل نش همچنین میتواند عواقب غیر عقلایی در بازیهای پی در پی به خاطر بازیکنان، ممکن است تهدیدی برای یکدیگر با حرکت غیر منطقی داشته باشند. برای مثال در تئوری بازیها تعادل کامل نش با بازی فرعی میتواند معنی دار تر به عنوان ابزار تجزیه و تحلیل باشد.
تعریف رسمی
[ویرایش]مجموعه را به عنوان بازی با بازیکن در نظر بگیرید، که در آن مجموعه راهبردها برای بازیکن است، مجموعهای از فضای راهبرد آن است و تابع بهرهمندی آن است را به عنوان فضای راهبرد همهٔ بازیکنان به جز بازیکندر نظر بگیرید. هر بازیکن به ازای هر عضو مجموعه اعداد صحیح، راهبرد را انتخاب کند، پروفایل راهبرد آن به صورت و تابع بهرهمندی آن به صورت نتیجه داده میشود. قابل ذکر است که تابع بهرهمندی به نمای راهبرد انتخابی وابسته است. به عنوان مثال، در راهبرد انتخاب شده توسط بازیکن i و همچنین راهبردهای انتخاب شده توسط تمام بازیکنان دیگر. نمای راهبرد یک تعادل نش (NE) است اگر هیچ انحراف یک سویی در راهبرد توسط هر بازیکن واحد با یکی دیگر از بازیکنان سودآور نمیباشد.
- یعنی
یک بازی میتواند یا راهبرد محض یا تعادل نش ترکیبی باشد،(در تعریف اخیر راهبردی محض آن است که به صورت تصادفی با فراوانی ثابت انتخاب شدهاست). نش نشان داد که در صورتی به ما اجازه راهبرد ترکیب شده بدهند، سپس هر بازی با تعداد محدودی از بازیکنان که در آن هر بازیکن میتواند به صورت غیر محدود از میان بسیاری از راهبردهای کامل که حداقل یک تعادل نش میباشد انتخاب کند. وقتی نابرابری اکید در بالا نگه میدارد برای تمام بازیکنان و تمام راهبردهای جایگزین امکانپذیر است، سپس تعادل طبقهبندی شده به عنوان یک تعادل دقیق نش میباشد. اگر در عوض، برای برخی از بازیکنان، برابری دقیقی بین x و بعضی از راهبردهای مجموعه S وجود دارد. سپس تعادل به عنوان یک تعادل طبقهبندی شده ضعیفی از نش میباشد.
نمونهها
[ویرایش]بازی هماهنگ
[ویرایش]بازیکن ۲، پذیرش راهبرد A | بازیکن ۲، پذیرش راهبرد B | |
---|---|---|
بازیکن ۱، پذیرش راهبرد A | ۴٬۴ | ۱٬۳ |
بازیکن ۱، پذیرش راهبرد B | ۳٬۱ | ۳٬۳ |
مثال بازی هماهنگ نسبت بازیکن ۱ به بازیکن ۲ با هر ترکیبی را نشان میدهد. بازی هماهنگ(متقارن) معمول دو بازیکن یا دو راهبرد بازی است، به عنوان مثال ماتریس بهرهوری در سمت راست نشان داده شدهاست. بازیکنان باید در نتیجه هماهنگ، هر دو راهبرد A را اتخاذ کنند. به عنوان مثال، ۴. اگر هر دو بازیکن راهبرد B را انتخاب کنند هنوز هم در تعادل نش قرار دارند. اگر چه به هر بازیکن کمتر از بهرهوری بهینه تعلق میگیرد، هیچیک از بازیکنان انگیزهای برای تغییر راهبرد به دلیل کاهش در پرداخت فوری ندارند (از ۳ به ۱). نمونهای از بازی هماهنگ تنظیم دو فناوری موجود برای دو شرکت با محصولات سازگار است، و آنها حق انتخاب یک راهبرد برای تبدیل شدن به استاندارد بازار دارند. اگر هر دو شرکت موافق به فناوری انتخاب شده باشند، فروش بالا برای هر دو شرکت انتظار میرود. اگر شرکتها در انجام این فناوری استاندارد را قبول نکنند نتیجه کمی نتیجه فروش میباشد. هر دو روش تعادل نش از بازی . در جاده در حال رانندگی کردن هستید، و دارای انتخاب برای رانندگی در سمت چپ یا به رانندگی در سمت راست جاده باشید همچنین این هم یک بازی هماهنگ است. برای مثال بهرهمندی ۱۰۰ به معنی بدون تصادف و ۰ به معنی تصادف است، این بازی هماهنگ را میتوان با ماتریس پرداخت زیر تعریف کرد:
رانندگی در سمت چپ | رانندگی در سمت راست. | |
---|---|---|
رانندگی در سمت چپ | ۱۰۰٬۱۰۰ | ۰٬۰ |
رانندگی در سمت راست | ۰٬۰ | ۱۰۰٬۱۰۰ |
در این حالت دو راهبرد محض تعادل نش، هنگامی که هر دو به یکی از دو حالت رانندگی در سمت چپ یا در سمت راست را انتخاب کنند وجود دارد، اگر ما اعتراف راهبردهای مختلط که در آن راهبرد محض تعادل نش است به تصادف انتخاب شده (موضوع برای بعضی احتمالات ثابت)، سپس سه تعادل نش برای موارد مشابه وجود دارد: ما برای هر دو راهبرد محض را به ترتیب در نظر میگیریم که در آن احتمالات (۰٪،۱۰۰٪) برای بازیکن نخست، (۰٪،۱۰۰٪) برای بازیکن دو،(۱۰۰٪و۰٪) برای بازیکن نخست و (۱۰۰٪و۰٪) برای بازیکن دوم. یکی دیگر از احتمالاتی که برای هر بازیکن مشخص میکنیم (۵۰٪و۵۰٪) است.
معمای زندانی
[ویرایش]معمای زندانی مشابه ماتریس بهرهوری است که به منظور نشان دادن بازی هماهنگ به کار میرود، اما اکنون در نظر بگیرید که<C> A> D> B. چونکه C>A و D>A، هر بازیکن موقعیت خودش را با تغییر راهبرد از از راهبرد ۱ به ۲ بهبود میبخشد. بدون توجه به آنکه بازیکن دیگر چه تصمیمی میگیرد؛ بنابراین معمای زندانی یک تعادل نش است: هر دو بازیکن راهبرد ۲ (خیانت) را انتخاب میکنند. این مورد جذاب مدت زیادی ساخته شدهاست برای مطالعه این حقیقت که D>A است، (به عنوان مثال، "هر دو خیانت" است در سطح جهانی پایینتر از "هر دو وفاداری باقی میماند "). راهبرد بهینه بهطور کلی ناپایدار است، بلکه در تعادل نیست. مثال ماتریس بهرهوری معمای زندانی
همکاری | عدم | |
---|---|---|
همکاری | ۳٬۳ | ۰٬۵ |
عدم | ۵٬۰ | ۱٬۱ |
تعادل نش در ماتریس پرداخت
[ویرایش]یک راه آسان عددی برای شناسایی تعادل نش در ماتریس بهرهمندی وجود دارد. این امر به ویژه کمککننده در بازیهای دو نفره که در آن بازیکنان بیش از دو راهبرد میگیرند میباشد. در این مورد تجزیه و تحلیل رسمی ممکن است بیش از حد طولانی شود. این قانون برای جایی که حالت مختلط است (تصادفی) راهبردهای مورد علاقه صدق نمیکند. قانون آن به شرح زیر است: اگر شماره اولین بهرهوری، در سلولهای دوتایی، حداکثر ستون ازهر سلول است و اگر عدد دوم حداکثر ازمیان ردیف سلول باشد، سپس آن سلول نشان دهنده تعادل نش است. ما میتوانیم این قاعده برای یک ماتریس ۳ × ۳ به کار بگیریم
انتخاب A | انتخاب B | انتخاب C | |
---|---|---|---|
انتخاب A | ۰٬۰ | ۲۵٬۴۰ | ۵٬۱۰ |
انتخاب B | ۴۰٬۲۵ | ۰٬۰ | ۵٬۱۵ |
انتخاب C | ۱۰٬۵ | ۱۵٬۵ | ۱۰٬۱۰ |
با استفاده از این قانون، ما خیلی سریع (خیلی سریع تر از تجزیه و تحلیل رسمی) میتوانیم ببینیم که سلولهای تعادل نش (B,A)، (A,B) و (C,C) هستند. درواقع، برای سلول (B,A) امتیاز ۴۰ درستون اول و امتیاز ۲۵ برای ردیف دوم حداکثر است. برای سلول (A,B) امتیاز ۲۵ درستون دوم و امتیاز ۴۰ برای ردیف اول حداکثر است. مشابه برای سلول (C,C). برای سلولهای دیگر، یا یکی یا هردوی اعضای دوتایی حداکثر در سطر و ستون مربوطه نیستند.
پایداری
[ویرایش]مفهوم پایداری، در تجزیه و تحلیل بسیاری از انواع تعادل مفید است، همچنین میتواند برای تعادل نش استفاده شود. تعادل نش برای بازی راهبرد ترکیبی پایدار است اگر یک تغییر کوچک (بهطور خاص، تغییر بینهایت کوچک) در احتمال وقوع برای یک بازیکن باعث تغییر موقعیت آن به دو حالت میشود:
- بازیکنی که تغییری نکرد هیچ راهبرد بهتری در شرایط مالی جدید ندارد؛
- بازیکنی که تغییر انجام میدهد در حال حاضر با راهبرد به شدت بدتر بازی میکند؛
اگر این موارد هر دو را ملاقات نمود، سپس بازیکن با تغییر کوچک در راهبرد ترکیبی خود فوراً به تعادل نش باز خواهد گشت. تعادل گفته شده با ثبات میباشد. اگر شرط اول برقرار نباشد سپس تعادل ناپایدار است. اگر فقط شرط نخست برقرار باشد سپس احتمالاً تعداد نامحدود از راهبردهای بهینه برای بازیکنی که تغییر کرده وجود دارد. جان نش نشان داد که وضعیت دوم که در طیف وسیعی از بازی به خوبی تعریف شده نمیتواند به وجود بیاید. در بازی «رانندگی» مثال بالا هر دو تعادل پایدار و ناپایدار وجود دارد. تعادل شامل راهبردهای ترکیبی با احتمال ۱۰۰ ٪ پایدار میباشند. اگر هر دو بازیکن کمی احتمالات خودشان را تغییر بدهند، و حریف خود هیچ دلیلی برای تغییر راهبرد خود در عوض نداشته باشد. تعادل (۵۰ ٪، ۵۰ ٪) ناپایدار است. اگر هر دو بازیکن احتمالات خود را تغییر بدهند و سپس دیگر بازیکنان بلافاصله یک راهبرد بهتر را از بین (۰ ٪، ۱۰۰ ٪) یا (۱۰۰ ٪، ۰ ٪) میگیرند. پایداری در کاربردهای عملی از تعادل نش بسیار مهم است، زمانی که راهبرد ترکیبی از هر بازیکن کاملاً ناشناخته است، اما باید از توزیع آماری در اقدامات خود در بازی استنتاج کرد. در این حالت تعادل ناپایدارند بسیار بعید است که در عمل به وجود آیند، از آنجا که در هر دقیقه تغییر در سهم هر راهبرد دیده میشود منجر به تغییر در راهبرد و شکست تعادل میشود. تعادل نش تنها بر حسب انحرافات یک جانبه، پایداری را تعریف میکند. در بازیهای مشارکتی ایده قانعکننده کافی نیست. تعادل قوی نش برای انحرافات با هر اتحاد امکانپذیری اجازه میدهد. بعبارت دیگر، تعادل قوی نش هنگامی تعادل نش است که در آن هیچ اتحادی نمیباشد، در نظر گرفتن اقداماتی که خود به عنوان مکمل داده میشود، با همکاری میتوان منافع تمام اعضا را منحرف ساخت. با این حال، مفهوم نش قوی، گاهی خیلی قوی تصور شدهاست که در محیط برای برقراری ارتباط خصوصی نامحدود اجازه میدهد. در حقیقت، تعادل قوی نش میتوان بهینه پارتو باشد. در نتیجه این شرایط، نش قوی تقریباً هرگز وجود ندارد. تعادل نش اصلاح شده معروف به تعادل نش ضد اتحاد (CPNE) هنگامی رخ میدهد که بازیکن نمیتواند بهتر عمل کند حتی اگر به آنها اجازه برقراری ارتباط و ایجاد «خود اجرا درآوردن» توافق برای منحرف شدن را بدهند. هر راهبرد مرتبط با حمایت شده توسط تسلط همهجانبه تکرار شده که بر روی مرز پارتو میباشد (CPNE) است. علاوه بر این، ممکن است برای یک بازی داشتن تعادل نش که انعطاف در برابر ائتلافها کمتر از یک اندازه مشخص شده باشند. (CPNE) مرتبط با تئوری مرکزی است.
پیش آمد
[ویرایش]اگر بازی دارای یک تعادل نش منحصربهفرد است و در میان بازیکنان تحت شرایط خاصی انجام میشود، بنابراین مجموعه راهبرد تعادل نش تصویب شده خواهد بود. شرایط کافی برای تضمین اینکه تعادل نش در حال بازی شدن است عبارت اند از:
- بازیکنان تمام قدرت خود برای حداکثر کردن بهرهوری مورد انتظار خود در بازیهای مورد انتظار انجام میدهند؛
- بازیکن بی نقص در اجرای بازی هستند؛
- بازیکنان هوش کافی برای استنتاج راه حل دارند؛
- بازیکنان از راهبرد تعادلی برنامهریزی شده توسط بازیکنهای دیگر با خبرند؛
- بازیکنان بر این باورند که انحراف در راهبرد خود باعث انحراف هر بازیکن دیگر نخواهد شد؛
- شناخت مشترک که همه بازیکنان با این شرایط مواجهاند وجود دارد.
جستارهای وابسته
[ویرایش]منابع
[ویرایش]- مشارکتکنندگان ویکیپدیا. «Nash equilibrium». در دانشنامهٔ ویکیپدیای انگلیسی، بازبینیشده در ۱۲ مه ۲۰۱۱.