استراتژی (نظریه بازی) - ویکی‌پدیا، دانشنامهٔ آزاد

در استراتژی (نظریه بازی) (به انگلیسی: (Strategy (game theory) استراتژی یا راهبرد یک بازیکن در یک بازی یک مجموعه کامل از اعمالی است که در هر موقعیت انجام می‌دهد. راهبرد به‌طور کامل رفتار بازیکن را بیان می‌کند. راهبرد یک بازیکن بیان‌کننده اعمالی است که بازیکن در هر مرحله از بازی، برای هر مجموعه از اعمالی که بازیکن قبل از این مرحله انجام داده، انتخاب می‌کند.

یک نمایه راهبرد (گاهی آن را ترکیب راهبرد نیز می‌نامند) مجموعه‌ای از راهبرد‌ها برای هر بازیکن است که به‌طور کامل همه اعمال در یک بازی را بیان می‌کند. یک نمایه راهبرد باید شامل یک و فقط یک راهبرد برای هر بازیکن باشد.

مفهوم راهبرد گاهی به غلط با حرکت اشتباه گرفته می‌شود. یک حرکت عملی است که توسط یک بازیکن در نقطه‌ای از بازی انتخاب می‌شود (مثلاً در شطرنج حرکت فیل سفید از نقطهٔ a۲ به نقطهٔ b۳). در حالی که یک راهبرد یک الگوریتم کامل برای انجام بازی است که به بازیکن می‌گوید در هر موقعیت ممکن در طول بازی چه کار کند.

مجموعه راهبرد

[ویرایش]

مجموعه راهبرد یک بازیکن تعیین می‌کند که برای این بازیکن، بازی کردن کدام راهبرد‌ها ممکن است. اگر برای یک بازیکن تعدادی راهبرد گسسته وجود داشته باشد، مجموعه راهبرد این بازیکن متناهی است. به عنوان نمونه در بازی سنگ، کاغذ، قیچی، هر بازیکن مجموعه راهبرد متناهی {سنگ، کاغذ، قیچی} را دارد.

در غیر این صورت یک مجموعه راهبرد نامتناهی است. به عنوان هستند و مجموعه راهبرد نامتناهی است {۱۰ هزار تومان، ۲۰ هزار تومان، ۳۰ هزار تومان و...}. همچنین، بازی بریدن کیک دارای راهبرد‌های کراندار و پیوسته در مجموعه راهبرد‌ها است {بریدن هر جا بین ۰٪ تا ۱۰۰٪ از کیک}.

در یک بازی پویا مجموعه راهبرد شامل قوانین ممکن است که یک بازیکن می‌تواند به یک ربات یا یک عامل نرم‌افزاری بدهد تا بفهمد که چطور بازی کند. برای مثال در بازی اولتیماتوم، مجموعه راهبرد برای بازیکن دوم شامل همه قوانین ممکن است که برای آن‌ها پیشنهاد می‌شود فرد بپذیرد یا رد کند. در یک بازی بایزی (Bayesian game) مجموعه راهبرد شبیه بازی پویا است. مجموعه راهبرد شامل قوانینی است که بیان می‌کند برای هر اطلاعات خصوصی ممکن چه عملی انجام شود.

انتخاب یک مجموعه راهبرد

[ویرایش]

در نظریه بازی‌های کاربردی، تعریف مجموعه‌های راهبرد بخش مهمی از هنر به صورت هم‌زمان معنادار و قابل حل کردن یک بازی است. نظریه پرداز بازی می‌تواند از دانش سراسر مسئله به منظور محدود کردن فضای راهبرد و ساده‌تر کردن راه حل استفاده کند.

به عنوان مثال، اگر بخواهیم در مورد بازی اولتیماتوم دقیق صحبت کنیم، یک بازیکن می‌تواند راهبرد‌هایی مثل رد کردن پیشنهاد (۱ تومان، ۲ تومان، ...، ۱۹ تومان) و پذیرفتن پیشنهاد (۰ تومان، ۱ تومان، ...، ۲۰ تومان) را داشته باشد. به حساب آوردن همهٔ این راهبرد‌ها، فضای راهبرد بسیار بزرگی را به وجود می‌آورد و مسئله را دشوار می‌کند. یک نظریه‌پرداز بازی در عوض می‌تواند مجموعه راهبرد‌ها را به این صورت بسازد: {رد کردن هر پیشنهاد کمتر یا مساوی x و پذیرفتن هر پیشنهاد بزرگتر از x، برای x در (۰ تومان، ۱ تومان، ...، ۲۰ تومان)}.

راهبرد خالص و راهبرد مختلط

[ویرایش]

یک راهبرد خالص تعریف کاملی از این که یک بازیکن چگونه بازی خواهد کرد ارائه می‌دهد. این راهبرد حرکتی را که یک بازیکن برای هر موقعیتی که با آن روبه‌رو خواهد شد باید انجام دهد، تعریف می‌کند. مجموعه راهبرد یک بازیکن مجموعه‌ای است از راهبرد‌های خاصی که برای آن بازیکن ممکن است.

یک راهبرد مختلط انتصاب یک احتمال به هر راهبرد خالص است. این راهبرد به یک بازیکن اجازه می‌دهد به صورت تصادفی یک راهبرد خالص را برگزیند. چون احتمال‌ها پیوسته هستند راهبرد‌های مختلط نامتناهی برای یک بازیکن وجود دارد، حتی اگر مجموعه راهبرد‌های آن متناهی باشد.
البته می‌توان یک راهبرد خالص را نوع خاصی از راهبرد مختلط دانست که در آن یک راهبرد خالص خاص با احتمال ۱ و بقیه راهبرد‌ها با احتمال ۰ انتخاب می‌شوند.

یک راهبرد کاملاً مختلط، راهبرد مختلطی است که در آن بازیکن یک احتمال اکیداً مثبت به هر راهبرد خالص می‌دهد.

راهبرد ترکیبی

[ویرایش]

مثال

[ویرایش]

ماتریس بازدهی که در شکل زیر نشان داده شده را در نظر بگیرید (بازی تشریک مساعی). در اینجا یک بازیکن ردیف و بازیکن دیگر ستون را انتخاب می‌کند. بازیکن ردیف اولین بازده را دریافت می‌کند و بازیکن ستون دومی را. اگر بازیکن ردیف ترجیح دهد که A را با احتمال ۱ انتخاب کند، در این‌صورت می‌گوییم او یک راهبرد خالص را بازی می‌کند. اگر بازیکن ستون یک سکه بیندازد و اگر شیر آمد A و اگر خط آمد B را بازی کند، در این صورت او یک راهبرد مختلط را بازی کرده و نه یک راهبرد خالص.

A B
A ۱٬۱ ۰٬۰
B ۰٬۰ ۱٬۱

اهمیت

[ویرایش]

جان فوربز نش، در مقاله معروف خود اثبات کرد که برای هر بازی متناهی یک تعادل وجود دارد. تعادل نش بر دو قسم است: تعادل‌های نش راهبرد خالص تعادل‌هایی هستند که در آن‌ها همه بازیکنان با راهبرد خالص بازی می‌کنند. تعادل‌های نش راهبرد مختلط تعادل‌هایی هستند که در آن‌ها حداقل یک بازیکن با راهبرد مختلط بازی می‌کند. نش اثبات کرد که هر بازی متناهی یک تعادل نش دارد، نه این که هر بازی متناهی یک تعادل نش خالص دارد. بازی‌ها می‌توانند هم تعادل خالص و هم تعادل مختلط داشته باشند.

جستارهای وابسته

[ویرایش]

منابع

[ویرایش]

ویکی‌پدیای انگلیسی