Czego dokonał John Nash?
John Forbes Nash - genialny matematyk, odkrywca teorii racjonalnego zachowania. Prowadził badania nad teorią gier.
Wprowadził koncept równowagi w grach niekooperacyjnych nazwany od jego nazwiska równowagą Nasha.
Wynalazł on niemal równocześnie z Pietem Heinem grę planszową Hex.
Na czym polega równowaga Nasha?
Równowaga Nasha (ang. Nash-Equilibrium) jest jednym z kluczowych dla teorii gier pojęć.
Pojęcie to zostało stworzone przez Johna Nasha, laureata nagrody nobla z 1994 r.
Jest to stan strategicznej równowagi w grach niekooperatywnych, w którym strategia każdego
z graczy jest optymalna. W grach dwuosobowych strategie graczy są najlepszymi odpowiedziami
na siebie nawzajem. Podobnie w grach wieloosobowych - równowaga jest układem strategii,
z których każda jest optymalną odpowiedzią na pozostałe strategie.
Matematycznie przedstawia się to następująco:
Pod warunkiem, że wszyscy gracze pozostają przy swojej strategii, dla konkretnego gracza i
nie istnieje stan , który dawałby temu graczowi większą wypłatę:
.
Gracz zatem nie może podwyższyć swojej wypłaty poprzez jednostronną zmianę strategii.
Tak prosto jest jednak tylko w przypadku prostych strategii .
W przypadku strategii mieszanych
sprawa się komplikuje. W grach o sumie dowolnej interesy graczy nie muszą być przeciwstawne,
czyli nie należy zakładać, że każdy z graczy będzie dążył do minimalizacji wypłat pozostałych.
W nich nie chodzi zatem o jedną konkretną strategię, lecz o rozkład prawdopodobieństw,
w którym σi zostaje przypadkowo wylosowane z Σi. Jeżeli Σi jest skończona, wówczas ten
rozkład prawdopodobieństw może być przedstawiony za pomocą wektora si, przy czym si,j
jest prawdopodobieństwem wyboru strategii .
Jeżeli strategia mieszana jest równowagą Nasha,
to:
Na czym polega zasada wzajemności w teorii gier?
Tit for tat, to najprostszy (a zarazem najbardziej dobitny) przykład jednego z ciekawszych aspektów
teorii gier, a mianowicie zasady wzajemności.
Strategia ta stała się znana przede wszystkim
dzięki książce Roberta Axelroda Ewolucja Kooperacji .
Axelrod zorganizował turniej na program komputerowy, który najkorzystniej wybrnie
z sytuacji powtarzającego się dylematu więźnia. W turnieju wzięli udział przedstawiciele
różnych dyscyplin: psychologii, socjologii, politologii, ekonomii i matematyki, zajmujący
się w szczególności teorią gier. Każdy program zmierzył się z każdym, jak również z samym
sobą oraz z RANDOM, czyli programem losowo wybierającym kooperację lub jej brak.
Zwycięzcą turnieju został najprostszy z programów, TIT FOR TAT, napisany przez prof.
Anatola Rapoporta. Bazował on właśnie na czystej zasadzie wzajemności.
W pierwszym ruchu kooperował, a następnie robił to samo co jego partner w ruchu poprzednim.
|