剪刀石頭布背後的博弈|剪刀石頭布|規律

2019-03-01 07:56:03

倫敦人鮑勃·庫珀(Bob Cooper)外號“石頭”。這常常給他的競爭對手帶來一種錯覺。對手們會以為他習慣於出“石頭”,於是他們會相應地出“布”。而庫珀有意利用了這一點,他會出“剪刀”來打敗對手。

庫珀是2006年剪刀石頭布世界冠軍。他打敗了496人之後獲得由“世界剪刀石頭布協會”頒發的獎牌。那塊獎牌看起來跟任何“正規”體育運動的獎牌沒什麼區別。但是很少人會意識到剪刀石頭布是一種策略性運動,大部分人認為它靠的只是運氣。

剪刀石頭布的遊戲最早可以追溯到中國漢代,典籍中將其稱為“手勢令”。同樣的遊戲在日本的歷史上也有很多記載,後來它在20世紀初傳到歐洲。直到1930年代,美國記者在報紙上提到它時,還需要特意描述一下遊戲規則。

A能打敗B,B能打敗C,而C又能打敗A。表面上看來非常公平,但數學家早就注意到事情並沒有這么簡單。

英國牛津大學的數學家馬庫斯·杜·索托伊(Marcus Du Sautoy)2011年千里迢迢去到美國費城,觀看在那裡舉行的剪刀石頭布比賽,其獲勝者會去拉斯維加斯參加決賽。索托伊在記錄了這段經歷的影片《密碼》(The Code)中指出,如果遊戲是完全公平的,那么每個參賽者的獲勝幾率都是一樣的,然而,總有一些人能夠一次又一次地獲勝。

美國加州大學洛杉磯分校的社會神經科學家馬修·利伯曼(Matthew Lieberman)也在其著作中提到,如果剪刀石頭布是一種公平遊戲,“那么鮑勃·庫珀一定是這個星球上最幸運的人”。

要想讓剪刀石頭布的結果真正隨機,那么從數學上來講必須有一個前提,就是參與者甩出來的手勢是隨機的。然而大量的研究已經發現,人類並不擅長做出隨機的動作,我們總是免不了將某種規律暗含在行為當中。

制勝法則

在一篇不久前被貼到論文“預印本”平台上的學術文章中,中國的研究人員描述了他們最新獲得的剪刀石頭布“制勝法則”。這種制勝法則也正是基於人類不自覺的行為規律。

浙江大學實驗社會科學實驗室的王志堅與合作者招募了360名學生,將他們分為6組。每一名學生都會跟他同組的人玩300輪剪刀石頭布,一個人在遊戲中獲勝的次數越多,他們也將獲得越多的金錢獎勵。

結果表明,從總體上來看剪刀、石頭和布出現的次數基本是相等的,就像是隨機得到的結果。然而,再仔細分析數據則發現了一個有趣的規律:如果參賽者在一輪遊戲中獲勝,那么接下來他會傾向於更頻繁地使用獲勝手勢;失敗者則傾向於換一個手勢,並且,他們選擇的順序是按照遊戲名稱中順序來的。

比如說,如果大家習慣於把遊戲稱為“剪刀石頭布”,一名參賽者在甩出“剪刀”輸了之後,下一次他出“石頭”的幾率是高於三分之一的。

類似的規律也被剪刀石頭布的專業玩家總結過,比如在北美,人們稱呼這種遊戲時的順序是“石頭、紙(布)、剪刀”,那么男人們甩出三種手勢的可能性從高到低依次是石頭、布、剪刀,而女人們的順序則是石頭、剪刀、布。

由此,根據中國科學家的研究,遊戲的“制勝法則”是:如果你的對手用“石頭”打敗了你,那么你接下來可以選擇出“布”;如果你的對手出“石頭”輸了,那么接下來你大概應該出“剪刀”——如果你的對手習慣於把這項遊戲稱為“剪刀石頭布”的話。

不過,科學家研究剪刀石頭布並不是為了找到它的最佳策略,他們在這個遊戲中看到了更深層的含義。

如果每個參賽者都將自己的手勢做到完全隨機、不可預測,那么他們就最大程度上避免了相互利用,由此達到博弈論中的“納什均衡”。而事實卻不是這樣,科學家發現人們在無意識中採用了“贏則留、輸則變”的策略,這被稱為“條件回響”,這種規律可能與人類大腦的結構有關。

“在生物學層面上,條件回響究竟是人腦的一種基本的決策機制,還是更為基礎的神經機制帶來的一個結果,這仍是未來研究中具有挑戰性的問題。”王志堅等人在論文稿中寫道。

在實際的遊戲中,你也並不可能僅靠這個科研成果變得天下無敵。專業的玩家有非常複雜的策略,僅僅由世界剪刀石頭布協會主席編寫的《剪刀石頭布官方指南》一書就有兩百多頁,這還只被認為是一部啟蒙書籍。剪刀石頭布大師們還會各自有獨門絕學。

社會神經科學家利伯曼在他的著作中列舉了新手很容易被利用的一些情況。比如新手會比較多地出“石頭”,因為與剪刀和布相比,石頭更加能夠顯示力量。再比如,如果一個人連續兩次出相同的手勢,那么第三次就有更大的可能性發生改變。

後一個例子很有趣,因為它說明了人不善於給出隨機的手勢。索托伊也提到過這一點。如果你拋了兩次硬幣都是字朝上,並不代表你第三次拋的時候花朝上的機率更高。因為硬幣是沒有記憶的。但如果你跟人——特別是新手——玩剪刀石頭布就不是這樣。老手於是很容易利用新手的這些特點來大大增加自己的獲勝幾率。

自動模仿

英國科學家還做過另一個有趣的剪刀石頭布實驗。他們讓參賽者蒙著眼睛玩。

這種情況下,他們得到了一個與數學上完全一致的結果:在33.3%的情況下,參賽者會打成平手。

然而,當他們改變設定,讓參賽的一方蒙著眼睛,另一方不蒙的時候,平手的比例就發生了顯著的變化——上升到了36.3%。

為什麼會出現這種變化呢?研究人員認為這是因為不蒙眼的一方在模仿蒙眼的一方。他們測量了每個人的反應時間,發現如果蒙眼者甩出手勢的時間略早,那么不蒙眼者就有更大的可能性甩出相同的手勢。

這恰恰是“荒謬”之所在。剪刀石頭布遊戲的精髓就是你要跟對方出得不同,但人們卻傾向於給出相同的手勢。科學家猜測,這可能暗示了人類模仿他人的慣性有多么強大。在這其中起到關鍵作用的可能是大腦中的“鏡像神經元”。

鏡像神經元最早是義大利的一組科學家1980年代在實驗室里發現的。他們在監測猴子大腦的神經活動時,意外地發現了一個現象:猴子伸手去拿食物的時候腦部會有一部分特定神經元活躍起來,而當它們觀察科學家伸手拿食物的時候,腦部同樣的神經元也會被激活。僅僅是看到食物,或者是看到科學家假裝拿食物,都不會有這些回響。

科學家以前認為大腦中一定是有不同的神經元分管知覺和行動,然而鏡像神經元的發現顛覆了這一觀念,知覺和行動可以在同一批神經元中發生。當我們看到同類的一個動作的時候,鏡像神經元就會催促我們對它進行模仿。這在神經科學中被稱為“自動模仿”。

雖然對於這樣的行為是否真的是“自動”,以及是否真的是“模仿”,科學界還在進行許多嚴格的討論,但是鏡像神經元及其帶來的自動模仿常常被認為是人類能夠產生社會性的根源之一。至少在那些做剪刀石頭布實驗的英國科學家看來,自動模仿的力量如此之強大,以至於即便不模仿是最符合利益的事情,但人們也還是忍不住會去模仿。

讀心術

為了不受自身行為局限的影響,一個剪刀石頭布的玩家想要做到完全隨機甩出手勢,那么最直接的方法就是事先背下一段隨機手勢。數學家索托伊就採用了這種策略。

他把圓周率毫無規律的數字轉換成剪刀石頭布的手勢,他認為這樣對手就完全無法預判他會甩出哪個手勢。這種策略是一種“贏不了,亦輸不了”的辦法,或者說是一種消極的策略,而根據博弈論,想要在遊戲中勝出,採取一種積極的策略是更好的辦法。

畢竟參賽的雙方很難在策略水平上完全處於相等的地位。專業比賽中很少有一局定勝負的玩法,因為一局是不足以觀察對方的。通常會採取三局兩勝或五局三勝,這樣參賽者能夠有機會參透對方。

剪刀石頭布一度被認為是一種完全的人為設定——在自然界中,不可能有A打敗B、B打敗C,而C又能打敗A的情形。然而生物學家後來真的發現了兩個自然界的案例。

史丹福大學的生態學家布倫丹·博安南(Brendan Bohannan)發現大腸桿菌的三種菌株S、R、C之間剛好構成了剪刀石頭布的關係。S菌株生長的速度比R菌株快,R菌株生長的速度又比C菌株快。而C菌株能夠分泌出一種毒素毒死S菌株,但R菌株卻能夠抵抗這種毒素。

另一個例子被印第安納大學的生物學家巴利·斯諾夫(Barry Sinervo)和同事在美國加利福尼亞的海岸山脈里發現。側邊斑點蜥蜴有三種變體,它們的喉部分別呈現出橙色、藍色和黃色。這三種蜥蜴擁有不同的交配策略,而三種策略又各有優缺點。

橙色蜥蜴個頭大又很猛,於是能夠占領藍色蜥蜴的領地,並且獲得很多雌蜥蜴。藍色蜥蜴則能夠相互合作保衛自己的領地,不讓黃色蜥蜴跟自己的雌蜥蜴偷偷交配。而黃色蜥蜴沒有領地概念,但它們能夠模仿雌蜥蜴的行為和顏色,潛入橙色蜥蜴的領地里跟雌蜥蜴交配。

科學家後來的研究表明,蜥蜴之間的這種剪刀石頭布關係可能會讓新的物種得以形成。

至於數學家索托伊,他2011年採用圓周率的策略去打比賽,以未能進入半決賽告終。他也用圓周率跟鮑勃·庫珀對抗過,結果庫珀連贏他八次。神經學家利伯曼認為庫珀採用的是讀心術,通過索托伊細微的表情和肢體語言判斷出了這名數學家接下來會甩出什麼手勢。

庫珀曾這樣講解剪刀石頭布的秘密:“它不是要你預測對手將甩出什麼手勢,它是要你預測對手對你會甩什麼手勢做出何種預測。”

相關文章
精选文章