芥末堆芥末堆

“納什均衡”與作業(yè)僵局

作者:隱蔽的歷史 發(fā)布時間:

“納什均衡”與作業(yè)僵局

作者:隱蔽的歷史 發(fā)布時間:

摘要:人類社會的絕大部分集體活動,都可以在博弈論中找到答案。

00.jpg

筆者曾以“劇場效應(yīng)”一詞分析了當(dāng)下中國教育慘烈的軍備競賽(《從坐著看戲到站著看戲-兼談教育現(xiàn)狀》)?!皠鲂?yīng)”是個通俗比喻,不僅適用于教育領(lǐng)域,也廣泛適用于各行各業(yè)的過度競爭現(xiàn)象(比如:手機(jī)的攝像頭越來越多、屏幕越來越大、各單位加班時間越來越長……等)?!皠鲂?yīng)”這種現(xiàn)象還可以從博弈論角度進(jìn)行學(xué)理分析。

一、什么是“納什均衡”?---從博弈論說起。

看過電影《美麗心靈》的該知道數(shù)學(xué)家納什。納什最重要的貢獻(xiàn)就是提出了“納什均衡”,并由此獲得1994年諾貝爾經(jīng)濟(jì)學(xué)獎。

640.jpg

 “納什均衡”是博弈論中的一個重要推論,了解“納什均衡”,必須先從博弈開始說起。

人類社會中的所有集體活動都可以用“博弈”來解釋。社會中的人、企業(yè)、國家,幾乎隨時隨地都在“博弈”(購物時討價還價、企業(yè)間合同談判、中美之間的“貿(mào)易戰(zhàn)”……)。

舉個栗子:

令狐沖和張無忌在一起吃飯,令狐沖分到一份面條,張無忌分到一份米飯。面條、米飯的熱量、售價相同,兩人各吃各的。假設(shè)米飯與面條的福利都等于1。則令狐沖和張無忌各自占有的福利為1,兩人總福利等于2。

起初兩人各吃各的飯,兩人之間無博弈。經(jīng)過一段時間后,令狐沖對面條產(chǎn)生了厭倦,于是在某一天,令狐沖想品嘗張無忌的米飯,這就產(chǎn)生了兩人之間進(jìn)行博弈的可能。

第一輪博弈:令狐沖身高馬大,孔武有力,采取暴力脅迫手段奪取了張無忌 的米飯。令狐沖一人吃了兩份飯,張無忌無飯可吃。此時,令狐沖的福利為1+1=2,張無忌的福利為1-1=0。令狐沖+張無忌的總福利不變?nèi)詾?。這輪博弈沒有增加總福利量,只是福利發(fā)生了轉(zhuǎn)移,這種博弈局面稱為“零和博弈”。例如,封建社會中統(tǒng)治者憑借暴力對農(nóng)民的殘酷剝削,社會中的各種詐騙犯罪行為,就類似于零和博弈。又如,超級中學(xué)獨(dú)占了全省的清北升學(xué)人數(shù),代價卻是普通中學(xué)升入名校人數(shù)銳減,也類似于零和博弈。在生活中,這類結(jié)果也稱為“單贏”。成因在于博弈雙方資源(實(shí)力)的不對等和強(qiáng)勢一方的打破規(guī)則、恃強(qiáng)凌弱。

第二輪博弈:張無忌被令狐沖打劫后,痛感自己的羸弱,苦練九陽神功。某一天當(dāng)令狐沖故技重施時,遭到了張無忌的強(qiáng)力反彈,兩人激烈拼搶,在爭奪中面條和米飯都被破壞而無法食用。結(jié)果,當(dāng)天兩人不但都挨了餓,而且還都受了傷,還要去醫(yī)院看病,治療過程將減少各自的福利0.5。所以,這一輪博弈的結(jié)果是雙方的福利均為-0.5,達(dá)成的福利總量為-1。這種導(dǎo)致福利總量減少的博弈稱為“負(fù)和博弈”。例如,國家之間慘烈的戰(zhàn)爭(如第一次世界大戰(zhàn)。),破壞了社會生產(chǎn)力,減少了全世界的福利總量;歷史上有的農(nóng)民起義推翻了舊王朝,嚴(yán)重破壞了生產(chǎn)力,在一段時間內(nèi)也減少了文明社會的福利總量。在生活中,這類博弈結(jié)果也稱為“雙輸”“多輸”。成因在于博弈各方力量接近,且均采取對抗策略。

第三輪博弈:痛定思痛,令狐沖,張無忌握手言和,采取合作策略,各自把一半食物與對方交換,雙方都品嘗到對方的飲食(兩人營養(yǎng)都更豐富了),由于兩人的健康指數(shù)和心理狀況都因此輪博弈得到了改善,故福利都比原來增加了0.2,這輪博弈達(dá)成的雙方福利總和為2.4。對比初始狀態(tài),福利總量增加了0.4,所以這輪博弈為“正和博弈”。例如,二戰(zhàn)后成立聯(lián)合國,減少了各國沖突,增加了世界福利總量;歐洲成立了歐共體增進(jìn)各國合作減少彼此對抗,經(jīng)濟(jì)全球化深入推動各國合作,都推動了世界福利總量飛速提升。在生活中,這類博弈結(jié)果稱為“共贏”“雙贏”“多贏”。成因在于博弈參與者改變了博弈策略,從對抗走向了合作,從個體理性走向了集體理性。今天的文明社會,即使是實(shí)力不對等的博弈,占上風(fēng)的一方也往往不會采取直接掠奪的博弈策略,就是看到了合作策略能帶來長遠(yuǎn)的穩(wěn)定收益。這是人類社會經(jīng)過反復(fù)博弈后的理性選擇,也是人類文明告別叢林法則,趨于整體進(jìn)步的表現(xiàn)。

總結(jié)圖:

WX20181217-102846.png

人類社會的絕大部分集體活動,都可以在博弈論中找到答案。小到公司企業(yè)的興衰,大到國家民族的治亂,都能看出群體博弈的力量。

總結(jié):博弈的分類和后果:

1、爭取正和博弈。

把參加博弈各方的所有收益相加,得數(shù)為正數(shù)的為“正和博弈”,此時,博弈的結(jié)果整體促進(jìn)了社會總福利。達(dá)成正和博弈是社會進(jìn)步的根本所在,應(yīng)盡力創(chuàng)造條件增加或維持正和博弈。如十字路口紅綠燈制度就是典型的合作型正和博弈。交通參與者在路口越合作,每個人的長期通過效率越高,社會的整體交通福利越好。反之,無紅綠燈設(shè)計(jì),或紅綠燈故障的路口,每個人都搶行,極易形成人人難以通過的負(fù)和博弈。

2、控制零和博弈。

把參加博弈各方的所有收益相加,得數(shù)為零的為“零和博弈”。此時,可能博弈的某一方是利益獲得者,另一方是利益損失者,也可能大家都有得有失,但得失相互抵消后,社會的總福利只是發(fā)生了轉(zhuǎn)移,但總量維持不變。零和博弈改變了福利的分配狀態(tài)。有時候可以選擇,有時候必須選擇,有時候盡量避免。如學(xué)??荚嚺琶惊劷鸱峙?,財政資金分配等。零和博弈有利于調(diào)動部分人群的積極性,但存在邊際收益遞減的問題,所以需要及時調(diào)整零和博弈格局。

3、避免負(fù)和博弈。

把參加博弈各方的所有收益相加,得數(shù)為負(fù)數(shù)的為“負(fù)和博弈”,此時,博弈的結(jié)果整體減少了社會的福利。負(fù)和博弈減少了社會總福利量,且增加了各方的對抗,會激化矛盾。故制度設(shè)計(jì)和政策安排應(yīng)引導(dǎo)各方淡化短期利益,重視長期收益,促進(jìn)各方合作,減少各方對抗。如商家間避免惡性降價競爭、開發(fā)商減少暴力拆遷、城管避免釣魚執(zhí)法等。

0.jpg

二、“納什均衡”:一種負(fù)和博弈的僵局。

承接前文,“負(fù)和博弈”是最差的一種博弈結(jié)果。

引入:“納什均衡”則是指無法終結(jié),且持續(xù)惡化的“負(fù)和博弈”。(“納什均衡”有數(shù)學(xué)定義,本文側(cè)重其在經(jīng)濟(jì)學(xué)、社會學(xué)領(lǐng)域中的含義。)

含義:所謂納什均衡,指的是博弈參與人的這樣一種策略組合,在該博弈演進(jìn)中,任何參與者單獨(dú)改變博弈策略都不會得到好處。換句話說,除非所有人同時改變博弈策略,否則沒有任何人會改變策略,則該博弈組合就是一個納什均衡。

延伸:在沒有強(qiáng)大外力介入情況下,“負(fù)和博弈”中的參與者均不會改變博弈策略,無人愿意與其他博弈者合作,“負(fù)和”局面不斷惡化,博弈的結(jié)果越來越差,導(dǎo)致社會總福利持續(xù)減少的惡果。通俗來說,就是“惡性循環(huán)”無法中止。

例:納什均衡的推演:愈演愈烈的作業(yè)。

作業(yè)布置多少合適?這可不光是寫作業(yè)的學(xué)生和布置作業(yè)的老師博弈的結(jié)果,而是多方力量博弈的結(jié)果。作業(yè)這輪博弈的參與者有學(xué)生、家長、老師、班主任、學(xué)校管理層、其他競爭學(xué)校、政府管理部門。

根據(jù)前文所述:

第一輪博弈:正和博弈階段。老師布置的作業(yè)不多,學(xué)生能順利完成,也樂意完成。雙方的博弈策略為合作博弈,師生都是正收益,此時為“正和博弈”。

第二輪博弈:零和博弈階段。來自家長、考核機(jī)制和管理層的壓力,推動了某一科個別教師增加作業(yè)量。當(dāng)此學(xué)科作業(yè)量激增后,那些作業(yè)量較少的學(xué)科學(xué)習(xí)時間將被嚴(yán)重蠶食,這些學(xué)科成績會顯著下降,但學(xué)生的各科總成績不變。教師之間有得有失,收益在教師之間發(fā)生了轉(zhuǎn)移,教師們的收益之和不變。

第三輪博弈:負(fù)和博弈階段。為捍衛(wèi)自己學(xué)科的學(xué)習(xí)時間,這些學(xué)科老師也被迫增加作業(yè)量。此時,所有學(xué)科的作業(yè)量都持續(xù)增加。學(xué)生的身心健康受損,寫作業(yè)的積極性下降,教師的批改作業(yè)量和勞動強(qiáng)度也大為增加,但大家的考核排名并未有本質(zhì)變化。此時,博弈就進(jìn)入了“負(fù)和博弈”階段。

第四輪博弈:納什均衡階段。但,悲哀的是,此時沒有老師敢減少自己的作業(yè)量,因?yàn)槟阋坏p少作業(yè)量,學(xué)生就會把這部分時間用于寫其他作業(yè),你的學(xué)科利益就會短期受損。這就形成了大家相互加碼,無人選擇退出的“納什均衡”局面。此時,納什均衡下大家的福利總和持續(xù)減少(所有參與者都更累了,但排名收益并未有大的變化),形成了沒有贏家、都是輸家的僵持局面,但堅(jiān)持當(dāng)下策略卻是僵局中每個參與者的最佳選擇,因?yàn)楦淖儺?dāng)下的策略,自身利益會減少的更快。

第五輪:納什均衡的強(qiáng)化。當(dāng)某學(xué)校、某老師試圖減少作業(yè)量,以打破越來越累的“納什均衡”僵局,就會招致家長的強(qiáng)烈反彈:為何不補(bǔ)課?隔壁學(xué)??墒窃谘a(bǔ)課呢!為何不重視成績?基于此,單個學(xué)校、學(xué)科無法獨(dú)立改變增加作業(yè)的博弈策略,除非所有的學(xué)校全部同時結(jié)束對抗,走向合作,以集體理性取代個體瘋狂。

這就解釋了作業(yè)為何愈來愈多且難以控制難以減少的內(nèi)在機(jī)制。作業(yè)布置的“納什均衡”,其原因就在于社會用短期的評價機(jī)制考量學(xué)生學(xué)習(xí)和教師業(yè)績,必然推動各個博弈參與者為謀求短期收益,采取非理性的對抗性博弈策略。最終形成“負(fù)和博弈僵局”,即“納什均衡”局面。

同理,愈演愈烈的惡性補(bǔ)課、惡性延長的學(xué)習(xí)時間、越來越少的假期、變本加厲的生源大戰(zhàn),都可以在“納什均衡”中找到答案。

00.jpg


三、如何避免形成負(fù)和博弈尤其是納什均衡?

其一、增加優(yōu)質(zhì)資源供給,緩解福利焦慮。因?yàn)橘Y源越是短缺,人們越趨向于非理性的短期利益,趨向?qū)?,拒絕合作。比如增加優(yōu)質(zhì)學(xué)位數(shù)量會一定程度緩解了人們爭搶學(xué)位的拼搶現(xiàn)象。

其二,增加替代選項(xiàng)。技術(shù)進(jìn)步帶來替代資源的爆炸式增長,是緩解博弈困境的重要機(jī)遇。比如辦好職業(yè)院校,引導(dǎo)部分學(xué)生分流,也會降低競爭烈度。

其三、增加監(jiān)督機(jī)制。防止博弈各方中某一方違規(guī)搶跑,否則博弈很容易從正和、零和演化為負(fù)和局面。如限制作業(yè)布置的上限,嚴(yán)懲節(jié)假日補(bǔ)課等。

其四、調(diào)整福利分配。在資源供給短期內(nèi)難于增加,替代技術(shù)進(jìn)步緩慢情況下,改變利益分配方案也是一個思路。如把學(xué)位按人口比例分解到各下級學(xué)校,學(xué)校以對教師實(shí)行綜合評價制度替代單一成績評價等。

四、繼續(xù)來看納什故事:

烈日炎炎的下午,納什教授給學(xué)生上課,窗外樓下有幾個工人正施工,機(jī)器的響聲成了刺耳的噪音,于是納什走到窗前狠狠地把窗戶關(guān)上。馬上有同學(xué)提出意見:“教授,請別關(guān)窗子,實(shí)在太熱了!”而納什教授一臉嚴(yán)肅地回答說:“課堂的安靜比你舒不舒服重要得多!”然后轉(zhuǎn)過身一邊嘴里叨叨著“給你們來上課,在我看來不但耽誤了你們的時間,也耽誤了我的寶貴時間……”,一邊在黑板上寫著數(shù)學(xué)公式。

正當(dāng)教授一邊自語一邊在黑板上寫公式之際,一位叫阿麗莎的漂亮女同學(xué)(這位女同學(xué)后來成了納什的妻子)走到窗邊打開了窗子,電影中納什用責(zé)備的眼神看著阿麗莎:“小姐……”而阿麗莎對窗外的工人說道:“打擾一下,嗨!我們有點(diǎn)小小的問題,關(guān)上窗戶,這里會很熱;開著,卻又太吵。我想能不能請你們先修別的地方,大約45分鐘就好了。”正在干活的工人愉快地說:“沒問題!”又回頭對自己的伙伴們說:“伙計(jì)們,讓我們先休息一下吧!”阿麗莎回過頭來快活地看著納什教授,納什教授也微笑地看著阿麗莎,既像是講課,又像是在評論:“你們會發(fā)現(xiàn)在多變性的微積分中,往往一個難題會有多種解答?!?/p>

阿麗莎對“開窗難題”的解答,使我們得出啟示:那些看似零和博弈或者是負(fù)和博弈的問題,也會因?yàn)閰⑴c者的巧妙博弈策略而轉(zhuǎn)為正和博弈。正如上文中納什教授所說:“多變性的微積分中,往往一個難題會有多種解答?!?/p>

關(guān)鍵點(diǎn)就是,用合作策略取代對抗策略。關(guān)鍵點(diǎn)就是,以集體理性取代個人理性。

本文轉(zhuǎn)自微信公眾號“隱蔽的歷史”,作者郭山。文章為作者獨(dú)立觀點(diǎn),不代表芥末堆立場。

1、本文是 芥末堆網(wǎng)轉(zhuǎn)載文章,原文:隱蔽的歷史
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。
來源:隱蔽的歷史
芥末堆商務(wù)合作:王老師 18710003484
  • “納什均衡”與作業(yè)僵局分享二維碼