筆者曾以“劇場效應(yīng)”一詞分析了當(dāng)下中國教育慘烈的軍備競賽(《從坐著看戲到站著看戲-兼談教育現(xiàn)狀》)?!皠鲂?yīng)”是個(gè)通俗比喻,不僅適用于教育領(lǐng)域,也廣泛適用于各行各業(yè)的過度競爭現(xiàn)象(比如:手機(jī)的攝像頭越來越多、屏幕越來越大、各單位加班時(shí)間越來越長……等)。“劇場效應(yīng)”這種現(xiàn)象還可以從博弈論角度進(jìn)行學(xué)理分析。
一、什么是“納什均衡”?---從博弈論說起。
看過電影《美麗心靈》的該知道數(shù)學(xué)家納什。納什最重要的貢獻(xiàn)就是提出了“納什均衡”,并由此獲得1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。
“納什均衡”是博弈論中的一個(gè)重要推論,了解“納什均衡”,必須先從博弈開始說起。
人類社會(huì)中的所有集體活動(dòng)都可以用“博弈”來解釋。社會(huì)中的人、企業(yè)、國家,幾乎隨時(shí)隨地都在“博弈”(購物時(shí)討價(jià)還價(jià)、企業(yè)間合同談判、中美之間的“貿(mào)易戰(zhàn)”……)。
舉個(gè)栗子:
令狐沖和張無忌在一起吃飯,令狐沖分到一份面條,張無忌分到一份米飯。面條、米飯的熱量、售價(jià)相同,兩人各吃各的。假設(shè)米飯與面條的福利都等于1。則令狐沖和張無忌各自占有的福利為1,兩人總福利等于2。
起初兩人各吃各的飯,兩人之間無博弈。經(jīng)過一段時(shí)間后,令狐沖對面條產(chǎn)生了厭倦,于是在某一天,令狐沖想品嘗張無忌的米飯,這就產(chǎn)生了兩人之間進(jìn)行博弈的可能。
第一輪博弈:令狐沖身高馬大,孔武有力,采取暴力脅迫手段奪取了張無忌 的米飯。令狐沖一人吃了兩份飯,張無忌無飯可吃。此時(shí),令狐沖的福利為1+1=2,張無忌的福利為1-1=0。令狐沖+張無忌的總福利不變?nèi)詾?。這輪博弈沒有增加總福利量,只是福利發(fā)生了轉(zhuǎn)移,這種博弈局面稱為“零和博弈”。例如,封建社會(huì)中統(tǒng)治者憑借暴力對農(nóng)民的殘酷剝削,社會(huì)中的各種詐騙犯罪行為,就類似于零和博弈。又如,超級中學(xué)獨(dú)占了全省的清北升學(xué)人數(shù),代價(jià)卻是普通中學(xué)升入名校人數(shù)銳減,也類似于零和博弈。在生活中,這類結(jié)果也稱為“單贏”。成因在于博弈雙方資源(實(shí)力)的不對等和強(qiáng)勢一方的打破規(guī)則、恃強(qiáng)凌弱。
第二輪博弈:張無忌被令狐沖打劫后,痛感自己的羸弱,苦練九陽神功。某一天當(dāng)令狐沖故技重施時(shí),遭到了張無忌的強(qiáng)力反彈,兩人激烈拼搶,在爭奪中面條和米飯都被破壞而無法食用。結(jié)果,當(dāng)天兩人不但都挨了餓,而且還都受了傷,還要去醫(yī)院看病,治療過程將減少各自的福利0.5。所以,這一輪博弈的結(jié)果是雙方的福利均為-0.5,達(dá)成的福利總量為-1。這種導(dǎo)致福利總量減少的博弈稱為“負(fù)和博弈”。例如,國家之間慘烈的戰(zhàn)爭(如第一次世界大戰(zhàn)。),破壞了社會(huì)生產(chǎn)力,減少了全世界的福利總量;歷史上有的農(nóng)民起義推翻了舊王朝,嚴(yán)重破壞了生產(chǎn)力,在一段時(shí)間內(nèi)也減少了文明社會(huì)的福利總量。在生活中,這類博弈結(jié)果也稱為“雙輸”“多輸”。成因在于博弈各方力量接近,且均采取對抗策略。
第三輪博弈:痛定思痛,令狐沖,張無忌握手言和,采取合作策略,各自把一半食物與對方交換,雙方都品嘗到對方的飲食(兩人營養(yǎng)都更豐富了),由于兩人的健康指數(shù)和心理狀況都因此輪博弈得到了改善,故福利都比原來增加了0.2,這輪博弈達(dá)成的雙方福利總和為2.4。對比初始狀態(tài),福利總量增加了0.4,所以這輪博弈為“正和博弈”。例如,二戰(zhàn)后成立聯(lián)合國,減少了各國沖突,增加了世界福利總量;歐洲成立了歐共體增進(jìn)各國合作減少彼此對抗,經(jīng)濟(jì)全球化深入推動(dòng)各國合作,都推動(dòng)了世界福利總量飛速提升。在生活中,這類博弈結(jié)果稱為“共贏”“雙贏”“多贏”。成因在于博弈參與者改變了博弈策略,從對抗走向了合作,從個(gè)體理性走向了集體理性。今天的文明社會(huì),即使是實(shí)力不對等的博弈,占上風(fēng)的一方也往往不會(huì)采取直接掠奪的博弈策略,就是看到了合作策略能帶來長遠(yuǎn)的穩(wěn)定收益。這是人類社會(huì)經(jīng)過反復(fù)博弈后的理性選擇,也是人類文明告別叢林法則,趨于整體進(jìn)步的表現(xiàn)。
總結(jié)圖:
人類社會(huì)的絕大部分集體活動(dòng),都可以在博弈論中找到答案。小到公司企業(yè)的興衰,大到國家民族的治亂,都能看出群體博弈的力量。
總結(jié):博弈的分類和后果:
1、爭取正和博弈。
把參加博弈各方的所有收益相加,得數(shù)為正數(shù)的為“正和博弈”,此時(shí),博弈的結(jié)果整體促進(jìn)了社會(huì)總福利。達(dá)成正和博弈是社會(huì)進(jìn)步的根本所在,應(yīng)盡力創(chuàng)造條件增加或維持正和博弈。如十字路口紅綠燈制度就是典型的合作型正和博弈。交通參與者在路口越合作,每個(gè)人的長期通過效率越高,社會(huì)的整體交通福利越好。反之,無紅綠燈設(shè)計(jì),或紅綠燈故障的路口,每個(gè)人都搶行,極易形成人人難以通過的負(fù)和博弈。
2、控制零和博弈。
把參加博弈各方的所有收益相加,得數(shù)為零的為“零和博弈”。此時(shí),可能博弈的某一方是利益獲得者,另一方是利益損失者,也可能大家都有得有失,但得失相互抵消后,社會(huì)的總福利只是發(fā)生了轉(zhuǎn)移,但總量維持不變。零和博弈改變了福利的分配狀態(tài)。有時(shí)候可以選擇,有時(shí)候必須選擇,有時(shí)候盡量避免。如學(xué)??荚嚺琶?,公司獎(jiǎng)金分配,財(cái)政資金分配等。零和博弈有利于調(diào)動(dòng)部分人群的積極性,但存在邊際收益遞減的問題,所以需要及時(shí)調(diào)整零和博弈格局。
3、避免負(fù)和博弈。
把參加博弈各方的所有收益相加,得數(shù)為負(fù)數(shù)的為“負(fù)和博弈”,此時(shí),博弈的結(jié)果整體減少了社會(huì)的福利。負(fù)和博弈減少了社會(huì)總福利量,且增加了各方的對抗,會(huì)激化矛盾。故制度設(shè)計(jì)和政策安排應(yīng)引導(dǎo)各方淡化短期利益,重視長期收益,促進(jìn)各方合作,減少各方對抗。如商家間避免惡性降價(jià)競爭、開發(fā)商減少暴力拆遷、城管避免釣魚執(zhí)法等。
二、“納什均衡”:一種負(fù)和博弈的僵局。
承接前文,“負(fù)和博弈”是最差的一種博弈結(jié)果。
引入:“納什均衡”則是指無法終結(jié),且持續(xù)惡化的“負(fù)和博弈”。(“納什均衡”有數(shù)學(xué)定義,本文側(cè)重其在經(jīng)濟(jì)學(xué)、社會(huì)學(xué)領(lǐng)域中的含義。)
含義:所謂納什均衡,指的是博弈參與人的這樣一種策略組合,在該博弈演進(jìn)中,任何參與者單獨(dú)改變博弈策略都不會(huì)得到好處。換句話說,除非所有人同時(shí)改變博弈策略,否則沒有任何人會(huì)改變策略,則該博弈組合就是一個(gè)納什均衡。
延伸:在沒有強(qiáng)大外力介入情況下,“負(fù)和博弈”中的參與者均不會(huì)改變博弈策略,無人愿意與其他博弈者合作,“負(fù)和”局面不斷惡化,博弈的結(jié)果越來越差,導(dǎo)致社會(huì)總福利持續(xù)減少的惡果。通俗來說,就是“惡性循環(huán)”無法中止。
舉例:納什均衡的推演:愈演愈烈的作業(yè)。
作業(yè)布置多少合適?這可不光是寫作業(yè)的學(xué)生和布置作業(yè)的老師博弈的結(jié)果,而是多方力量博弈的結(jié)果。作業(yè)這輪博弈的參與者有學(xué)生、家長、老師、班主任、學(xué)校管理層、其他競爭學(xué)校、政府管理部門。
根據(jù)前文所述:
第一輪博弈:正和博弈階段。老師布置的作業(yè)不多,學(xué)生能順利完成,也樂意完成。雙方的博弈策略為合作博弈,師生都是正收益,此時(shí)為“正和博弈”。
第二輪博弈:零和博弈階段。來自家長、考核機(jī)制和管理層的壓力,推動(dòng)了某一科個(gè)別教師增加作業(yè)量。當(dāng)此學(xué)科作業(yè)量激增后,那些作業(yè)量較少的學(xué)科學(xué)習(xí)時(shí)間將被嚴(yán)重蠶食,這些學(xué)科成績會(huì)顯著下降,但學(xué)生的各科總成績不變。教師之間有得有失,收益在教師之間發(fā)生了轉(zhuǎn)移,教師們的收益之和不變。
第三輪博弈:負(fù)和博弈階段。為捍衛(wèi)自己學(xué)科的學(xué)習(xí)時(shí)間,這些學(xué)科老師也被迫增加作業(yè)量。此時(shí),所有學(xué)科的作業(yè)量都持續(xù)增加。學(xué)生的身心健康受損,寫作業(yè)的積極性下降,教師的批改作業(yè)量和勞動(dòng)強(qiáng)度也大為增加,但大家的考核排名并未有本質(zhì)變化。此時(shí),博弈就進(jìn)入了“負(fù)和博弈”階段。
第四輪博弈:納什均衡階段。但,悲哀的是,此時(shí)沒有老師敢減少自己的作業(yè)量,因?yàn)槟阋坏p少作業(yè)量,學(xué)生就會(huì)把這部分時(shí)間用于寫其他作業(yè),你的學(xué)科利益就會(huì)短期受損。這就形成了大家相互加碼,無人選擇退出的“納什均衡”局面。此時(shí),納什均衡下大家的福利總和持續(xù)減少(所有參與者都更累了,但排名收益并未有大的變化),形成了沒有贏家、都是輸家的僵持局面,但堅(jiān)持當(dāng)下策略卻是僵局中每個(gè)參與者的最佳選擇,因?yàn)楦淖儺?dāng)下的策略,自身利益會(huì)減少的更快。
第五輪:納什均衡的強(qiáng)化。當(dāng)某學(xué)校、某老師試圖減少作業(yè)量,以打破越來越累的“納什均衡”僵局,就會(huì)招致家長的強(qiáng)烈反彈:為何不補(bǔ)課?隔壁學(xué)??墒窃谘a(bǔ)課呢!為何不重視成績?基于此,單個(gè)學(xué)校、學(xué)科無法獨(dú)立改變增加作業(yè)的博弈策略,除非所有的學(xué)校全部同時(shí)結(jié)束對抗,走向合作,以集體理性取代個(gè)體瘋狂。
這就解釋了作業(yè)為何愈來愈多且難以控制難以減少的內(nèi)在機(jī)制。作業(yè)布置的“納什均衡”,其原因就在于社會(huì)用短期的評價(jià)機(jī)制考量學(xué)生學(xué)習(xí)和教師業(yè)績,必然推動(dòng)各個(gè)博弈參與者為謀求短期收益,采取非理性的對抗性博弈策略。最終形成“負(fù)和博弈僵局”,即“納什均衡”局面。
同理,愈演愈烈的惡性補(bǔ)課、惡性延長的學(xué)習(xí)時(shí)間、越來越少的假期、變本加厲的生源大戰(zhàn),都可以在“納什均衡”中找到答案。
三、如何避免形成負(fù)和博弈尤其是納什均衡?
其一、增加優(yōu)質(zhì)資源供給,緩解福利焦慮。因?yàn)橘Y源越是短缺,人們越趨向于非理性的短期利益,趨向?qū)?,拒絕合作。比如增加優(yōu)質(zhì)學(xué)位數(shù)量會(huì)一定程度緩解了人們爭搶學(xué)位的拼搶現(xiàn)象。
其二,增加替代選項(xiàng)。技術(shù)進(jìn)步帶來替代資源的爆炸式增長,是緩解博弈困境的重要機(jī)遇。比如辦好職業(yè)院校,引導(dǎo)部分學(xué)生分流,也會(huì)降低競爭烈度。
其三、增加監(jiān)督機(jī)制。防止博弈各方中某一方違規(guī)搶跑,否則博弈很容易從正和、零和演化為負(fù)和局面。如限制作業(yè)布置的上限,嚴(yán)懲節(jié)假日補(bǔ)課等。
其四、調(diào)整福利分配。在資源供給短期內(nèi)難于增加,替代技術(shù)進(jìn)步緩慢情況下,改變利益分配方案也是一個(gè)思路。如把學(xué)位按人口比例分解到各下級學(xué)校,學(xué)校以對教師實(shí)行綜合評價(jià)制度替代單一成績評價(jià)等。
四、繼續(xù)來看納什故事:
烈日炎炎的下午,納什教授給學(xué)生上課,窗外樓下有幾個(gè)工人正施工,機(jī)器的響聲成了刺耳的噪音,于是納什走到窗前狠狠地把窗戶關(guān)上。馬上有同學(xué)提出意見:“教授,請別關(guān)窗子,實(shí)在太熱了!”而納什教授一臉嚴(yán)肅地回答說:“課堂的安靜比你舒不舒服重要得多!”然后轉(zhuǎn)過身一邊嘴里叨叨著“給你們來上課,在我看來不但耽誤了你們的時(shí)間,也耽誤了我的寶貴時(shí)間……”,一邊在黑板上寫著數(shù)學(xué)公式。
正當(dāng)教授一邊自語一邊在黑板上寫公式之際,一位叫阿麗莎的漂亮女同學(xué)(這位女同學(xué)后來成了納什的妻子)走到窗邊打開了窗子,電影中納什用責(zé)備的眼神看著阿麗莎:“小姐……”而阿麗莎對窗外的工人說道:“打擾一下,嗨!我們有點(diǎn)小小的問題,關(guān)上窗戶,這里會(huì)很熱;開著,卻又太吵。我想能不能請你們先修別的地方,大約45分鐘就好了?!闭诟苫畹墓と擞淇斓卣f:“沒問題!”又回頭對自己的伙伴們說:“伙計(jì)們,讓我們先休息一下吧!”阿麗莎回過頭來快活地看著納什教授,納什教授也微笑地看著阿麗莎,既像是講課,又像是在評論:“你們會(huì)發(fā)現(xiàn)在多變性的微積分中,往往一個(gè)難題會(huì)有多種解答?!?/p>
阿麗莎對“開窗難題”的解答,使我們得出啟示:那些看似零和博弈或者是負(fù)和博弈的問題,也會(huì)因?yàn)閰⑴c者的巧妙博弈策略而轉(zhuǎn)為正和博弈。正如上文中納什教授所說:“多變性的微積分中,往往一個(gè)難題會(huì)有多種解答?!?/p>
關(guān)鍵點(diǎn)就是,用合作策略取代對抗策略。關(guān)鍵點(diǎn)就是,以集體理性取代個(gè)人理性。
本文轉(zhuǎn)自微信公眾號“隱蔽的歷史”,作者郭山。文章為作者獨(dú)立觀點(diǎn),不代表芥末堆立場。
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請您 填寫信息告訴我們。