社會是由人組成的,社會因人而存在。WEB3 本質上是一個支持社會活動的基礎性系統,那麽,為何解決社會合作問題仍然是 WEB3 的主旋律,WEB3 是促進社會合作的基礎設施?這是因為人與人之間的合作始終存在「囚徒困境」問題。
作為理性的個體,我們每個人都有自己的利益,都在追求自己的幸福。這是天性使然,沒有什麽力量能夠改變。這就是存在個體理性的基礎。但社會進步只能來自人們之間的相互合作,只有合作才能帶來共贏,才能給每個人帶來幸福。這就是說我們除了個體理性,我們還應有集體理性。然而,基於個體理性的決策常常與集體理性相沖突,導致所謂的「囚徒困境」的出現,整體上不利於所有人的幸福。除了個體利益之外,妨礙人與人合作的另一個重要原因是我們的認知有限。可以說正是由於我們的認知的有限,才導致了人類社會許多沖突。許多看似利益的沖突,實際上是理念的沖突。事實上,大部分損人利己的無恥行為本質上是無知的結果。一度有活力的但後來僵化的計劃經濟就是一個典型的例子。(參考《博弈與社會》 張維迎)。
所以,從人與人互動的角度來看,社會最基本問題有兩個,第一是協調問題,第二是合作問題。協調問題就是要形成相關方的一致預期;而合作問題本質上是一個激勵問題,並且使得個人理性與集體理性達成一致,亦即實現「通過利他之行,滿足利己之心」。事實上大量的現實問題中,這兩個問題是綜合在一起的,並相互影響,相互作用的。
而解決「囚徒困境」最主要的手段就是通過技術和製度安排建立一種激勵和懲罰機製從而改變人們的行為,進而達到社會利益帕累托最優的納什均衡。所謂納什均衡,是所有參與人的最優戰略選擇的組合,給定這一組合中其他參與人的選擇,沒有任何人有積極性改變自己的選擇。
為了理解囚徒困境和納什均衡,我們先展示一個囚徒困境的一般形式。
圖 1.1
圖 1.1 是一個二人博弈的支付矩陣。博弈雙方都有兩個選擇:合作與不合作。如果兩個人都選擇合作,各自得到的支付利益為 T;如果一個人合作另一個人不合作,合作方的支付為 S,不合作方的支付為 R;如果兩個人都不合作,每一方的支付為 P.
要使上述博弈成為一個囚徒困境需要滿足這樣一個條件:R>T>P>S。即:對每個人來說,最好的結果是別人合作自己不合作(R),其次是兩人都合作(T),再次是兩人都不合作(P),最壞的結果是自己合作別人不合作(S)。另外我們假定 T+T>R+S,即兩人合作的總收益大於一人合作、另一人不合作時候的總收益。只要滿足這兩個條件,無論支付收益的具體數字如何,結果一定是個人理性選擇不滿足集體理性,亦即人們最終的選擇對個人來說是最好的選擇,但不是社會價值最優的納什均衡。
囚徒困境是社會合作面臨的最大問題。從本質上說,古今中外,人類社會的許多製度安排都是為解決囚徒困境而設計的,而技術的應用可以保證製度的執行效率和可行性。現在我們考慮如何借助法律,執行當事人之間的合同來解決交易中的囚徒困境問題。設想甲、乙兩人在采取行動之前簽訂一個合同,合同規定不合作的一方將受到處罰,罰金為 X。再假定雙方都相信這個合同能夠在法律上得到有效執行。我們就得到了圖 1.2。
圖 1.2
此時,假定對方合作,己方如果也合作,則雙方都得到 T;己方如果不合作,對方如圖 1.2 所示得到支付收益為 S,而己方得到的支付收益為 R-X。顯然,只要罰金 X 足夠大,使得 R-X<T,那麽,每個人的最好選擇都是「合作」,雙方都選擇合作成為一個納什均衡,解決了個人理性與集體理性的矛盾。這也就是合同的價值。當然,如果當事人不相信合同能夠得到有效執行(這部分可能就需要技術來解決,比如區塊鏈的智能合約),或者違約處罰的力度不夠大(即 X<R-T),我們就又回到了囚徒困境,合作仍然不會出現。
上述例子中,我們也可以通過對合作一方提供獎勵的辦法解決囚徒困境問題。在經濟學上,對不合作行為的懲罰等同於對合作行為的獎勵,都屬於激勵製度,盡管在心理學上獎勵和懲罰的效果並不總是等同的。國家、企業、家庭內部各種各樣的獎懲製度,其目的就是解決囚徒困境問題,促進合作。
那麽,如何借助規範和技術建立起有效的機製,解決囚徒困境問題,從而促進社會協作?WEB3 會給予哪些方面的基礎性支持?
一、製度和規範的協調作用
社會博弈通常存在多個納什均衡。許多情況下,多個納什均衡之間不存在優劣之分;即使有優劣之分,也很難通過無成本的交流選擇一個特定的納什均衡。這就產生了對製度和規範的需求。社會規範和製度的一個重要功能。就是通過協調人們的預期形成一個特定的納什均衡。比如車輛行駛,中國規定都靠右邊,而英國規定都靠左邊。
而現實中我們經常會碰到製度和規範不透明或者容易多變,使得我們對未來的判斷無所適從,有些不合理的製度和規範也不得不承受,也沒有更多的選擇,這就會阻礙人們的合作意願。
基於區塊鏈技術構建的 WEB3,所有的製度和規範都是透明且不可輕易更改的,人們可以根據實際需要建立起不同的協作製度和規範,通過規則來協調人們之間的行為,實現一定的社會共識和社會秩序。人們也可以自由地選擇並參與自己認為最優的社會規範和製度生態的協作中。各種製度規則不斷地競爭演化,最終會形成社會價值帕累托最優的各種納什均衡。穩定一致的預期和強大的共識,堅定了人們協作的信心和耐心,從而更有效地創造社會財富和幸福生活。
比如,正是由於比特幣的規則透明和不可更改性,從而給人們帶來了可靠的一致預期,從而促使人們互相協作的意願,並且積極參與其中。
二、威脅和承諾的可信度
社會博弈中分為靜態博弈和動態博弈。靜態博弈是指所有參與人都同時行動。而動態博弈中的參與人行動有先後順序,後行動者在先行動者做出決策之後再選擇自己的行動。生活中大部分博弈屬於動態博弈。
在市場交易中,合同就是一個納什均衡,一般在合同中對合作方的不合作行為會有必要的懲罰措施,這可以看成是一種威脅。但如果在法製不健全的地區,或者外界條件的變化,促使一方事後不再擔心懲罰會得到執行時,其就可能違約。這說明博弈中存在不可置信威脅的納什均衡。這一威脅可信性問題的根源是動態博弈中事前最優和事後最優的不一致性。而我們把不包含不可置信的行動戰略組成的納什均衡稱為精煉納什均衡。而在 WEB3 上建立的 DeFi 的智能合約其執行是由算法強製執行且不可更改的,所以始終是一種精煉納什均衡。
比如,金融危機的發生很大程度上是懲罰的不可信導致的。如果經營不善的企業必須倒閉,欠債不還的人必須受到懲罰,每個人融資時都會謹慎行事,就不會過度負債,金融危機就可能避免,至少不會那麽嚴重。但現實中,由於擔心大企業,特別是大的金融機構的倒閉會帶來一系列的社會問題,一旦大企業出現債務危機,政府就會出手救助。這種現象被稱為「大而不倒」。預期到這一點,企業在融資時就更喜歡冒險,因為成功的收益歸己,失敗的成本可以由社會承擔,結果風險不斷積累出現了金融危機。典型如美國的次貸危機,中國的某些房地產企業也有類似問題,風險積累到不可收拾的地步。而同樣,最近發生在原生態區塊鏈領域的 Luna 事件,三箭資本作為其中一個投資方出現了巨額虧損,由於智能合約的剛性執行,則完全由其自身的決策失誤承擔後果。這就會促使參與者謹慎行事,從而實現良性合作與社會發展。
在博弈中,如果某個參與人采取某種行動,使得一個原來事後不可置信的威脅變成一個事後可以置信的威脅,事前最優和事後最優相一致,則這種行為稱為承諾。應用到一般情況,一個人對其財產擁有的所有權可以起到他對社會的承諾作用。也就是說,「恒產者有恒心」。歷史上看,中產階級參與社會革命的可能性比較小,而沒有資產的人群因為機會成本小,更有可能揭竿而起。因為有一定資產的人希望社會是穩定的,因為如果社會不穩定,動蕩不安,他們的損失也會更大。從這個意義上講,中產階級是社會穩定的重要因素。WEB3 則在技術上實現了個人數據和資產的更加可靠的所有權保障(比特所有權),所以,更能促進人們在社會中合作的意願。
動態博弈理論對我們理解社會機製架構也具有重要意義。現代民主製度也可以理解為一種社會承諾,包括多個維度。這裏我們只討論其中的選舉製度。我們將現代民主製度定義為全民定期投票選舉領導人的一種製度安排。在非民主製度比如君主製下,政治權力往往掌握在少數人組成的特權階級中,獲得統治權的方式或者是繼承,或者是暴力革命。在現代民主製度下,政治權力通常是多數人通過投票賦予權力,並受到嚴格法律約束,這些法律本身也是製度上得到多數人認可。由於這個原因,邏輯上說民主製度是為了照顧普通大眾利益,而非民主製度在實際操作中成為了維護少數特權階層利益的工具。在非民主製度下,「為民眾服務」的許諾往往會出現很多變數。而在民主製度下,「為民眾服務」承諾相對而言有一個外部監督的機製來加以落實,但在實際執行過程中往往效果並不理想,並且還可能會出現在執行中暗箱操作或者被操縱的情況。而 WEB3 的意義在於通過建立 DAO 機製,進一步保證了良好製度的執行。
三、重復博弈機製
在現實中,我們會發現如果博弈不是一次性的,而是在重復博弈的情況下,許多合作則無須借助法律和正式的製度也可以實現(這點可以得到理論證明)。
舉個例子,過去在中國喜歡旅遊的人可能都有這種體驗:旅遊景點的商家普遍存在斬客現象。那是因為遊客一輩子可能只去一次旅遊景點。這時商家認為采取不合作的方式是對其利益最大化的,且受到懲罰的概率很小。但是如果在你家的小區附近的商家,相對而言都會誠實經營,還經常做活動給消費者實惠。這是因為小區居民會經常光顧購買商品和服務,亦即重復博弈,此時,商家為了長期利益就不會短視而采取不合作的行為。重復博弈之所以會導致合作,是因為它可以增加參與人的戰略空間,隨時應付對手的變化。比如毛澤東所提出的「人不犯人我不犯人,人若犯我我必犯人」就是一種成功的針鋒相對的合作戰略。
如今互聯網 2.0 已經非常成熟,其最大的成功在於實現了不同地域陌生人之間的合作和交易,商家可以在各互聯網平臺上開設網店、註冊賬號、建立直播間等等,而客戶則在平臺上註冊賬號,並進行各種經濟活動。於是買賣者都在平臺上建立了長期博弈機製,但都必須遵守平臺規則,如果有違反規則時,則由平臺進行仲裁和懲罰。這樣的機製下,買賣雙方實現了很好的合作。然而,平臺作為第三方履行對違約的懲罰責任,就構成了二階囚徒困境問題。一方面,平臺可能由於政治或者自身利益的考慮可能隨時關閉商家的賬號和客戶的賬號;另一方面平臺為了自身利益追求而采取非法使用用戶數據、歧視性的算法、限製權限以及非公平競爭等行為損害用戶利益。目前這種問題已經成為 WEB2.0 的普遍現象,人們辛辛苦苦經營多年的商號、公眾號可能一夜之間被關閉,造成巨大的財富損失。
WEB3 為我們提供了能夠由自己控製的去中心化身份 (DID),並且基於此建立的個人網站、公眾號、商戶號、直播號等都不受第三方控製,這就會促使人們更願意投入畢生精力和資源積極投入到商業合作中,為社會創造更多的財富。
那麽,如何在沒有第三方平臺的參與下,通過 WEB3 實現陌生人之間的合作呢?
我們可以借助一些特定的社會規範來促進社會成員的合作。比如:聯合抵製規則、敵友規則以及連帶責任規則等等(這些理論推導可以參考張維迎的《博弈與社會》),WEB3 使得這些規則的實施成為可能。
四、信息非對稱下的博弈
我們把交易一方擁有但不被交易的另一方所知道的信息稱為非對稱信息。非對稱信息可能會導致帕累托改進無法實現,使得雙贏的交易無法達成。因此,人們之間要進行有效的合作,就需要找到克服信息不對稱的辦法。
非對稱信息可以分為兩種情況:一類是事前的非對稱,一類是事後的非對稱。事前信息非對稱會導致逆向選擇問題,事後信息非對稱則會導致道德風險。
在解決信息不對稱情況下的合作時,可采用市場機製或非市場機製 ( 比如監管 ) 兩種方式。在市場機製下,信息處於劣勢的一方最好的辦法就是直接收集和加工信息,同時,市場也會逐步發展出大量專業化的信息提供商。在競爭的市場上,信息處於優勢的一方也有很強的積極性告訴對方真實的信息,比如你有好產品希望別人知道它的好。除直接提供信息外,也可通過信號傳遞間接提供信息。
市場機製解決非對稱信息最重要的機製是「聲譽機製」,「聲譽機製」在市場上發揮作用的重要形式是建立品牌。WEB3 通過可以自我控製的身份 DID 與 NFT 等其他數字資產的綁定可以建立長期穩定可信的品牌標識,有利於長期經營,通過合作創造價值。
雖然信息不對稱問題可以通過市場解決,但是政府和消費者也不一定喜歡市場解決問題的方法。所以,另一個解決途徑就是政府管製。這也是 WEB3 未來體系中政府可以在其中承擔相關的角色機會。 但是政府管製和市場信譽作為解決非對稱信息問題的兩個基本機製,並不是簡單的相加。他們之間既有一定的替代性,也有一定補充性。事實上,現實中管製與信譽的關系,是政府與市場相互博弈的結果。當然,政府管製的風險在於效率低下,如果政府官員的行為受不到有效約束,最後會造成只有管製沒有信譽,市場變得混亂不堪。從政府的角度講,如果市場中的信譽機製運行非常好,商戶自身有積極性提供高質量的產品,就不需要太多的政府管製;反之,如果信譽機製不能有效發揮作用,市場上坑蒙拐騙嚴重,就需要更多的政府監管。如今 WEB3 正在快速發展,有些項目也在積極研究和推進相關內容,比如亦來雲生態項目 CreDA 等,
目前來說,WEB3 是人類構建的未來數字世界的試驗場,其更需要市場化的構建方式, 各種創新的技術和製度通過演化博弈和自發秩序不斷完善,最終達成社會價值帕累托最優的各種納什均衡的合作體系,同時,每個人也能同時實現財富自由和幸福的生活。
我們無法預知未來,但不妨礙我們從社會合作的方向來思考和推動 WEB3 的發展。
比:吉,原筮,元永貞。不寧方來,後夫兇。《象》曰:地上有水,比。先王以建萬國,親諸侯。