2015年5月26日 星期二

2015/5/26 「管理辭典」………… (41)

管理辭典

納許均衡
Nash Equilibrium

解讀環境,找出最佳策略

摘錄自:經理人 每日學管理 電子報                        2015/5/26
2015-05-25 00:00 撰文 張鴻 


經理人 每日學管理 電子報 - 20150526 - 1

在日常生活中,選擇用猜拳輸贏來做決定的例子不勝枚舉,例如玩遊戲時,由猜贏的一方先攻;或者分配掃除工作時,由輸的人負責倒垃圾。其實,猜拳就是一種賽局。

在上述的猜拳賽局中,任何一方在決定自己要出剪刀、石頭或布時,是看不到對方會出什麼拳的,也就是玩家們必須要同時行動,而且現在出的拳,又跟自己或對方過去出過什麼拳無關;若滿足了這兩個條件,就是典型的靜態賽局。

值得注意的是,「同時行動」在這裡指的並不是一個時間概念,而是一個訊息概念,亦即只要每個參與者在選擇自己的行動時,看不到其他參與者的選擇,就可視為同時行動的靜態賽局。

舉例來說,每逢年節或連續假期時,高速公路上總會有幾天塞車特別嚴重,若想避開車潮高峰期,或許有人會這樣猜測:「假期即將結束,大家都怕假期最後一天會塞車,所以可能會選在最後第二天上路。如果是這樣,那就盡量避開這天,排在最後一天或最後第三天上路,應該就比較不會塞車了。」

在這個由千萬人組成的塞車賽局中,每個人在安排行程時,因為看不到其他人的選擇,只能用猜的,因此雖然大家最後所選的回程時間不是同一天,但是在賽局用語裡,這算是「同時行動」,屬於靜態賽局。

面對靜態賽局時,要如何找出最佳決策?如果是像猜拳賽局般,那麼參與者的最佳決策自然只有一個,就是出剪刀、石頭或布的機會各三分之一的這個隨機策略,最終得出公平的勝負均衡結果,因為每個參與者輸贏的機會都一樣。

善用報酬矩陣,思考如何選擇

但是在現實生活中,並不是所有賽局都只有一個均衡策略,而且均衡的結果也不保證是公平的,以下就以「兩性戰爭」賽局為例說明。

一對雙方一見鍾情的忙碌單身貴族,正在考慮如何重新安排自己的周末活動,雙方都希望能利用每周僅有的外出機會遇到對方。假設男方過去習慣周末去看球賽,女方則是去逛街,在以兼顧擇偶與自己偏好的休閒活動為首要目標下,男女雙方該如何選擇未來最理想的周末活動?在這個兩性賽局裡,雙方有沒有可能像猜拳賽局那樣,能夠預測出均衡策略呢?而最後的均衡結果又會是公平的嗎?

Step1:畫出決策報酬矩陣架構

「如果不管別人怎麼做,都不會改變你的行為所帶來的報酬,那就不是賽局要討論的狀況了,」中央研究院經濟研究所助研究員梁孟玉指出。因此,在前述男女選擇周末活動的故事中,由於兩人從活動中獲得的快樂指數與對方的選擇息息相關,所以適合用賽局模型來分析。

為了分析這個狀況,在設計靜態賽局的報酬矩陣時,讓我們假設「兩人要遇在一起」才會有快樂指數,而各自去玩時,心情指數都是0分(如【圖1】)。

經理人 每日學管理 電子報 - 20150526 - 2

Step2:定出男方的行動報酬分數

對男方來說,最好的情況是,當他選擇看球賽時,女方也選擇看球賽,結果是看到了球賽也遇上了心愛的人,所以男方的心情指數設為10分;但如果女方跑去逛街,男方選擇看球賽,結果就是無心看球賽,心情指數盪到谷底(0分)。

同樣地,如果男方選擇逛街,女方卻選擇看球賽,男方的心情指數依然可設為0;但如果女方也選擇去逛街,雖然去逛街並不是男方原來想做的,但是因為遇到心愛的人,所以心情指數可給8分(如【圖2】)。

經理人 每日學管理 電子報 - 20150526 - 3

Step3:定出女方的行動報酬分數

再從女方的角度來看,如果女方為了遇到男方而選擇看球賽,但是因為女方對於看球賽並不感興趣,因此在球賽中遇到男方的心情指數只給8分;而如果女方去逛街時遇到男方,女方的心情指數就可達10分(如【圖3】)。
經理人 每日學管理 電子報 - 20150526 - 4

Step4:找出雙方的均衡策略

由上可知,從心情指數來看,在4種可能的結果中,對男方最好的結果就是一起去看球賽(看球賽10分>去逛街8分),對女方則是一起去逛街(去逛街10分>看球賽8分),但不論是看球賽或去逛街,只要能遇到對方,看球賽和去逛街這兩個決策,對兩人來說都可以是彼此的最佳決策。

經理人 每日學管理 電子報 - 20150526 - 5

對應對方決策,做出最佳反應

這種情況在學理上就叫做「納許均衡」(Nash Equilibrium),也就是當參賽者到達此決策組合時,任何一方都不想獨自改變決策,因為那樣只會讓自己的報酬更低。

從另一個角度來說,當每個參賽者都是在對應對方的決策之下,做出最佳的反應策略,則兩者的交集,就是納許均衡。

若利用賽局策略報酬矩陣圖來求納許均衡,那麼納許均衡就是在行動報酬的分數欄內,當兩個參賽者的報酬分數下都被畫上底線時所對應到的那個策略組合。例如在兩性賽局中,(108)對應到的納許均衡是「一起看球賽」,而(810)對應到的納許均衡則為「一起逛街」,而對參賽者而言,這兩個均衡結果都是不公平的(因為總是有一方的快樂指數較低)。

在這種情況下,假設雙方第一次周末碰面是在逛街時偶遇,若彼此都沒說破,在給定對方下周還是會去逛街的猜測下,為了要再相遇,每個周末「一起逛街」這個均衡就一直維持下去。

不過,因為這個賽局事實上是有兩個均衡落點,所以男方很容易會想要把彼此的周末活動均衡,移到對自己更有利的「一起看球賽」,而女方則不容易主動想改變「一起逛街」這個均衡點。

如果雙方都很清楚這個賽局均衡結果的來龍去脈,那麼當男方提出要「一起看球賽」時,溝通起來就不會產生無名的情緒反應,比較容易理性地協調出對男女雙方都公平的周末活動均衡共識。

比如說,這個周末約會看球賽、下星期的約會就去逛街,直到最後兩人天天在一起了,使得共度周末的舉動對彼此心情指數的影響力愈來愈低時,那麼各自回到原本最愛的周末活動,自然又變成雙方的最佳理性選擇。

賽局訓練的目的不在於針對各種狀況,提供標準答案,而是透過賽局模型和均衡分析,讓我們可以很快地了解一個均衡結果的來龍去脈,或是對未來必然的均衡落點做好心理準備。

有句話說:「給人一條魚,不如教他釣魚的方法。」了解賽局這套學問可以培養我們在做選擇時,先看清楚事物的全貌,透過預測分析各種狀況,選擇自己在該環境狀況下的最佳策略,這樣最後的均衡結果不管乍看之下是吃虧或占便宜,但是因為一切因果都已了然於心,也就不容易產生無謂的情緒反應。

審訂 / 梁孟玉博士(中央研究院經濟研究所助理研究員)
圖片來源/Jeffrey Pott via flickr, CC licensed





















沒有留言:

張貼留言