如何正確使用賽局理論來推導「防疫策略」？／Vivian Fang

Mar 18, 2020

最近疫情肆虐，各國因應方法不一；有些靠經驗、有些靠佛心，但也有人試圖用學術方法，推導出合理的、將損害壓到最低的策略。「賽局理論」也是這些學術方法之一，但遺憾的是，部分相關的論述方式並不準確。

筆者忝為教授賽局理論的老師，就以本文來說明一下在這個題目上的應用方式、以及為什麼「謹慎防疫」應該是目前最適合台灣的策略。

以賽局理論看防疫策略

在某篇日前被廣傳的「以賽局理論分析防疫」文章中、以及一些其他類似作品中，都有個很大的問題，就是將賽局中的「策略」（strategy）和可能的「結果」（outcome）混為一談，而這兩者其實是完全不同的概念。

事實上，在筆者以賽局矩陣表（payoff matrix）解釋該文的數字設計、並以賽局理論工具正確推導出來的結論，竟然跟該文想表達的論點恰恰相反。

賽局中的「策略」和「結果」是完全不同的概念。

例如該文提到「全面防堵或是全面減災都是辦不到的事」，但用它的賽局架構推導出來的結論，跟這句話竟然是自相矛盾的。

由於這篇推導有問題的文章受到廣傳，所以或許讀者對賽局理論是有興趣的，所以筆者寫下這篇文章，說明賽局理論的適當應用方式、以及比較正確的觀念。

在本文中，筆者會以武漢肺炎（新冠肺炎、COVID-19）防疫時事為題目，以賽局理論架構中的「賽局矩陣表」（game matrix）架構及工具，來拆解目前面對防疫局勢的策略。

賽局理論入門

先來談談賽局入門（熟悉的人不妨跳過）。賽局的基本要素包括：

玩家（player）：玩家必須多於一人，兩人才能成局的概念。
策略（strategy）：指的是在所有可能發生情況下的一套完整行動計畫；這完全決定了玩家的行為。
得失/支付（Payoffs）：「得失」指的是賽局裡玩家在每個可能的行動的「得」與「失」；簡單來說，可以想成玩遊戲裡的「得分」。由於這個「得失」取決於對手玩家的策略，學術上一般以支付（payoffs）的函數來計算。
最佳反應（Best Respond，以下簡稱BR）：針對「對手玩家」的某一策略，能帶給此玩家最佳「得失」（payoff）結果的策略，就是「最佳反應」。換個角度想，最佳反應（BR）問的就是：「當對手出某一招時，你出哪一招才能才會高分？」
均衡（Equilibrium）：均衡就是平衡，也是最終的賽局結果。在賽局裡一般簡單的均衡指的是「納許平衡」（Nash Equilibrium）。

防疫策略賽局

好，介紹完基本因素之後，現在進入正題，來談談防疫策略的各種計算條件。

假設：

兩位玩家：A國與B國；
兩個策略：「封鎖」（Lock-down）或「防疫」（Containment，也就是不封鎖，但在必要時管制特定行為）；
兩位玩家在下列條件上都有相似背景：醫療資源、人文、政治態勢、經濟體系及規模，而且目前皆處在「未爆發重度社區感染」的狀態；

另外還包括兩個假設：

4. 採取「封鎖」策略時的得分：

如兩位玩家都同時採取「封鎖」策略，成本為80，得分為-80分（因為是負面結果，所以分數為負分）；
如果單方採取「封鎖」策略，因為封鎖的一方必須加派人員，防止對方人員入境，所以成本為100、得分為-100分。

5. 採取「防疫」策略的得分：

如果兩位玩家同時採取「防疫」策略，成本為40，得分為-40分；
如果單方採取「防疫」策略，因為還得加派醫療人員，協助追蹤境外移入感染，所以成本為60，得分為-60分

從上述的得分設計，可以看出此賽局假設中的「防疫」成本比「封鎖」低。

當然，「防疫」策略對醫療體系造成的衝擊、以及社會成本也都很高；但畢竟「封鎖」的先期成本（軍方、官方、海關等）相對高，更不用說可能造成的恐慌效應，以及企業、勞工等其他社會成本了。

所以，將「封鎖」成本設定得比較高，應該是合理的假設。

賽局矩陣

此賽局有2位玩家、雙方有2個可選用的策略，所以共有 4個可能發生的結果（outcome）；而賽局矩陣（game matrix），就是將玩家的得分（payoffs）放入一個2x2的表格，如表一示意。

玩家的得分（payoff）讀法是，每一格的左邊數字代表國家A的分數，右邊的是國家B的分數，如表右上標示的定義。

那麼，就讓我們用賽局矩陣的小技巧，來拆解國家A的最佳反應（BR）：當國家B採取「封鎖」策略時，請看表二的左欄中，圖示的綠色箭頭處：

從表二可知：國家A採取「封鎖」策略的得分為-80，採「防疫」策略的得分為-60；而因為-60大於-80，所以當國家B採用「封鎖」策略時，國家A的最佳反應應該是「防疫」。

在賽局矩陣中，將高分數字圈起來就代表是最佳反應分數，如表三中的綠圈：

而如果國家B採「防疫」策略，則請看表格中的右欄。用同樣計算方法，在表四中可以看到-40大於-100，所以國家A的最佳反應一樣是「防疫」。所以我們將把最高分圈起來，如表四右邊的綠色圓圈：

這邊先再介紹一個賽局新名詞「優勢策略」（dominant strategy）：不管對手出哪一招，只要玩家出這招都可以拿高分，就叫做優勢策略。

而由於不論國家B採哪個策略，國家A都是「防疫」分數高，所以「防疫」就是國家A的優勢策略。

依照同樣的方法來分析國家B的策略，這邊就不重複過程了；結果如表五所示：

用紫色圈出來的，就是國家B的最佳反應；從圖中不難發現，國家B的優勢策略一樣也是採取「防疫」措施。

畫圈圈這個賽局技巧，是用來幫助尋找均衡點；當矩陣裡每位玩家的最佳得分都被圈出來，就代表找到了賽局終點。

當有個「可能的賽局結局」（possible outcome）是雙方都獲得最佳反應時，賽局就找到了稱為「納許均衡」的平衡點，也就是雙方都應該理性採取「防疫」策略。

結論：兩國都應該採「防疫」策略，而非「封鎖」策略。

結語

當然，上述的賽局模型簡化了很多其他可變的因素及參數，也假設了政府有能力追蹤每一位入境者的旅遊史和感染史，而且醫療體系也尚足夠應付。

此賽局也只探討靜態（static game），實際上這些情勢隨時在變化，應該是動態賽局（dynamic game）；不過，這個簡單的賽局分析結論，剛好呼應了台灣當局目前的策略。

在社區疫情未大爆發前，應該採取的是「防疫」策略；包括審慎查詢每一位確診案例染症來源、追蹤確症個案接觸人士、謝絕疫情嚴重區之入境、並加強自疫區返國人士的自我居家管理，以隔離患者、杜絕傳染。

如果是未染症的國人，則最好能勤於洗手、出入人多場合時戴口罩、延緩舉辦大型活動、減少外出等等，透過這些措施來自我保護，應該相對比「全面封鎖」來得理智。

上述的賽局理論分析，也說明了對台灣而言，現階段「嚴謹防疫」應該是目前最理想的策略。

參考閱讀

〈逃之夭夭〉：此篇談及「策略」、「possible worlds」等面向。
〈又毀了？〉：此篇談的是賽局的結果（outcome）。
〈Just Do It (JDI)-1 〉：此篇針對最佳回應（Best Respond）提供了介紹及案例。

Discussion about this post

No posts

#nojs-banner { position: fixed; bottom: 0; left: 0; padding: 16px 16px 16px 32px; width: 100%; box-sizing: border-box; background: red; color: white; font-family: -apple-system, "Segoe UI", Roboto, Helvetica, Arial, sans-serif, "Apple Color Emoji", "Segoe UI Emoji", "Segoe UI Symbol"; font-size: 13px; line-height: 13px; } #nojs-banner a { color: inherit; text-decoration: underline; } This site requires JavaScript to run correctly. Please turn on JavaScript or unblock scripts