協力して高い値段で売るか、裏切って安い値段で売るか
あなたがあるイベントで、たこ焼きの屋台を出すことになった。そのイベントではたこ焼きの屋台が2台出る。売れる数は全部で400箱。たこ焼き1箱の原価は100円、諸経費は売り上げに関わらず2万円だ。
そこであなたは考える。
「2人で協力して同じ400円にしたら、だいたい半々の200個ずつ売れるとして、
1箱当たりの利益300円(売価400円-原価100円)×200個-諸経費20,000円=利益40,000円 か。まあ悪くないな」と。
しかし、こう考えるかもしれない。
「ちょっと待てよ。自分だけ出し抜いて300円に値下げしたら、売り上げを総取りできるな。
1箱当たりの利益200円(売価300円-原価100円)×400個-諸経費20,000円=利益60,000円 か。よしよし。
相手はまったく売れなくて諸経費2万円の赤字になるけどしょうがないな」
だけれども相手だって負けてはいない。
「あいつは協力すると言いながら、裏切って値下げしようと考えているに違いない。そう出た時のために俺も値下げしたおいた方が損をしなくてすむな。よし300円で売るぞ」
かくして両方が値下げした場合、次のようになる。
1箱当たりの利益200円(売価300円-原価100円)×200個-諸経費20,000=利益20,000円
2人とも400円で売っておけばその倍の利益が上がったのに、結局その半分の利益に留まるという、残念な結果となったのである。
駆け引きや交渉の戦略を考える理論
これは帝京大学霞ヶ関キャンパス開催の公開講座『ピンチを乗り越えるゲーム理論』の一幕だ。講師は帝京大学文学部社会学科教授の大浦宏邦先生である。
『ゲーム理論』というと、テレビゲームやスマホゲームを作る際のロジックのように受け止められがちだが、それとはまったく違い、一言でいえば人間の駆け引きを数学を使って分析し表現するものだ。
社会の中で生きていると、様々なシーンで駆け引きや交渉、戦略が必要になる。たとえば恋愛やスポーツ、取引先との交渉、そして上に挙げたような商品の料金設定。国家レベルで見れば、紛争や戦争をどう回避しながら自国の利益を守るか、という問題が今もそこらじゅうで起きている。
そうした時に役立つのが、ゲーム理論だ。ゲーム理論では〈プレイヤー〉〈戦略〉〈利得〉という3つの要素により物事を単純化して考える。そのために作られるのが〈利得表〉だ。では冒頭にあげたタコ焼き価格問題の〈利得表〉を作ってみよう。
損を恐れて動けない、それがナッシュ均衡
たこ焼き価格問題では、〈プレイヤー〉は自分と相手の2人、〈戦術〉は400円にするか300円にするか、そして得られる利益が〈利得〉である。その〈利得表〉は以下のようになる。(本来の利得表よりやや丁寧な記述にしています)
自分\相手 | 相手400円 | 相手300円 |
自分400円 | 自分 4万円 相手 4万円 |
自分 -2万円 相手 6万円 |
自分300円 | 自分 6万円 相手 -2万円 |
自分 2万円 相手 2万円 |
このような状況で、相手はきっと裏切るに違いない、その時自分は損をしたくないと合理的に考えてリスクを回避しようとすると、そこから抜け出せない膠着状態に陥る。それが〈ナッシュ均衡〉だ。
上であれば、自分が400円に戻しても相手が300円で売り続けたら2万円の損となる、それなら2万円でも利益出した方がいいと考えて、互いに300円で売る、そこが〈ナッシュ均衡〉になる。
もし、自分の利益のみではなく、自分と相手の利益の総和を考えた時、お互いに信頼しあえば全体として8万円の利益となるのだが、なかなかそうはならない。
つまり、個人が合理的に考えた結果が、必ずしも全体として見たときに利益の最大化をもたらすとは限らないのだ。
決して良い結果とはならない〈囚人のジレンマ〉
これが〈囚人のジレンマ〉といわれる状態だ。
2人の囚人がいる。2人とも黙秘すれば両者ともに2年の刑で済むが、どちらかが自白すれば自白した者は1年に減刑され、自白しなかった者は15年の刑となる。もし両者ともに自白した場合は10年の刑となる。
どう考えても協力したほうが得だが、そうはならない。相手が裏切った時、自分が損をするからだ。そこで両方とも自白して双方10年の刑を選んでしまうのである。
このように世の中はジレンマだらけだ。ではどうしたらこのジレンマから脱出することができるのだろうか。
そこで大浦先生は、米国の政治学者ロバート・アクセルロッド(1943-)が行った、〈協力〉と〈裏切り〉のシミュレーションを紹介した。
〈囚人のジレンマ〉ゲームを繰り返し行ったとき、どのような戦略が最も多くの利得をもたらすか、世界中の学者から戦略を募集して総当たりトーナメントで対戦させたのだという。
『繰り返し囚人のジレンマゲーム』で優勝した戦略は
アクセルロッドが募集した『繰り返し囚人のジレンマゲーム』には、全部で15の戦略が寄せられた。その中で主だった戦略を以下に挙げる。
〇最初は協力するが、相手が一回でも裏切ったら、永久に非協力。『フリードマン戦略』
〇最初は協力するが、時々裏切って利益の食い逃げし、また協力に戻ったりを繰り返す。『ヨッス戦略』
〇最初は協力するが、相手が裏切ったら次に自分も裏切り、相手が協力に戻したら自分も協力に戻す。『しっぺ返し戦略』
〇相手が協力的か裏切るか、つまり相手の協力確率を予測して対応を考える。『ダウニング戦略』
これらの戦略に、協力と裏切りをランダムに出す『でたらめ戦略』を加えて全部で16の戦略で総当たりトーナメントが行われた。
結果、優勝したのは『しっぺ返し戦略』だった。
冒頭のタコ焼き価格問題に当てはめれば、イベントが週イチで永遠に繰り返されるとして、最初は400円にし、相手が400円を続けたら永遠に400円とする。もし相手が300円に下げてきたら、翌週は自分も300円で対抗するが、相手が400円に戻して来たらその翌週は自分も400円に戻すという形だ。
ちなみに他の戦略の順位だが、『フリードマン戦略』は7位、『ダウニング戦略』は10位、『ヨッス戦略』は12位、『でたらめ戦略』は最下位だったという。
キーワードは『上品』『短気』『寛容』
アクセルロッドはこの結果を明らかにしたうえで、2回目のシミュレーションを実施した。新たに加わった戦略は、2回裏切られたら非協力として、相手が協力に戻すと協力する『堪忍袋戦略』、最初に裏切ってあとはしっぺ返しをする『試し屋戦略』、協力が安定したらふいに裏切る『精神安定剤戦略』など。これらの63戦略に、『でたらめ戦略』を加えた全64戦略で実施された。
結果は『しっぺ返し戦略』が2連覇を達成した。なぜこの戦略が優勝したのだろうか。大浦先生によれば、この戦略が最も協力することのリスクを減らせる戦略だからだという。
得点が上位の戦略を分析した結果、次の3つのキーワードが見出された。それが、『上品』『短気』『寛容』だ。
『上品』は、自分からは裏切らないことで裏切りの連鎖を招かない、ということ。『短気』は、裏切られたら機敏に反応する、ということ。そして『寛容』は裏切った相手が協力してきたら即座に許す、ということだ。
たとえば『フリードマン戦略』は上品で短気ではあるが不寛容であり、『ダウニング戦略』や『ヨッス戦略』は自ら裏切るため下品とされた。
つまり、できるだけ他者と協力し、他者が裏切ったら即座に懲罰を与えるが、他者が謝ってきたら許して、また協力体制へと戻る。この3つを兼ね備えた『しっぺ返し戦略』が最も優れた戦略だったのだ。
知るだけで頭の中のもやが払われるようなゲーム理論だが、さらに大浦先生は、この理論は人間関係にも応用できるという。これについては次回に。
(続く)
〔あわせて読みたい〕
エルサレムはどこの国のものか?池上彰が解説
自分が借金体質かどうかがわかる2つのクイズ
おおうら・ひろくに 帝京大学文学部社会学科教授
1962年生まれ。京都大学大学院理学研究科修士課程、同大文学部哲学科、同大大学院人間・環境学研究科博士課程を卒業。専門は数理社会学、進化ゲーム理論。著書に『人間行動に潜むジレンマ―自分勝手はやめられない?』(化学同人)『社会科学者のための進化ゲーム理論―基礎から応用まで』(勁草書房)等。
☆まなナビ☆は、各大学の公開講座が簡単に検索でき、公開講座の内容や講師インタビューが読めるサイトです。トップページの検索窓に大学名検索したいワードを入れたり、気になるワードを入れて検索したり、気になるジャンルをクリックすると、これから始まる講座が検索できます。
◆取材講座:『ピンチを乗り越えるゲーム理論-駆け引きと協力のシミュレーション-』(帝京大学霞ヶ関キャンパス)
取材・文・写真/まなナビ編集室(土肥元子)