しっぺ返し戦略

しっぺ返し戦略とは

しっぺ返し戦略（Tit for Tat, TFT）とは、繰り返し囚人のジレンマにおいて最も有効とされる行動戦略の一つである。最初は協力し、それ以降は相手が前回取った行動をそのまま模倣する、という極めてシンプルなルールで動く。

囚人のジレンマとは、両者が協力すれば双方に利益があるにもかかわらず、相手を裏切ることによる一時的利益の誘惑と相手に裏切られることへの恐れから、合理的な個人が協力できない状況を指す。この一回限りのジレンマを「繰り返し」に延長すると状況は一変する。

歴史的背景：アクセルロッドのトーナメント

1980年に政治学者のロバート・アクセルロッドは独創的なコンピュータ・トーナメントを開催した。様々な分野の研究者に繰り返し囚人のジレンマのための戦略プログラムを提出させ、総当たり戦を行った。

優勝したのは、心理学者アナトール・ラポポートが提出したわずか4行のプログラム――しっぺ返し戦略だった。複雑な条件分岐を持つ精巧な戦略を打ち破り、最もシンプルな戦略が最高得点を獲得した。

さらにアクセルロッドはこの結果を公開した上で第二回トーナメントを開催した。参加者はしっぺ返しの優秀さを知っていた。それでもしっぺ返しは再び優勝した。

利己的な遺伝子でリチャード・ドーキンスがこの結果を一般向けに紹介し、進化生物学における協力の起源という問題との接続を示した。

しっぺ返し戦略のメカニズム

しっぺ返しの成功の理由として、アクセルロッドは四つの特性を挙げた：

親切さ（niceness）: 先に裏切らない。無意味な対立を自ら開始しない。

報復性（provocability）: 裏切られたらすぐに報復する。なめられることを防ぐ。

寛大さ（forgiveness）: 報復は一回だけで終わり、相手が協力に戻れば自分も戻る。憎しみを引きずらない。

明確さ（clarity）: ルールが単純で相手に理解されやすい。相手がパターンを読んで協力を選びやすくなる。

生物学的な文脈では、互恵的利他主義の具体的な実行プログラムとしてしっぺ返しが機能する。「助けた者は助けてもらい、裏切った者は裏切られる」という互恵の論理をシンプルに体現している。

進化的に安定な戦略としてのしっぺ返しは、ただし純粋なESSではない。常に裏切る戦略（AlwaysDefect）の集団に侵入することはできないが、しっぺ返しの集団はいったん形成されれば内部崩壊に対して安定する。

他概念との関係

延長された表現型の観点からは、しっぺ返し戦略は遺伝子が生物の行動として表現された形と捉えられる。協力行動を制御する遺伝子が集団内に広まるための条件として、しっぺ返しの論理が機能する。

道徳哲学との接続も深い。カントの定言命法「普遍化可能な格率に従え」は、しっぺ返し戦略の「協力を先行させる」という原則と共鳴する部分がある。また功利主義的観点からは、しっぺ返しが長期的に最大の利益をもたらす戦略として正当化できる。

現代への示唆

アクセルロッドの発見から数十年が経過し、しっぺ返し戦略の限界も明らかになっている。相手の行動を誤認識しやすい（ノイズのある）環境では、一回の誤解が報復の連鎖を生み出す「復讐の螺旋」に陥りやすい。このため「気前のよいしっぺ返し（Generous TFT）」や「Win-Stay, Lose-Shift」のような改良戦略が提案されている。

現代社会への応用として、外交政策・ビジネス交渉・労使関係・環境協定など、繰り返しの相互作用が存在する場面においてしっぺ返しの論理は示唆を与え続けている。「先に協力し、裏切りには報復し、しかし許しを忘れない」という原則は、人間の協力関係を設計する際の根本的な指針となりうる。

核抑止論における「相互確証破壊（MAD）」は、しっぺ返し論理の極端な形として理解できる。また企業間の協調・競争のダイナミクス、SNSにおける情報拡散と反応パターンにも、しっぺ返しの論理は顔を出す。シンプルなルールが複雑な社会現象を支配するという事実は、進化ゲーム理論の最も重要な発見の一つである。

しっぺ返し戦略

しっぺ返し戦略とは

歴史的背景：アクセルロッドのトーナメント

しっぺ返し戦略のメカニズム

他概念との関係

現代への示唆

概念ネットワーク

この概念を扱う本(1冊)

関連する概念