博弈论

维基百科，自由的百科全书

博弈论(Game Theory)，有时也称为对策论，或者赛局理论，应用数学的一个分支, 目前在生物学，经济学，国际关系，计算机科学, 政治学，军事战略和其他很多学科都有广泛的应用。主要研究公式化了的激励结构（游戏或者博弈（Game)）间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。表面上不同的相互作用可能表现出相似的激励结构(incentive structure)，所以他们是同一个游戏的特例。其中一個有名有趣的應用例子是囚徒困境悖論(Prisoner's dilemma)。

具有竞争或对抗性质的行为成为博弈行为。在这类行为中，参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益，各方必须考虑对手的各种可能的行动方案，并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋，打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案，以及如何找到这个合理的行为方案的数学理论和方法。

生物学家使用博弈理论来理解和预测进化（论）的某些结果。例如，John Maynard Smith 和George R. Price 在1973年发表于Nature上的论文中提出的“evolutionarily stable strategy”的这个概念就是使用了博弈理论。还可以参见进化博弈理论（evolutionary game theory）和行为生态学（behavioral ecology）。

博弈论也应用于数学的其他分支，如概率，统计和线性规划等。

[编辑] 数学定义

对于“博弈”(game)有不少可以互换的定义。这里给出简短的介绍和相互关系的说明。

[编辑] 正则形式的博弈(Normal form game)

设定 $N$ 是一个“游戏者”(players)的集合。对于每一个“游戏者” $i \in \mathrm{N}$ 都有一个给定的“策略”集合 $\Sigma\ ^i$ . 博弈（游戏）是一个函数，定义为:

$\pi\ : \prod_{i\in \mathrm{N}} \Sigma\ ^i \to \mathbb{R}^\mathrm{N}$

也就是说，如果我们知道了游戏者的策略集合是什么，那么就可以有一个实数值与之对应。我们可以把上面的方程拆成两个方程来进一步把它一般化。一个方程是正则形式(Normal form game)的博弈方程，描述策略规定结果的方式。另外一个方程描写游戏者对于结果(outcome)集合的偏爱(preference)。也就是：

$\pi\ : \prod_{i \in \mathrm{N}} \Sigma\ ^i \to \Gamma\$

这里 $\Gamma\$ 是游戏（博弈）的结果集合(outcome set)。对于每一个游戏者 $i\in \mathrm{N}$ 都有一个偏爱函数( preference function)

$\nu\ ^i : \Gamma\ \to \mathbb{R}$ .

[编辑] 展开形式的博弈(Extensive form game)

(参见展开形式的博弈)(Extensive form game)

正则形式的定义为数学家们提供了“均衡”(equilibria)问题的研究一个容易使用的表达式。因为它避免了怎么计算“策略”的问题，也就是说游戏是怎么进行的问题。处理这类问题的一个比较方便的表达式，是展开形式的博弈。这个形式与组合博弈论关系密切。这个定义通过一个树的形式给定。在树的每一个节点（vertex), 不同的游戏者选择一个边(edge)。

[编辑] 简单游戏(Simple game)

[编辑] 博弈论简史

对于博弈论的研究，开始于策墨洛(Zermelo,1913)，波雷尔(Borel,1921)及冯·诺伊曼(von Neumann, 1928)，后来由冯·诺伊曼和奥斯卡·摩根斯坦(von Neumann and Morgenstern，1944，1947)首次对其系统化和形式化（参照Myerson, 1991）。随后约翰·福布斯·纳什(John Forbes Nash Jr., 1950, 1951)利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。

[编辑] 当代博弈论领军人物

约翰·福布斯·纳什、约翰·C·海萨尼，以及萊因哈德·澤爾騰。这三人同时因为他们对博弈论的突出贡献而获得1994年的瑞典銀行經濟學獎（也称诺贝尔经济学奖）。
罗伯特·J·奥曼、肯·宾摩尔、戴维·克瑞普斯，以及阿里尔·鲁宾斯坦。

[编辑] 博弈分类

博弈的分类根据不同的基准也有不同的分类。一般认为，博弈主要可以分为合作博弈和非合作博弈。它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。

从行为的时间序列性，博弈论进一步分为两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。通俗的理解："囚徒困境"就是同时决策的，属于静态博弈；而棋牌类游戏等决策或行动有先后次序的，属于动态博弈

按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息，在这种情况下进行的博弈就是不完全信息博弈。

目前经济学家们现在所谈的博弈论一般是指非合作博弈，由于合作博弈论比非合作博弈论复杂，在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈。与上述四种博弈相对应的均衡概念为：纳什均衡(Nash equilibrium)，子博弈精炼纳什均衡（subgame perfect Nash equilibrium），贝叶斯纳什均衡(Bayesian Nash equilibrium)，精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。

博弈论还又很多分类，比如：以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈；以表现形式也可以分为一般型（战略型）或者展开型，等等。

[编辑] 博弈论相关概念

纳什均衡
囚徒困境
重复博弈
大众定理
信息
帕累托最优

[编辑] 参考书目

Harold W. K.(editor), 1997, Classics in Game theory, Princeton, NJ:Princeton University Press ISBN 0691011931
Myerson, R., 1991, Game Theory: Analysis of Conflict. Cambridge and London: Harvard University Press.
Osborne, M. and A. Rubinstein，1994，A Course in Game Theory, Cambridge and London: The MIT Press.
岡田章,1996,『ゲーム理論』東京：有斐閣 ISBN 4641067945
Axelrod, Robert: The Evolution of Cooperation, 1985, ISBN 0465021212
Axelrod, Robert: The Complexity of Cooperation - Agent-Based Models of Competition and Collaboration, 1997, ISBN 0691015678
Dixit, Avinash K./ Skeath, Susan: Games of Strategy, 1999, ISBN 0393974219
Eigen, Manfred / Winkler, Ruthild: Das Spiel, 1976, ISBN 3492021514
Hargreaves Heap, Shaun P. / Varoufakis, Yanis: Game Theory - A Critical Text, 2004, ISBN 0415250951
Kelly, Anthony: Decision Making Using Game Theory - An Introduction for Managers, 2003, ISBN 0521814626
Schlee, Welter: Einführung in die Spieltheorie, 2004, ISBN 3528032146