博弈基本要素精品(七篇)

时间：2024-04-13 10:27:57

博弈基本要素

博弈基本要素篇(1)

关键词:博弈论;行为经济学;理性人;行为博弈论

中图分类号:F224.32 文献标志码:A 文章编号:1673-291X(2010)26-0277-02

一、博弈论的定义

博弈论是一门研究相互影响着的博弈参与者进行策略选择时的行为规律的科学。它研究:(1)存在若干博弈的参与者;(2)每一参与者有一系列可选择的策略;(3)博弈结果取决于参与者策略的组合;(4)参与者了解博弈局势预设的信息等。博弈包含四个要素:博弈的参与者、策略、可评价结果与信息结构。博弈论是研究博弈弈的参与者的理,博弈的参与者策略选择时的相互影响以及他们之间的利益冲突与吻合关系。博弈论研究利益冲突与吻合的,将特定经济问题纳入博弈四要素中以转化为待研究的博弈局势,然后加以分析解决。(1)将特定经济问题转化为博弈问题。(2)运用博弈理论方法得出博弈问题的解。(3)将博弈问题的结论转化回经济语言,同时与第一步中所省略的信息一起为原始经济问题提供解释。

二、标准博弈论的现状和缺陷

标准博弈论包括完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈和不完全信息动态博弈。尽管标准博弈论的发展就是不断放松一系列严格假定的过程,但它仍然存在一个重大的缺陷――严格的理性人假定。假定了现实行为主体能力以外的复杂思维过程,假设所有博弈参与者都符合三个条件:(1)策略思考,即在对其他参与者将如何行动的基础上形成信念;(2)最优化,即对于给定信念选择最优反应;(3)均衡,即参与者调整信念和最优反应至相互达成一致。但是,现实的博弈参与者并不都是经济理性的,并且,由于博弈参与者是相互影响的,即使只有极少数的博弈参与者违背经济理性,其他理性参与者的行为也会随之改变,理想化均衡也同样无法实现。因此,经济现实并不能满足标准博弈论对博弈参与者的假定条件。为了延伸博弈论对现实活动的解释,应该是有限理性的前提下重构标准博弈论。如果说,标准博弈论提供了有关经济理性的行为人如何行动的理论,那么,行为博弈论就试图探讨行为人如何在理想的经济理性和现实的有限理性之间进行折衷,以求达到准确解读有限理性的行为人在现实约束中如何行动的目的。作为研究不同条件下行为人如何进行互动决策的经济理论,博弈论应该尽可能准确地预言和解释经济现实活动;当经济现实和理论模型不一致时,研究者的工作方向就是改造模型,提高其实证效用。

标准博弈论在“经济理性”假设下分析博弈参与者如何在追求各自最优目标的同时实现均衡。但由于现实行为人是“有限理性”的,标准博弈论对实践的理解和指导受到限制。为了延伸博弈论对现实活动的解释,行为博弈论将实验经济学与标准博弈论相融合,在博弈实验的基础上,考察和解释标准理论推断和实验结果之间的差异,引入行为因素改进标准博弈的基本假定,重构博弈分析模型,以求达到准确解读有限理性的行为人在现实约束中如何行动的目的。

三、几种基本博弈的介绍及分析

1.投资博弈

投资博弈中有两位互不相识的参与人A和B。A得到一笔钱并被告知可以完全保留也可以将其中的任意比例投资于B,他给出的任何金额都会以大于1的某一倍数付给B,然后由B决定是否回报和回报多少给A。标准博弈论的均是:理性的B应该最大化他自身的利益,保留获得的所有支付,而理性的A会估计到B的策略,因此,不会投资于B,结果双方都得不到超额支付。

标准博弈论认为理性自利的人不会信任别人,但它忽略了人类是自利的,是高度社会化的动物,因此,标准博弈论的结论是:博弈中理性人的个人理导致机体的非理性,而行为博弈论的结论是:博弈中参与人的个人非理性但而导致机体的理性。

2.可置信威胁的议价博弈

它是讨价还价博弈中最简单的一种,即如果双方的交易成功就会有一定的利益,A出价,要求对方要么接受、要么拒绝,如果B接受,那么双方就按照A提出的分配比例瓜分利润,如果B拒绝,那么双方之间不会有交易行为。按照标准博弈论,这个博弈具有无穷多个纳什均衡。

但不少时候对应者宁愿牺牲自身的利益去惩罚那些未公平对待他们的出价者 ,这种报复性回报在社会领域表现得很明显,为了伤害对方不惜牺牲自己。人类当被欺侮时,反应机制会使人愤怒,因为愤怒在进化过程中是作为一种生存优势保留下来的。不同的文化观使人具有不同的公平标准,参与人有时并不在意分配比例是否公平,即使出价者只支付很少的金额对应者也愿意接受。议价博弈中的拒绝并不意味着参与人没有意识到标准博弈论中的最优策略,他们明白使自己经济利益最大化的策略是什么,只是因为情感或社会的因素使他们不再是传统经济学意义上最大化经济利益的理性人,在某些情况下,他们宁愿牺牲自己的经济利益以达到其他方面的满意。

3.协调博弈

在协调博弈中,参与人都希望自己的行动和其他参与人的行动取得某种一致。但是社会习俗、相互的交流、博弈呈现的不同方式、参与人曾有的类似经历以及自己的幸运数字都会影响均衡的形成。

4. 竞猜博弈

竞猜博弈指的是:让每个参与人去猜谁会是选美比赛中的最后得主,最后得主由所有参与人的平均看法决定,这时每个参与人既不是选择自己认为最漂亮的也不是选出所有人平均认为最漂亮的,而是要去思考所有参与人对平均看法的平均预期。因此,行为博弈论提出利用有限重复推理来理解参与人的初次选择,用认知的深化来解释参与人选择的变化。

5.总结分析

大量的实验研究为行为博弈论的提出提供了坚实的数据基础,行为博弈论并不是要否定标准博弈论,他们两者也并不矛盾。标准博弈论体现一种完美的策略分析过程,整个推理严谨周密,是由于经济理性人的假定使其缺乏可操作性,因为人类的目标不仅仅是经济利益最大化,而行为博弈论正是从这一点出发,将博弈论拉回到现实的框架中来,使其更真实,更人性化和社会化。

四、行为博弈的模型研究

行为博弈的模型的构建遵循精确性、一般性和实验规则的原则。它研究的基础数据都是经实验取得的。博弈实验对博弈预测的敏感因素进行了严格的控制,包括博弈参与者知道什么、什么时候行动、各自的支付是多少等等。博弈实验的关键在于通过实验控制来区别哪种理论更加有效,然后再使用该理论来进行一般事件的研究。行为博弈研究就是要在标准均衡概念失效的情况下,以实验控制为主要手段,以实验数据为基本依据,通过不断地试错与修正建立能够对博弈参与者的未来行为进行准确预测的理论。

行为博弈模型主要包括三方面内容:第一,在一次性博弈中,有限理性条件下,构建博弈参与者的思考模型,发展一个有限理性的指标系来衡量博弈参与者的思考步骤,并且使用一个参数来说明博弈参与者的异质性。与最优反应相联系,该指标系可以对任何一个一次性博弈中的行动进行了唯一的统计预测。第二,在思考模型的基础上,构造一个学习运算法则来估计博弈参与者的行为均衡路径。这一运算法则既包括了虚拟的博弈和强化模型,也具有很强的经验预测能力。因此,EWA可以作为经验性工具去寻求表现为初始函数形式的行为静止点。第三,提出如何将有限理性指标系和学习运算法则应用于分析重复博弈中的博弈参与者行为,为利用行为博弈论分析价格竞争、专利竞赛等现实经济活动奠定基础。

五、总结

标准博弈论对实践的理解和指导是有限制的。为了延伸博弈论对现实活动的解释,作为研究不同条件下行为人如何进行互动决策的经济理论,博弈论应该尽可能准确地预言和解释经济现实活动;当经济现实和理论模型不一致时,研究者的工作方向就是改造模型,提高其实证效用。这一思潮引致了行为博弈论的出现。行为博弈论将实验经济学与标准博弈论相融合,在博弈实验的基础上,考察和解释标准理论推断和实验结果之间的差异,引入行为因素改进标准博弈的基本假定,重构博弈分析模型,以求达到准确解读有限理性的行为人在现实约束中如何行动的目的。

行为博弈研究的起点就是进行博弈实验,将实验结果与标准博弈论的预测进行比较,并用不同方法分析差异存在的原因,为进一步构建正式模型提供现实依据。需要说明的是,行为博弈论并没有否定纳什均衡的意义,而是作为标准博弈论的延续,在有限理性的前提下深化了对博弈均衡的讨论,以更加贴近现实的研究视角对具有某种内生变动性的博弈均衡的存在方式和形成过程进行了新的思索。行为博弈论最重要的观点就是在大量实验数据的基础上提出利用有限重复推理来理解参与者的初次选择,利用认知和学习的深化来解释参与者选择的变化,而行为博弈正式模型则试图为上述观点提供完美的数理表达,提高理论的精确性和一般性。

参考文献:

[1] 阿克罗夫,乔治 A.宏观行为经济学和宏观经济行为[J].当代经济科学,2OO2,(5).

[2] Camerer,C…F Behavioral Game Theory:Experiment in Strategic Interaction[M].Princeton University Press,2003:11-20.

博弈基本要素篇(2)

引言

一、两个简单的例子

1.1 老鹰（Hawk）与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发，以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用，在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处，并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词：沉默互动；社会互动；进化稳定策略；模仿者动态；均衡分析法；局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用？为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现？为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率？诸如此类的问题，新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人（仅研究单个生产者或消费者的行为），不能把其所考察的问题放在一定的环境中去，该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响，单纯考察某个条件与结果之间的一一对应关系。因而，无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中，但依然没能跳出新古典均衡分析法的基本框架，并且由于其对理性赋予更强的假定，使得该理论更加脱离现实。进化博弈理论则一反常规，从一种全新的视角来考察经济及社会问题，它所提供的局部动态研究方法是从更现实的社会人出发，把其所考察的问题都置于一定的环境中进行更全面的分析，因而，其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论，该理论从其理论框架建立到现在仅仅只有近三十年的历史，但其在经济学、社会学、生态学等领域却得到了广泛的应用，近年来已经成为主流经济的研究方法之一。在我国由于历史原因，对经济学的研究起步较晚，特别对进化博弈这样的前沿理论更是知者甚少，本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用，让读者对该理论有一个全面的了解。

本文的结构如下：第一部分给出进化博弈理论的两个典型的例子；第二部分对进化博弈理论的产生及其发展进行阐述；第三部分对进化博弈理论的基本内容进行简要的介绍；第四部分概述进化博弈理论的有关应用；第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性；第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便，本文先给出进化博弈理论中两个具有代表性的例子，在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰（Hawk）与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物，它们为了生存需要争夺有限的资源（如食物或生存空间等）而竞争。老鹰一般比较凶悍，必要时在斗争中直到重伤。鸽子一般比较温驯，竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代，重伤者则不利于其后代生长，即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源，那么老鹰就会轻而易举地获得全部资源，而鸽子由于害怕强敌退出争夺，从而不能获得任何资源（当然不会受伤）；如果群体中两个鸽子相遇并竞争生存资源，由于它们均胆小怕事不愿意战斗，结果平分资源；如果群体中两个老鹰相遇并竞争有限的生存资源，由于它们都非常勇猛而相互残杀，直到双方受到重伤而精疲力竭，结果虽然双方都获得部分生存资源但损失惨重，入不敷出。假定竞争中得到全部资源为50个单位（该数字也可以表示为生物的适应度、繁殖成活率或后代数量）；得不到资源则表示其适应度为零；双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述，博弈的支付矩阵如下：

操作依赖于该群体的初始状态。如果初始时，该宿舍有多于4人使用操作系统，那么该宿舍所有学生最终都会使用该操作系统；否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新，该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架，它结合了生态学、社会学、心理学及经济学的最新发展成果，从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问，是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少，他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版，标志着新古典经济学的成形，马歇尔之后，新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与，也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题，强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的，为了更好地从微观个体行为来解释资源配置问题，新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而，理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力，当代伟大的哲学家康德在其著作《纯理性批判》一书中指出，人类理性即认知能力并不是万能的，而是有限的。经济学中的理性则是指一种行为方式，具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息，并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的，人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后，就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题，传统经济学家们从偏好，信念及理性三个方面来界定经济主体的特征，其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念，个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象，经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观，认为经济系统常常处于均衡状态，非均衡只是一种暂时的现象，当受到外生因素扰动而使系统偏离均衡状态时，系统会以线性的方式回归均衡，这种机械式线性反应的均衡观来源于牛顿力学，由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观，认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的，认为时间是可逆的，即经济变量与物理学的变量一样，只要条件相同系统的均衡也就相同，市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上，传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响，或者当一个因素的影响消除之后，下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的，各种因素之间不可能相互独立，系统中任何一个因素的变动都会引起其他因素的变动，这些因素之间相互作用的时间可能很短也可能很长，各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体，企图通过比较不同均衡来找出系统达到均衡的条件，因此得不出符合现实的结论，其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入，特别近来实验经济学的迅速发展，主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法，其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上，斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始，一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响，心理分析在经济学中的地位慢慢地被降低了；另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始，许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象，宏观经济学也把经验法则和适应性预期纳入到其模型之中，正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而，1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分，经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮，心理的研究方法在经济学界几乎无立足之地，严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期，随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章，如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases，1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk，慢慢消除了经济学界中存在的对心理学分析方法的偏见，此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中，心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s，随着经典博弈理论、生态理论及心理学理论研究的深入发展，特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖，极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动，并形成分散的非同质的知识，其中“感知秩序”是指人的理解力、知识和人类行动之间的关系；其次表现为个体通过学习所达到的理性程度的有限性，组织学习个体学习行为的整合而形成的多层次“理性结构”，个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用，在这个过程中，个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的，因为人类认知能力有着心理的临界极限，人类进行推理活动需要消耗大量的能量，推理也是一种相对稀缺的资源，另外决策者决策时需要大量的信息，而这些信息是不可能免费获得的，获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力，经济主体的决策行为并非总是最大化的结果，其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下，由于参与人无法免费获得决策所需要的全部信息，并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此，参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响，不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果，即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年，他与有着深厚数学及哲学背景的心理学家特韦尔斯基（Tversky）提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学，使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定，更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”，经济学直面现实。如何从有限理性出发来研究参与人的行为，许多经济学家对之进行了广泛而深入的研究并提出了许多理论，在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释，1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现，动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而，博弈论是研究完全理性的人类互动行为时提出来的，为什么能够解释根本无理性可言的动植物的进化现象呢？我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论，生态演化的结果却能够利用博弈理论来给予合理的解释，这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外，1960年代生态学理论研究取得突破性的进展，非合作博弈理论研究成果也不断涌现并日趋成熟，进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议，争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的，而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为，因此，借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出，越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功，利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此，利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件，那么参与人是如何作出决策的呢？进化博弈理论在处理有限理性参与人决策问题时，常常假定参与人遵循某种比贝叶斯法则更简单的行为规则，这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择，这样参与人只要知道什么会发生，而不必知道为什么会发生。

1970年代，生态学家Maynard Smith and Price（1973）结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略（Evolutionarily stable stragegy ESS），目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后，生态学家Taylor and Jonker（1978）在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态（Replicator Dynamics）。至此，进化博弈理论有了明确的研究目标。

1980年代以后，随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识，有限理性概念得到了学术界的普遍认可，加之进化博弈理论在解释生态现象时获得的巨大成功，特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议，正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展，并使之逐渐转化为描述经济行为的理论。目前，进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此，它仍然处于不断发展和完善的阶段，但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法，从而得到了越来越多的经济学家、社会学家、生态学家的重视，我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果，并以有限理性的参与人群体为研究对象，利用动态分析方法把影响参与人行为的各种因素纳入其模型之中，并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史，初看起来使人觉得奇怪，因为博弈论常常假定参与人是完全理性的，而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略，那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一，但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈，他们没有特定的博弈对手 ④。在这种情况下，参与人既可以通过自己的经验直接获得决策信息，也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息，还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说，观察群体行为的历史即估算群体分布是非常重要的，首先，群体分布包含了对手如何选择策略的信息。其次，通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰，模仿是学习过程中的一个重要组成部分，成功的行为不仅以说教的形式传递下来，而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的（Naive），其决策不是通过迅速的最优化计算得到，而是需要经历一个适应性的调整过程，在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此，系统均衡是达到均衡过程的函数，要更准确地描述参与人行为就必须考察经济系统的动态调整过程，动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究，在研究生态现象时，生态学家常常把同一个生态环境中所有种群看作一个大群体，由于生物的行为是由其基因唯一确定的，因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后，整个群体就相当于一个选择不同纯策略（纯策略集的数目就相当于群体中的种群数）的个体。群体中随机抽取的个体两两进行的都是对称博弈，有些文献中称这类模型为对称模型（Symmetry model）。严格地说，单群体时个体进行的并不是真正意义上的博弈，博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈，该生态环境中有两个种群老鹰与鸽子，它们代表两个不同的纯策略，用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略，此时的博弈并不是在随机抽取的两个个体之间进行，而是每个个体都观察群体状态（选择老鹰策略与鸽子策略个体数在群体中所占的比例），给定此状态它就可以计算自己选择不同策略所得的期望支付（严格地说这并不是期望支付，但为了说明的方便本文仍然借用该概念）进而确定选择哪一个策略不选择哪一个策略，对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的，他在传统单群体生态进化模型中通过引入角色限制行为（Role Conditioned Behavior）而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分，此时可以从大群体中区分出不同的小群体，群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈，有时又称之为非对称模型（Asymmetry model）。如果我们把系统选择博弈中的宿舍变成学校（整个学校相当于一个大群体）而把十个人变成十个班（每一个班看成是一个小群体，且同一班的同学无角色区分即与单群体情形一样），每个班的学生都有多种选择，此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进，由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论，这就说明在多群体博弈中，传统的进化稳定均衡概念就显示出其局限性了。同时，在模仿者动态下，同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的，进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势，因而，理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响，一般比较复杂，但该类模型却能够更准确地描述系统的行为，近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price（1973）及Maynard Smith(1974)在研究生态演化问题时提出来的，其直观思想是：如果一个群体（原群体）的行为模式能够消除任何小的突变群体，那么这种行为模式一定能够获得比突变群体高的支付，随着时间的演化突变者群体最后会从原群体中消失，原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态，此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price（1973）对进化稳定策略的定义（此后本文称之为原初定义），用符号表示如下：

说是进化稳定策略，如果，存在一个<，不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵；y表示突变策略；是一个与突变策略y有关的常数，称之为侵入边界（Invasion Barriers）；表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径，也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质，而落于吸引域范围之外是不考虑的，所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中，当该生态环境中只有老鹰（或只有鸽子）时，这时系统已经处于均衡状态，但它们都是不稳定的均衡，因为这两个均衡都可以被突变者侵入。开始时，假定该生态环境处于老鹰均衡，如果由于某种原因而进入鸽子时，那么随着时间的演化，整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态，即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为，当系统处于纯策略所表示的状态时，只要存在突变者系统就会离开这种状态，所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样，即当系统处于一半是老鹰一半是鸽子时，如果由于某种因素使得系统偏离该状态，那么系统会自动恢复到原来状态。另外，在系统选择博弈中突变者、侵入边界就更为明显，所谓突变者即是指选择进化稳定策略以外的策略者，且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡（），前一个均衡所对应的侵入边界就是，也就是说如果选择操作系统的学生数占群体总数的比例大于（即学生数大于4），那么选择操作系统的突变者就不可能侵入到该群体中，如果选择操作系统的学生数占群体总的比例小于（即学生数小于4），那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制，如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用，随着学术界对进化博弈理论研究的深入，许多理论家们从不同的角度对最初定义进行了拓展，如Selten 1980首次给出了适应于描述多群体均衡的定义；Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义；Foster and Young（1990）首次给出了适应于描述连续随机系统的均衡定义等等（有关对进化稳定策略进行拓展的讨论见文献[5]）。最初定义是在解释生态现象时提出来的，如果进行经济分析，时需要进行相应的改变。在分析生态现象时，把每一个种群的行为都程式化为一个策略，因此进化的结果将会是突变种群的消失（消失的原因在于生物的行为是由其遗传基因唯一确定的）。如果用于经济分析，那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略（因为人类可以通过学习、模仿等来改变自己所选择的策略）。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合，在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念，不能描述系统的动态性质，用数学语言来说它是动态系统的不动点，纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略，它是纳什均衡的精练，文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中，按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡，但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件，在某种程度上，较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究，该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制：选择机制(Selection Mechanism)和突变机制（Mutation mechanism）。选择机制是指本期中能够获得较高支付的策略，在下期被更多参与者选择；突变是指参与者以随机（无目的性）的方式选择策略，因此突变策略可能获得较高支付也可能获得较低支付，突变一般很少发生。新的突变也必须经过选择，并且只有获得较高支付的策略才能生存（Survive）下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究，由于他们考虑问题的角度不同，对群体行为调整过程的研究重点也就不同，因而提出了不同的动态模型，如Weibull(1995) 提出的模仿动态（Imitation Dynamics）模型，认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为；Börgers and Sarin(1995，1997)等提出并应用强化动态（Reinforcement Dynamics）来研究现实中参与人的学习过程；Skyrms (1986) 引入了意向动态（Deliberational Dynamics）模型对哲学中的理性问题进行了讨论；Swinkels(1993)提出了近似调整动态（Myopic Adjustment Dynamics）；Borgers and Sarin(1995)提出了刺激—反应动态（Stimulus-Response Dynamics）等等。到目前为止，在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态（Replicator Dynamics）。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker（1978）提出的模仿者动态的微分形式：

化的而且因素之间的互动作用也是需要时间的。因此，均衡只是一种暂时现象或者在多数情况下，系统根本不可能达到的现象，要更准确地考察参与人的行为就必须运用系统论的观点，把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中，经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国，对人类互动行为的研究至少可以追溯到三国时期田赛马的故事，但作为一种正式理论提出来，一般认为是始于冯·诺意曼和摩根斯藤（Von Neumann and O. Morgenstern, 1944）出版的《博弈论与经济行为》一书，直到纳什（Nash 1950）在研究非合作博弈的基础上提出著名的纳什均衡（Nash Equilibrium）概念才使得博弈论成为一门完整的理论。经过近五十年的发展，终于在1994年，三位杰出的博弈论大师：纳什（John F. Nash）、泽尔藤（Rechard Selten）和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖，在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角，使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具，其应用相当广泛。在信息经济学中得到了充分的应用，1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下，每一个人单独偏离均衡都不会变得比不偏离好，显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中，并认为现实中参与人不是孤立地作出自己的决策，每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息，而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先，博弈论中的互动是一种“沉默互动⑨ ”，这种互动不允许参与人之间存在任何形式的交流，即假定参与人都是一个个只会理性计算的孤立经济人而非社会人，一旦引入社会互动，许多博弈都无法进行分析，也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次，博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的，并且理性是共同知识，博弈时如果某一方选择了非理，那么博弈就无法进行下去。特别地该理论在利用后向归纳法（Backward Induction）对纳什均衡进行精练时，不但要求参与人完全理性，而且还要求参与人的行为满足序贯理性（Sequential Rationality）要求。这一比理性更强的要求使得博弈论更加远离现实人。再次，在处理参与人所面临的不确定性时，不仅要求各参与人知道世界的各种状态，而且要求参与人知道每一种状态所出现的概率，并且给定一个先念信念，当出现任何新信息时，每个参与人都能够应用贝叶斯法则修正自己的先念信念，也就是说参与人不但具有很强的计算、推理能力，而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下，参与人并不都具有这种计算、推理能力。最后，博弈论碰到了其最棘手的问题就是多重均衡的处理，当博弈出现多重均衡特别是多重严格纳什均衡时，尽管许多理论家提出了一些方法（Selten（1965）提出的子博弈精炼纳什均衡概念，Selten（1975）提出的颤抖手精练纳什均衡，Kerps—wilson(1982)提出的序贯均衡，Schelling（1960）提出的聚点均衡等）来处理多重均衡问题，但始终没能获得一致认可的结论。

与新古典经济学相比，经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系，但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架，这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素，依然认为影响因素与决策结果是一一对应的关系，依然没能把参与人所处社会环境等因素纳入到其模型之中，因而不能准确地描述现实中人的决策行为，其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果，从西蒙提出有限理性（Bounded Rationality）的参与人群体出发，通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟，实现了经济学研究方法革命性的突破。与传统均衡分析法相比，进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应，因而，经济系统是常常处于均衡状态的，分析参与人的行为只需要研究均衡结果，并以此来预测经济人的行为，通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响，使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定，直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中，认为经济系统达到均衡需要一个长期的渐进过程，均衡结果依赖于达到均衡的过程，也就是说任何一个结果都是路径依赖的，它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的，所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中，强调系统达到均衡的过程，并认为经济系统由于受到各种互动行为及互动因素的影响，有些系统达到均衡可能只需要很短的时间，有些系统达到均衡可能需要很长的时间，有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义，如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素，如果不考虑时间因素有些政策可能很有效率，但纳入时间因素，一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径，这样有利于决策者控制经济系统使之朝向既定的目标前进，也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素，使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡，然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件，即比较静态法，最后结合条件找出希望达到的均衡，因此，该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题，在老鹰与鸽子博弈中，尽管全是老鹰（全是鸽子）都是均衡的，但这两个均衡都极不稳定即都不是进化稳定均衡，一旦有鸽子（老鹰）突变者进入该系统就会使系统偏离，随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰（该均衡是一个全局吸引子）；在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡，局部动态法引入了突变因素就能够很好地解决了均衡选择问题，即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时，系统就会对其他的突变策略具有一定程度（即在突变边界内）的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为，并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难，因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈，在该博弈中两个囚徒都从个体理性出发，但得到了集体非理性均衡的结论。也就是说，均衡分析法根本无法实现从个体行为向集体行为的过渡，在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发，利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点，在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系，很巧妙地避开由个体行为向集体行为转化问题，因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论，它来源于对生态现象的研究，虽然该理论应用于经济分析的时间不长，但它为经济学研究提供了一个全新的分析方法，较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且，应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果，能够更加现实地解释经济现象，因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释： ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖，这样假定的意思就是说后代继承其母体的策略，并且永远不改变，当然用于研究人类的行为时，需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样，只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象，并且，在重复动态博弈中，后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念，然后，在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下，每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上，这与Selten提出的颤抖手均衡概念具有相似性，所谓颤抖手均衡是指一个战略组合，只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡，其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义，但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换，可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出，募捐者要求每一个人都自愿捐款，最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者，为了使得博弈能够分析下去，募捐者要求自愿捐款时每个人都不得与其他人讨论，否则该博弈就无法进行下去，因此，本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性，即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯（1999）：《博弈论平话》，中国经济出版社。

[2] 张维迎（1999）：《博弈论与信息经济学》，上海三联出版社。

[3] 张良桥，冯从文（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。

[4] 张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。

[5] 张良桥（2003）：《论进化稳定策略》，《经济评论》，2，70-74。

[6] 张良桥，郭立国（2003）：《论模仿者动态》，《中山大学学报自然科学版》，3。

[7] 杨小凯（2000）：《新兴古典经济学和超边际分析》，中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

博弈基本要素篇(3)

目前，当代大学生诚信缺失的表现主要集中在学习、经济、社会交往三个方面。在学习方面，大学生诚信缺失主要表现在考试作弊、论文抄袭、不尊重科学事实、臆造科学数据等方面，大学生考试作弊已成为当下大学校园发生频率较高的现象。在经济方面，拖欠助学贷款、恶意透支信用卡、拖欠学费、弄虚作假获取贫困生资格骗取国家助学金等现象时有发生，严重影响了大学生的经济诚信意识。在社会交往方面，存在着提供虚假信息获取求职岗位、求职签约后又随意毁约、网络交友及网络求职提供虚假信息等现象。这些诚信教育的缺失行为不仅冲击了当代大学素质教育的失效，也损害了大学生在社会价值体系中被赋予的较高的知识文化和道德标准的形象。如果在这一阶段诚信教育没有得到应有的提高和深化，那么在大学毕业进入社会以后，这不仅会加剧整个社会诚信体系的退化，也会潜移默化的影响着整个社会诚信的建设。

2博弈论视角的大学生诚信缺失行为分析

2.1诚信与失信的简单博弈分析

博弈论主要是用来解决主体之间的行为发生直接相互作用时候的决策，以及这种决策之间的均衡问题。为研究方便，本文选取了大学生申请助学贷款与银行放款这二者之间在诚信与失信方面的博弈分析，并在分析中做出了以下的假定：①本文只研究两个行为主体之间的诚信与失信的博弈，假定一方为大学生，另一方为银行，假定大学生和银行这两者都是“经济人”，以追求自身利益最大化为目标，并且不能控制对方的决策；②博弈的双方均为“理性人”，具有机会主义的倾向，即在双方博弈过程中，一方发现欺骗可以获利时，就会采取或选择欺骗策略；③博弈双方可以选择的策略为诚信或失信；④博弈双方的获益。采取诚信，大学生和银行双方都可以获益5；如果银行放款，大学生失信不还款，则大学生获益10；如果大学生诚信贷款，而银行失信不放款，则银行获益10；如果大学生选择不贷款，银行选择不放款，即双方均选择失信策略，这样助学贷款制度就失去意义，则双方的获益均为0。在上面的博弈矩阵表可以看出，表中策略组D为纳什均衡解，即大学生、银行双方都以自身利益为选择目标，其最终的选择结果有很大可能是“失信”，因为“失信”是能实现个体利益最大化的最优策略。之所以会出现这种结局，是基于信息不对称的角度双方博弈的结果，如果大学生选择贷款但是不还款，那么学生得到的效用最大，即得到了免费完成学习的机会成本，而银行损失最大，失去了放贷本金和利益以及可以投资在其他领域的沉没成本；而银行如果存在比给学生放款更有收益的项目，那么银行会选择不放款而转向其他，这样银行可以获取自身经济利益的最大化，学生损失最大，不能贷款助学，失去了完成学业的机会。但以上两种策略的选择都不是博弈的均衡点，必然无法达到稳定。实际上只有在学生不贷款，银行不放款的时候，即达到失信的纳什均衡，这样一来大学生助学贷款制度将毫无意义可言，如果这项制度取消了，最后损失最大的还是大学生。然而，经济博弈理论告诉我们，在非价格因素和博弈双方信息不对称的情况下，个体理选择的结果，往往是非理性的。上述例子说明，由于双方的理，导致了诚信的缺失和社会资源的浪费。

2.2诚信与失信的重复博弈分析

重复博弈是一种特殊的博弈，在博弈中，相同结构的博弈可以重复多次，甚至无限次。当博弈只进行一次时，每个参与人都只关心一次性的获益；如果博弈是重复多次的，参与人可能会为了长远利益而牺牲眼前利益，从而选择不同的均衡策略。因此，重复博弈的次数会影响博弈均衡的结果。在上述的分析中，之所以会出现这种失信的“囚徒困境”局面，最根本的原因在于双方所进行的是一次性的简单博弈，即大家所说的“一锤子买卖”。学生和银行双方都无法根据这一次的博弈结果再组织一次博弈、再做一次选择，基于此，博弈双方都只关心一次性的效益。但从动态博弈的过程来看，如果这种博弈是重复的、持续进行的，那么博弈的结果就会发生根本性的改变，诚信策略的纳什均衡就会成为双方博弈的必然结果。因为在动态博弈中，参与博弈的主体过去的行为都是可以看到或者查询到的，因此博弈中的一方可以通过这阶段博弈的选择，来回应博弈中另一方在上一阶段博弈中的失信行为。在诚信的动态博弈中，如果银行在上一次助学贷款的博弈选择中因采取放款的诚信策略，而大学生选择拖欠还款甚至不还款使银行利益收到损失，那么在本次的博弈过程中，银行必然会选择失信的策略来“报复”失信的大学生，比如将他（她）列为银行系统征信的黑名单，那么他（她）将面临银行以后所有的“报复”。在这里，银行所采取的策略被称为“以牙还牙”策略。基于此，为了更加长期、稳定获取各自的效用，博弈双方都会理性选择自己的行为，双方都会选择诚信，于是必然会出现诚信纳什均衡的博弈结果，由此可见，要想使诚信成为博弈双方的主动选择，其关键是要把一次性的简单博弈转化为重复博弈，从而达到双方共赢的目的。

3以重复博弈促进大学生诚信教育的探索

3.1增加博弈双方信息的对称性，将一次性的简单博弈有效转化为重复博弈。

现实生活中，由于信息的不对称、理性人的机会主义、利己主义等行为，因此博弈双方在博弈过程中出现失信的现象是在所难免的。在一次性的简单博弈中，由于博弈双方都无法根据这一次的博弈结果再进行一次博弈或再做一次选择，因此，博弈双方都只关心一次性的效用，那么选择失信策略是理性人的最佳选择。要想克服这种困境，必须将一次性的简单博弈转化为重复博弈。而将一次性的简单博弈转化为重复博弈的主要思路是要加强大学生诚信教育的认知，深刻认识重复博弈与诚信之间的关系。诚信是大学生应有的基本道德素养，但现实是接受过多年素质教育的大学生对诚信内涵的认知还是很模糊，很多人认为诚信已过时，加之受社会多元化思想的冲击，直接导致其诚信缺失行为的出现。其实主体间诚信关系的建立并非一蹴而就，这需要一个长期的选择、磨合、认同的过程，诚信是双方博弈的试金石，诚信关系的确立是双边的、动态的，任何一方的失信都可能导致诚信关系的中断。所以在大学生的诚信教育中，必定要将一次性的简单博弈转化为重复博弈，不能只顾眼前失信利益而忽视长期诚信利益。

3.2建立大学生诚信档案，畅通大学生诚信信息获取的渠道。

大学生诚信档案是一种写实的记录，主要用于对大学生在校期间的诚信情况进行真实描述，同时这种诚信的描述会起到一种客观评定的作用；同时大学生诚信档案也是一种特殊的教育，这种教育会及时发现问题，正视问题，纠正问题，对失信行为有一定的鞭策作用。学校应该将大学生的诚信档案纳入常态化管理，及时公布诚信档案，特别是面向社会公开，畅通社会获取大学生在校期间的诚信档案信息，如果诚信档案不公开，大学生诚信档案信息不能及时获知，这对于失信之人不能起到监督的作用，诚信之人不能起到标杆作用，“囚徒困境”的一次性简单博弈失信策略必然再抬头，那么制定大学生诚信档案也就失去了其应有的作用，所以大学生诚信信息应当及时公开，特别是要面向就业部门公开，并将考试作弊、学术不端、拖欠贷款等诚信缺失行为直接与就业联系起来，对有失信行为的学生暂缓或不予推荐就业，增加失信的一次性博弈成本，让失信之人无处遁形。3.3加大对诚信缺失行为的处罚力度，增加对失信行为处罚的可信性。在多元价值取向下，诚信如果被仅仅当成一种道德规范，很难要求所有人都遵守。在诚信的动态博弈中，若诚信收益与处罚机制不对称时，双方在博弈时基于个人利益必定会选择失信。在经济社会发达的当下，一个可信的处罚威胁是减少诚信缺失最有力的武器，从某种程度上而言，大学生之所以会出现诚信缺失的行为，有很大部分原因是由于高校对大学生失信行为的处罚力度还不够，因此，高校在大学生的诚信教育方面应加大对失信行为的处罚力度，比如针对考试作弊，给予取消考试成绩、记过、甚至取消学位等处分，让大学生意识到失信行为所付出的的巨大代价，并且这种代价要大于通过不诚信行为所获得的一次性博弈的收益。当成本大于收益时，博弈双方基于理性的角度，必定会选择诚信。

4结论

博弈基本要素篇(4)

一、引言

基础设施是社会经济发展的基础，对社会经济发展具有巨大拉动作用。随着经济的发展，社会对基础设施的需求也进一步增强。由于基础设施具有投资大、回收期长和收益率低等特点，加之固定资产具有巨额沉淀特性，基础设施领域投融资非常困难，这也严重影响了经济发展的速度。随着投融资制度改革的深入，触及社会最深层次的基础设施领域投融资制度改革也逐渐被提上议事日程。

演化博弈理论是演化生物学与经济学结合的产物，该理论认为生物可以通过试错的方法达到最终的博弈均衡。历史、制度和经济等因素以及均衡过程的某些细节均会对博弈的多重均衡选择产生影响。 smith和 price1973年在开创性论文中提出了演化稳定策略（evolutionary stable strategy，ess）的概念，标志演化博弈理论的产生。演化博弈理论的基本思想是通过体制内的群体抵抗体制外群体侵入的一种复制动态过程，对不同群体演化博弈进行分析，找出影响制度演化方向的关键因素，再对这些因素进行分析，调整相应的应对策略，最终实现制度动态合理发展。因此，演化博弈适用于存在利益冲突的决策分析过程。

在基础设施投融资制度变迁过程中，一直存在国有资本和社会资本两种投融资群体，这两种群体之间的合作关系直接受到政府管制政策的影响。基础设施投融资制度演化是制度内外各相关群体动态博弈的互动过程，演化博弈模型可以有效地分析基础设施投融资制度变迁过程，揭示制度变迁影响因素并寻求最终达到稳定状态的路径。本文正是运用演化博弈模型来研究基础设施投融资制度的动态演化的过程，试图分析影响投融资制度变迁、稳定的因素，找出制度变迁的决定力量。

二、相关研究综述

世界银行 1994年将基础设施分为经济性基础设施和社会性基础设施，其中，交通运输、邮电通讯、能源等经济性基础设施直接参与生产过程，可以提高社会生产能力进而加快经济增长速度，而科教文卫等社会性基础设施有利于调整和优化经济结构、改善投资环境、巩固经济发展的基础［1］。

学者们围绕基础设施投融资政策环境和政策选择等问题进行了深入探讨。亚当·斯密在《国富论》中提出建设并维持某些公共事业及某些公共设施是政府的主要职能；20世纪 30年代，凯恩斯从理论层面论证了公共工程政策的必要性；20世纪 40年代，基础设施受到了发展经济学家的高度重视，被视为经济发展的前提条件；而内生经济增长理论认为基础设施投资等活动是经济长期增长的根本源泉，基础设施的外部性逐步成为研究的重点［2］。学者们发现政治环境对基础设施投融资具有重要影响。如 evans认为基础设施本身及其引致投资是最容易度量的“政绩”之一，有话语权的官员基于仕途发展的考虑，很容易进行政治性诱致的基础设施建设［3］；rauch发现文官制度的改革、政府任期时间的延长会激励政府将更多的资源投入到基础设施建设，政府提高基础设施投资的政策具有内生扩张倾向［4］；randolph指出较完善的政治制度会增加私人供给基础设施的可能性［5］；henisz认为政治环境和政府组织的差异是基础设施投资的重要决定因素，他通过对一百多个国家长达两个世纪的数据进行研究发现，政治环境是解释国家间基础设施投资差异的重要因素［6］；gwartney的研究表明完善的经济制度对基础设施边际产出的促进作用更加突出［7］；张军等人研究发现外商直接投资对地方政府竞相提供优良的基础设施具有激励作用［8］；banerjee和 sudeshna提出地方分权硬化了地方政府的预算约束，有利于提高基础设施投资效率，且地方分权增强了地方政府独立解决问题的能力，可促进各种投融资方式的出现［9］。

学者们采用了各种方法对基础设施投融资制度变迁进行研究。有学者采用相关性研究分析基础设施对经济的作用，如 aschauer通过检验基础设施投资对私人产出及全要素生产率的影响，发现基础设施投资减少可以解释美国生产率的下降［10］；shioji、esfahani和 ramirez、范九利与白暴力、郭庆旺与贾俊雪等学者均采用类似方法证实了基础设施建设对经济增长具有积极意义［11 14］。也有学者采用因果关系方法（主要是联立方程法、向量自回归、协整分析等方法）研究基础设施和经济发展关系，如demetriades和 mamuneas、calderón和 servén等学者［15 16］。还有学者采用贡献度方法研究基础设施对经济发展的贡献，如 romp和 de haan、刘生龙和胡鞍钢等学者［17 18］。纵观国内外研究成果，学者们多采用计量经济学模型对基础设施投融资进行实证分析，而较少从理论上研究，这也使基础设施投融资的理论研究深度不足，尤其缺乏对基础设施投融资政治环境影响的理论分析，这也制约了基础设施投融资的进一步发展。本文从演化博弈理论视角出发，研究政府管制政策对基础设施投融资制度的变化过程的影响，并以公用事业民营化为案例进行实例分析，探索基础设施投融资制度演化的决定因素。

三、演化博弈模型的构建

（一）基本假设

本文构建的演化博弈模型建立在以下基本假设基础上：（1）基础设施投融资制度中存在两个群体，分别为国有资本和社会资本；（2）两个群体都为理性的“经济人”，它们根据自身的成本收益来决定其行为；（3）两个群体分别有合作和不合作两种策略；（4）假设群体主要受政府管制影响，忽略其他因素影响；（5）为便于分析，政府的管制程度采用税率表示，税率越高则管制程度越高，反之越低①。

【①在《国务院关于鼓励和引导民间投资健康发展的若干意见》（简称“非公36条”）中政府鼓励和引导民间资本进入基础产业和基础设施领域，鼓励民间资本通过参股、控股、资产收购等多种形式参与基础设施相关企业经营。但“非公36条”主要是通过准入标准降低和优惠扶持政策来体现出放松管制，这使得博弈过程中的政府管制程度难以得到有效衡量。税率作为最直接的管制政策，可以用来体现管制程度，即用来表征政府管制从紧到松的政策变化过程，因此本文以税率作为管制程度变化的衡量指标有一定的合理性。

（二）动态重复博弈

基础设施投融资制度共经历了以下四个阶段：（a）国有资本直接投资经营，（b）国有资本投资市场化运营，（c）国有资本和社会资本共同投资市场经营，（d）社会资本投资市场化经营。在传统计划经济时代，基础设施投资融资主要是政府直接投资政府运营，随着市场经济的发展，市场力量逐步进入基础设施领域。基础设施投融资制度发展如图 1所示。

由于制度供给结构不合理、市场化进程限制、政府角色错位等原因，中国基础设施领域成为垄断竞争市场。在基础设施投融资过程中，博弈的双方地位存在不对等的情况，主要体现在信息不对等、政策待遇不对等等方面，在博弈过程中，由于存在信息不对称等情况，国有资本群体和社会资本群体处于一种不对称博弈状态，两个群体中的个体随机配对进行博弈，双方主要通过对博弈事件概率判断和策略选择来进行博弈。

在基础设施投融资制度变迁过程中，国有资本群体和社会资本群体有合作和不合作两种策略，国有资本选择合作的概率为 x，不合作的概率为1 － x，社会资本选择合作的概率为 y，不合作的概率为1－ y。基础设施投融资制度变迁的支付为 u，其方程为 u（c，r）＝x′ix＝ μi（ci，ri）－ μ0（c，r），其中 μ0，μi分别为投融资制度变迁前后的收益，c为投融资制度变迁成本，r为变迁个体产生的增值利润。当 μ＞ 0，此时投融资制度变迁的收益大于旧制度收益，即个体选择策略增长率为正，反之为负；当 μ ＝ 0时，投融资制度成本就等于投融资制度变迁收益，则制度变迁过程必然处在均衡状态，即渐进演化中的均衡状态。博弈双方的支付如表 1所示。

五、结论

本文构建基础设施投融资演化博弈模型，分析了国有资本和社会资本两个博弈主体在基础设施投融资制度变迁过程中的博弈过程，并以公用事业民营化改革为案例进行分析，发现政府管制政策对基础设施投融资制度的演化有着决定性作用。在基础设施投融资制度演化过程中，博弈双方的行为取决于博弈主体自身的收益，同时管制政策对博弈双方行为有重要影响，在不同的管制程度下，博弈双方会采用不同的对策，这会影响学习方向和演化速度，进而加速投融资制度的变迁和稳定演化。在内部原动力不变的情况下，如何提高政府的管制水平，促进基础设施投融资制度变迁和稳定是政府管制政策的重要研究方向。

政府管制政策对基础设施投融资制度变迁具有举足轻重的作用，直接影响和决定着基础设施投融资制度演化方向，这在我国基础设施投融资制度发展和演化历史中体现得尤为突础。基于此，本文研究的政策启示在于：（1）由于基础设施的固有特征和政府管制的作用，政府制定管制政策时，必须根据基础设施投融资制度的现状和现实社会的需求，树立引导基础设施制度科学而合理演化的观念；（2）国有资本和社会资本作为基础设施投融资过程中的两种重要力量，对基础设施投融资制度演化具有重要影响，进而引导基础设施投融资制度演化，并最终达到均衡状态；（3）在政府管制政策中，税收仅仅是直接影响基础设施投融资制度博弈双方的重要手段之一，政府还可以综合运用其他手段，如行政许可、特许经营等方式，间接影响基础设施投融资制度，使其向政府和社会预期的目标演化。

参考文献：

［1］青木昌彦．比较制度分析［m］．周黎安，译．上海：上海远东出版社，2001：134136．

［2］盛昭瀚，蒋德鹏．演化经济学［m］．上海：上海三联书店，2002．

［3］王辰．基础产业融资论［m］．北京：中国人民大学出版社，1998．

［4］谢识予．经济博弈论［m］．上海：复旦大学出版社，2002．

［5］史普博 f d．管制与市场［m］．余晖，何帆，钱家骏，等译．上海：上海三联书店，1999．

［6］彭秀丽，陈柏福．矿业集群演化与区域协同发展［j］．吉首大学学报：社会科学版，2011（2）：9499．

［7］weibull j． evolutionary game theory［m］． cambridge， mass： mit press，1995．［8］samuelson． evolutionary games and equilibrium selection［m］． cambridge， mass： mit press，1997．

［9］friedman d． evolutionary game in economy［j］． econometrica，1991，59：637666．

［10］aoki m． organizational conventions and the gains from diversity： an evolution game approach［j］． industrial and corporate change，1998，7：399432．

［11］etsuro s． public capital and economic growth： a convergence approach［j］． journal of economic growth，2001，6：205227．

［12］esfahani h s， ramirez m t． institutions， infrastructure， and economic growth［j］． journal of development economics，2003，4：443477．

［13］范九利，白暴力，潘泉．基础设施资本与经济增长关系的研究文献综述［j］．上海经济研究，2004（1）：3643．

［14］郭庆旺，贾俊雪．政府公共资本投资的长期经济增长效应［j］．经济研究，2006（7）：2940．

［15］demetriades p o， mamuneas t p． intertemporal output and employment effects of public infrastructure capital： evidencefrom 12 oecd economies［j］． the economic journal，2000，7：687712．

［16］calderón c， servén l． the effects of infrastructure development on growth and income distribution［r］． bank policy re

search working paper，2004．

博弈基本要素篇(5)

关键词：超赔再保险；BS期权定价模型；动态博弈

中图分类号：F224 文献标识码：A 文章编号：1003-9031（2015）03-0009-07 DOI：10.3969/j.issn.1003-9031.2015.03.02

一、引言

再保险是指在投保人和保险人所建立的原保险合同的基础上，通过双方签订再保险合同的方式，原保险公司将其所承担的风险转移给再保险公司的过程。原保险公司为再保险合同的分出人，再保险公司为再保险合同的分入人。所以再保险也被称作“保险的保险”，美国保险信息协会的主席罗伯特・哈特维格甚至在金融危机后提出“保险公司是比银行更好的风险管理者”的观点，而再保险便是这个风险管理者最后的风险保障。如此重要的风险管理工具如何进行合理的定价成为了一个首要问题，分入的保费既要覆盖再保险人的成本，还需要留出合理的利润空间。

在传统的保险定价中，我们都是基于合同双方是理性人的设定，但是我们在基础的定价原理中看不到决策者双方的决策顺序，这其实是不符合保险在实务操作中的流程的。博弈论的出现有效的解决了这个问题，博弈论是研究多人决策的理论工具，它考虑了理性的行为人在给定的策略环境中如何采取行动以保证自己的效益最大化，并且是建立在考虑决策对手最优决策的前提下的。因此，本文在原有的再保险定价原理的基础上，通过结合期权和博弈论的理论优势对再保险进行定价，制定出符合双方效用最大化的定价方案。

二、研究现状

（一）关于再保险定价模型的研究现状

传统的原保险定价有以下几种方式，包括净保费原理即平衡原理、期望值原理和方差原理等，当然保险定价还有多种原理，但基本是在以上理论的基础上衍生出的。而再保险的定价没有非常统一的公式可以去遵循，典型的再保险定价公式为再保险保费=（1+附加保费率）×再保险公司分担的理赔额期望值，等同于原保险的期望值原理[1]。然而此种定价方式在粗略定价的同时，忽略了资金运作中的很多问题，比如再保险人在收取保费后并不是立即提供保险赔偿，而是在未来存在赔付的可能性，这段期间再保险人可以通过资本市场的运作，达到资金增值保值的目的，此种情况下上式的再保险保费明显被高估。同时随着金融市场的快速发展，保险的外延也在不断扩大，尤其是衍生品市场的崛起，保险有了新的内涵。1995年，美国芝加哥期货交易所正式推出财产索赔服务期权（Property Claim Service Option，简称PCS期权）[2]，开创了保险衍生产品的先河，自此人们也越来越多的关注保险的期权性质。

（二）关于期权博弈理论的研究现状

关于期权博弈的研究开创性的工作要归功于1993年Smets，他最先将博弈模型和实物期权结合起来，建立了不确定条件下的对称双寡头期权博弈模型[3]。1994年Dixit和Pindyck将Smets 模型进行了总结，分析了不完全竞争情况下的案例[4]。近些年国外研究中也出现了将期权博弈理论运用在保险领域的实例，但基本是以定性研究为主。国内许多学者在国外研究的基础上，对期权博弈理论模型进行了深化的研究。在2001年，安瑛晖、张维针对传统企业项目投资估价和决策理论方法中存在的问题，总结归纳出期权博弈方法的一般化分析框架[5]。2004年石善冲、张维提出了期权博弈投资战略分析的思路、基本框架和具体分析步骤，并指出了期权博弈领域研究中存在的问题和研究方向[6]。

该理论应用主要集中在战略和风险投资领域和房地产领域，在保险领域，2006年孙建胜将金融框架下的期权博弈理论运用到保险领域，但也停留在定性研究的阶段[7]。整体来看期权博弈模型的运用主要是在实物期权方面，在保险领域中的运用还比较少，近些年出现了运用期权博弈模型来研究原保险定价问题的一些模型研究，而在再保险定价方面的研究还非常少[8]。

三、期权动态博弈定价模型原理介绍

（一）期权特性在再保险中的运用

再保险同原保险的运作原理是一致的，都是由投保人向保险人支付保费，投保人通过保费的支付从而获得了在保险事故发生时向保险人索赔的权利。在这种定义下，其实保险赋予了投保人一项或有索求权，这种权利可以看作是我们熟悉的期权，其中投保人支付的保费就可以等同为期权费，如果保险事故在保险期限内发生，投保人就可以在合同到期前行使索赔权，并且在有免赔额的情况下，相当于期权中的美式期权提前行权的模式。因此，本文运用期权的定价技术来考虑再保险的定价问题。

本文重点分析一层超额损失再保险的定价模型，是指在定价决策中只涉及一次分保过程，过程中也只包含一位原保险人和一位再保险人。设S为原保险合同的赔付额，D为再保险分出人的自留额，且我们的分析是在原保险人拥有足够大的同类保单的基础上。如果原保险赔付额S不大于再保险合同的免赔额D，则再保险人没有支付义务；如果S大于D，则再保险人需要承担S超过D的部分赔付额。故原保险人的保单到期价值可描述为

（二）完全信息动态博弈理论在再保险中的运用

传统的保险定价只是一种非策略性的理性人选择结果，合同中的参与方是在不知晓对方的情况下，完全根据自身的最优化理论孤立地做出决策。其实这种决策方式并不能够完全适用于保险的环境中，尤其是再保险合同中，因为再保险中的合同双方均是具有专业知识的保险机构，且常见的再保险合同并不是格式化的，而是经过合同双方的反复博弈得出的一个双方认同的费率、自留额和保额等。因此，本文分析中运用博弈论的理论框架，极大地还原合同双方在签订合同时的决策考虑。

1.完全信息动态博弈理论框架在再保险中的运用

博弈论根据博弈双方在决策时是否能够相互影响从而决定出一个有约束力的协议分为“合作博弈”与“非合作博弈”，合作博弈更注重博弈双方的合作理性，非合作博弈则更强调决策个体的理性。其中，非合作博弈根据博弈方的决策顺序分为静态博弈和动态博弈。静态博弈指博弈双方是同时进行决策的，每个个体在进行决策时不知道对方的决策，而动态博弈则区分先后顺序，且后序决策者能够充分的了解前序决策者的行为。同时，可针对信息的分布情况进行分类，如果博弈双方对彼此的决策信息完全知悉，则为完全信息博弈，那么不完全知悉就为不完全信息博弈。结合以上两个维度的区别，可以将博弈论定义为“完全信息静态博弈”、“不完全信息静态博弈”、“完全信息动态博弈”、“不完全信息动态博弈”四种形式，对应的均衡状态分别是“纳什均衡”、“贝叶斯纳什均衡”、“子博弈精练纳什均衡”、“精练贝叶斯均衡”[11]。本文结合再保险合同中期权的特性，将采用完全信息动态博弈理论来进行后续分析。

博弈论中的基本要素包括“局中人”对应在再保险中相当于分出人和分入人，“行动”则是原保险人的分出行为，“信息”是分出人和分入人对对方的信息掌握情况，“策略”是包括分出人的自留保费、分入人的费率厘定等再保险计划，“支付”则是分出人与分入人个体的支付函数，由上面介绍的期权定价公式来代替。博弈当然遵循完全信息公开并且博弈双方有先后顺序的进行决策，最终结果是博弈结束即再保险合同合意时，博弈双方形成的能够使所有的局中人达到最优的均衡策略。

2.完全信息动态博弈理论的求解方法在再保险中的运用

下面通过举例来详细说明，gamble A拥有两个局中人分别为Player（1）和Player（2），他们对收益的结果有相同的判断，且各自面对两种决策方式，前者是决策A和决策B，后者是决策C和决策D，收益组合（X，Y）表示Player（1）和Player（2）各自博弈收益。

（2）的最优决策的基础上确定的，这便是上述的决策树描述的倒退归纳法[12]。我们将这种方法运用到再保险定价过程中，则是再保险分入人进行最优决策时能够了解到再保险分出人的最优策略，即知道分出人的保险期权定价公式和最优解，使得分入人可以在观察到的结果基础上制定最优的免赔额。

四、期权动态博弈定价模型基本框架构建

（一）期权动态博弈定价模型基本框架内要素定义

期权动态博弈定价模型，是把BS期权定价模型和动态博弈理论结合起来，由于BS模型的搭建是建立在无套利的前提下的，所以可以通过求解纳什均衡，得到一层超额损失再保险的理论价格。这个方式的实质是把局中人的支付函数用分出人和分入人的或有索求权用期权定价的技术加以确定，在双方先后决策的情形下，运用动态博弈的方法进行求解。这种方式的优点在于，在决策过程中涉及再保险双方的动态决策分析时，合同双方的支付不固定，它是一个由诸多因素决定的内生变量，此时博弈论中设定的期望效用模型无法正确测量分保的风险，然而前面介绍的BS期权定价模型则能够有效的为风险定价，所以两者的结合便能够有效的分析再保险决策中双方的博弈过程。

在框架搭建之前，需要先对博弈中的基本概念进行了解，其中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素，局中人、行动和结果被统称为博弈规则。

那么根据上述博弈中的要素定义，再保险期权动态博弈过程中的要素可以描述为，第一阶段是再保险人决策过程，第二阶段是原保险人决策过程，再保险人在第一阶段制定出一个再保险合同的“免赔额”，其实是原保险人的自留额（D），原保险人在观察到再保险人的D后，向再保险人购买一份自留额为D*的再保险合约，相当于购买了一份美式看涨期权，直到期权的价值最大化时选择执行期权[13]。则再保险人通过签订再保合同的最终收益可以描述为下式：

原保险公司的效用函数设定方面，由于保险公司具有有效的风险分散机制，U（X）=a+bX，由于再保险公司被认为是金融体系内风险的最后一道保障，且保险公司就是为风险定价的机构，它拥有数量巨大的风险单位，故一般的分析设定保险公司对风险的态度为风险中性[14]。

对于原保险的损失分布函数的设定，本文中选取韦伯分布函数[15]（关于为何选择韦伯分布请见附录）F（X）=1-e它由Waloddi Weibull在1937创造性提出，是用于失效数据分析分布中应用最广泛的分布之一。韦伯分析的优点在于它能提供比较准确的失效分析和小数据样本的失效预测，对出现的问题尽早地制订解决方案，并且为单个失效模式提供简单而有用的图表，使数据在不充足时，仍易于理解。韦伯分析一般用于失效数据的分析，包括研制、生产和服务、质量控制和设计缺陷等，其中还包括对自然灾害（闪电袭击，暴风雪，强风，暴雪等）的损失分布分析。由于再保险的承保标的所暴露的风险主要是以上所描述的自然灾害，故本文中运用韦伯分布来估计原保险标的的损失分布。

（二）期权动态博弈定价模型基本框架的构建

通过上述分析，我们知道在再保险合同的签订过程中，合同双方原保险人和再保险人如何制定最优决策是相互影响的，因此用一个两阶段的动态博弈来描述这一决策过程。在第一阶段，再保险人制定自留额D；在第二阶段，原保险人进行是否行权决策。决策问题中支付函数用BS期权定价模型确定，因此可得到符合实际的一层超赔损失再保险的正确定价。可用以下三个步骤来描述[16]：首先，定义博弈双方即局中人的博弈要素，包括行动顺序和支付函数；其次，运用BS期权定价模型确定局中人的未来不确定支付；最后，运用倒推归纳法从第二阶段开始求解均衡结果。

通过这样的分析框架搭建，把原本复杂的动态分析过程进行了简化求解，既拥有了期权定价包含货币的时间价值和风险的价格优势，又结合了动态博弈理论的策略化的分析过程，更好的更准确的还原了再保险合同签订时合同双方的决策考虑[17]。并且将这种复杂动态金融条件下的决策简化到只需要寻找再保险人的期望效用对原保险人自留额一阶导数等于零的简单计算。

五、期权动态博弈框架下一层超赔损失再保险无套利求解

求解完全信息下的动态博弈的方法即倒推归纳法，首先确定第二阶段中原保险人在观察到自留额D后的最大化策略。我们知道一般情况下的再保险合同只有在签订和到期时才有现金流动，这相当于是合同双方签订了不分红的美式看涨期权，那么在原保险人的立场上，提前行权没有意义，因为美式看涨期权和欧式看涨期权在无分红时的期权最小价值相等，均可以表示为：

通过对上面的计算可以得D=D*，这个D*就是Player（1）即再保险人在分析Player（2）原保险人能够达到最优的基础上的最优自留额，博弈过程即再保险人在博弈的第一阶段确定D*，然后在第二阶段，原保险人在此基础上选择能够自己效用最大化的时机行权，双方都在合同中得到了相对最大化的效用。那么最终得到的博弈均衡解为（D*，P0（D*）），其中，P0（D*）则是我们基于无套利定价原理分析得到的一层超额损失再保险的公平定价。由于在求解过程中既运用了欧式看涨期权的优势，将时间价值和风险价格纳入分析，又结合了动态博弈论的策略定价方法，在无套利的设定下得到了再保险的公平价格。

六、关于期权动态博弈定价模型的一些结论

（一）期权动态博弈定价模型求解过程中的函数设定问题

在求解D*的过程中需要定义原保险人和再保险人的效用函数U（・）和原保险赔付额X的分布函数F（X），在本文的分析中设定原保险人和再保险人是风险中性者，其效用函数被设定为线性的并且采用期望效用的方法来求解。但其实长久以来在学界一直就存在很多期望效用理论的悖论，比如Allias Paradox等，并且随着RDEU（等级依赖期望效用理论）等理论出现都在不断揭示者期望效用在分析问题时的弊端，但在一般性的分析中，运用是可以满足分析需要的，但我们可以在分析中试图变换效用模型的使用，有可能会得到更可靠的分析结果。

原保险赔付额X的分布函数F（X）的设定在本文中是采用韦伯分布来定义的，虽然韦伯分布广泛的用于自然灾害的损失定价中，但是关于损失分布函数的确定还没有一个非常普适的结论，包括最常见的损失均匀分布的设定也只能在诸多约束条件下才能够成立。并且由于损失分布在不同的合同责任项下有着很大的区别，仅仅是财产险部分其分类就有不止几十种的风险属性所对应的风险分布，还由于有地区、环境等诸多影响因素的存在，损失分布函数并不是十分容易确定，在后续的研究中可以尝试其他损失分布的情况。

（二）期权动态博弈模型的推广运用

在本文中运用构造的期权动态博弈模型来分析一层超额损失再保险的定价问题，当然我们可以基于模型中的基本理论将模型推广到多层的超赔再保险定价问题中，其实质就是将两阶段的博弈过程扩展到三阶段、四阶段等，相应的局中人也从两位而不断扩展。并且我们还可以将模型求解过程中得到的加以运用，用来分析最优分出额的问题，因为原保险人的自留额决策关系到双方的经营效益，是个非常重要的效益中间指标。同时该模型不仅可以分析再保险的情形，也适用于原保险合同中，可用来分析投保人和保险人的最优决策。

参考文献

[1]邓志民，张润楚.基于投资的再保险定价公式[J].高校应用数学学报，2006（10）.

[2]张兰兰.期权博弈方法在保险定价中的应用[D].武汉：华中科技大学，2011（5）.

[3]Smets F&R，Essays on For-eign Direct Investment[D].Yele University，1993.

[4]Avinash K. Dixit and Rob-ert S. Pindyck. Investment under Uncertainty[M]. Princeton University Press，1994.

[5]安瑛晖，张维.期权博弈理论的方法模型分析与发展[J].管理科学学报，2001（2）.

[6]石善冲，张维.实物期权博弈投资战略分析理论框架研究[J].技术经济，2004（7）.

[7]孙建胜，王文举.最优再保险的期权博弈分析[J].首都经贸大学学报，2006（1）.

[8]段静静.国内外期权博弈研究评述[J].发展研究，2007（9）.

[9]刘银国，赵培标.保险创新-保险期权探讨[J].经济问题研究，2000（6）.

[10]李晓Q.对我国构建保险期权制度的思考[J].上海保险，2005（10）.

[11]孙建胜.保险期权博弈分析[D].北京：首都经贸大学，2006.

[12] K.A.Froot，P.G.J.O'Connell.美国巨灾再保险的定价[J].世界地震译丛，2005（4）.

[13]姜礼尚.期权定价的数学模型和方法[M].北京：高等教育出版社，2003.

[14]卡尔・博尔奇.保险经济学[M].北京：商务印书馆，1999.

[15]王文举等.博弈论应用与经济学发展[M].北京：首都经济贸易大学出版社，2003.

[16]王文举，夏龙梅.保险人行为博弈分析[J].数量经济技术经济研究，2003（8）.

博弈基本要素篇(6)

【关键词】初步博弈论，基本理论，日常应用

前言

博弈论是二人在平等的对局中为达到取胜的目的而各自利用对方的策略变换自己的对抗策略的思想。博弈论思想古已有之，我国古代的《孙子兵法》就是最早的一部博弈论著作。最初主要研究象棋、中的胜负问题，人们对博弈局势的把握只停留在经验上，没有向理论化发展。1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，奠定了这一学科的基础和理论体系。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。

一、博弈论的概念

博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。这里，策略性环境是指，每一个人进行的决策和采取的行动都会对其他人产生影响；策略性决策和策略性行动是指，每个要根据其他人的可能反应来决定自己的决策和行动。

二、博弈论的类型

博弈论有两种基本的类型，即“同时博弈”和“序贯博弈”。前者是参与人同时进行决策或行动的博弈，后者是参与人的决策和行动有先有后的博弈。这里，所谓的“同时”或“先后”主要是看参与人在决策时是否知道其他参与人的决策，而并不一定取决于物理意义上的时间。当然，除了上述两种基本的类型，还有其他不同的分类方式。

三、博弈的要素

博弈的目的是利益，利益形成博弈的基础。经济学中最基本的假设就是经济人或理性人的目的在于使收益最大化。参与博弈者正是为了自身收益的最大化而相互竞争。也就是说，参与博弈的各方形成相互竞争、相互对抗的关系，以争得利益的多少来决定胜负，一定的外部条件又决定了竞争和对抗的具体形式，这就形成了博弈。博弈的要素大致上可以包含以下四点：⑴2个或2个以上的参与者；⑵要有参与各方争夺的资源或收益；⑶参与者有自己能够选择的策略；⑷参与者拥有一定量的信息。

四、日常生活中的博弈策略

正如王春元在其编著的《博弈论的诡计》中所言“博弈论的目的在于巧妙的策略，而不是解法”。学习博弈论的目的，不是为了享受博弈分析的过程，而在于赢得更好的结局。博弈的思想既然来自现实生活，它就既可以用数学工具来高度抽象地表述，又可以用日常事例来具体说明并运用。博弈时时存在，它就在你的身边。

在博弈论中，一个著名例子就是塔克给出的“囚徒困境”模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设警察怀疑甲乙两人作案，但他们手中并没有掌握确凿证据，于是警方将两人分别置于不同的两个房间内进行审讯，并分别告知两名犯罪嫌疑人：对他们犯罪事实的认定及相应的量刑完全取决于他们自己的供认。

两名囚徒面临的选择及带来的后果组合可以查看下表。

从上表中可以知道：每个犯罪嫌疑人都有两种可供选择的策略：供认或不供认。而且，每个犯罪嫌疑人选择的最优策略不依赖于同伙的策略选择。基于人是理性的这一前提，由于犯罪嫌疑人不知道对方的想法，最理性的博弈策略，就是选择供认。这时的策略，可称之为占优策略。不管甲乙两人谁供认，都将得到减轻惩罚的结果。显然，这一策略一定是所有其他参与人选择某一特定策略时该参与者的占优策略。但值得注意的一个问题是，采用优势策略得到的最坏结果，并不一定比采用另外一个策略得到的最佳结果要好。

除了上例，博弈论在生活中的应用还有很多，譬如：重复博弈的应用。以我国俗语“以牙还牙，以眼还眼”来说，在没有法律和道德的约束下，对自己最有利的一种策略是一报还一报。重复的博弈理论导致了合作的产生，但是谁也不能保证合作的继续，因为合作的代价是建立在损害个人利益基础之上的。如果个人放弃未来收益或背叛当前收益大于未来收益则背叛风险将仍然存在。

五、博弈论的局限性

“任何一个理论体系必定是不完全的，任何理论都包含了既不能证明为真也不能证明为假的命题，对这个世界的最好描述可能只有其本身。”博弈论也是如此，其基本假设之一就是人是理性的。所谓理性的人是指行动者具有推理能力，在具体策略选择时的目的是使自己的利益最大化。而现实生活中，人们在做决策时往往是有限理性的。因为人类的精力和时间是有限的，人不可能具备完全理性，不可能掌握所有知识和信息。花费大量的时间、财力、物力去寻求所有信息，企图做出最优决策，有时反而是最不理性的举动。

六、博弈论的意义

从理论上讲，博弈论是研究理性的行动者相互作用的形式理论，而实际上正深入到经济学、政治学、社会学等并被各社会科学所应用。

博弈论代表着一种全新的分析方法和全新的思想。诺贝尔经济学奖获得者保罗·萨缪尔逊如是说“要想在现代社会做个有价值的人，你就必须对博弈论有个大致的了解”，也可以这样说，要想赢得生意，不可不学博弈论；要想赢得生活，同样不可不学博弈论。

参考文献：

[1]王春永（2007.1）.博弈论的诡计.北京.中国发展出版社[M]

博弈基本要素篇(7)

1944 年冯・诺伊曼（Neumann）和奥・摩根斯坦（Morgenstern）合作出版了《博弈论与经济行为》一书，标志着博弈理论的正式提出。博弈论又称对策论（GameTheory），是在研究各方策略相互影响的条件下，理性决策人的决策行为的一种理论，是分析博弈行为和博弈决策的一门科学。

一场博弈主要由以下五个因素构成：一是博弈的参与者，又叫博弈方或局中人，是指博弈中能独立决策，选择最大化效用并承担结果的参加者。二是博弈的策略，在博弈中由参与者做出的策略选择，直接、实用地针对某一个具体问题采取的应对方法。三是收益，是参加者选择策略并加以实施后的结果，是参与人从博弈中获得的效用水平高低的体现。四是博弈的次序，博弈双方在策略选择和行动中的顺序。在博弈中，即使同样的博弈方、同样的策略，博弈顺序的不同也会对博弈的结果产生重要的影响。五是博弈的均衡，指所有参与者的最优战略组合。一般而言，一个博弈至少应该具备前三个要素。

博弈论起发于数学领域，盛行于经济领域，在20世纪50年代得到较大发展，和其他学科之间的关系也逐渐深入。20世纪90年代以来博弈论领域的经济学家已经三次获得经济学诺贝尔奖，该理论已经对经济学产生了重大的影响。随着博弈论研究的日益深入和理论框架的不断完善，经济学家和管理者们逐渐把这一理论引入到经济、政治、外交、军事、教育等领域中。在高校辅导员激励管理过程中，如何借鉴和运用博弈论的管理理念与方法，提高高校辅导员激励管理的效度，是本文探讨的主要内容。

一、高校辅导员激励管理引入博弈论的必要性

（一）博弈论可以满足高校辅导员队伍管理方式创新的迫切需求

辅导员是开展大学生思想政治教育的骨干力量，是大学生日常思想政治教育和管理工作的组织者、实施者和指导者。辅导员队伍的整体素质，对思想政治教育的效果和学生素质有着重要影响。随着社会经济的发展，以及我国高校发展和改革的不断推进，高校辅导员的作用也愈加重要。而近些年来辅导员队伍中面临的一些问题，如工作任务重、薪酬待遇较差、人员积极性不高、职业发展困扰较多等都极大地影响着这支队伍的稳定性，给高校辅导员队伍管理和思想政治教育工作带来严重的挑战。而能根据环境变换而做出应对策略的博弈管理可以满足高校寻求辅导员队伍管理的新方式的迫切需求。

（二）博弈论可以丰富高校辅导员激励管理理念

随着辅导员在高校人才培养中发挥的作用日益重要，全社会对辅导员的重视程度正不断提高，党和国家注重从各个层面对辅导员进行激励，以期充分调动他们的工作积极性和保证这支队伍的稳定性。国内外专家学者从心理学、管理学等多个视角开展了对高校辅导员激励机制的研究。从目前我国高校辅导员激励管理研究的现状来看，国内外研究者主要从工作制度、措施、环境以及辅导员需要等因素研究辅导员激励，把激发辅导员工作的积极性和创造力，挖掘其工作潜能，作为辅导员激励问题研究的主要出发点。这些激励机制的形成与应用一定程度上缓解了高校辅导员激励管理中的问题。但是随着环境和辅导员需求的不断变化，高校辅导员激励管理需要更多更丰富的先进理论来作为指导。博弈论作为近些年来在诸多领域被广泛应用，越来越受到大家重视的科学理论，可以极大的丰富高校辅导员激励管理理念。

（三）博弈论与高校辅导员激励管理存在契合

在目标上，博弈论的假定前提是“理性的经济人”，博弈的参与者都要追求各自利益的最大化。而在高校辅导员激励管理中，学校和辅导员作为博弈的双方，为了自身利益的最大化，不可避免的会产生重复博弈。而辅导员与辅导员之间，因为职务晋升、工作分配等问题的存在，也势必会产生智猪博弈。但若满足或构建一定的条件，学校与辅导员，辅导员与辅导员之间的合作共赢依然是有可能的。而这点则与博弈论有着契合之处。

综上所述，把博弈论引入到高校辅导员激励管理中，不仅是新形势下满足高校辅导员激励管理寻求创新方式的迫切需求，而且为解决高校辅导员激励机制问题提供了一种新的思维方式和理念，这为消除传统高校辅导员激励机制中存在的弊端和解决其内在矛盾提供了有效途径，是提高高校辅导员激励管理效度的必然选择。

二、高校辅导员激励管理中的博弈关系分析

辅导员在高校这样一个特定的环境中，较容易因为学校管理者恰当的激励措施而产生积极的行为动机，进而影响他们的工作表现与积极性。高校在实际管理中，可以遵循博弈规则来研究激励管理，使得所采取的激励措施符合管理实践的需要。

1.学校与辅导员

站在博弈论的观点考虑，高校作为博弈的一方，希望能够以最少的劳动力成本（最低的工资）获得最大的产出（辅导员受到激励后所采取的积极行动带来的工作成效），这是其利益最大化的选择；而博弈的另一方―――辅导员，希望以最少的付出（付出最少的时间和精力）换取最大的回报（高额的工资、成绩的取得、精神的满足感与成就感），这是其利益最大化的选择。所以，投入与回报是这一博弈中的两个关键所在。处于长期重复博弈中的两个对策者―――高校与辅导员，想要获得个人利益及整体利益的最大化，选择适当的合作策略是必要的。而这种合作的关系，正是博弈论的一种―――重复博弈。

2.辅导员与辅导员

在高校中，除了学校与辅导员的重复博弈外，基于辅导员彼此之间的角色定位不同，做事能力、人际关系等因素的不同，辅导员与辅导员之间，也客观存在着博弈关系。如，不同职位的辅导员之间，就存在着不平等的博弈―――在同一团队中的辅导员由于工作态度与能力不同而出现的“搭便车”式（智猪博弈）的不均衡的博弈关系―――这种强势与弱势的不平衡，往往造成辅导员队伍中的弱势方（小猪）采取坐享其成的等待型的最佳策略，而强势方（大猪）的辅导员则往往疲于做事，这样最终不利于辅导员的均衡发展；另外，不是同一团队的辅导员之间也有可能存在着不均衡的关系―――人际关系好的辅导员往往可以得到领导和同事更多的庇护及赏识，而人际关系不好的辅导员往往会因此采取消极的应对策略，更加消极的对待工作。

三、博弈论视角下高校辅导员激励管理的有效路径

通过以上对学校与辅导员、辅导员与辅导员之间的博弈关系分析得知，对高校辅导员的激励对策和措施不能依赖传统的激励机制，而需要从多方面考虑切合这一群体特点的因素，，在满足个体需求时充分调动其工作的积极性，同时需耍调动其他方面的各耍素形成合力，构建并完善辅导员激励机制，提高其工作的有效性。

（一）以物质激励为基础，建立透明、合理的薪酬制度，

物质是人类生存和发展的基本需求，是马斯洛需求层次理论的基础。随着当前社会经济的发展和居民收入水平的增加，辅导员的低收入与其工作的高付出不成正比，这成为影响高校辅导员队伍稳定性的重要原因。根据博弈论原理改革高校薪酬制度，建立合理的薪酬级别，充分体现出薪酬制度的保障功能与激励功能。

一方面高校应提高辅导员的整体工资水平，满足他们追求“合理利益的最大化”，使他们能安心于本职工作。同时，高校还应突出薪酬制度的透明与合理性，这样有利于辅导员明确行为与后果，努力与回报之间的关系，有利于维持竞争的公平性和透明性，促进辅导员之间积极竞争关系的发展。

（二）以精神激励为突破口，满足辅导员的情感需求

情感作为一种巨大的精神力量，能够直接影响人的行为方式。高校在进行物质激励的同时，也要发挥精神奖励的重要性，给予辅导员更多的人文关怀。随着当前学生工作环境的复杂多变，学生特点的多样化，社会对辅导员要求的提高，导致辅导员面临的工作量和工作压力持续加大，工作积极性下降。高校管理者应充分认识辅导员在高校思想政治教育工作中的重要性，积极加强与辅导员的情感交流，工作中尊重他们的劳动成果，生活中帮助他们解决实际困难，积极建立一种彼此信任、团结和谐的工作氛围，使辅导员能够更加舒心的开展工作。

（三）以公平、合作、共赢为目标，完善与改进辅导员考核办法

对辅导员工作考核的准确与公正，也是影响辅导员激励的重要因素。因此，对辅导员工作的考核一定要多渠道、全方位进行评定和测量，同时要坚持定性与定量相结合的原则。高校应引入公平的竞争机制，坚持“公平公正、论功行赏”的竞争原则，对于考核优秀的辅导员给予奖励，通过颁发荣誉证书、发放一定数额的奖金、给予进修机会等特别奖励，使其感到一种精神上的满足，从而更加努力地工作。对于考核较差的辅导员给予适当的惩罚，激发他们工作的责任感。这样既可以维持学校与辅导员之间的合作关系（双方共赢），又保持了辅导员之间竞争的公平性（多劳多得）。

（四）以辅导员职业生涯规划为导向，完善培养机制

近些年来由辅导员在工作中成就感普遍偏低，职业受挫感较易产生，自认为职业前景黯淡等原因所带来的职业倦怠成为影响辅导员队伍稳定性的另一重要因素。鉴于此，高校应按照《教育部关于加强高等学校辅导员、班主任队伍建设的意见》中明确提出“要统筹规划专职辅导员的发展。鼓励和支持一批骨干攻读相关学位和业务进修，长期从事辅导员工作、向职业化、专家化方向发展”的要求，帮助辅导员落实自身职业生涯发展规划，确立职业发展目标。一方面完善辅导员的培训机制，巩固和完善现有的多形式、多层次的辅导员培训体系，不断提高他们的思想政治素质与管理能力，提升辅导员的职业认同感；另一方面要积极探索辅导员的流动机制，拓宽辅导员的发展道路，支持有能力的辅导员转任道行政、教师和科研等岗位。