期刊大全 杂志订阅 SCI期刊 SCI发表 期刊服务 文秘服务 出版社 登录/注册 购物车(0)

首页 > 精品范文 > 博弈论的方法

博弈论的方法精品(七篇)

时间:2024-02-05 15:21:06

博弈论的方法

博弈论的方法篇(1)

关键词:新闻传播学 博弈论 方法

问题的由来

新闻传播学比之其他社会人文学科,方法论的研究尚未深入,本文所要论及的新闻传播学研究中的博弈论方法,就表现得比较典型。

将博弈论与新闻传播学相交叉的思路,在上个世纪80年代社会科学方法论讨论最热烈的时候,新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究,开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中,一直没有很好地重视新闻传播博弈学的研究。作者在1997年复旦大学新闻学院做访问学者一段时间,涉猎了一些有关博弈论的论著,产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的,从新闻文化的外延角度来看,新闻传播的竞争生态研究。不能缺少博弈论的思想。

上个世纪90年代之后,有关博弈论的书籍开始增多,后来出现了普及性的博弈论读物,这些书籍大都将社会生活、经济领域、历史经验等方面内容,与各种博弈类型相类比,说明博弈论的道理,但也带来某些副作用,即博弈论的庸俗化。在这样一种背景下,“博弈”一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系,真正被新闻传播理论界重视,是在2004年第八次传播学研讨会上,会上提出“传播即博弈”的观点,并存在争议。2008年10月,孙光海、陈立生的《传媒博弈论》由三联书店出版,有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题,或在文章论著中有意识地使用“博弈”概念来看,可以分为以下三种情况:

一是狭义基础上的理解。仅仅从传媒市场竞争的角度,来研究新闻传播的博弈。如《传媒博弈论》一书,“将四大主流门户网站、两家中央重点新闻网站、四大城市的13家都市报作为研究对象,对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析,从新闻到版面到受众再到发行,通过大量案例剖析与实战推演,总结出各大媒体在不同环境下,针对不同的竞争对手以及竞争对手采取的策略,从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然,从最严格意义上来看,该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看,完全是从社会主义市场经济的媒体之间竞争策略着眼,探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发,来探讨新闻传播领域中,如何把握新闻活动的规律,有学者称之为“大博弈的思维观”。实事求是地说,新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解,所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念,但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归人人际传播理论。说明他已经把博弈论纳入到传播学视野了,不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题,即所有社会科学理论都存在传播的问题,传播学强调传播的双向性,恰好说明了与博弈论的紧密联系。另一位讨论者强调:“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的,但“传播之中有博弈”,“博弈之中有传播”,在一般的传播现象中存在部分博弈现象,也是不争的事实。而且,我们注意到,在正常的新闻传播过程中,传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的,从而认定传播学一般现象无法以博弈论进行解释,不尽妥当。我们知道,传播模式研究的前提,也要求理性的状态。

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约,或传统哲学所说的作用与反作用意义层面,来使用“博弈”概念。诚然,博弈论研究确实离不开这些因素,但所有事物间的这些因素,不一定都是博弈论所讲的博弈。也有在互动反馈意义层面,来理解博弈的,比起前者进了一层,然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为,但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象,把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象,这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词,而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法,而是力图客观地思考博弈论方法在新闻传播学研究中,究竟能否作为一种研究视角,起到对新闻传播学研究的建构作用,甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性

德国著名数学家哥德尔1931年提出不完备性定理:第一不完备性定理――任意一个包含算术系统在内的形式系统中,都存在一个命题,它在这个系统中既不能被证明也不能被否定。第二不完备性定理――任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的,但是其革命意义远远涉及科学哲学、逻辑学,而这种情况也注定要影响社会科学研究领域。诚然,新闻传播研究中,也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性,目的主要是运用其基本思想,扩展研究视域,在新闻传播领域内最合适的地方。找到双方的契合点,从新的角度描述新闻传播现象与活动的规律。调整我们的传播行为,使社会信息资源得到有效的配置。

博弈论最基本的思想,其一,在同一活动中,某事物的行为效果如何。有赖于它事物的行为。其二,是均衡概念。其三,假设人是理性的。理性的人,指行动者具有一定的逻辑推理能力,进行决策选择策略的目的就是自身利益的最大化。现实生活中,人们在作决策时可能往往是有限理性。其四,博弈论是竞争与合作的游戏,一般有协议契约。根据以上的简单概括,随之需要思考的问题就是,新闻传播现象与

活动过程中,有没有相类似的情况?其一,在同一新闻传播活动中,双方各自的行为要视对方的行为而定?其二,均衡概念在新闻传播过程中能否实现?其三,新闻传播活动的行为主体是不是理性的?情况允许的话,自己的利益最大化是否是追求的目标?其四,竞争与合作的契约关系,在新闻传播过程中能否建立?答案是倾向积极的。

有了上述基本思考,我们再从更大一些的方面来探讨运用博弈论的可能性:

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态。即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然,马克思主义承认社会历史的发展有着诸多的因素,正如恩格斯所说的“平行四边形”合力作用。但归根结底的因素是生产力与生产关系的矛盾对立统一。博弈论之所以在经济领域呈现出活跃的情况,人们之所以在各类社会活动、人际关系中发现博弈的因素,是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动,归根结底是由交往关系决定的。因此。博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后,包括新闻传播业在内的文化产业,亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下,力求社会效益与经济效益的双赢,这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为,都存在博弈论的问题,因为在某一次传播活动中的传播者之间、传受之间等,都有一个行为对策选择的问题,在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化,可能追求的就是整体国家民族利益的最大化,如我国文化产业的双赢策略,即博弈论的“均衡”。公益与私利、赢利的矛盾,在社会主义初级阶段会一直存在,博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道,博弈论最初作为应用数学的一个分支,是运筹学下面的对策论。后来应用于经济领域。在西方发达国家,作为西方经济学前沿领域的博弈论,已逐渐变为一种占主流地位的基本分析工具,人们十分重视其方法论意义。从中国的传统文化来说,经史子集弈的思想无处不在。过去曾有学者提出这样的观点,自然科学最基础的学科是数学,而社会科学的基础可以是博弈论。我们不能说它完全正确,但是至少应该承认有其一定的合理性。

从广义的角度看,传播应用学派的传播模式研究,实际上相当于博弈模型。在我国较为流行的英国人丹尼斯・麦奎尔、瑞典人斯文・温德尔合著的《大众传播模式论》中,许多传播模型十分典型地体现出这种情况。该书第一版介绍了35个传播模式,第二版介绍了66个传播模式。除了个别早期线性模式外,在控制论的反馈概念出现之后,传播模式越往后越具有博弈的性质,甚至可以这样说。研究当代传播模式离开了博弈的思维,其研究是存在欠缺的,虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学、传播学以及中国化的新闻传播学,从它们的发生与发展的历史来看,是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代,在需要破除自然与社会科学鸿沟的时代,谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学,从来不存在其他学科的不可逾越的障碍。

由于受经济学的影响。人们思考博弈论在新闻传播研究领域的运用时,可能认为仅仅反映在传媒的经营管理上。这种狭义的理解,导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为,新闻传播研究中重视运用博弈论。并不是要求新闻传播理论“范式”像经济学那样转向博弈论,并把它作为核心的理论分析工具,而是在理论体系建构中,对博弈论方法给予足够的重视,将其中合理的内容,吸纳到基础理论中来。更重要的是,将博弈思维作为指导理论研究的一个窗口,扩展新闻传播理论空间。当然,也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”。进行专门的新闻传播学新领域探索。

博弈论的方法篇(2)

所谓“博弈”(Game),是指某些个人或组织作出相互有影响的决策,它不仅包括扑克、桥牌等游戏,也包含现实生活中大量的合作和冲突现象。博弈论又称“对策论”,研究的核心是决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论的原始思想萌芽于2000多年前,中国春秋战国时代的典籍如《孙子兵法》、《孙膑兵法》中都充满了博弈的案例。“田忌与齐王赛马”就是我国耳熟能详的博弈实例之一,但这不过是博弈思想的雏形,现代意义上的博弈论则是20世纪的贡献了。一般认为,1944年同冯·诺伊曼(Von  Neumann)和摩根斯坦恩(Morgenstern)合作发表的《博弈论与经济行为》(The  Theory  of  Games  and  Economic  Behavior)提出合作博弈的基本模型,标志着现代博弈论的开始。50年代,博弈论巨匠辈出,纳什(Nash)提出了非合作博弈论,塔科尔(Tucker)定义了“囚徒困境”,从而奠定了现代非合作博弈的理论基石。60后代,泽尔腾(Selten)将纳什均衡引入动态分析,创立了“精炼纳什均衡”的概念;海萨尼(Harsanyi)则把不完全信息引入博弈论研究,随后出现了不完全信息博弈论。至此,博弈论的理论构架基本完成。

博弈论可以划分为合作博弈(cooperative  game)和非合作博弈(non-cooperative  game)。二者的区别主要在于参与人能否在行为时达成有约束力的协议,达成则是合作博弈;反之,不能强制他方遵守协议,各参与人只能选择自己的最优战略,则是非合作博弈。合作博弈强调团体理性、效率、公平和公正;非合作博弈则强调个人理性、个人最优决策。我们谈到的博弈多指非合作博弈。

博弈有两种划分:从参与人出场的先后顺序来看,博弈分为静态博弈(static  game)和动态博弈(dynamic  game)。静态博弈指博弈参与人同时选择行动或非同时行动但对前者行动一无所知;动态博弈指参与人行动有先后顺序,且后行动者能够观察到先行动者的选择。从参与人对其他参与人的知识来分析,博弈分为完全信息博弈和不完全信息博弈,前者指每一个参与人对其他参与人的特征、战略和支付函数有确切的了解;后者则恰好相反。将两种分析结合起来,我们就有四种类型的博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。

1.完全信息静态博弈:纳什均衡

完全信息静态博弈讲的是,假设博弈中所有参与人事先达成一项协议,规定每个人的行为规则,那么,在没有外在强制性约束时,参与人是否会自觉遵守协议。如果参与人自觉遵守该协议,则构成一个纳什均衡:给定其他参与人遵守协议的情况下,没有人积极偏离协议规则。换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。“囚徒困境”(Prisoner's  Dilemma)和“性别战”(Battle  of  theSexes)是任何一本博弈论著作都会提到的纳什均衡特例。

2.完全信息动态博弈:子博弈精炼纳什均衡

动态是世间万物的基本特征。完全信息静态博弈只是一种独特的理想状态。在现实中,当后一个参与人行动时,自然会根据前者的选择而调整自己的选择,而前者也会理性地预期到这一点,所以不可能不考虑自己的选择对他人的影响。1965年,泽尔腾通过对动态博弈的分析,提出了“子博弈精炼纳什均衡”的概念,它要求任何参与人在任何时间、地点的决策都是最优的,决策者应该随机应变,而不是固守前谋。这就推导出子博弈的概念。当参与人的战略在每一个子博弈中都构成纳什均衡时,则形成“子博弈精炼纳什均衡”。也就是说,组成“子博弈精炼纳什均衡”的战略必须在每一个子博弈中都是最优的。

3.不完全信息静态博弈:贝叶斯纳什均衡

不完全信息静态博弈指的是,参与人共同行动,没有机会观察他人的选择。每个参与人的最优战略只能是在给定自己的类型和他人类型依从战略的情况下,最大化自己的期望效用。在项目投标中各承包者的标价高低之争就是一个应用例证。

4.不完全信息动态博弈:精炼贝叶斯纳什均衡

在不完全信息动态博弈中,后行动者观察前者的选择并获得其偏好、战略空间等信息,修正自己的判断;而先行为者也知道自己行为的效用,会有意识地选择某种行动掩盖或揭示自己的真实目的。“黔驴技穷”就是一个不完全信息动态博弈的例证。

国际机制理论的理性主义流派概述

当前,国际机制的研究在理论与实践层面都对国际关系理论学者形成冲击,引起他们持续的浓厚兴趣,并表现出非凡的整合能力,对国际机制研究的不同思路和方法加以整理和批评已经成为学者们重视的工作。德国著名国际机制理论家沃科尔·利特伯格认为,国际机制理论有两种理性主义流派:新现实主义国际机制理论和新自由主义国际机制理论。(注:Andreas  Hasenclever,Peter  Mayer  and  Volker  Rittberger,Theories  of  International  

Regimes(London:Cambridge  UniversityPress,1997),pp.1-2.)

新现实主义国际机制理论的基本出发点是行为体之间的权力资源分配极大地影响着机制的出现、某问题领域机制的存在及其性质,特别是合作中的利益分配;国家会考虑无政府状态下的相对权力,对国际机制的效率形成制约。这些观点都体现在霸权稳定理论中。利特伯格认为,霸权稳定理论是“基于权力的国际机制理论的经典理论模式”,(注:Andreas  Hasenclever,Peter  Mayer  and  Volker  Rittberger,Theoriesof  International  

Regimes(London:Cambridge  University  Press,1997),pp.86.)而克劳福德认为,霸权稳定理论是新现实主义对机制产生最权威、最普遍认同的解释。(注:Robert  Crawford,Regime  Theory  inthe  Post-Cold  War  World:Rethingking  Neoliberal  Approaches  toInternational  Relations(Dartmouth:Darmouth  Publishing  Company,1996),p.57.)霸权稳定理论的基本机制理论主张是:霸权国家建立了自己的霸权体系,并制定该体系的基本原则、规则、规范和决策程序,霸权国的实力与威望是其他国家接受这些国际机制的重要前提;霸权国利用这些机制维持霸权体系,最大限度地获得自己的利益;同时,为了维持该体系,它愿意向体系内的其他国家提供“公共商品”(Public  Goods),容忍“搭便车行为”(Free-rider);霸权国的衰落或急剧变化,则该体系的国际机制发生相应变化。

新自由主义机制理论在过去10多年影响巨大,成为分析国际机制的主流理论。其基本机制理论主张是:国家是追求绝对收益的理性自我主义者,只关心自己的得失;承认权力在国际机制中的作用,但认为国际机制是国际关系中的独立变量(independent  variable),强调国际机制在帮助国家实现共同利益中的重大作用;活跃在特定问题领域的国家拥有只能通过合作才能实现的共同利益;不确定性是国际机制形成理论的核心,世界政治存在广泛的不确定性。国际机制帮助达成政府之间意愿的契合。行为体相信这种安排会帮助达成互利的安排。换言之,没有国际机制,则协议无法达成。国际机制正是通过降低不确定性来促进国际合作的。新自由主义机制理论是国际机制理论的主流学派,其影响也最大。该派理论用相互依赖的概念将现实主义和自由主义结合起来,具有重要的理论整合意义。

博弈论与国际机制理论

在过去十多年里,国际机制理论在国际合作的分析中独占翘楚,而博弈论在分析社会、经济和政治现象中应用最为广泛。两种理论都以探讨无政府状态下的竞争与合作问题为核心命题。这种平行并非巧合,因为机制理论从博弈论中借取了许多知识能量。理解促进合作的战略逻辑是解释无政府状态下国际机制起作用的关键。在讨论霸权、问题联系、相对收益和相互依赖时,博弈论的解释力有目共睹。这些恰恰是国际机制理论讨论的重心问题。(注:Andrew  Kydd  and  Duncan  Snidal,"Progress  in  Game-Theoritical  Analysis  of  International  Regimes",in  Regime  Theory  and  International  

Relations,ed.Volker  Rittberger(Oxford:Clarendon  Press,1993),pp.112.)

早期的博弈论分析国际合作的总体问题,其目标在于探究国际合作在无政府状态下如何发生,但对国际机制的特殊作用关注不够,国际机制在合作中的作用没有得到突出和明确的分析。克拉斯纳、基欧汉等使用博弈论分析国际机制的作用,促使现实主义和自由制度主义的国际机制理论逐步成熟。

克拉斯纳用“性别战”博弈模型来描述基于权力的国际机制理论,既现实主义的国际机制理论。所谓“性别战”是指热恋中的一对男女安排业余活动的博弈:或者去看足球,或者去看芭蕾舞。

这里有两个纳什均衡,男女二人期望在一起,但到哪儿却是需要选择的。这里有一种先动优势(first-move  advantage),即谁先采取行动。该博弈模型用以解释国际合作问题具有重要的启示意义。在该模式中,追求一致的努力使欺骗不再存在,实际上偏离协议的行为被视为非理性的。克拉斯纳指出,智力在解决合作问题上的作用下降了。而在机制形成与变迁中权力的决定性地位突出了。(注:Stephen  Krasner,"GlobalCommunicationsand  National  Power:Life  on  the  Pareto  

Frontier",World  Politics,1991,Vol.43,pp.336.)在这里,合作不是相互协调,而是一方对另一方的协调。在这方面,国际机制并未展示多少自主和弹性,但却常常是权力分配和伴随利益的关键性中介。克拉斯纳强调说,机制本身也可以成为权力的源泉。(注:Stephen  Krasner,StructuralConflict:The  Third  World  Against  Global  Liberalism(Berkelay:University  of  California  Press,1985),pp.7-9.)因此,即使非常弱小的国家也会对某一问题领域的集体政策施加相应的影响。例如,在国际电讯联盟中,由于实行基于主权平等原则的一国一票制,小国可以参与集体决策并拥有相当的影响。如果国际机制没有重要的作用,行为体也就不必为确定国际机制的内容而激烈地讨价还价,在国际机制建立之后也不会继续进行“战斗”。(注:Stephen  Krasner,"Global  Communications  and  National  Power:Life  on  the  Pareto  

Frontier",World  Politics,1991,Vol.43,pp.351-353.)

而基欧汉则使用囚徒困境来分析基于利益的国际机制理论,即自由制度主义的国际机制理论。所谓“囚徒困境”,指的是两个犯罪嫌疑人作案被抓住,分别关在不同的房间里审讯。警察告诉他们,如果两个人都坦白(合作),则各判刑3年;如果都抵赖(合作),则各判1年;如果一人坦白而另一个抵赖(不合作),则坦白者释放,而抵赖者判4年。

在孤立的囚徒困境中,合作是几乎不可能的,因为行为者发现不合作是理性的。在国际合作的单一博弈中,每一方都有不合作的主导战略即背弃。如果双方放弃了自我理性的战略则结果更好,但这只能在一方期望未来合作可能性的情况下发生。机制的部分作用正是产生和促进这种期望。(注:Andreas  Hasenclever,Peter  Mayer  and  Volker  Rittberger,Theories  of  International  

Regimes(London:Cambridge  University  Press,1997),

【编  者  按】.46.)

基欧汉明确指出,国际机制的功能理论建立在独特的环境前提下:活跃在特定问题领域的国家拥有只能通过合作才能实现的共同利益。该前提不可忽视,而正统的现实主义在批评基欧汉时往往忽略了这一点。国家之间确实存在共同利益,而国际政治并不完全是零和游戏,例如在国际政治经济学领域和七大工业国之间就存在这种情况。当然,国家之间拥有共同利益并不一定合作,共同利益的存在是合作的必要而非充分条件。合作意味着既有利益冲突又有互补利益。当行为体调整他们的行为以适应对方的实际或期望的倾向时,就会出现合作。(注:Keohane,"International  Institutions:Two  Approaches",International  StudiesQuarterly,

1988,Vol.32,p.380.)合作是互相协调作为政治协调过程的结果出现的。(注:Robert  Keohane,After  Hegemony:Cooperation  and  Discord  in  the  world  Political  

Economy(PrinCETon:PrinCETonUniversity  Press,1984),pp.52.)基欧汉认为,国家为追求共同利益而创立了国际机制。国家发现自己困在囚徒困境中,但由于机制为协议的达成提供了谈判的规则、原则、规范和决策程序的框架,即使自我中心主义者之间也可以相互合作。基欧汉用囚徒困境理论解释机制的作用,其出发点是不确定性(uncertainty)。一国对他国的选择是不确定的,因而错过了许多达成共同获益的机会或从已经达成的协议中抽身。而机制则向国家提供信息或降低信息成本,从而促进合作。(注:RobertKeohane,After  Hegemony:Cooperation  and  Discord  in  theworldPoliticalEconomy(PrinCETon:PrinCETon  University  Press,1984),pp.245.)在囚徒困境中,监督安排的机制降低了双方的恐惧,使得合作更为顺利。机制多是在大的国际原则和规范框架中形成的,从而在问题之间建立“联系”,违背某种协定会有影响其他目标的可能。而且,机制促使政治关系的存续时间更长。所以,机制增加了环境的“反复出现”,从而使未来的期望挫败了背弃行为的发生。在囚徒困境中进行多重博弈,则合作增加。(注:Robert  Keohane,After  Hegemony:Cooperationand  Discord  in  the  world  Political  Economy(PrinCETon:PrinCETonUniversity  Press,1984),pp.76.)

基欧汉利用博弈论分析机制试图克服的集体行为问题,认为囚徒困境抓住了国际政治中许多问题的核心方面。(注:Andreas  Hasenclever,Peter  Mayer  and  Volker  Rittberger,Theories  of  International  

Regimes(London:Cambridge  University  Press,1997),

博弈论的方法篇(3)

关键词:群体决策;信息集结;博弈论;信息获取;审议;透明性

一、引言

群体决策的研究涉及多个学科,不同学科对群体决策的研究所采取的方法和着重点不一样。在经济学、政治学、管理学领域对群体决策的研究侧重于偏好的集结,较少考虑影响偏好形成的潜在背景信息。其中社会选择理论与公共选择理论利用数学分析的方法和福利经济学的一些基本原理,研究如何“公平合理地”将群体成员的偏好集结为群体的偏好并据以作出群体的选择,这方面的研究源于Condorcet投票悖论的提出,从20世纪50年代开始经过Arrow、Sen、Gibbard和Satterthwaite等人的进一步发展,已形成完整的理论体系,通过对理性社会选择本质的剖析,促进了人们对选举、立法以及政治机构运作等问题的理解。

在管理科学领域,对群体决策的研究主要强调如何通过对群体成员以不同形式表达的偏好的集结,使得群体成员就最终决策达成某种程度上的一致,而一致性则意味着“正确性”,这方面最具代表性的是社会决策图式理论。

在社会心理学领域对群体决策的研究主要采用实验性方法,通过对群体成员之间交互过程的分析研究群体决策的信息集结有效性,一般假定群体成员具有共同的目标,很少考虑决策过程中的策略,心理学研究的主要成果是对群体思维和群体极化现象的分析。

近年来国外出现了不少用博弈论作为理论工具研究群体决策信息集结问题的文献,这些文献主要发表于经济学、政治学与政治经济学期刊,通过对群体决策过程中群体成员的动机和理的分析,给出了一些与人们的直觉完全相反的结论。笔者将对此领域的研究进展从决策信息的获取、审议过程中信息的披 露、透明性的影响与最优决策规则四个方面进行评述。需要说明的是,这四个方面紧密关联,特别是决策群体成员的信息披露动机直接受到决策过程对公众是否透明以及最终的投票表决规则的影响,而群体成员的信息获取动机则部分地取决于信息披露动机,但由于利用博弈论分析群体决策问题的复杂性,现有的文献主要还是相对集中于其中的一两个方面。

文[1]是注意到此领域较早的综述性文章,该文发表于1999年,讨论了当时出现不久的研究政治机构信息集结作用的文献,其中对最先考虑策略性投票表决行为的文[2-5]等进行了简要介绍。同年9月份,《美国国家科学院院刊》发文评述了研究选举的信息集结作用及因投票者私有信息的不准确而导致的策略性投票表决行为的成果[6],其中提及的部分研究工作尚处于未发表状态。文[7]对研究货币政策委员会决策过程中的动机问题的文献进行了系统讨论。文[8]总结了货币政策委员会决策机制设计应该考虑的各种因素,对与群体决策相关的经济学与社会心理学理论与实验分析文献进行了评述,其中讨论了信息集结问题。应该说文[9]是目前评述基于博弈论的群体决策信息集结研究文献较为全面和细致的文章,该文从策略性投票、信息获取、利益冲突和交流四个方面进行了详细评述,并讨论了此领域的研究成果对货币政策委员会决策机制设计的参考价值。

本研究与文[9]的差别在于:第一,文[9]的讨论基本上局限于基于博弈论的群体决策信息集结研究本身,而笔者从研究方法、研究对象与研究成果等方面将基于博弈论的群体决策信息集结研究与经济学、政治学、管理学以及社会心理学领域对群体决策的传统主流研究进行了对比,分析了博弈论作为理论工具研究群体决策信息集结问题的优缺点,并深入探讨了现有研究工作存在的不足之处,也即指出了此领域可能的研究方向,因此,笔者的深度与广度有所超越。第二,文[9]对此领域研究成果的评述思路稍显混乱,文献分类较不合理。第三,笔者特别关注了研究决策过程的透明性对群体成员信息获取与信息披露动机以及投票表决行为的影响的文献,而文[9]对此几乎没有涉及。第四,文[9]发表后此领域出现了不少具有重要参考价值的文献,笔者对这些最新的文献给予了较为详细的评述。

二、决策信息的获取

(一) Condorcet陪审团定理与搭便车问题

与决策问题相关的各类信息一般以分散的、局部的形式存在于社会系统,群体决策的意义之一,是可能更充分地利用这些信息,因而更有可能作出正确的决策。不考虑其他因素,仅从信息集结的角度看,让更多拥有信息的个体参与决策可以改善决策质量,这种观点符合人们的直觉,其形式化证明出自18世纪Condorcet给出的陪审团定理。该定理认为:群体决策可以有效集结信息,在多数决定规则下,增加群体成员数量可以增加作出正确决策的概率,并且随着成员数量趋于无穷,作出正确决策的概率趋于1。

Condorcet陪审团定理及其后来的很多拓展往往都有个潜在的假设:群体决策者所掌握的与决策问题相关的信息是事前外部给定的,或是以零成本获得的[9]。但对于许多现实决策情形,信息并不是不需要投入成本和努力就能轻易得到的,如审稿专家需要付出一定的时间和精力才能决定稿件是否符合录用标准,因此决策者必须决定是否付出以及付出多少代价以获取信息。而在群体决策中,与决策问题相关的信息是公共物品,因而存在典型的所谓社会惰化(social loafing)现象或搭便车问题(freerider problem)。

文[10]对陪审团决策中的信息获取问题进行了研究,认为陪审员的信息准确程度取决于陪审团的大小,更大的陪审团的陪审员具有更少的动机认真听取审判过程,所以更大的陪审团作出正确判决的概率可能更小,从而导致陪审团定理不再成立。文[11-17]进一步研究了群体决策中的理性无知(rational ignorance)问题,对仍能有效集结信息时信息获取成本或成本函数需要满足的条件进行了分析,这些文献针对多数决定规则,假定所有群体成员具有完全相同的决策偏好。其中文[11,13-15]证明,当全体或部分群体成员的信息获取成本函数在获取零信息处的二阶导数为零,则Condorcet陪审团定理仍然有效。

另外,文[18]通过一个仅有两个成员的群体决策模型,指出群体成员间的交流可能会恶化信息获取中的搭便车问题。在该文中,决策成员首先收集关于一项工程实施后果的信息,然后相互交流,再投票表决是否实施该项工程。文章指出,如果交流的作用仅限于信息集结,则交流可能会减少作出正确决策的概率,特别是当高质量的信息很容易获得时,交流会减少决策成员收集信息的动机,加剧信息收集中的搭便车问题,但当信息收集需要付出高昂的代价时,更多的交流通常会增加作出正确决策的概率。

(二)搭便车问题避免措施

因为信息获取活动一般是不可观测的,搭便车者可以通过提供一个虚假的信息假装已经给予了足够的投入,所以无法通过有效的惩罚措施以阻止搭便车问题,只能够从决策群体的成员组成和决策规则等方面考虑避免该问题的发生。

文[19-20]的研究结论从决策群体人员组成方面为避免信息获取中的搭便车问题提供了理论参考,指出具有极端偏好的成员相对来说更具有收集高成本信息的动机,但这两篇文献的研究内容不属于严格意义上的群体决策,因为其中的委员会成员仅负责收集与报告信息,自身并没有决策权。在文[19]中,委员会成员在信息收集之前相互间没有偏好差异,在投入不可观测的努力收集信息后形成各自不同的政策偏好,该文证明最优的委员会规模和总的社会剩余有时会随委员会成员偏好差异期望值的增大而增大,因为预期的偏好差异为成员提供了收集信息的动机。文[20]指出,如果信息收集的成本较低,委员会成员的偏好应该与决策者的偏好类似,这是因为一方面与决策者偏好类似的成员会收集决策者想要的信息,另一方面由于偏好类似所以在报告时不会产生信息的扭曲问题;如果信息收集的成本较高,则委员会应该由具有极端偏好的成员组成,只有这些成员才具有足够强烈的动机付出代价收集信息,但因为信任问题,他们往往只会收集硬信息,即客观上可验证的信息。对于在投票表决前需要对决策选项进行审议的群体决策来说,文[20]的研究结论尤其具有参考价值。

从群体决策机制设计的角度看,如果存在信息获取问题,则机制设计者必须既要考虑如何提供充分的激励促使群体成员获取信息,又要考虑如何有效集结成员所获得的信息,以最大化群体决策的期望效用。

文[21]证明,采用适当保守的决策规则可以促进群体成员收集证据,从而改善决策质量。文[22-23]对存在信息获取时的群体决策最优规则与最优群体成员数量进行了研究。文[22]指出,尽管一致性规则使每个群体成员的投票选择对最终结果都具有决定性影响力,但一致性规则并不能为获取信息提供适当的激励,而且一致性规则特别不适合于信息较不准确的情形,也即更需要群体决策的情形,在只考虑单调纯策略均衡的条件下,除非群体成员的信息足够准确,否则一致性规则或接近于一致性规则的规则不可能最优。文[23]认为,为了提供足够的信息获取激励,对于相当普遍的决策情形,事前最优的决策机制事后可能是非最优的,即不必然利用了所有群体成员获取的信息导致从统计学角度有最优的信息集结,该事前最优的决策机制是在激励成员获取信息与最大程度提取成员信息之间折中的产物。需要指出的是,文[21-23]均假定决策群体成员具有相同的偏好。

三、审议过程中信息的披露

决策群体,尤其是规模较小的群体,一般会在投票表决前对决策选项进行审议,交流各自的私有信息。信息的共享能引起成员信念的收敛。但群体成员通常代表着不同的利益集体,具有不同的利益追求或偏好,因而具有操纵或隐藏私有信息的动机,从而限制了信息共享的可能性,成员间策略性的信息操纵与反操纵甚至导致比纯粹偏好冲突更大程度上的意见不一致。

绝大多数群体决策文献对审议(deliberation)、交流(communication)、辩论(debate)、廉价磋商(cheap talk)等类似表述用语没有进行明确的区分,虽然这些用语在不同场合有一些微妙甚至较大的差异,如文[24]认为审议是辩论的子集。

研究审议对群体决策的影响的文献一般将决策过程建模为两阶段博弈:先审议后正式投票表决,通过对贝叶斯Nash均衡策略和均衡存在条件的分析,研究审议是否以及如何对群体决策发生作用。这类文献一般假定无论是以公共利益还是以私人利益作为评判标准,好的决策选择总是部分取决于世界的真实状态,而世界的真实状态对决策群体成员来说无法确切知道,他们仅不对称地掌握了有关世界真实状态的部分信息。在正式投票表决之前的审议过程可以使群体成员有机会告诉其他成员他们所掌握的私有信息,然后,根据各自已掌握的关于世界真实状态的部分信息,群体成员形成自己对世界真实状态的判断,进而根据自己的评判标准形成各自的决策选择偏好,如果他们的决策选择偏好不一致,就有可能在审议的过程中不披露自己的真实信息,或提供虚假的信息以诱导其他成员作出对自己有利的决策选择。因此,此类文献注重从信息集结角度对完全信息披露均衡和完全信息集结均衡的分析。

Coughlan在文[25]中认为,当所有群体成员的决策偏好完全相同或足够接近,在审议过程中每个成员都具有真实披露私有信息的动机。文[26]则进一步证明,只要群体成员主观上认为多数成员与他拥有共同偏好具有较大的可能性,客观上的偏好差异不会影响信息的真实共享。然而,该文同时指出,审议并不总是能有效集结信息,特别是当群体成员没有较强的先验信念认为自己的价值取向就是群体主流的价值取向时,可能出现有意的相互欺骗。需要说明的是,在文[26]给出的模型中,所有群体成员的偏好或者完全相同,或者完全相反,与此相符的现实群体决策情形很少,甚至几乎没有。文[24,27-28]证明一致性规则在很多情况下为群体成员在审议过程中策略性地隐藏信息提供了动机,多数决定规则比一致性规则能引导出更多的信息共享。文[28]还证明,在相当一般的条件下,审议使得除一致性规则以外的所有其他规则具有相同的序贯均衡集合,也即审议使得所有的无否决权规则在序贯均衡方面等价,从而说明如果群体成员在投票表决前有向所有成员公开宣布各自私有信息的机会,那么采用除一致性规则以外的其他任何决策规则,都会产生相同的决策结果。文[29]对陪审团在审议阶段信息的披露进行了实验研究,以无约束力的意向性投票形式实现信息的交流,实验结果与理论分析基本近似。

另外,文[30]给出了一个两成员的交流与决策模型,两个成员投票表决是否组成具有不确定回报的合伙关系,他们的偏好不一致且为私有信息。文章分析了均衡的特征,发现在均衡时仅有部分信息被传递,交流对于双方的福利是有益的。

对于很多现实决策问题,决策者可能拥有客观上可验证的信息,即所谓硬信息(hard information)。文[31]对硬信息在具有偏好冲突的委员会中的交流进行了研究,证明完全信息集结均衡在偏好为私有信息的情况下比在偏好为常识情况下更有可能存在,即允许更大程度上的偏好差异;另外该文证明,如果信息可验证,完全信息集结均衡的存在条件等同于完全信息披露均衡的存在条件。文[32]指出,在审议阶段群体成员共享私有信息的动机一定程度上取决于其私有信息的可验证性,如果决策成员能够为自己的信息提供验证材料,则一致性规则比其他规则提供了更强的信息共享激励,更有可能实现完全信息共享。文章给出了在一致性规则下审议阶段存在完全信息披露均衡的充分必要条件。

文[33]指出,尽管偏好与信息的差异可能使得部分成员在审议过程中具有错误表达私有信息的动机,但给予群体成员适当的外部激励能消除此类动机,促进信息与偏好的完全集结,而且随着群体规模的扩大,外部激励的强度可以很小,外部激励的具体措施包括对成员决策能力的肯定等。

四、透明性的影响

随着社会的进步,公众对涉及自身利益的重要决策过程的透明性提出了越来越高的要求。透明的决策过程意味着公众可以评价决策群体成员的偏好、能力与贡献,从而引起决策者对自身声誉的关注,而对声誉的关注既可能促进信息的获取和真实信息的披露,但也有可能导致信息传递与投票表决行为的扭曲。

在文[34]中,委员会成员在前一时期表现出的决策能力影响了他在后一时期能否获得连任,而作为委员会成员可为其带来一定的效用。该文证明公开个人投票记录可以促进委员会成员努力获取信息。文[35]认为,仅公布最终决策结果,不公开个人投票记录,会诱导委员会成员按照现有偏见作出投票选择,因此,委员会的决策倾向于保守化,向公众公开成员的投票记录则能够减少现有偏见对决策的影响。该文同时认为,群体决策机制的设计应该不仅考虑决策过程的透明性,也要考虑决策规则的适当性,如果决策规则选择合适,则不透明的决策过程可能比透明的决策过程得到更好的决策结果。在文[34-35]所给出的模型中,都没有考虑委员会成员在投票表决前可能会相互交流各自的私有信息。

在文[36]中,委员会代表公众对一项新工程的实施与否进行表决,委员会成员既关心工程的实际价值,又关心委员会在公众中的声誉,如果维持现状,不实施新工程,则暴露出委员会成员意见的不一致,从而给委员会的声誉带来负面影响,而公众仅能注意到委员会的决策结果,事后不能观测到工程的实际价值。该文证明,在审议阶段,部分成员对声誉的过分关注可能使他们不愿真实披露私有信息,而是夸大工程的价值,导致更容易采取实施新工程的决策。文[37]认为,公开委员会的具体审议记录可能会降低决策质量。由于委员会成员关心公众对其决策能力的判断,使得他们在正式会议交流过程中可能隐藏内部存在的意见分歧,公众对于决策过程透明性的要求,可能导致委员会在正式会议之前组织秘密的非正式预备会议,将真正实质性的讨论从公开的正式会议阶段转移到秘密的预备会议阶段,从而对公众消除委员会内部意见的不一致,而非正式的会议更具有不稳定性,因此,透明性要求并不一定能增加社会福利。

在文[38-40]中,外部利益关联者可以观察到公开委员会每个成员的具体投票记录和决策结果,但对于秘密委员会则只能看到最终决策结果,而委员会成员既关心决策结果又关心外部利益关联者所给予的回报。文[38]和[39]认为,不公布委员会成员的个人投票记录可以减少外部利益关联者对决策的影响,在某些情况下秘密委员会优于公开委员会。文[39]还特别指出,由于随着群体成员数量的增加,单个成员的投票对最终决策具有决定性影响的概率减小,对单个成员而言不诚实投票的代价随之减小,所以对于公开委员会来说,其成员更容易因外部利益关联者承诺给予的回报而不诚实投票,因此Condorcet陪审团定理可能不再成立。在文[40]中,对于秘密委员会,外部利益关联者可以根据投票表决规则的阈值和最终决策结果对委员会成员的投票作出推断。文章分析了秘密委员会的最优决策规则,指出决策规则中增加选择某一选项需要的投票比例可能会导致该选项更容易成为最终决策结果,传统看法认为降低决策规则的阈值可以防止委员会过于保守的看法未必正确,但对于公开委员会则不存在此问题。文[41]虽然不是直接研究透明性,但其研究结论与此处内容相关,该文通过一个博弈模型,说明在特定情况下,外部利益集团可以不用付出任何代价就能操纵委员会的决策。

另外,不少文献从理论与实证两方面研究了决策过程的透明性对货币政策委员会决策的影响。文[7,42]对这方面的文献进行了综述。文[42]区分了三种类型的透明性:决策目标透明性;知识透明性,这里的知识指决策所依据的经济数据或经济模型等;操作透明性,包括委员会会议记录与投票记录的透明性以及决策结果的透明性等。该文评述的文献有部分运用了博弈理论作为分析工具。文[7]专门讨论了货币政策委员会决策过程中的动机问题,指出货币政策委员会的最优规模与透明性等仍有待进一步研究。

类似于文[34],研究透明性对货币政策委员会决策信息集结有效性的影响的文献,一般认为委员会成员希望得到社会公众对其决策能力或决策偏好的正面评价,从而获得连任的机会,如文[43]假设委员会成员希望公众认为他是通货膨胀的强硬抵制者,而最近的文献如文[44-46]等,则假设委员会成员希望公众认为他是具有较强决策能力者。文[44]认为,公开审议过程的详细记录会使得货币政策委员会成员不愿意表达不同的意见,该文通过对美联储联邦公开市场委员会在被要求公开会议记录之前和之后的会议记录的分析说明了理论结果的有效性。文[45-46]分析了投票记录的公开对委员会成员投票表决行为的影响,认为投票记录对公众的透明带来的负面效应占主导地位,透明性不能增加社会福利。

五、最优决策规则

显而易见,不同的决策规则极大地影响了群体决策的信息集结效率,尤其是决策群体成员的偏好或能力不完全一致时,决策规则更是直接影响了群体成员的投票选择行为,进而影响了决策结果的正确性。前述文献大多不同程度地讨论了决策规则的比较和选择,除此以外,另有部分文献对各种情况下的最优决策规则进行了研究。

文[47-48]从最大化期望效用的角度对固定规模的委员会形式集体决策的最优决策规则进行了分析,文[49-50]研究了在特定约束条件下的最优决策规则。然而,这些早期的文献都有个潜在的假设:决策成员仅按照自身获得的信息作出投票选择。文[2,51]等指出,即使决策群体成员的偏好完全一致,也不能保证一定能够如Condorcet陪审团定理所预测的那样有效集结各成员的信息,因为群体成员仅根据自身信息作出非策略性的选择不符合理性要求,当且仅当所使用的决策规则为集结群体成员私有信息的最优规则时,所有群体成员仅按自身信息投票才是Nash均衡,而最优决策规则则取决于特定的决策情形。

文[52]证明,当采用文[48]所定义的最优决策规则时,所有成员仅按照自身获得的信息投票表决形成Nash均衡,但仅按自身信息投票可能不是有效的,因为部分成员联合决定策略性投票可以增加期望效用。文[53]讨论了投票者对不同决策选项具有可用基数表示的效用时的诚实投票问题,试图给出当决策机制允许多种消息类型时诚实投票的准确定义。为使投票者具有诚实投票的动机,文[54]提出了一种在随机选择的投票表决集合上运用多数决定规则得到最终决策的方法,在对所有投票者的表决结果运用多数决定规则和仅对投票表决结果的随机抽样子集运用多数决定规则之间进行随机选择,可以激励投票者诚实投票,从而得到Condorcet陪审团定理的有效性收敛结果。

文[55]基于陪审员的私有信息和策略性表决行为构建了一个陪审团决策模型,证明一致同意规则可能会导致无辜被告得到有罪判决和有罪被告得到无罪判决这两种错误的概率都增加。文[56]分析了决策群体所投票表决的决策选项不独立于投票表决规则的情形:给定决策群体的投票表决规则,提案者向决策群体提出一个要么完全接受要么完全拒绝的议案,群体投票表决是接受还是拒绝该议案。该文证明由于一致同意规则能促使提案者提出更有吸引力的议案,所以增加了决策群体的期望效用,在某些情况下,一致同意规则甚至是Pareto最优的表决规则,因为它也增加了提案者的期望效用,即使提案者与决策群体的利益追求可能完全相反。总结考虑一致性规则的文献[22,24,27,28,32,55,56],可见博弈分析得到的结论往往与人们直观上的认识截然相反,一致性规则是不是合适的决策规则完全取决于特定的决策情形。

既然投票表决规则直接影响了投票者的投票选择行为,那么,对于群体决策机制的设计者来说,他在选择投票表决规则时是否需要考虑投票者在各种表决规则下的投票行为,换言之,机制设计者关于投票者在各种规则下的博弈行为的信念是否会影响到最优决策规则的选择。文[57-58]对此问题进行了研究,其中假设群体成员的决策偏好完全一致。文[57]分析了决策成员的能力存在差异且这种差异是常识的情况下的投票表决规则,指出最优的匿名单调投票规则并不取决于成员是否按照自身信息投票或策略性投票。类似于文[57]的结论,文[58]认为,决策机制设计者对最优投票表决规则的选择与机制设计者关于投票者在不同表决规则下的投票行为的信念无关,在该文中,机制设计者为决策群体选择投票表决规则,其目的是为了最大化决策群体的期望福利,文章证明,仅从信息集结的角度看,关于投票者在各种表决规则下的投票行为的不同假设对于最优决策规则的选择来说,结论是一样的,不同的行为假设导致相同的结论。对于具有相同偏好的决策群体来说,文[57-58]的研究结论大大简化了决策规则的选择。

现实中的决策群体往往存在具有极端偏好的成员,这些成员的存在为信息的有效集结带来较大的困难。文[59]对存在极端偏好者和中立者的群体面对二分决策问题时的最优决策规则进行了研究,考虑了决策成员之间存在转移支付的情况,指出最优投票表决规则相对于转移支付可能性的大小来说是非单调的。文[60]对由两类具有完全相反的偏好的成员所组成的委员会决策进行了分析,对比了一致性规则与非一致性规则的信息集结效率。文[61]给出了一个现实中较难接受的非单调性决策规则――超多数惩罚(supermajority penalty)规则,当选择某一选项的投票过多时,将该选项作为群体决策最终结果的概率反而会下降,该文证明,当对于每个选项都存在极端偏好者时,超多数惩罚规则是最优匿名激励相容规则。

前述文献都假定群体成员的偏好相互独立,而文[62]对群体成员具有相互关联但不完全相同的偏好的情况进行了分析,其中的决策选择空间是连续的,该文分别讨论了采用平均规则与中值规则时所对应博弈的对称贝叶斯Nash均衡的存在性问题,并比较了这两种规则在不同偏好关联程度下的性能。

由于从众心理,群体成员经常会根据对其他成员行为的观察相应调整自己的行为。文[63-64]对从众心理对群体决策的影响进行了研究,其中假定群体成员一方面希望选出好的决策选项,另一方面又希望自己成为胜出的一方。文[63]分析了群体规模较大时同时投票机制与顺序投票机制的均衡特征和信息集结质量,文[64]指出这种从众心理导致同时存在多个均衡,而且对于这些均衡中的多数,信息不能被有效集结。文[64]从某种程度上说明了最优决策规则设计的困难。

六、现有研究工作的不足之处

其一,社会选择理论与公共选择理论以及管理学领域对群体决策的研究,主要考虑偏好集结的有效性,而其中的偏好则是指对决策选项的偏好,这种偏好取决于决策者对最终结果的更根本意义上的偏好和对世界真实状态的信念。在现实社会中,纯粹以偏好的有效集结为终极目标的重要群体决策问题几乎不存在,例如社会选择理论与公共选择理论最重要的应用领域――选举,既是偏好集结(这里指更根本意义上的偏好),更是信息集结。仅考虑偏好的集结问题,不考虑偏好的形成过程以及信息在偏好形成过程中的潜在作用,无法分析群体内外部交流与互动等对决策的影响,无法解释现实中的很多现象,因而对相关决策机制设计的指导作用较为有限。

其二,社会心理学从认知的角度研究群体决策,其结论出自于对实验和经验数据的统计学分析,易于为人们接受。但由于从实验或经验数据中利用统计学方法推导出群体的偏好分布参数极为困难,所以无法深入研究群体决策过程中因偏好不一致而导致的隐藏与扭曲私有信息等策略。

其三,与社会选择理论和公共选择理论一样,用博弈论研究群体决策信息集结问题的文献也是以理性选择假设作为判断与决策的微观基础。尽管所有群体成员严格按照贝叶斯规则更新自己的信念等完全理性假设对于心理学家和普通人来说都是难以接受的,但博弈论文献还是以其数学分析的简洁与严谨颠覆了很多直觉上的认识,通过对群体决策者动机的分析,有助于我们理解决策机制的哪些方面可能会引起不利于决策目标实现的策略,进而有助于决策机制的改进。随着群体成员偏好差异程度和决策问题重要程度的增加,审议方式和决策规则趋向于书面化和正规化,群体思维与群体极化现象将很少出现,决策结果也将更接近于博弈分析的预测。

目前对群体决策信息集结问题的研究尚处于起步阶段,还有很多不完善之处,在某些方面甚至存在根本性的缺陷。

第一,可能是受到信息经济学研究的误导,本领域的很多理论与实验分析文献,包括一些奠基性的文献,混淆了信息与在信息基础上形成的判断。真实信息的披露不会引起其他群体成员以及公众对自己决策能力的负面评价,更不会如判断的披露那样引起认知上的从众,如果决策者掌握了确凿可靠的信息,则其不会因为其他人基于其他信息产生的不同看法而轻易改变自己的信念。

除个别文献外,现有研究群体决策信息集结问题的文献几乎都是将审议完全等同于信息经济学领域的廉价磋商,将交流限制为每个群体成员同时向所有其他成员发送一轮公开的消息。在现实群体决策过程中,审议至少包括对各方面提供的信息的真实性的审议,以及对信息与世界真实状态之间的逻辑关联(即潜在的决策模型)的审议。因此,将审议建模为完全的廉价磋商的现实意义极为有限,对于偏好差异较大的群体更是如此。

第二,客观上难以验证的信息的可接受性,取决于接收者对于信息发送者的偏好的信念,例如,人们有充分的理由怀疑垄断企业单方面提供的企业运营成本数据的真实性。另一方面,在很多情况下,信息的软硬程度(可验证程度)与信息获取者和信息接收者的成本投入相关。因此,群体成员获取可验证信息与不可验证信息的动机,以及群体成员对信息软硬程度的投入,既取决于是否有审议阶段以及审议方式和决策规则,也取决于群体成员的偏好和群体成员关于群体偏好差异程度的先验信念。诸如此类问题现有文献几乎没有涉及。

群体决策在现代社会无处不在,如政府部门对重大战略性问题的决策、公司董事会对重要项目投资与实施问题的决策、审判委员会对犯罪嫌疑人的判决、专家对科学基金项目申请书的评审等。从组织或社会的目标出发,针对特定的决策问题,为了尽可能作出正确的决策,应该如何组成决策群体,选择何种决策规则?此类群体决策的科学化与民主化问题很久以来一直是管理、政治、法律和经济等领域讨论的中心,其研究结果对于各类政治、社会、经济组织的运行机制设计具有重要的意义。

中国学者对群体决策的理论与方法进行了大量的研究,提出了不少新的概念和方法,作出了很多重要贡献,国家自然科学基金委员会对群体决策理论与方法研究也较为重视,曾将其列为优先资助领域。但根据现有的各类文献和历年的基金项目研究摘要,总体感觉国内对决策群体成员的动机和理考虑较少,到目前为止还没有发现国内其他学者利用博弈论研究群体决策信息集结问题。

笔者试图利用不完全信息博弈论和机制设计理论,研究决策群体成员的策略性信息获取、信息传递和投票表决行为,揭示决策群体人员组成、审议方式、决策规则、透明性等决策机制的各个方面对群体决策的信息集结有效性的具体影响。并试图从信息集结角度,为一些典型公共决策情形优化决策机制。

参考文献:

[1] PIKETTY T. The informationaggregation approach to political institutions[J]. European Economic Review, 1999, 43(4-6):791-800.

[2] AUSTENSMITH D, BANKS J. Information aggregation, rationality, and the Condorcet jury theorem[J]. American Political Science Review, 1996, 90(1):34-45.

[3] FEDDERSEN T, PESENDORFER W. The swing voter’s curse[J]. American Economic Review, 1996, 86(3):408-424.

[4] FEDDERSEN T, PESENDORFER W. Voting behavior and information aggregation in elections with private information[J]. Econometrica, 1997, 65(9):1029-1058.

[5] MYERSON R. Extended Poisson games and the Condorcet jury theorem[J]. Games and Economic Behavior, 1998, 25(1):111-131.

[6] FEDDERSEN T, PESENDORFER W. Elections, information aggregation, and strategic voting[J]. Proceedings of the National Academy of Sciences of the United States of America, 1999, 96:10572-10574.

[7] FUJIKI H. The monetary policy committee and the incentive problem: A selective survey[J]. Monetary and Economic Studies, 2005, 23(S1):37-82.

[8] VANDENBUSSCHE J. Elements of optimal monetary policy committee design[EB/OL]. IMF Working Paper No. 06/277, 2006. (2006-06-30) 省略/external/pubs/ft/wp/2006/wp06277.pdf.

[9] GERLING K, GRNER H, KIEL A, SCHULTE E. Information acquisition and decision making in committees: A survey[J]. European Journal of Political Economy, 2005, 21(3):563-597.

[10] Mukhopadhaya K. Jury Size and the Free Rider Problem[J]. The Journal of Law, Economics, and Organization, 2003, 19:24-44.

[11] MARTINELLI C. Would rational voters acquire costly information?[J]. Journal of Economic Theory, 2006, 129(1):225-251.

[12] MARTINELLI C. Rational ignorance and voting behavior[J]. International Journal of Game Theory, 2007, 35(3):315-335.

[13] KITAHARA M, SEKIGUCHI Y. Condorcet’s jury theorem under costly information acquisition[EB/OL]. Working Paper, University of Tokyo, 2004. (2004-04-25).e.utokyo.ac.jp/cemano/research/DP/documents/coef54.pdf.

[14] KITAHARA M, SEKIGUCHI Y. Aggregate accuracy under majority rule with heterogeneous cost functions[J]. Economics Bulletin, 2006, 4(25):1-8.

[15] KITAHARA M, SEKIGUCHI Y. Condorcet jury theorem or rational ignorance[J]. Journal of Public Economic Theory, 2008, 10(2):281-300.

[16] BAG P, LEVINE P, SPENCER C. A note on: Jury size and the free rider problem[J]. Economics Bulletin, 2006, 4(3):1-12.

[17] TRIOSSI M. Costly information acquisition. Better to toss a coin?[EB/OL]. Working Paper, Collegio Carlo Alberto, 2010.(2010-03-15).webmanager.cl/prontus_cea/cea_2010/site/asocfile/ASOCFILE120100127120554.pdf.

[18] SWANK O, WRASAI P. Deliberation, information aggregation, and collective decision making[EB/OL]. Working Paper, Tinbergen Institute, 2003.(2003-06-20) .tinbergen.nl/discussionpapers/02006.pdf.

[19] CAI H. Costly participation and heterogeneous preferences in informational committees[J]. The RAND Journal of Economics. 2009, 40(1):173-189.

[20] BENIERS K, SWANK O. On the composition of committees[J]. Journal of Law, Economics, and Organization, 2004, 20(2): 353-378.

[21] LI H. A theory of conservatism[J]. Journal of Political Economy, 2001, 109(3):617-636.

[22] NICOLA P. Committee design with endogenous information[J]. Review of Economic Studies, 2004, 71(1):165-191.

[23] GERARDI D, YARIV L. Information acquisition in committees[J]. Games and Economic Behavior, 2008, 62(2):436-459.

[24] AUSTENSMITH D, FEDDERSEN T. Deliberation and voting rules[M]//AUSTENSMITH D, DUGGAN J. Social choice and strategic decisions. Berlin: Springer Berlin Heidelberg, 2005:269-316.

[25] COUGHLAN P. In defense of unanimous jury verdicts: Mistrials, communication, and strategic voting[J]. American Political Science Review, 2000, 94(2): 375-393.

[26] MEIROWITZ A. In defense of exclusionary deliberation: Communication and voting with private beliefs and values[J]. Journal of Theoretical Politics, 2007, 19(3): 301-327.

[27] AUSTENSMITH D, FEDDERSEN T. Deliberation, preference uncertainty, and voting rules[J]. American Political Science Review, 2006, 100: 209-217.

[28] GERARDI D, YARIV L. Deliberative voting[J]. Journal of Economic Theory, 2007, 134(1): 317-338.

[29] GUARNASCHELLI S, MCKELVEY R, PALFREY T. An experimental study of jury decision rules[J]. American Political Science Review, 2000, 94: 407-423.

[30] DORASZELSKI U, GERARDI D, SQUINTANI F. Communication and voting with doublesided information[J]. Contributions to Theoretical Economics, 2003, 3(1), Article 6.

[31] SCHULTE E. Information aggregation and preference heterogeneity in committees[J]. Theory and Decision, 2010, 69(1):97118.

[32] MATHIS J. Deliberation with partially verifiable information[EB/OL]. THEMA Working Papers No. 2006-03, (2006-08-20). ucergy.fr/IMG/2006-03.pdf.

[33] MEIROWITZ A. Designing institutions to aggregate preferences and information[J]. Quarterly Journal of Political Science, 2006, 1(4): 373-392.

[34] GERSBACH H, HAHN V. Information acquisition and transparency in committees[EB/OL]. CEPR Discussion Paper no. 6677, London, Centre for Economic Policy Research, (2009-06-20). papers.省略/sol3/papers.cfm?abstract_id=1084060.

[35] LEVY G. Decision making in committees: Transparency, reputation and voting rules[J]. American Economic Review, 2007, 97(1):150-168.

[36] VISSER B, SWANK O. On committees of experts[J]. The Quarterly Journal of Economics. 2007, 122(1):337-372.

[37] SWANK O, VISSER B. Is transparency to no avail? Committee decisionmaking, premeetings, and credible deals[EB/OL]. Working Paper, Tinbergen Institute, (2009-06-18). people.few.eur.nl/bvisser/articles/Transparency%20Dec%202009.pdf.

[38] SEIDMANN D. A Theory of voting patterns and performance in private and public committees[EB/OL]. CeDEx Discussion Paper 2009-06, (2009-10-15). nottingham.ac.uk/economics/cedex/papers/2009-06.pdf.

[39] FELGENHAUER M, GRUNER H. Committees and special interests[J]. Journal of Public Economic Theory, 2008, 10(2): 219-243.

[40] SEIDMANN D. Optimal quotas in private committees[J]. The Economic Journal, 2008, 118(525):16-36.

[41] DAL B E. Bribing voters[J]. American Journal of Political Science, 2007, 51(4):789-803.

[42] HAHN V. Transparency in monetary policy: A survey[J]. IFO Studien, 2002, 48(3):429-455.

[43] SIBERT A. Monetary policy committees: Individual and collective reputations[J]. The Review of Economic Studies, 2003, 70(3):649-665.

[44] MEADE E, STASAVAGE D. Publicity of debate and the incentive to dissent: Evidence from the US Federal Reserve[J]. The Economic Journal, 2008, 118(528):695-717.

[45] HAHN V. Committees, sequential voting and transparency[J]. Mathematical Social Sciences, 2008, 56(3):366-385.

[46] HANS G, HAHN V. Should the individual voting records of central bankers be published?[J]. Social Choice and Welfare, 2008, 30(4):655-683.

[47] NITZAN S, PAROUSH J. Optimal decision rules in uncertain dichotomous choice situation[J]. International Economic Review, 1982, 23:289-297.

[48] BENYASHAR R, NITZAN S. The optimal decision rule for fixedsize committees in dichotomous choice situations: The general result[J]. International Economic Review, 1997, 38:175-186.

[49] BENYASHAR R, KHULLER S, KRAUS S. Optimal collective dichotomous choice under partial order constraints[J]. Mathematical Social Science, 2001, 41:349-364.

[50] KRAUS S. Optimal collective dichotomous choice under quota constraints[J]. Economic Theory, 2002, 19:839-852.

[51] MCLENNAN A. Consequences of the Condorcet jury theorem for beneficial information aggregation by rational agents[J]. American Political Science Review, 1998, 92:413-418.

[52] BENYASHAR R. Information is important to Condorcet jurors[J]. Public Choice, 2006, 127(3):305-319.

[53] BALLESTER M, REYBIEL P. Does uncertainty lead to sincerity? Simple and complex voting mechanisms[J]. Social Choice and Welfare, 2009, 33(3):477-494.

[54] LASLIER J, WEIBULL J. Providing incentives for informative voting[EB/OL]. Working Paper, Ecole Polytechnique, (2006-10-10). hal.inria.fr/docs/00/24/30/42/PDF/2007-01-04-1531.pdf.

[55] FEDDERSEN T, PESENDORFER W. Convicting the innocent: The inferiority of unanimous jury verdicts under strategic voting[J]. The American Political Science Review, 1998, 92(1):23-35.

[56] BOND P, ERASLAN H. Strategic voting over strategic proposals[J]. Review of Economic Studies, 2009, 77(2):459-490.

[57] BENYASHAR R, MILCHTAICH I. First and second best voting rules in committees[J]. Social Choice and Welfare, 2007, 29(3):453486.

[58] COSTINOT A, KARTIK N. On optimal voting rules with homogeneous preferences[EB/OL]. Working Paper, Massachusetts Institute of Technology,(2009-05-25). econmit.edu/files/3732.

[59] MEHMET B, PARIMAL K B. Committee decisions with partisans and sidetransfers[J]. Theory and Decision, 2002, 52(3):267286.

[60] JAEHOON K. A model of adversarial committees[EB/OL]. Working Paper, University of Rochester, (2005-09-12).省略.rochester.edu/~jaek/Adversarial.pdf.

[61] CHWE M. Anonymous procedures for Condorcet’s model: Robustness, nonmonotonicity, and optimality[J]. Quarterly Journal of Political Science, 2010, 5(1):4570.

[62] GRNER H, KIEL A. Collective decisions with interdependent valuations[J]. European Economic Review, 2004, 48(5):1147-1168.

博弈论的方法篇(4)

一、博弈论的形成和发展

1、博弈理论的早期研究。一般认为,对于博弈理论的最早研究可以追溯到18世纪初。瓦德格拉夫(Waldegrave)在1713年提出了两人博弈的极小化极大混合策略解。古诺(Cournot)和伯特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型,两位学者分别从产量决策和价格决策分析垄断的双寡头竞争模型,确定了在竞争之下各自的最优反映函数。这些都是关于博弈问题的早期的零星研究。

2、博弈论发展的不同阶段。一般认为博弈论萌芽于20世纪20年代初。博弈论创立的标志是冯・诺伊曼和奥・摩根斯坦(Morgenstern)在1944年的《博弈论与经济行为》这部著作,他们的贡献现在看来主要是创立了博弈论研究的基本概念、二人零和博弈的完全解决和对合作博弈的贡献。现在应用更为普遍的非合作博弈理论的创立,则是以纳什(John Nash)1950年的博士论文《非合作博弈》为标志,该文的主要贡献是提出了纳什均衡的概念。此后(20世纪70年代),美国海萨尼(Harsanyi)和德国塞尔顿(Selten)的不完全信息博弈理论工作进一步完善了非合作博弈理论。当20世纪70年代经济学家开始将注意力由价格制度转向非价格制度时,博弈论逐渐成为经济学的基石。

1944年,冯・诺伊曼(Von Neumann)和奥・摩根斯坦(Morgenstern)合著的《博弈论与经济行为》被认为是博弈理论初步形成的标志。该书在总结以往关于博弈的研究成果的基础上,提出了博弈论的概念术语、一般框架和表述方法,提出了较系统的博弈理论。而且,在该书以前,博弈论主要是数学家们研究的课题,主要是一种数学理论而不是经济学理论。《博弈论与经济行为》极大地促进了博弈论和经济学研究的联系。从此,博弈论开始被经济学家们所接受,对博弈论的发展起了巨大的推动作用。虽然《博弈论与经济行为》的出版标志着博弈论的初步形成,但是这个时候的博弈论还是比较幼稚的,研究的范围也较小,总体影响也很小。研究的主要对象是少数类型的合作博弈和零和博弈。

20世纪的40年代末到50年代初,是博弈论的发展史上一个重要阶段。越来越多的学者进行了博弈理论的研究。1950年,纳什(John Nash)在他的博士论文《非合作博弈》中,将博弈论扩展到了非零和博弈,最终形成了非合作博弈理论的思想源泉,纳什均衡概念的提出以及纳什均衡存在性的纳什定理的证明,发展了以纳什均衡概念为核心的非合作博弈理论。纳什均衡是对古诺模型和伯特兰德模型中均衡概念的一般化,纳什均衡的概念是有关均衡概念的最基本的概念,后来的子博弈精炼纳什均衡,贝叶斯纳什均衡、精炼贝叶斯纳什均衡等概念的提出都是以纳什均衡为研究出发点的。

20世纪50年代中后期一直到70年代也是博弈论发展历史上较为重要的一个时期。“微分均衡”、“强均衡”、“重复博弈”以及在此基础上的完全信息动态博弈等概念就是在这一时期提出来的,而且在60年代初开始了博弈论在进化生物学中的应用的研究。这个时期产生的里程碑式的成果是海萨尼(Harsanyi)关于不完全信息博弈理论,他在1967-1968年的三篇关于不完全信息博弈理论的论文中,提出了关于不完全信息静态博弈的“贝叶斯纳什均衡”的概念,此外还在1973年提出了关于“混合策略”的不完全信息解释,以及关于不完全信息动态博弈的严格“纳什均衡”概念。同时这个时期也是进化博弈论发展的重要阶段,提出了“进化稳定策略”等概念。当然,这个时期产生的博弈论成果还有很多,博弈论更多地应用到经济学理论的研究当中,为80-90年代博弈论的成熟以及经济学理论的博弈论革命起了很大的推动作用。

20世纪80-90年代到现在是博弈论走向成熟的时期,期间产生了大量的研究成果和文献,表明博弈论已经作为一种一般的分析方法逐渐走进了政治学、军事学、生物学、统计学等多门学科中。尤其是在经济学中,博弈论占据了核心地位。这个时期,是对非合作博弈理论的进一步深化,产生了博弈论基础上的经济学分支,如信息经济学,以及一些关于特殊问题的理论,如拍卖理论、激励理论。早在1983年,因一般均衡理论而得到诺贝尔经济学奖的德布鲁(J・Debreu)表明,如果没有博弈论中纳什均衡的重要概念,也就没有他对一般均衡的存在性的证明。到了90年代,克莱普斯(D・Kreps)、克鲁格曼(P・Krugman)和格罗斯曼(S・Grossman)都是因为在博弈论上的贡献而获得了美国的克拉克奖(Clark Prize),这是美国对40岁以下经济学家的最高奖。之后,博弈论两度夺得诺贝尔经济学奖,1994年颁给纳什(Nash)、海萨尼(John Harsanyi)和塞尔顿(Reinhard Selten)三位博弈论专家;2005年颁给罗伯特・奥曼(Robert J・Aumann)和托马斯・谢林(Thomas C・Schelling )。

二、博弈的类型及其均衡概念

博弈理论有合作博弈和非合作博弈之分。合作博弈强调团体理性,强调效率、公平和公正,非合作博弈更强调个体理性、个体的最优决策。按照参与人行动的先后顺序,博弈可以分为静态博弈和动态博弈。完全信息博弈是指每个参与者对所有其他参与者的特征、策略空间和支付函数有准确的知识;否则,就是不完全信息博弈。下图是基于上述分类方法的博弈类型以及各自的均衡概念。

三、博弈论的研究趋势及未来

1、合作博弈和非合作博弈之分。博弈论有合作博弈和非合作博弈之分,现在的研究更多地是基于非合作博弈的研究,事实上合作博弈也是博弈理论的重要内容。当前合作博弈理论研究的落后,正说明这个领域有很大的发展潜力,基于这方面的研究可能会带来博弈理论以及经济学理论的重大革命。

博弈论的方法篇(5)

【关键词】唯物辩证法 经典博弈论 演化博弈论 经济学革命

一、博弈论与辩证法

1.辩证法要义

辩证法,源出希腊文,含义是进行谈话、进行论战。这一术语在哲学史上曾在各种不同的意义上被使用,其历史发展经历了古代的朴素辩证法、以黑格尔为代表的唯心辩证法、马克思主义的唯物辩证法等三个阶段。19世纪中叶,马克思和恩格斯在概括革命实践经验和自然科学新成果的基础上,批判地继承了黑格尔的唯心主义辩证法,创立了唯物主义辩证法,他们认为,世界“是一幅由种种联系和相互作用无穷无尽地交织起来的画面”,唯物辩证法就是对这一生动画面的概括和反映。从内容上看,唯物辩证法作为科学的理论体系包括对立统一(矛盾)、质量互变、否定之否定三大基本规律,以及本质与现象、内容与形式、原因和结果、必然性和偶然性、可能性和现实性五对基本范畴。总体上看,唯物辩证法是对客观物质世界普遍联系和永恒发展这一基本特征的揭示和反映,既是一种世界观又是一种方法论。

2.博弈论的内涵及其发展阶段

博弈论作为数学的一个分支,本身不涉及经济问题。这种理论是一种分析工具,它研究怎样以数学模型模拟决策者之间的冲突与合作。由于冲突与合作的结果依赖于所有人所作的选择,每个决策者都企图预测其他人可能的抉择,以确定自己的最佳决策。如何合理地进行这些相互依存的战略策划便是博弈论的主题。

博弈论的发展经历了以下三个阶段:

一是思想萌芽阶段。1838年古诺简单双寡头垄断博弈、1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断、2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的、片断的研究,带有很大的偶然性,很不系统。

二是经典博弈论形成阶段。1944年冯·诺依曼和摩根斯坦的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础;1950年和1951年纳时发表了《n人博弈的均衡点》和《非合作博弈》两篇关于非合作博弈的文章、1950年Tucker定义了“囚徒困境”;60年代,泽尔滕将纳什均衡的概念引入了动态分析,提出了“精炼纳什均衡”概念、海萨尼则把不完全信息引入了博弈论的研究;80年代,克瑞普斯和威尔逊研究了动态不完全信息博弈。总体来说,经典博弈论主要关注纳什均衡的形成,以及当纳什均衡存在多重性时,如何通过不断地精炼来寻找最终的结局。

三是博弈论在当前的发展阶段。20世纪90年代以来,演化博弈论、博弈学习理论、行为博弈等研究成为博弈论的最新发展,主要从博弈论的角度探索正式和非正式制度的形成与演变、通过实验来检验和修正有关经济人的行为理论等问题。

二、博弈论对西方经济学的改良

首先,传统西方经济学对寡头市场和垄断竞争市场和市场失灵问题的研究是苍白无力的,这使得传统西方经济学解释现实的能力并不像其宣扬的那样完美。博弈论作为工具在西方经济学中的应用正好弥补了传统西方经济学的这一缺陷。正如克雷普斯在《博弈论与经济模型》一书中所作的评价:“我认为博弈论最成功之处在于使一望而知的直觉认识规范化,从而使人们了解这类直觉认识怎样应用于新的形势,以及在较为复杂的形势下怎样获得这种直觉认识。”“博弈论提出的问题正是那些‘在理论上难以解释’的合乎情理的直观行为,非合作博弈理论只是应用数学理论提供了分析这类行为的简单工具。”

其次,“博弈论在经济学获得巨大成功的主要原因,是它提供了模拟和分析动态性竞争互动的技术手段。”互动结构是一种社会结构,长期以来,经济学家一直试图理解个人行为与社会结构之间的关系。美国经济学家H·培顿·扬在《个人策略与社会结构——制度的演化理论》一书中认为:“经济制度和行为模式可以被解释为很多个人决策的产物或者说结果……那么,有哪些特征能将‘演化’的观点与经济学中的古典观点区别开来呢?一个是符合均衡的状态,另一个是符合理性的状态。”H·培顿·扬是演化博弈论领域的领军人物,他的上述这段引文清楚地表明了新古典研究传统的两大缺陷:一是没有动态分析,尤其是没有关于复杂情况下的动态分析;二是脱离现实太远的强经济人假定。演化博弈论将经济运行理解为一个动态演化的过程,并认为经济人并不是强理性的,而是适应性理性的。在动态演化的过程中,经济人通过不断的学习来提高理性程度,进而实现最优决策,这无疑推动了西方经济学的发展。

上面我们从两个方面分析了博弈论给西方经济学带来的变化,但不能据此就认为博弈论给西方经济学带来了革命。第一,博弈论并没有从整个体系上改革西方经济学,只是对其进行修修补补,将西方经济学原本不能解决或解决不好的问题给予改良。第二,新兴起的演化博弈论虽然为西方经济学的动态演化分析提供了工具,但随着研究的深入也对西方经济学提出了挑战。“随着一组新的分析工具特别是博弈论和信息经济学的出现和越来越明显的经验证据表明,瓦尔拉斯模型存在缺陷,经济学教学和实践的方式正在发生改变。经济参与人不再单纯与自然或是其他环境参数打交道,而是有策略地与其他经济人交往。”经典博弈论(如非合作博弈论中的完全信息条件下的静动态博弈和不完全信息条件下的静动态博弈)为经济人的互动决策建立了模型,从而部分解决了上述问题。然而,非合作博弈论在基本模式上依然遵循均衡模式,只不过将范围从瓦尔拉斯的单个经济人拓展到相互影响的两个人或多人之间的均衡。经济社会运行是一个不断从均衡走向非均衡,又从非均衡走向均衡的动态演变过程。这与瓦尔拉斯传统所宣扬的一般均衡是不相容的。如果说以非合作博弈理论为代表的经典博弈论还能在某种程度上对西方经济学进行补充的话,当演化博弈论兴起以后,瓦尔拉斯传统就再也无法自圆其说了。但由于西方经济学本身固有的辩护性,它不会允许新理论去触动传统理论的核心,与上述引文出自同一本书的一段话清楚地表明了这一点,“在许多经济学家和其他学科学者贡献的基础上,本书提出了关于个人行为与经济制度如何相互作用产生总体效果,以及两者随着时间的推移如何变化的理论。”根据上面的分析,我们不难看出博弈论改良了西方经济学,但却没给其带来革命。一方面,博弈论本身体现着辩证思维,其与传统西方经济学形而上学的方法论相比,更符合真实世界的运行,因而能在一定意义上给西方经济学带来改变,使其科学性稍稍加强;但另一方面,博弈论又囿于西方经济学本身的辩护性,作为一个工具它的应用被限制在一定的范围内,无法给西方经济学带来革命。只有将马克思唯物辩证法与博弈论相结合,使其具有唯物辩证法所具有的革命性,才有可能为经济学带来一场革命。

三、改造博弈论的设想及借鉴意义

我们设想可以从以下几个方面对博弈论进行批判性的吸收和改造,以便为马克思经济学的发展所用。

1.“社会生活在本质上是实践的。凡是把理论导致神秘主义的神秘东西,都能在人的实践中以及对这个实践的理解中得到合理的解决。”演化博弈论之所以在当前蓬勃发展且应用前景广泛,其根本原因在于其突破了经济人的超理性假定,如果再向前走几步,其科学性会大大增强,指望西方经济学家来完成这项工作是不可能的,只有马克思和马克思经济学者有这样的革命性。从这个意义上说,演化博弈论中学习着的人正在向马克思实践的人靠近,也为马克思经济学的发展提供了新的工具。

2.将马克思生产力与生产关系辩证统一原理与演化博弈论关于经济社会动态演变的理论分析结合起来。马克思生产力与生产关系辩证统一原理是唯物辩证法在人类社会历史发展中的应用。马克思主义哲学认为,生产力与生产关系、经济基础与上层建筑之间的矛盾是社会基本矛盾,它们的运动形成社会发展的基本规律,同时也构成社会发展的根本动力,社会是在对立统一、否定之否定的螺旋式发展中上升的。这一原理体现在马克思经济学中就是资本主义制度自身的发展造就了替代自己的新的共产主义制度,同时,每一制度下的各种上层建筑又由构成其经济基础决定的。演化博弈论主张用从均衡到非均衡、再由非均衡到均衡动态演变方法来分析社会制度的形成、驻存和演变,这一点与马克思的分析有着相通之处,可以用马克思的思想对其进行改造。

3.利用西方社会科学正以博弈论为基本分析工具走向融合之路的契机,可以在改造后的博弈论框架下批判吸收西方相关社会科学发展的成果。近年来,西方社会科学各学科在大量地应用博弈论对本学科进行改写和发展,呈现出各社会科学统一的趋势,跨学科研究方兴未艾。如果能将博弈论这种分析工具融入马克思的分析中,那么将为马克思理论批判吸收西方社会科学的最新研究成果提供一个平台。

参考文献:

[1]马克思恩格斯选集(中文第二版):733.

[2] [美]戴维·M.克雷普斯著,邓方译.博弈论与经济模型.商务印书馆,2006:94.

[3][美]戴维·M.克雷普斯著,邓方译.博弈论与经济模型.商务印书馆,2006:45.

[4][美] H·培顿·扬著,王勇译.个人策略与社会结构——制度的演化理论.上海三联书店、上海人民出版社,2004:4.

[5][美]萨缪·鲍尔斯著,江艇、洪福海、周业安译,微观经济学:行为,制度和演化.中国人民大学出版社,2006:6.

[6]马克思恩格斯选集(中文第二版)(第一卷):58.

[7]马克思恩格斯选集(中文第二版)(第1—4卷).北京:人民出版社,1995.

[8]梁树发.马克思主义哲学原理.北京:中国人民大学出版社,2003.

[9]李建平.《资本论》第一卷辩证法探索.北京:社会科学文献出版社,2006.

[10]李云峰.马克思学说中人的概念.北京:人民出版社,2007.

[11]杨耕,陈志良,马俊峰.马克思主义哲学研究.北京:中国人民大学出版社,2000.

博弈论的方法篇(6)

博弈论又称为“对策论”,一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如军事领域、经济领域、政治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。

博弈论的研究开始于本世纪,1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成,随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖,使博弈论在经济领域中的地位和作用得到权威性的肯定。

2. 博弈论的基本原理和方法

文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来,博弈论模型可以用五个方面来描述

G={P, A, S, I, U}

P: 为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。

A: 为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策,重复博弈和微分对策等。

S:博弈的进程,也是博弈进行的次序。局中人同时行动的一次性决策的博弈,成为静态博弈,如齐威王和田忌赛马;局中人行动有先后次序,称为动态博弈,如下棋。

I: 博弈信息,能够影响最后博弈结局的所有局中人的情报,如效用函数,响应函数,策略空间等。打仗强调“知己知彼,百战不殆”,可见信息在博弈中占重要的地位,博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈(game with complete information),例如齐威王和田忌赛马,各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈(game with incomplete information),例如投标拍卖,博弈各方均不清楚对方的估价。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈(game with perfect information),例如下棋,双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”(game with imperfect information)。由于信息不完美,博弈的结果只能是概率期望,而不能象完美信息博弈那样有确定的结果。

U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。

还有另一类型博弈称为多人合作博弈,例如安理会投票表决,OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上,它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域,特征函数表示各个联盟的得益(N是局中人的数目),它的分配解必须符合一定的合理性和稳定性,它的解的概念也发展成多种多样,包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要,针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。

不管博弈各方是合作、竞争、威胁还是暂时让步,博弈论模型的求解目标就是使自身最终的利益最大化,这种解建立在对方也采取各自“最好策略”为前提,各方最终达到一个力量均衡,也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。

3、博弈论与电力市场

博弈论是研究市场经济的重要工具。电力作为特殊的商品,它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中,遇到很多前所未有的新课题,运用博弈论来分析解决其中一些问题是一个研究方向。 用博弈论模拟电力市场,模拟的结果可能更加接近实际,为市场模式设计提供依据。另外,电厂或用电用户作为市场的参与者,可以用博弈论来分析市场,研究如何报价获利最大。

正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如:力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法;而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题:如何识别合作伙伴,结盟利益如何在联盟内分配。电力市场环境下,电网输电作为一项服务,它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解:稳定集,核心,核仁,Shapely值等,如何合理选择或创造最接近实际的解的概念也是面临的课题。

博弈的结果是依赖于拥有的信息,采用什么样的信息披露政策是设计电力市场模式的一个方面。例如:电厂竞价上网,一个成功的报价不仅取决于自己的实力,还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息,因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来,博弈的实验结果也为电力市场披露怎样的信息提供依据。

博弈论和电力市场理论都是很年轻的科学,两者都有广阔的发展天地,两者的结合可以互相促进。

4、博弈论在电力市场中的应用

4.1自备电厂与公用电网之间的交易

开放发电市场的进程中,拥有自备电厂的用户是一类特殊的市场参与者,它既是用电用户,也可以是电力的供应者。随着电力市场深入发展和工业的进步,自备电厂将成长为一支生力军。

文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户(NCP)对定价的影响作用。NCP既可以从公用电网购电,也可以自己发电来满足自身需求。为解决两者的冲突,作者提出了三种博弈模型:非合作Nash博弈模型,合作博弈模型和超博弈模型。作者构造了三个局中人:公用电网,普通用户,带自备电厂的用户(NCP),并且假设它们的需求函数、边际成本、收益函数等均是线性的,通过数字模拟得出了一些有趣的结果:①NCP的加入促使公用电网降低出售给NCP的电价;②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进:①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况;②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场,如果公用电网规模很大,NCP数目很多但规模小,考虑Stackerlberg模型更符合两者实际;③该文假设公用电网的目标函数是整个社会利益最大化,而并非是自身利益最大化,这个假设不符合电力市场需要解除管制的发展方向。

文献[ 6]部分解决了以上问题,它重点放在自备电厂和公用电网相互作用的方式的选择:公用电网回购NCP多余电力(buy-back system)或者公用电网收取NCP运转电力的过网费(wheeling charges)。该文分析了在不同市场环境下,各方的得益情况,得出了一些可能只有用博弈论才能得出的结论。

4.2区域间输电交易分析

互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析,得出双方都可接受的交换功率和交易价格。在此基础上,文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策,采取合作型对策,应用 Nash谈判公理作为仲裁程序,决策出双方都可接受的交换功率和交易价格。应该指出,白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息,又应该如何分析处理呢?这个问题值得进一步深入探究。

4.3转运市场中电网的固定成本分摊问题

运转市场中一个难题是网络输电服务定价,这个定价能够给网络使用者一个信号,以达到全网最优化;并且能够补偿网络的投资者,网损、变动成本、固定成本等费用在网络使用者中合理分摊;同时能够正确激励网络增容。节点实时价格(nodal spot price)制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资,为了解决双边贸易中输电系统固定成本公正分摊问题,作者提出了基于多人合作博弈模型,可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点:①使用“核仁”而不用Shapely值,因为“核仁”处于核心,分配值更加稳定和易于被各方接受;②提供了一种激励,减轻线路过载。

4.4 基于Pool或PX模式的多边贸易市场

电力市场环境下的博弈具有行动策略随机性、信息隐蔽性,这些特点都给建模和计算造成困难,从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中,通常需要假设或者估计对方的信息,方法各有特色。

在文献[10]作者认为在完全竞争的市场环境下,市场参与者相对于市场规模都显得很小,市场影响力很小。在这种情况下,优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场,单个市场参与者对市场是有影响力的,其模型本质上属于不完全信息的非合作博弈。例如:每个参与者只知道自己的成本信息,而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题:在无法完全了解对方的信息情况下,参与者如何投标(选择高价投标还是低价投标)才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类,并对每一类的可能性进行概率估计,形成一个概率意义上的期望收益矩阵,用Nash平衡点的概念求解矩阵,得到问题的解。

文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时,都同时执行以下两个步骤:①对可能的合作对象按照一定的指标进行优先排序;②按照谈判优先顺序,逐一进行讨价还价,谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类,并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作,互相交换共享所拥有的信息,联合成博弈的一方,剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值,作为与B合作的优先指标。对每个局中人都进行一遍以上计算,得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序,各方同时进行合作谈判,谈判要解决如何合理分配或均衡比单干多出的利益。

该文关键的一点:正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息,并用这种反馈来更新自己的知识库,提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点:计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。

对于多边贸易模式的电力市场,文献[13]提出了多理论模型,解决贸易合作问题,文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段:①确定自身成本等信息;②与对方互相交换信息,互相寻求合作伙伴;③按照预先设定的准则和协议进行联合分组,形成一个谈判对象优先顺序表,这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表;④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行,直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况,但是模型仍偏于简单。

4.5用博弈论解释和实现算法

文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下,竞争各方均以实现自身利益最大化为目标,旋转备用的约束变得软起来,PX(power exchange)机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。

作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的,松弛旋转备用的乘子 被看作是提供备用的价格信息,各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整(例如:为t时段负荷)。根据优化原理,如果拉格朗日函数存在鞍点,则鞍点是原问题的最优解。

鞍点的概念与博弈论中的Nash平衡点有非常相似之处,如以上公式所示。基于此想法,作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益,它控制的决策变量是p,u(p向量表示各机组分配的有功,u向量表示机组启停),目标是使整个系统成本最低。另一个局中人Q,是一个假想的发电商,它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价,最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论,作者设计了自适应的次梯度算法寻求平衡点,其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数 该函数将 映射到备用容量的两种水平之间(例如:5%Dt-%Dt,Dtt时段负荷),形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数,模型可细分为两种:Nash模型(不了解对方反应函数)和Stackelberg模型(Q了解P的反应函数),作者认为后一种模型掌握的信息较多,因此收敛的速度和优化的效果梢好于前一种模型。

用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学,不过它更具有人的逻辑思维的色彩,融合了一些用别的方法难以表达的信息。

博弈论的方法篇(7)

关键词:博弈;委托与;经济行为

一、博弈论发展简述

博弈论思想古已有之,博弈论最初主要研究象棋、桥牌、中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初对于博弈论的研究,开始于策墨洛、波雷尔及冯・诺伊曼,今天博弈论已发展成一门较完善的的学科。目前已成为经济分析的主要工具之一,对产业组织理论、委托理论、信息经济学等经济理论的发展做出了非常重要的贡献。由于博弈论重视经济主体之间的相互联系及其辨证关系,大大拓宽了传统经济学的分析思路,使其更加接近现实市场竞争,从而成为现代微观经济学的重要基石,也为现代宏观经济学提供了更加坚实的微观基础。

有一只看不见的手引导他去促进一种目标,而这种目标决不是他所追求的东西。由于追逐他自己的利益,他经常促进了社会利益, 其效果要比他真正想促进社会利益时所得到的效果为大。二百多年来,西方经济学家坚持斯密的信条, 他们相信自私自利的个体在利益驱动下会使社会达到和谐一致。博弈论专家认识到,理性人在进行经济决策时,但由于目标(或经济利益)不一致时常发生冲突, 理性人的最优选择要受对方选择的影响, 理性人之间的这种互动行为使他们的决策均依赖于两个或更多的人们的交互式战略。冯.诺依曼和摩根斯坦因以合作博弈为对象, 主要对二人零和博弈进行了分析。此后,合作博弈有了长足发展,提出了稳定集,解概念, 核等重要概念与思想, 来研究人们发生冲突时的合作问题。1950年,纳什发表了他的博士论文非合作博弈,最先对合作博弈与非合作博弈进行了区别, 提出了博弈论中最为重要的概念:纳什均衡, 为非合作博弈一般理论奠定了基础, 非合作博弈发展起来。事实上,合作博弈可以看作非合作博弈的特殊情况, 它略去了非合作个体之间建立合作关系的过程而着重研究合作的可能性与形式。非合作博弈对分析理论更为适用, 因此,我们今天所说的博弈论主要是指非合作博弈。

二、博弈论与经济行为结合

(一)委托人与人之间约束与激励机制

作为产权经济学的一个重要分支,委托一理论是从信息不对称条件下的契约形成过程出发,探讨委托人如何设计出一种契约,以促使人为最大限度地增进委托人的效用而努力工作。标准的委托一理论是基于以下两个基本的假设:信息不对称与经济人假设委托一关系一旦确立期,委托人期望人忠诚为其服务,通过不断提高个人能力水平,来提高企业的产出绩效,进而实现其自身效用最大化。但因人利己主义倾向及信息不对称,这一前提经常与现实经济生活相背离,从而导致了委托一关系失效。

1.委托人与人之间的目标函数不一致

2.信息不对称所导致的问题

在信息不对称的前提下,委托人无法准确判断人是否在忠诚且有能力地为企业服务,因而也就无法有针对性地对其进行有效监督,此时,问题的产生也就具有了现实的可能性。在社会经济生活中,问题主要是指逆向选择和道德风险两个方面。 逆向选择,是指委托关系确立之前,人利用其相对于委托人的信息优势,使得契约的签订对自己有利 。

3.委托人和人之问契约不完备

委托一关系实质是一种契约关系,但现实经济生活存在诸多不确定性,使得委托双方不可能事前签订一个完备的契约。此外,契约的完备程度也与契约的成本密切相关,完备程度越高则其代价越大。

(二)讨价还价的博弈与情侣模型

在现实中,我们经常会遇到讨价还价的问题,这其实就是买主与卖主的一场博弈。博弈理论表明,当谈判的多阶段博弈是单数阶段时,先开价者具有“先发优势”;而双数阶段时,后开价者具有“后动优势”。这在商场竞争中是十分常见的现象:非常急切想买到物品的买方往往要以高一些的价格购得所需之物;急切于推销的销售人员往往也是以较低的价格卖出自己所销售的商品。

商业谈判中,有一种“情侣博弈”谈判的模式。“情侣博弈”说的是一对热恋中的情侣,在如何安排度周末,而提出了这样的问题:男士想要看球赛,女士想要听歌剧。如果从其中的某个个体来看,这样的结局不是最优,但是如果有一方的稍许让步,就可以换来情侣组合整体的最佳满意度,同时自己也得到相对较佳的满意度;反之,如果男士单独去看球赛而女士单独去听歌剧,由于缺少情侣陪伴,必然会造成或多或少的满意度下跌。对于这样一个模式,博弈论告诉我们,双方都去看球赛或者双方都去听歌剧,是博弈的两个“纳什均衡”,也就是对双方整体而言,满意程度最高的两个结局。

(三)寡头垄断

寡头垄断:又称寡头、寡占,一种由少数卖方(寡头)主导市场的市场状态。英语中这个词来源于希腊语中“很少的卖者”。寡头垄断是同时包含垄断因素和竞争因素而更接近于完全垄断的一种市场结构。它的显著特点是少数几家厂商垄断了某一行业的市场,这些厂商的产量占全行业总产量中很高的比例,从而控制着该行业的产品供给,寡头垄断又称为双占垄断或双头垄断。 寡头垄断的形成首先是由某些产品的生产与技术特点所决定的,寡头垄断行业往往是生产高度集中的行业,如钢铁、汽车、石油等行业。其次,寡头厂商为保持自身地位而采取的种种排他性措施,以及政府对某些寡头厂商的扶持政策等,也可促进寡头垄断市场的形成。

三、博弈论的不足与发展

虽然博弈论已经形成了比较完整的理论体系, 而且在经济学中得到了广泛应用, 但博弈理论仍存在很多不足,首先就是均衡解的多重性。在很多情况下, 博弈模型的均衡解不止一个, 而是很多个。可以说这是一种富余的均衡, 因为面对多重均衡解, 经济学家并不知道那一个均衡解最终会发生, 这就限制了博弈论对现实问题的解释力和对未来问题的预测能力。相信在博弈论的发展中, 对博弈均衡的精炼是博弈论专家们一项长久的任务。此外, 博弈的建模技术、分析方法和求解手段如何进一步发展; 博弈论的应用领域如何逐步拓宽; 博弈论在经济学的研究和应用中如何求得更广泛的普及等, 这些问题仍未得到满意的解决。

参考文献:

[1]杨瑞龙,杨其静.企业理论:现代观点[M].北京:中国人民大学出版社,2005

[2]张维迎.企业的企业家:契约理论[Ⅵ].上海:上海人民出版社,1995

[3] 蒋殿春. 博弈论如何改写了微观经济学[J]. 经济学家, 1997; ( 6): 86~ 95

[4] 张培刚, 方齐云. 博弈论的应用及其展望[J]. 经济评论, 1998; ( 2): 13~ 14

[5] 张维迎. 博弈论与信息经济学[M].上海人民出版社与上海三联书店, 1999