《石头剪刀布博弈心理学》Chapter 1 第一章博弈心理学的基础知识与支配性策略

首先为读者朋友们介绍博弈心理学的基本思维方式、规则和种类等基础知识。然后解说博弈的局中人如何找到让自己的收益最大化的策略，以及无论对手采取什么样的策略，我们在自己的几种策略中选择较好的策略，即“支配性策略”。

博弈论的基本要素

～局中人～

博弈论最基本的要素有三个，分别是：

1.局中人

2.策略

3.收益

◎局中人

在一场博弈中，登场的企业或者个人，就叫作局中人。不同的博弈，局中人的数量也不同，可能是2个、3个甚至更多。既有个人对个人，也有企业对企业的案例。

局中人可谓博弈的前提条件，没有人参与，就不能算博弈。我们事先设定局中人在参与博弈的时候，是按照下述基本原则采取行动的。

·为自己争取最大的收益而行动；

·局中人会合理地思考，不会采取让自己遭受损失的行动；

·不会产生误解或设想错误。

在现实中，人不会在所有时间都采取合理的行动，也并不是所有人在任何时候都追求收益最大化，而且人也常出现误解或设想错误的情况。但是，在博弈论中，我们姑且认为局中人会为了自己的利益最大化而努力，而且不会采取错误的行动。局中人预测对手将采取对自己最有好处的策略，并在此基础上寻找对自己最为有利的策略。也就是说，己方所采取的最佳策略，会根据其他局中人的行动进行调整，而其他局中人的最佳策略，也会根据己方的行动发生改变。

局中人虽然不会产生误解或设想错误，但为了自己的利益，会进行执着的谈判，通过协议来约束对方，有时甚至强迫他人。总之，在博弈论的世界里，局中人会采用各种各样的手段来维护自己的利益，争取收益最大化。

～策略、收益～

◎策略

所谓策略，是指在博弈中，局中人为了达到目的为自己的行动所做的计划。在企业之间的价格竞争中，准备将自己的商品价格设定为“100日元”或“80日元”，这就是策略；在猜拳游戏中，从“石头”“剪刀”“布”中选择一种手势，也是策略。

在博弈中，会遇到各种各样的情况，我们有策略，别人也有。大家一定要牢记，自己得到的结果，并不全是由自己的行为带来的，还会受到其他局中人行为的影响。

◎收益

所谓收益，就是局中人获得的利益。不同的博弈，其收益也各不相同，比如有的收益是金钱，有的则是商品的销售数量，还有的是胜负。在企业间的价格竞争中，企业获得的利润就是收益；在猜拳游戏中，赢就是收益。为了便于比较，我们可以把赢设定为“1”，把输设定为“-1”，把平局设定为“0”。

通过前面的数值设定，我们可以更加直接、客观地比较后分析出，在博弈中，“局中人”为了获得最大的“收益”应该选择什么样的“策略”。之后，再据此采取最为适合的行动，最终获得最大的收益。

博弈的种类

～局中人采取行动的时间顺序/静态博弈和动态博弈～

在博弈中，各个局中人采取行动的时机可能有所不同。既有可能同时采取行动，也可能先后有别。同时采取行动和先后采取行动是两种不同的博弈。因此，博弈论中按照局中人采取行动的时间顺序，可以将博弈分为静态博弈和动态博弈。

◎静态博弈

静态博弈，就是各个局中人同时采取行动的博弈。另外，虽然采取行动的时机有先后，但后者并不知情的博弈，也属于静态博弈。举例来说，每月同一天出版上市的杂志之间的博弈就是静态博弈；不同饭店在同一时期推出新菜单的博弈，也属于静态博弈。更简单的例子就是“猜拳游戏”，参与猜拳的人必须同时出手势，谁后出，或者后来改变手势，都算犯规，而且会遭到大家的鄙视。在博弈中，选择策略的时机非常重要。在静态博弈中，我们必须和对手同时决定策略，事前不可能知道对手的策略。博弈论中的经典案例“斗鸡博弈”和“囚徒困境”都属于静态博弈。

◎动态博弈

局中人的行动有先后顺序的博弈，就是动态博弈。举例来说，拍卖就属于动态博弈。一位买家出价后，其他买家可以据此调整自己的策略，随即出价。家用电器销售企业的价格竞争也是动态竞争。一家销售商可以对其他对手的定价策略进行调查，然后确定一个更低的售价，并打出“本地区最低价格”的广告。

我们日常生活中动态博弈的例子也不少，比如打扑克、下象棋、打麻将等棋牌类的游戏。玩棋牌游戏时，大家都是按顺序先后出牌，后者可以根据前者所出的牌确定自己的策略。按顺序先后行动并不是动态博弈的要点，能够根据对手的行动改变自己的策略，才是动态博弈的关键。

～局中人之间的合作关系/非合作博弈与合作博弈～

根据局中人是否存在合作关系，博弈还分为非合作博弈和合作博弈。如果局中人之间有一个具有约束力的协议，那就是合作博弈；如果没有，就是非合作博弈。经济学家所研究的博弈以非合作博弈为主，本书中也主要讲解非合作博弈。

◎非合作博弈

非合作博弈，是指局中人之间没有合作关系（具有约束力的协议）的博弈。各个局中人不会协助对手，只追求自己的最大收益。在现实生活中的营销战略、收视率竞争等经济活动中，常会用到非合作博弈的思维方式。再有，根据对手的策略选择己方策略的象棋、麻将等棋牌游戏，也属于非合作博弈。

此外，博弈中还有一种“协调博弈”。协调博弈在我们日常生活中的典型例子就是乘坐自动扶梯时，大家靠左站还是靠右站的问题。在日本的关东地区，人们习惯站在左侧，把右侧空出来；而在关西地区，人们则喜欢靠右侧站，把左侧空出来。不过，靠哪边站并没有明文规定，也不是大家商量之后的结果，而是约定俗成。人们在乘坐自动扶梯的时候，看大多数人站在哪边，就跟着站在哪边。不遵守这个规则，也不会受到惩罚。虽然不具有约束力，但人们大多会自觉遵守这个规则，因为给别人方便也会给自己带来方便。虽然情况有点儿复杂，但协调博弈可以算作非合作博弈中的一种。

◎合作博弈

所谓合作博弈，是指参加博弈的局中人相互之间可以进行协商、协助。局中人通过交涉达成的协议、规则是具有约束力的，并且各个局中人会按照协议、规则来选择策略。多个局中人对利益进行分配的博弈，属于合作博弈。与非合作博弈相比，合作博弈更加复杂，而且常带有政治色彩。近些年来对合作博弈的研究进展迅速，应用也越来越广泛和深入。

具有代表性的博弈例子

◎非合作博弈

（博弈的局中人之间不存在合作关系）

·斗鸡博弈

·囚徒困境

·男女博弈

·协调博弈等

◎合作博弈

（博弈的局中人受协议、规则的约束）

·打车费均摊的协议

·演员分配角色等

～局中人对信息的掌握情况和损益的总和～

除了前面几种分类标准外，还可以根据局中人对信息的掌握情况以及利益的总和对博弈进行分类。

根据局中人对信息的掌握情况进行分类

◎完全信息博弈

局中人对其他局中人的策略都有充分了解的博弈叫作完全信息博弈。比如象棋、围棋等棋类游戏，对手所采取的“招式”和策略，一目了然，自己的一举一动，对手也了如指掌。这样的博弈就是完全信息博弈。

◎不完全信息博弈

在博弈中，不了解其他局中人所采取的行动和策略，这便是不完全信息博弈。有些博弈，虽然局中人了解对手所拥有的选项，但并不知道他最终会选择哪一个，这样的博弈也可以称为不完全信息博弈。因为有尚未知晓的信息，因此才叫不完全信息博弈。此外，静态博弈也属于不完全信息博弈，因为所有局中人同时采取行动，在行动真正实施之前，任何人都不知道对手将采取什么样的行动。

根据博弈中局中人对信息的掌握情况，博弈还可以分为“信息完备博弈”和“信息非完备博弈”，以及“信息对称博弈”和“信息非对称博弈”。所谓“信息完备博弈”就是指局中人共享规则和所有信息的博弈。

根据利益的总和进行分类

◎定和博弈

各个局中人利益的总和是一个固定数值的博弈，叫作定和博弈。举例来说，A公司的市场份额为65%，B公司的市场份额为35%。两家公司的市场份额相加就是整个市场份额，这是一个固定的值，因此A公司与B公司的博弈就属于定和博弈。

在定和博弈中，各个局中人的利益和损失相加后为零的话，叫作零和博弈。两人猜拳、下象棋、下围棋、踢足球、打棒球等双方进行对决的比赛，都属于零和博弈（得分和失分相加等于零）。

◎非定和博弈

局中人的利益总和不是一个固定数值的博弈，就叫作非定和博弈。企业之间的销售额竞争、拍卖、保险金额与投保人数的关系等，都属于非定和博弈。

◎战争就是具有代表性的零和博弈。

博弈的表述形式

～策略型与展开型～

关于博弈论的基础知识，大家首先应该了解博弈的重要表述形式有两种。一场博弈，可以根据信息量的多少、进行比对的内容等，选择合适的表述形式。

◎策略型

所谓策略型表述形式，是将博弈的局中人、策略、利益等用表格的形式表现出来，这种表述形式也叫作“标准型”。这种表格可以将各个局中人的收益清晰地展现出来，因此也叫作“收益表”。博弈的目的是获得最大的利益，而不是战胜竞争对手。策略型的表述形式能够将博弈的目的——获得最大利益与局中人所采取的各种策略之间的关系，清楚地表现出来。

静态博弈不需要加以展开，因此没必要采用展开型来表述，一般都用策略型。关于策略型表述形式的归纳方法和使用方法，将在第一章稍后的内容及第二章中进行详细解说。

◎展开型

博弈的展开型表述形式，也叫树形表述形式。顾名思义，就是使用点和线描绘出树枝状图表的形式。一般都是从下向上展开或者从左向右展开。尤其是从下向上展开，很像树枝的形状。当一方局中人根据其他局中人的策略改变自己的策略，以及策略展开非常复杂或者信息量很大的时候，适合采用展开型来表述。有关展开型表述形式的具体内容，将在第五章中进行讲解。

◎策略型

◎展开型

牛肉盖浇饭屋之类的快餐店，为什么要降价？

～快餐店的营销策略/强支配性策略①～

接下来，我们就对博弈论进行具体的讲解。牛肉盖浇饭屋、炸鸡连锁店等快餐店之间，存在着非常激烈的竞争关系，有时不仅要比拼菜品的味道，还要在价格上做文章。很多快餐店看到竞争对手降价，也跟着降价。这到底是为什么呢？我们通过两家快餐店的静态博弈，来一探价格竞争策略的究竟。

◎例题1-1快餐店的价格设定

假设在某条商业街有两家快餐店A和B。这两家快餐店无论菜品味道还是服务质量，都旗鼓相当，顾客对它们的评价也不相上下，因此它们之间的竞争异常激烈。A店和B店每份快餐的平均价格都为500日元，双方都很关注对方的价格，而且都有降价争取更多顾客的想法。他们各自在纠结，是否要将价格降为450日元。

假设食材成本、人工费、水电费等成本平摊到每一份快餐的费用为250日元，而且两家店的成本一样，那么每份快餐的价格不可能降到250日元以下。再假设长期光顾这两家快餐店的顾客一共有400人，因为他们对两家店的评价几乎一致，所以价格一样的话，会有一半的客人去A店，另一半去B店。如果存在价格差异，那么将有八成客人去较为便宜的那家店。如果你是A店的经营者，为了获得最大的利润，你会采取怎样的定价策略呢？

A店如果通过降价的方式与B店竞争，那么B店不跟着降价的话，A店肯定会赢。但是，尽管赢了，A店的利润也会下降，所以从这个角度讲，A店想保持原价，不降价。卷入价格竞争的旋涡，对双方来说都将是一场惨烈的消耗战，对谁都没有好处。身处这种境地，A店是该降价，还是继续维持原有价格呢？

下面我们用策略型表述形式的“收益表”对这道例题进行分析。

～快餐店的营销策略/强支配性策略①～

下面我们来计算一下收益表中的“收益”。我们计算A店收益的时候，就得从A店的角度出发思考问题。表中的“收益1”，是指A店以500日元销售快餐，B店也以500日元销售的时候，A店获得的利润。

在这道例题中，我们假设一份快餐的平均利润是用销售价格500日元减去平均成本250日元，结果等于250日元。如果两家店都以500日元的价格进行销售，那么400名顾客中有200人购买A店的快餐。

这么一来，250日元×200人=50，000日元。这也就是A店的“收益1”。

A店的“收益2”是A店以450日元的价格销售快餐，而B店以500日元销售的时候，A店获得的利润。450日元的售价减去250日元的成本，一份快餐的平均利润为200日元。因为此时A店的售价比B店低，可以获得八成的客人，400人的八成是320人。那么最终计算得到的“收益2”是200日元×320人=64，000日元。

A店的“收益3”是A店以500日元的价格销售快餐，而B店以450日元销售的时候，A店获得的利润。500日元的售价减去250日元的成本，一份快餐的平均利润为250日元。但是，因为A店的售价比B店高，所以只能获得两成的客人，400人的两成是80人。于是，最终计算得到的“收益3”是250日元×80人=20，000日元。

A店的“收益4”是A店以450日元的价格销售快餐，而B店也以450日元销售的时候，A店获得的利润。450日元的售价减去250日元的成本，一份快餐的平均利润为200日元。因为A店与B店的售价相同，所以可以获得400名顾客中的一半，也就是200人。于是，最终计算得到的“收益4”是200日元×200人=40，000日元。

～快餐店的营销策略/强支配性策略①～

现在我们开始从收益表中寻找最佳策略。所谓最佳策略，就是能让局中人获得最大收益的销售价格。

先看B店以500日元销售快餐时的情况，此时，如果A店也以500日元销售，那么A店将获得5万日元的利润。如果A店以450日元销售，那么利润将达到6.4万日元。由此可见，如果B店的快餐卖500日元一份的话，A店将售价降至450日元，将获得更多的利润。为了更清楚地显示这一点，我们将两者中比较低的利润用红笔勾掉（表1-2）。

再看B店以450日元销售快餐时的情况，在这种情况下，如果A店以500日元销售，那么A店只能获得2万日元的利润。如果A店以450日元销售，那么获得的利润将是4万日元。由此可见，如果B店的快餐卖450日元一份的话，那么A店也卖450日元对A店更有利。我们再将收益低的一方（2万日元）用红笔勾掉（表1-3）。

从表1-4中我们可以看出，不管B店采取哪种价格策略，A店以450日元的价格销售都更为有利。

在博弈中，存在不管对手采取什么样的策略，总对自己有利或不利的策略。像这样，对其他策略都形成支配的策略，叫作支配性策略。其中，不管对手采取什么样的策略，己方的某一策略都可以获得比其他策略更大的收益时，这个策略就叫作“强支配性策略”。在前面的例题中，A店以450日元的价格销售快餐，就是强支配性策略。

～快餐店的营销策略/强支配性策略①～

我们来分析一下表1-4。看了这个表之后，估计有些朋友会想，A店采取“450日元策略”，B店也采取“450日元策略”的时候，A店的收益是4万元；而当A店采取“500日元策略”，B店也采取“500日元策略”的时候，A店的收益是5万日元。比较下来，A店是不是应该采取“500日元策略”呢？

但是，当B店采取“500日元策略”的时候，对于A店来说最佳定价策略不是500日元，而是450日元，因为这样可以让利润提高1.4万日元。而且，B店的经营者也不是傻子，会合理地思考，希望追求收益最大化，没准他们也会降价呢。如果B店真的把价格降为450日元，那么A店继续采取“500日元策略”的话，利润就只有2万日元了，比当初的4万日元还要低。

在一场博弈中，支配性策略可以让局中人获得最高的收益。可以说，支配性策略就是博弈的“解”。不管对手采取什么样的策略，我们都找不出比支配性策略能让自己收益更高的策略了。所以，我们在为一场博弈求“解”的时候，首先应该确认一下是否存在支配性策略。

消费者根据价格选择商品或服务的倾向性越强，降价销售的策略就越容易带来更多的利润。分析了前面例题中的博弈模型，我们就能理解快餐业经常传出降价消息的原因了。

之前，我们分析的是A店的收益表，同样，B店也有一张收益表。在博弈论中，一般是将两个局中人的收益情况列在同一张表中的。如果你觉得这样不好理解的话，也可以分别从每个局中人的角度进行单独分析。

在评价成绩的博弈中，如何获得较高的评价？

～强支配性策略②～

我们再来看一道有关强支配性策略的例题。这是某一所大学的成绩评价方法，请你把自己当作一名大学生，来解决这个博弈问题。

◎例题1-2评价成绩博弈

在某一所大学里，一位教授做了一个有点儿奇怪的实验。他给教室里的每位同学发了一张答题纸，让他们在纸上写好自己的名字，然后从“α”和“β”两个希腊字母中任选一个写在纸上。把学生们手里的答题纸收上来之后，教授随机将答题纸两两进行分组，然后对学生写的字母进行评分。

如果你写的是“α”，而与你同组的另一张答题纸上也写的是“α”，那么你的成绩为C。如果另一张答题纸上写的是“β”，那么你的成绩就是A。如果你写的是“β”，而与你同组的另一张答题纸上写的是“α”，那么你的成绩为D。如果另一张答题纸上写的是“β”，那么你的成绩就是B。成绩按照由高到低的顺序排列依次是A、B、C、D。那么，为了让自己获得最好的成绩，到底是该写“α”还是“β”呢？

局中人

在这个博弈中，局中人是“自己”。此外，因为尚不知道做比较的另外一个人是谁，所以将其称为“对方”。

策略

策略就是选择写“α”还是“β”。

收益

评价结果是A、B、C、D中的一个。A是最高成绩，D是最低成绩。

～强支配性策略②～

我们就从收益表中寻找最佳的策略。在这里，最佳策略就是让局中人获得更好成绩的策略。

当对方写“α”时，如果自己写“α”，那自己的成绩就是C；如果自己写“β”的话，成绩就是D。两者进行比较，自己写“α”的话，可以获得较高的成绩，因此将收益较低的策略从表中勾掉（表1-11）。

当对方写“β”时，如果自己写“α”，那自己的成绩就是A；如果自己写“β”的话，成绩就是B。两者进行比较，自己写“α”的话，可以获得较高的成绩，因此将收益较低的策略从表中勾掉（表1-12）。

这样看来，不管对方写“α”还是“β”，自己写“α”的时候，都可以获得相对较高的评价（表1-13）。

在这个例子中，不管对方采取什么样的策略，都有一个策略能让自己获得相对更好的收益。在这种情况下，“写α的策略”就强支配着“写β的策略”。其中的关键点在于“不管对方选择什么样的策略，都能获得相对较高的收益”。在一场博弈中，如果存在支配性策略，那么选择支配性策略才是正确的，因为这样才能让我们获得最好的收益。

～强支配性策略②～

对于自己来说，“选择α”这个策略强支配着“选择β”的策略，因此，在这个评价成绩的博弈中，自己应该选择“α”。也许有的朋友还是无法理解，我再做进一步的解说。

确实，从自己的角度来说，选择“α”是最明智的。但是，如果大家都这样想的话，自己写了“α”，对方写“α”的可能性也很大，结果，自己的成绩为C。可是如果双方都写“β”的话，自己的成绩为B。肯定有人会疑惑，不是说“α”是最佳策略吗？可是为什么写“β”有可能获得更好的成绩呢？

其实，我们只要稍稍思考一下，就知道那种情况是不现实的。因为在这个博弈中，任何人都不能合谋。本来，自己的答题纸和谁的答题纸分在一组，这是事先无法确定的。因此，对方写的是什么，根本无从判断。即使你有超能力，知道其他人都选择“β”，那么经过思考之后，你还是选择“α”才能获得更好的成绩。因为如果和你分在一组的人选择的是“β”，那你选择“α”就可以获得A。

存在强支配性策略的博弈的要点总结如下：

·在破解一场博弈的时候，先分析收益表，看看是否存在支配性策略；

·如果存在支配性策略的话，选择支配性策略是最明智的；

·要明白，即使选择了支配性策略，也不一定能获得最高的收益。

相信神好处多，还是不信神收益大？

～帕斯卡的赌注/弱支配性策略①～

我们再来看一道和前面不太一样的支配性策略的例题。“人是一株会思考的芦苇”是法国著名数学家、物理学家、哲学家帕斯卡流传后世的一句名言。他还提出过一个令人深思的问题，被称为“帕斯卡的赌注”。

◎例题1-3帕斯卡的赌注

帕斯卡曾说过，信神比不信神的好处要多。因为信神“将获得幸福与永生”，而不信神“将失去真和善”。事实正如帕斯卡所说，信神好处多，不信神将遭受损失吗？其实，帕斯卡用博弈论的思想帮我们分析了这个问题。

局中人

在这个博弈中，一个局中人是“人”，另一个是“现实”。“现实”所反映的是“存在神”，或“不存在神”。

策略

“人”所采用的策略有“信神”和“不信神”两种；而“现实”可以选择的策略有“存在神”和“不存在神”。

收益

为了便于理解，我们用数值化来显示收益。如果真能“获得幸福与永生”，那么这无疑是最大的收益，我们将其数值设定为100。另一方面，“失去真和善”自然是最差的收益，我们将其数值设定为-50。

～帕斯卡的赌注/弱支配性策略②～

首先，我们来确认一下这个博弈中是否存在支配性策略。如果现实中“存在神”，那么人选择“信神”的策略，收益比较大。于是，我们将采取“不信神”策略时得到的-50勾掉（表1-18）。接下来，再看现实中“不存在神”的情况，此时不管人信不信神，所得到的收益是相同的，都是0，所以没法勾掉任何数值（表1-19）。

从表中我们可以看出，在现实中“存在神”的情况下，人选择“信神”，收益比较大。但是，当现实中“不存在神”的时候，不管人选择信神还是不信神，得到的收益都是一样的。由此可见，其中的一种策略具有支配性，但另一种策略带给人的收益是相同的（表1-20）。这种情况下，我们认为，人的“信神”策略对“不信神”策略起到弱支配作用。

强支配性策略，是指不管对方选择什么样的策略，自己选择任一种策略时都会占据有利位置。而弱支配性策略，是指不管对方选择什么样的策略，自己选择某一策略会让自己有利，或者与对方收益相同。

前面讲过，在存在支配性策略的博弈中，我们选择支配性策略可以获得相对较好的收益。因此，弱支配性策略也是我们的首选。在上面的例题中，我们应该选择“信神”。

说实话，我们不知道现实中是否存在神。不过，通过博弈论的思维方式进行合理的思考之后我们发现，如果神存在的话，信神的收益比较大。如果神不存在的话，那么信不信神，收益都是一样的。但是，如果神存在的话，信神有很好的收益；而不信神可能会受到神的惩罚或遭受损失。即使有些人的内心非常强大，不把“失去真和善”当作损失，那最多也只是得0分，不会有正的收益。由此可见，不管有没有神，还是信神的好处多一些。

第一章　总结

◎博弈论有三个基本要素，分别是“局中人”“策略”和“收益”。

◎局中人为了自己获得最大的收益而行动，不会产生误解或设想错误。

◎博弈的表述形式有策略型的“收益表”和展开型的“博弈树形”。

◎在存在支配性策略的博弈中，支配性策略是最佳选择。

《石头剪刀布博弈心理学》Chapter 1 第一章 博弈心理学的基础知识与支配性策略

博弈论的基本要素

博弈的种类

根据局中人对信息的掌握情况进行分类

根据利益的总和进行分类

博弈的表述形式

牛肉盖浇饭屋之类的快餐店，为什么要降价？

在评价成绩的博弈中，如何获得较高的评价？

相信神好处多，还是不信神收益大？

第一章 总结

《石头剪刀布博弈心理学》Chapter 1 第一章博弈心理学的基础知识与支配性策略

第一章　总结