[返回学习园地首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]
第十二章 鹰鸽博弈:强硬与温和的演绎
送交者: diyunheng[★品衔R6★] 于 2018-09-23 16:16 已读 519 次  

diyunheng的个人频道

回答: 第十一章 蜈蚣博弈:学会以结果为导向思考问题 由 diyunheng 于 2018-09-23 16:15

这个博弈很多人把它等同于斗鸡博弈。不过,斗鸡是两个兼具侵略性的个体的博弈,鹰鸽却是两个不同群体的博弈。一个和平,一个侵略,在鹰鸽博弈中鹰鸽双方的得益是不对称的,由此产生了ESS进化上的稳定策略。也就是说一旦均衡形成,偏离的运动会受到自然选择的打击;也就是说鹰群饱满后,再试图加入的鹰将会被鹰群排挤。 6park.com

ESS稳定策略 6park.com

在一间大约100平方米的办公室里,十几位白领每天按部就班地工作着。但是平静的日子被其中一个人打破,他做出了一件让同事们看来是离经叛道的事情,在整齐划一的办公桌之间的木隔板上,自作主张地增加了一块纸板,比左邻右舍高出了大约20厘米。第二天同事们上班时,立刻发现了它的存在。 6park.com

他们一致抗议,理由是在这间统一的办公室里,这块20厘米高的纸板打破了整个办公室的协调与统一。每个人的利益似乎都受到了程度不同的损害,在感情上也受到了程度不同的伤害。他们认为,这20厘米高的纸板所体现出来的独特性和个性,或者说与众不同的东西,是对周围环境的蓄意的不协调和对整体的破坏,更是一种骨子里的自私和对秩序的蔑视和背叛。甚至于一位老同事还善意地规劝这位新同事:“年轻人,不要太标新立异,更不要别出心裁,这样是要吃大亏的。” 6park.com

在以后的若干天里,人们来到办公室,都不免要议论几句。随着时间一天天过去,那块起初被视做眼中钉的纸板,渐渐地在同事们眼中习以为常。于是,当这个人在众人面前主动将它拆掉时,也没有谁大惊小怪。因为所有人差不多都已经忘记了那块纸板,尽管当初曾那样激烈地反对过它。 6park.com

在一间100平方米的大厅里,一块20厘米高的纸板所产生的美学破坏力,应该说是微乎其微的。但是这块纸板却是一个试验品,反射出社会的群体怎样被个体冒犯以及这种冒犯要付出怎样的代价。 6park.com

从这个故事当中,我们也看到了博弈论中所说的ESS策略的影子:所谓ESS,即进化上的稳定策略(Evolutionarily Stable Strategy),是指凡是种群的大部分成员采用某种策略,而且这种策略的好处是其他策略所比不上的,这种策略就是进化上的稳定策略或ESS。换句话讲,对于个体来说,最好的策略取决于种群的大多数成员在做什么。由于种群的其余部分也是由个体组成,而它们都力图最大限度地扩大其各自的成就,因而能够持续存在的必将是这样一种策略:它一旦形成,任何举止异常的个体的策略都不可能与之比拟。 6park.com

在环境的一次大变动之后,种群内可能出现一个短暂的进化上的不稳定阶段,甚至可能出现波动。但是一种ESS—旦确立下来,偏离ESS的行为将要受到自然选择的惩罚。所以,我们与其相信“出淤泥而不染”,倒不如相信“近墨者黑,近朱者赤”才是符合进化规律的!也正因如此,舜出身于一个父兄凶顽的家庭却成为大圣人是值得推敲的。把舜的家庭看成一个种群,如果一个所谓的圣人在那样的环境中,而他的行为准则和其他人相左,那他的策略就是非ESS策略,他在种群中将不占优势。这样的历史如果是真的,那么在它之前,必然发生过促使ESS策略发生变化的事件。 6park.com

在ESS策略中,往往存在着一种可以称为惯例的共同认识:因为大家都这样做,我也应当这样做,甚至有时不得不这样做;加之,在大家都这样做的前提下我也这样做可能最省事、最方便且风险最校这样,ESS策略就成了社会运行的一种纽带、一种保障机制、一种润滑剂,从而也就构成了社会正常运转的基矗 6park.com

博弈论者认为,一个人只有当所有其他人的行动是“可预计的”并且他的预计是正确的时候,才能在任何规模的群体中选择和计划。显然,这意味着他人不是理性地而是机械地根据一种已确立的已知模式来选择……没有这样一些协调过程,一个人的任何实际行动,以及任何对过去惯例的偏离,都会使那些从他过去的一种行为预计他会如此行动的其他人的预期落空,并打乱其计划。 6park.com

被拒绝的“香蕉”与“路径依赖” 6park.com

科学家曾经进行过这样一个试验,来证明这一规律。他们将四只猴子关在一个密闭房间里,每天喂食很少食物,让猴子饿得吱吱叫。然后,实验者在房间上面的小洞放下一串香蕉。一只饿得头昏眼花的大猴子一个箭步冲向前,可是当它还没拿到香蕉时,就触动了预设机关,被泼出的滚烫热水烫得全身是伤。后面三只猴子依次爬上去也想拿香蕉时,一样被热水烫伤。于是众猴只好望蕉兴叹。 6park.com

几天后,实验者用一只新猴子换走一只老猴子,当新猴子肚子饿得也想尝试爬上去吃香蕉时,立刻被其他三只老猴子制止。过了一段时间,实验者再换一只新猴子进人。当这只新猴子想吃香蕉时,有趣的事情发生了,不仅剩下的两只老猴子制止它,连没被烫过的半新猴子也极力阻止它。 6park.com

实验继续,当所有猴子都已被换过之后,没有一只猴子曾经被烫过,上头的热水机关也被取消了,香蕉唾手可得,却没有猴子敢去享用。 6park.com

为什么会出现这种情况呢?在回答这个问题之前,我们先来看一个似乎与此无关的问题。大家知道现代铁路两条铁轨之间的标准距离是四英尺又八点五英寸(1435毫米),但这个标准是从何而来的呢? 6park.com

早期的铁路是由建电车的人所设计的,而四英尺又八点五英寸正是电车所用的轮距标准。那么电车的轮距标准又是从何而来的呢?这是因为最先造电车的人以前是造马车的,所以电车的标准是沿用马车的轮距标准。马车又为什么要用这个轮距标准呢?这是因为英国马路辙迹的宽度是四英尺又八点五英寸,所以如果马车用其他轮距,它的轮子很快会在英国的老路上撞坏。原来,整个欧洲,包括英国的长途老路都是由罗马人为其军队所铺设的,而四英尺又八点五英寸正是罗马战车的宽度。罗马人以四英尺又八点五英寸为战车的轮距宽度的原因很简单,这是牵引一辆战车的两匹马屁股的宽度。 6park.com

马屁股的宽度决定现代铁轨的宽度,一系列的演进过程,十分形象地反映了路径依赖的形成与发展过程。 6park.com

“路径依赖”这个名词,是美国斯坦福大学教授保罗·戴维在《技术选择、创新和经济增长》一书中首次提出的。20世纪80年代,戴维与亚瑟·布莱恩教授将路径依赖思想系统化,很快使之成为研究制度变迁的一个重要分析方法。他指出,在制度变迁中,由于存在自我强化的机制,这种机制使得制度变迁一旦走上某一路径,它的既定方向会在以后的发展中得到强化。即在制度选择过程中,初始选择对制度变迁的轨迹具有相当强的影响力和制约力。人们一旦确定了一种选择,就会对这种选择产生依赖性;这种初始选择本身也就具有发展的惯性,具有自我积累放大效应,从而不断强化自己。 6park.com

这也可以解释前文的猴子实验。由于取食香蕉的惩罚印象深刻,因此虽然时过境迁,环境改变,后来的猴子仍然无条件服从对惩罚的解释与规则,从而使整体进人路径依赖状态。 6park.com

路径依赖理论被总结出来之后,人们把它广泛应用在各个方面。在现实生活中,由于存在着报酬递增和自我强化的机制,这种机制使人们一旦选择走上某一路径,要么是进人良性循环的轨道加速优化,要么是顺着原来的错误路径往下滑,甚至被“锁定”在某种无效率的状态下而导致停滞,想要完全摆脱变得十分困难。 6park.com

胜出的未必是强者 6park.com

“皮洛斯的胜利”讲述的是古罗马时期的一场战事。皮洛斯是古罗马时期的一位国王。在一场血腥的战斗中,他获得了胜利,却损失了大半精锐部队。望着尸横遍野的战场,他感慨道:“再来这样一场胜利,我就完蛋了。”后来人们就用“皮洛斯的胜利”代表代价惨重、得不偿失的胜利。 6park.com

赢得战争(或避免战争)的一个有效策略就是增加对方的战争成本,使其难以坚持,或因为得不偿失而放弃发动战争的愿望。 6park.com

在很多情况下,一个方案会比另一个方案好得多;但即便如此,并不表示更好的方案一定会被采纳。如果一个方案已经制订了很长时间,现在环境发生了变化,即使出现了更可取的方案,这时要想改革也很不容易。要理解这一点,一个著名例子是电脑键盘的设计。 6park.com

键盘是电脑配件中一个非常不起眼的部件,但却是必不可少的输人设备,无论是操作电脑还是玩游戏,都得通过它来完成。140年前的1868年,键盘出现在斯托弗·拉恩兰·肖尔斯所发明的机械打字机上,当时的键盘是由26个英文字母顺序排列的按钮所组成。当时打字机的设计是通过人在打字时按下的键引动字棒打印在纸上。当人们熟习应用,打字速度加快,机动字捧追不上人手打字速度,经常交叠在一起,从而出现卡键现象,甚至因互相拍打而损坏。 6park.com

直到19世纪后期,对于打字机键盘的字母排列仍然没有一个标准模式。1873年,克里斯托弗·肖尔斯把键拆下来,将较常用的键设计在较外边,较不常用的放在中间,从而形成目前众所周知的Q、W、E、R、T、Y键排列在键盘左上方的方案。这种排法也就因其左上方第一行的头六个字母而被称为“QWERTY”排法。 6park.com

选择这一排法的目的是使最常用的字母之间的距离最大化。这在当时确实是一个解决方案:有意降低打字员的速度,从而减少各个字键出现卡位的现象。但是销售商对这种排列发生疑问。于是肖尔斯撒谎说,这是经过科学计算后得到的一个“新的、改进了的”排列结果,可以提高打字速度。这完全是撒谎!凡是用熟练了的,怎么排列打字速度都会快。可是当时人们就信以为真,并且把用其他方法排列的打字机挤出了市常 6park.com

QWERTY的设计安排并不完美,甚至可以说非常糟糕,因为设计者错误地把问题定位为人们打字太快。但是,“快”其实不是一个问题,人们使用打字机,时间一久便会熟能生巧,愈打愈快,这是无可避免的。而且打字机是为了方便人们以短时间完成文章的,所以快也是应该的。因此,设计者应把问题定位于字棒太慢才对。然而,随着1904年纽约雷明顿缝纫机公司已经大规模生产使用这一排法的打字机,这种排法实际上也成为产业标准。 6park.com

随着科技的发展,后来的电子打字机已经不存在字键卡位的问题。工程师们也发明了一些新的键盘排法,比如DSK(德沃夏克简化键盘),能使打字员的手指移动距离缩短50%以上。同样一份材料,用DSK输人要比用QWERTY输人节省5%c~10%c的时间。但QWERTY作为一种存在已久的排法,被人类广泛利用到电子词典、电脑等地方,成为键盘的标准设计。不仅几乎所有键盘都用这种排法,人们学习的也多是这种排法,因此不大愿意再去学习接受一种新的排法。于是,打字机和键盘生产商继续沿用QWERTY标准。 6park.com

假如DSK标准从一开始就被采纳,今天的技术就会有更大的用武之地。不过,鉴于现在的条件,我们是不是应该转用另一种标准?事情并不是那么简单。在QWERTY之下已经形成了许多不易改变的惯性,包括机器、键盘以及受过训练的打字员。这些是不是值得重新改造呢? 6park.com

从整体社会发展的角度看,答案应该是肯定的。第二次世界大战期间,美国海军曾广泛使用DSK打字机对打字员进行再培训。结果表明,再培训的成本只要使用新型打字机10天就能全部得到弥补。 6park.com

私营企业主愿不愿意做这个再培训的工作呢?假如他们知道这样做从经济角度上看是合算的,大概也会这样做。但是发现DSK的好处是一件并不容易而且要付出代价的事情,因此没有几个私营企业主愿意提供再培训服务,却要由某个像美国海军这样的大型机构充当第一个吃螃蟹的人。随着机械打字机被电子打字机和电脑键盘取代,即便是现有的QWERTY键盘存货也不能像以前那样阻挠改革,因为现在各键的排法只要改变一个小芯片,或改写某个软件就能完全实现。 6park.com

不过,事实证明我们就是跳不出那个恶性循环。没有一个个人使用者愿意承担改变社会ESS策略的成本。个人之间的难以协调,把我们紧紧束缚在QWERTY之上。历史上那个导致几乎100%的打字员都使用QWERTY的偶然事故,现在看来具有使其自身永生不朽的本事,即便当初推动发明的理由早已不存在,QWERTY不过是历史问题怎样影响今日选择的一个证明。在某一历史阶段曾经必须考虑的理由,到了今天可能已经无关紧要。今天,在选择相互竞争的技术时,类似打字机键卡位这样的问题与最终选择的得失已经毫无关系。在历史无法重新来过的情况下,如果使这种不好的路径依赖得以改变,仍然有可能使每一个人都从中受益。但历史上出现的偶然事故,不一定可以由今天的市场加以修正,市场的力量在这方面没有太多用武之地。我们选择QWERTY键盘的经历,迫使我们不得不继续使用这种相对比较差的技术。 6park.com

通过博弈论的分析我们发现,出现相对较差的标准,与其说是技术上的问题,不如说是行为上的问题。有关的例子都有一个均衡,若要从一个均衡转向一个更好的均衡,需要通过协调行动来进行,最有效的办法可能是借助一场短期而严厉的运动。 6park.com

战车的底盘与时速限定 6park.com

春秋时期,楚庄王起用了一位了不起的政治家孙叔敖,孙叔敖治国的最大特点是施教导民,唯实而不唯上,在想办一件利国利民的好事时,不靠脱离实际的行政命令,而是依靠高超的政治智慧。 6park.com

随着楚国实力的增强,与中原各强国的冲突也日益增多,对于作战用的战车的需求也相应增加:但是楚国民俗习惯坐矮车,民间的牛车底座很低,不适于在战时用做马车:楚庄王准备下令全国提高车的底座。孙叔敖说:“下令太多,民不知所从,这不好。如果您想把车底座改高,我请求让各个地方的城镇把街巷两头的门限升高。乘车的人都是有身份的君子,他们不能为过门槛频繁下车,自然就会把车的底座造高了。” 6park.com

庄王听从了他的建议,没有发布政令,而是由官府机构统一放弃底座低的矮车,而改造高车乘用,同时将大小城镇的街巷两头设一较高的门限,只有高车才能通过,矮车就会被卡在那里,靠人推才能通行。这样过了不到三个月,全国的牛车底座都提高了。对这件事,司马迁评价说:“此不教而民从其化,近者视而效之,远者四面望而法之。” 6park.com

实际上,孙叔敖的这一做法,包含着很深刻的博弈论智慧在其中,要理解这种智慧,我们需要考察一个现实生活中的博弈一超速博弈。在这个博弈里,一个司机的选择会与其他所有司机发生互动。 6park.com

在我国,交管部门按照《中华人民共和国道路交通安全法》等法律法规的有关规定,对车辆的行驶速度进行限定。比如在北京,二环、三环和四环路,限速在50~80公里每小时;五环路的限速为50~90公里每小时;机场高速路最高限速为120公里每小时;京津塘高速路的限速为110公里每小时;长安街、两广大街、平安大街、前三门大街限速为70公里每小时。对于超速的车辆,根据情节不同处以罚款、记分直至吊销驾驶执照的惩罚。 6park.com

那么在这种规定之下,你要不要约束自己的行驶速度呢? 6park.com

假如所有的人都在超速行驶,那么你有两个理由超速。首先,驾驶的时候与道路上车流的速度保持一致更安全。在大多数高速公路上,谁如果开车只开到每小时55公里,就会成为一个危险的障碍物,人人都必须避开他。其次,假如你跟着其他超速车辆前进,那么被抓住的机会几乎为零,因为警方根本没工夫让它们通通停到路边进行处理。只要你紧跟道路上的车流前进,那么总体而言你就是安全的。 6park.com

假如越来越多的司机遵守限速规定,上述两个理由就不复存在。这时,超速驾驶变得越来越危险,因为他需要不断在车流当中穿过来又插过去,而被逮住的可能性也会急剧上升。 6park.com

在超速行驶的案例中,变化趋势变成朝向其中一个极端。因为跟随你的选择的人越多,这个选择的好处就越多。一个人的选择会影响其他人,假如有一个司机超速驾驶,他就能稍稍提高其他人超速驾驶的安全性。假如没有人超速驾驶,那就谁也不想第一个超速驾驶,为其他人带来“好处”,因为那样做不会得到任何“补偿”。反之假如人人超速驾驶,谁也不想成为唯一落后的人。 6park.com

交管部门若是希望鼓励驾驶者遵守限速,关键在于争取一个临界数目的司机。这么一来,只要有一个短期的极其严格且惩罚严厉的强制执行过程,就能扭转足够数目的司机的驾驶方式,从而产生推动人人守法的力量。均衡将从一个极端(人人超速)转向另一个极端(人人守法)。在新的均衡之下,警方可以缩减执法人员,而守法行为也能自觉地保持下去。 6park.com

看到这里,我们已经能够理解孙叔敖在抬高城门槛的行动中所运用的智慧了。在他的方法中,提高门槛的高度,相当于对底座较低的矮车进行的一种惩罚,而为高车提供的一种便利。最开始的时候,使用矮车的“君子们”受到种种限制,产生种种不便,无法顺利通过街巷的门限。而与此同时,官府所使用的高车又给了他们一个示范的效应。为了得到这种通行便利,改造自己的车辆底座也就理所当然地成为一种优势策略。 6park.com

孙叔敖的做法给我们的启示在于,一个短暂而立竿见影的执法过程,其效率不仅远远胜过无法触动现行习惯的任何行政命令,而且大大高于一个投人同样力量进行的长期而温和的执法过程。 6park.com

任何法规政令,无论它的规定多么严密周详,如果无法严格执行,那么它的存在价值不仅会大打折扣,而且还会产生一种容易被人忽视的负面作用,那就是阻碍更新也更有效的法规的出现。
喜欢diyunheng朋友的这个贴子的话, 请点这里投票,“赞”助支持!
[举报反馈]·[ diyunheng的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回学习园地首页]
帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖:        ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


用户名:密码:[--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助

手机扫描进入,浏览分享更畅快!

楼主本栏目热帖推荐:

>>>>查看更多楼主社区动态...






[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]