最近在看凯文··凯利的《失控》,相信不少朋友都读过或听过这本大作,书中第5章第5节提到了博弈论衍生出的“社会困境”分为四种变体,分别是“草鸡博弈”、“猎鹿博弈”、“僵局”、“囚徒困境”,然而书中对“僵局”的解释语焉不详,给不少读者造成了疑惑,作者没有深厚的数学知识及博弈论相关的任何专业素养,于是以大家能看懂的方式为这四种模式做个简要分享。
1.什么是博弈论?
博弈论,又称为对策论、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
换成大家容易理解的方式就是:
我预测了你的动作;
你预测了我对你的预测;
我预测你预测到了我对你的预测;
……
然后这样不断重复,直至做出具体动作并得到博弈结果。
这本质上是一个二级混沌,一级混沌不会因为预测而改变,二次混沌则会随着预测而改变结果。
金色财经合约行情分析 | BTC小幅回调 市场多空博弈将加剧:据火币BTC永续合约行情显示,截至今日16:00(GMT+8),BTC价格暂报9607美元(-2.26%),20:00(GMT+8)结算资金费率为0.033470%。
昨日晚BTC缩量再次向上测试一万美元大关后开始回调,最低到9550美元一带,目前在9600上方盘整。根据火币交割合约数据,BTC季度合约成交额大幅降低,持仓量大涨近12%,精英多头占比小幅下降,季度合约升水增加。随着在BTC一万美元位置下的震荡,市场上多空博弈将加剧,市场整体结构在交易量和持仓变化出现了一些异动,投资者需注意控制风险。[2020/5/9]
2.草鸡博弈(ChickenGame):
也叫斗鸡博弈、懦夫博弈、胆小鬼博弈,书中的原文是:“草鸡博弈”是供鲁莽的青少年玩的游戏。两辆赛车朝悬崖边奔去;后摔出来的司机是赢家。可谓短小精辟,另一方面也说明了我和很多读者的情况一样,有具体的案例更容易理解。
整体来说“草鸡博弈”是一个博胆行为,狭路相逢勇者胜,我也举个身边的例子,有个朋友说他前两天遇到一个逆行超车的还是左转来着,具体记不清了,总之我朋友是直行,对方理应让行,我朋友说他根本没松油门,反正有保险,最终对方先认怂了。在这里我不是说我朋友的行为正确,而是阐述一个生活中的“草鸡博弈”案例,对方认为继续相向而行的成本太高而率先退出。
博弈节点来临,BTC震荡中带动市场上扬:据ZG现货盘面显示,昨日BTC行情整体呈现为6400-6800区间的震荡向上走势,延续了一天的多空博弈后,底部量能开始缓慢缩减,顶背离形态也渐渐浮出水面。ZG.COM分析师leo认为这预示观望的人在?缓慢增多,也暗示着短期上涨将进一步受阻,日内出现回调概率加大?。但辩证地去看会发现,4小时布林带持续呈开口状,行情也始终保持在中上轨区域,均线形态也良好,再加上日线上升趋势三角马上结束,可见只要ATR趋势线与4小时布林带中轨支撑牢靠,日内回调后的反弹也会?让投资者喜获丰收。[2020/3/25]
“草鸡博弈”的结局一定是两败俱伤或者一方败退,换位思考和协议补偿是解决“草鸡博弈”的方式,也就是我可以让步,但是你怎么补偿我?又或者是我想让你让步,我选择用什么来补偿你?古巴导弹危机是“草鸡博弈”在现实中的表现,大家可以想想还有哪些现实事件符合“草鸡博弈”理论。
3.猎鹿博弈:
也叫猎鹿模型或猎人的帕累托效率,同样祭出《失控》中的原文:“猎鹿”是一群猎手面对的难题,他们必须合作才能把鹿杀死,如果没有人合作的话,那么开小差各自去撵兔子会更好些。他们是在合作还是背叛吗?
分析 | 多空双方陷入博弈,近期或再度走出震荡行情:根据OKEx现货显示,截至欧盘开始,BTC暂报价8098.7美元(-0.33%)。 在今日大盘整体维稳的态势下,主流币市场得到短暂的休整时间。OKEx分析师Neo认为,多数主流币在近半年底部附近徘徊,已接近大量多头成本区域,反映到盘面上则是日内多空博弈产生的震荡行情。受制于低迷市场情绪,很多资金仍然处于谨慎观望状态,抄底情绪并不高涨,因此多头在短期内或难有大作为。目前主流币市场仍将继续追随大盘走势,若大盘止跌,从日线级别历史走势来看,LTC下方支撑或为主流币最强,企稳概率也较大,ETH、EOS次之,TRX与XRP的支撑区域仅得到近期几次验证,且接近年内最低位,有一定再度探底的风险,但币价若能在该区域企稳,后市有一定反弹空间。本周主流币市场有大概率走出箱体震荡行情,投资人需以观望为主。OKB现货暂报2.53美元(-1.92%)。
注:开盘时间以香港时间0点为准
根据OKEx永续合约显示:
BTC 报8075.4美元(-0.48%)
ETH 报174.2美元(-0.90%)
EOS 报3.063美元(-0.87%)
LTC 报53.81美元(-2.43%)
ETC 报4.347美元(-0.78%)
BCH报242.25美元(-0.01%)
BSV 报106.56美元(-1.11%)
XRP 报0.2478美元(-1.24%)
TRX报0.01622美元(-3.28%)
根据国际第三方统计机构CoinGecko数据显示,OKEx平台24小时合约交易额21.3亿美元。
风险提示:
入市有风险,投资需谨慎。[2019/11/21]
猎鹿博弈出自法国启蒙思想家卢梭著的《论人类不平等的起源和基础》,具体内容是:古代的村庄有两个猎人。当地的猎物主要有两种:鹿和兔子。如果一个猎人单兵作战,一天最多只能打到4只兔子。只有两个一起去才能猎获一只鹿。从填饱肚子的角度来说,4只兔子能保证一个人4天不挨饿,而一只鹿却能让两个人吃上10天。这样两个人的行为决策可以形成两个博弈结局:分别打兔子,每人得4;合作,每人得10。这样猎鹿博弈有两个纳什均衡点,那就是:要么分别打兔子,每人吃饱4天;要么合作,每人吃饱10天。并配下图说明:
独家 | 极豆资本合伙人李泳:矿机市场是算力的博弈 所有企业都不敢懈怠:针对目前矿机三大巨头企业谋求上市一事,金色财经独家采访到极豆资本合伙人李泳,在关于“三大矿机企业集体谋求上市,您有何看法?”这一问题上,他表示:“即使三家企业上市,市场选择还是会以矿机算力为主,像玛雅、阿瓦隆、芯动、GMO等新的矿机企业新出的矿机算力很高,也备受关注。矿机制造业的战场,就是一场算力的博弈,所有矿机企业都不敢有丝毫懈怠,一旦落后于时代的矿机和芯片技术的高速更新迭代,迎来的就是淘汰。任何一个行业都不是一成不变的,虽然比特大陆、嘉楠耘智与亿邦国际目前垄断了全球市场,但随着币价变化,矿机市场会涌现更多竞争者。它们在尝试上一个台阶,但后来者也在全力冲刺,只要有市场需要,优质的矿机就一定能出线。”[2018/9/11]
很显然猎兔不是最优选择,并不能充分利用现有资源,也就是没有达成“帕累托效率”,而从各自猎兔的角度看,合作猎鹿是为了达成1+1>2的效果,可以看到这就是典型的“非零和博弈”,国际和企业间的强强联合都可以视作合作猎鹿。然而在猎鹿过程中,谁出卖的力气更多,成功猎鹿后,谁获得的利益更大则是更值得思考的问题。你可以选择上班摸鱼,也可以选择配合老板命令做好项目,但是收益嘛~
Coinness分析:多空博弈激烈 BTC短期可能出现上攻走势:据Coinness作者分析,BTC当前多空博弈比较激烈,已经窄幅震荡了近24个小时,布林带指标再度收窄,短期有望出现上攻走势。上攻区间为10日均线($9446)之上,突破后将使BTC重新考虑1万美元。另外50小时均线($9227)可作为短期支撑,如果放量跌破BTC将会试探回调的新低点。总之,短期多空胜负即将分晓,维持横盘将使BTC重新回归10日均线之上,回调可留意50小时均线。[2018/5/10]
4.僵局
“僵局”是不少读者疑惑的地方,书中表述为:“僵局”是挺无聊的游戏,彼此背叛收益最高。“僵局”到底是什么样的体现形式呢?其实可以参照Deadlock的直译“死锁”,也被译作死结。维基百科给出的名词解释是:计算机科学名词。当两个以上的运算单元,双方都在等待对方停止执行,以取得系统资源,但是没有一方提前退出时,就称为死结。同时维基百科也给出了配图说明:
配图的解释文字是:P1、P2两个process都需要资源才能继续执行。P1拥有资源R2、还需要额外资源R1才能执行;P2拥有资源R1、还需要额外资源R2才能执行,两边都在互相等待而没有任何一个可执行。
是不是有点绕,其实有更简单的说明方式,这里举个例子,假如你要去一个地方,必须路过一条只能通过一辆汽车的小道,这时遇到了对头车,对方和你相向而行,你俩都要通过这条路,结果显而易见,只能有一辆车退出,两辆车才都能去往自己的目的地。
此外还有一个与“死锁”类似的场景叫“活锁”或“活结”,即Livelock,解释是:与死结相似,死结是行程都在等待对方先释放资源;活结则是行程彼此释放资源又同时占用对方释放的资源。当此情况持续发生时,尽管资源的状态不断改变,但每个行程都无法取得所需资源,使得事情没有任何进展。
这个例子更容易举:比如还是这条路,这次你和对面的人都骑自行车,而这条路能容纳两辆自行车并排通过,但是你和对面人一个习惯左边骑,另一个习惯右边骑,然后你们遇上了,很显然你们在同一条车道,这时你和对方都礼貌的换到另一车道让行,不幸的事情发生了,你们“向”上了。这就是“活结”。
“死锁”的解决方案是一方退出占用资源,在计算机系统还可以用重启来重置场景,“活结”的解决方案是双方停止谦让,各自占用各自资源。
5.囚徒困境(Prisoner'sdilemma):
囚徒困境可谓博弈论中最典型的场景,同样先摘原文:
“囚徒困境”是由兰德公司的梅里尔·弗勒德于1950年设计出来的。游戏中,两个分别关押的囚徒必须独立决定否认还是坦白罪行。如果两人都认罪,那么两人都会受到惩罚。如果两人都否认的话,则都会被无罪释放。但假如只有一人认罪,那么他就会得到奖励,而另一个则受到惩罚。合作有回报,但如果策略奏效的话,背叛也有回报。
MBA智库中关于这一段的描述是:囚徒困境最早是由美国普林斯顿大学数学家阿尔伯特·塔克1950年提出来的。他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论,这个故事后来成为博弈论中最著名的案例。故事内容是:两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
而后MBA智库又做补充说明:1950年,由就职于兰德公司的梅里尔·弗拉德和梅尔文·德雷希尔拟定出相关困境的理论,后来由顾问阿尔伯特·塔克以囚徒方式阐述,并命名为“囚徒困境”。同样配表格解释:
可以看出两人的最优选择是合作,次优选择是两人同时背叛,最差选择时自己选择了合作,而对方选择了背叛。单次“囚徒困境”的随机性相对较大,就像抛硬币一样,但是如果把囚徒困境的次数增加呢,如何能在长期多次的“囚徒困境”中获得最大收益,获胜的策略叫“一报还一报”,也就是“以牙还牙”,实施这个策略需要四个前提:
1.友善:不选择先背叛;
2.报复:报复背叛者,让他下次不敢;
3.宽恕:为了收益最大化,引导之前的背叛者合作;
4.不嫉妒:不去主动争取收益最大化;
从现实情况来看,无论国家行为抑或是企业行为都存在于某一个相对较长的周期中,所以“囚徒困境”很可能是促进社会合作的重要一部分。我们知道在“零和博弈”中选择对抗,在“非零和博弈”中选择合作是最优解,《失控》中同样阐述了零和游戏和非零和游戏的区别:在零和游戏中你总想隐藏自己的策略,但在非零和游戏中,你可能会将策略公之于众,这样一来,别的玩家就必须适应它。也就是之前所说的“一报还一报”。
那么如果在把“囚徒困境”的广度做延伸,不只局限于二人呢,比如高污染企业、森林的乱砍滥伐、渔业的过度捕捞,是否同样适用二人博弈时的策略。或许答案正是《失控》中驳斥的托马斯·霍布斯的理论:只有在善意的中央集权帮助下才能产生合作。
文章部分内容摘自《失控》、维基百科、MBA智库等
完
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。