您现在的位置是:首页 > 健康

病毒的反击战病菌与人体的免疫系统博弈数千万年,双

2020-06-09 12:00:14

方在较量中同步进化,各有输赢。

人类免疫系统主要面对两大对手,一种是细菌,一种是病毒。

细菌(病原细菌)一般是人体细胞1/10,它们侵入细胞内部,汲取细胞营养,致使器官坏死。霍乱弧菌、梅毒、麻风、白喉、结核杆菌都是人类杀手,近代人类发现青霉素等抗生素,对病原细菌取得了暂时性战略胜利。

另一大对手是病毒,比细菌、细胞小数千倍,它侵入细胞内部,汲取营养疯狂复制,最后胀破细胞喷涌而出,如法泡制致使人类死亡。治疗病毒主要依靠疫苗。

经过几百年现代医学干预之后,人体免疫系统与病菌之间的战斗越来越明朗。

细菌逐渐妥协,越来越倾向于寄生。

病毒依然顽强,继续与人类对抗到底。

总体来说,人类依靠医学发展占得上风。

但这次COVID-19病毒打响了“反击战”,给骄傲自大的人类当头棒喝。

COVID-19为什幺这幺厉害?

因为它与人体免疫系统的博弈都是一连串精心设计。

1

病毒的合作博弈

病毒何以能够取得如此辉煌的战绩?

首要因素是因为病毒之间不内讧,不计较个人得失,不占小便宜,专注于打击敌人。

1
病毒的合作博弈

备注:图中横排和竖排汉字表示博弈双方可能选择的博弈策略,交叉的括号表示双方在该策略组合下的收益,箭头表示策略组合和对应收益的动态演化,阴影部分表示最终稳定下来的纳什均衡态

我们来分析一下病毒博弈的不同策略组合形成的收益矩阵:

?首先,如果两个病毒都选择后攻击,等待其它病毒先攻击,那幺就没有病毒去攻击人体,结果是所有病毒都会被人体免疫系统反击清除,最后病毒的收益都是负数(-1,-1)。(图左上)

?如果其中一个病毒鼓起勇气选择先攻击,而另一个病毒则跟在后面辅助攻击,一先一后。先攻击的病毒因为先占优势,能选择更好的食物,得利更高,形成(2,6)或(4,2)的增长收益。(图右上和左下)

?观察到先攻击的病毒收益更高,于是后攻击的病毒转换自己的策略变成先攻击。所有的病毒最后都选择先攻击策略,蜂拥而上,人体免疫系统崩溃,细胞营养任由病毒吸食,形成最好的综合收益(6,6)。(图左下阴影)

每一个病毒都抓住机会率先攻击,而不是等待别的病毒。在病毒的集体攻击下,总收益迅速增长,单个病毒就能分得丰富的营养物质。

2

合作博弈的典型:社会分工

每个人都选择分工,而且是最优组合的分工

分工显着提高总收益和平均收益,但是分工也存在着巨大风险,一个人一旦选择分工策略,就意味着放弃了其它生存技能,抵抗风险的能力变差。所以专业化细致分工要在人口密度较高的城镇发生,以便节约交流时间。还需要法律优良,避免摩擦,实现迅速合作去抵抗突发危险。人类靠自觉的法律和自发的市场,实现了大规模的安全分工。

合作博弈是双赢博弈,增量博弈。它的魅力,就是“整体大于部分之和”的神奇效果,这种现象广泛存在于生物和人类社会中。

P表示产出,S表示投入的资源,a、b表示博弈双方

2

细菌的搭便车博弈

COVID-19病毒感染宿主并发起攻击后,友军细菌才开始趁虚而入,然而,病毒作为头攻部队,占了更多利益,细菌只能跟在病毒后面打扫战场,吃点剩余战利品。

细菌缩头缩脑,不愿出头与免疫系统正面对抗,它在搭病毒的便车。当然,病毒也需要细菌这样骑墙头的盟友,帮自己牵制免疫系统,减轻自己的作战负担。

从图中博弈矩阵分析:

?不管细菌选哪种策略,病毒都会选择先攻击,因为病毒先攻击的收益明显比后攻击高很多,(9,4)大于(3,1),或者(8,6)大于(-1,-1)。

?细菌明确的知道病毒会选择先攻击,于是它选择等待病毒先攻击之后,跟着病毒后面打扫,获得6的最大收益。

?病毒即使知道细菌在搭自己的便车,占自己的便宜,也会选择率先攻击,形成(8,6)的均衡组合。

病毒和细菌形成搭便车均衡,攻击顺序一先一后,双方都得利很大。搭便车博弈也是双赢博弈,但是搭便车一方付出较少,回报比例较高,这是“整体略大于或等于部分之和”。

搭便车、抱大腿、攀龙附凤、攀高枝、占小便宜在群体行为中非常普遍,例如大企业周围的小企业,大人物身边的小人物,大国周边的小国,军舰附近的商船,保卫森严的城镇附近的贸易市场,创业者和守成者,老板和员工,冒险者和保守者,甚至男人和女人的婚姻关系,大型食肉动物身边的小动物,植物借助动物的粪便传播种子等等。

3

搭便车博弈案例

搭便车行为是半合作行为,它与完全的合作行为一道,形成了生物生态和人类的政治经济生态。

1
鸟的飞翔阵列

搭便车在动物群体行为中是普遍现象,如鸟群飞翔队形,后面的弱鸟利用前面的大鸟的翅膀制造的空气旋涡减轻自己的飞翔负担。

大鸟和小鸟形成搭便车均衡

2

国家之间的抱大腿

国际安全中,小国往往并不建设军队,而是通过结盟,将安全事务让渡给大国,在外交和贸易上和大国合作。大国为了防止小国倒向对手,甚至会优待小国的贸易。小国既能让大国承担安全,也能得到优惠的贸易条款,占两次便宜。

3

意料之外情理之中:二八定律

搭便车者出于自身利益最大化,选择了搭便车策略,但是每个人都这幺做,却合成了意料之外的二八定律。

二八定律由意大利经济学家帕累托提出,指的是一类社会现象,20%的节点占据了80%的资源,百分之80%的节点只占据20%的资源。二八定律的粗糙说法就是马太效应,强者越强,或者所谓“人之道,损不足以奉有余”。

1999年,美国物理学家巴拉巴西发现二八定律的数学分布其实就是幂律分布(power law)。

二八分布的长尾效应:长长的尾部揭示大部分人只占据很少的资源

之所以形成幂律分布,是因为人类之间的网络结构非常特殊,20%左右的节点是网络的核心部分,接入80%的资源。无论社会网络增大还是缩小,二八分布不会改变,自己与自己保持相似性,与网络的尺度大小无关,所以才叫scale-free(无标度),类似于圆周率与圆的大小无关。

二八分布与规模无关的无标度网

而搭便车正是形成无标度网和二八定律的关键。新加入社会网络的人,为了自己的利益,首先会选择加入已经占据优势的节点,实现最大化。一旦每个人都想和中心节点相连,就会增加中心节点对其它小节点的吸引,形成累积效应,最后形成强者越强的幂律分布。

社会关系网、金融网、互联网社交软件是最显着的幂律分布,名人、金融中心、微信会聚集大量资源,而且轻易不能取代。

很多时候,第一名和第二名的差距很小,但是大部分人仍然会去投资第一名,导致第一名拥有的资源数量远远超过第二名。一旦第一名形成优势,想要改变就很难了,因为围绕在中心节点周围的一大群普通人把自己的小利益和中心节点捆绑起来,形成了规模化的利益集团。反之,一旦核心节点崩盘,周边的小节点也会迅速改投到另一个核心节点上,树倒猢狲散。

4

为什幺树倒猢狲散?

如果猢狲搭便车的大树能够带来大量收益,那幺一旦大树倒掉,这些巨量收益也会迅速消失。猢狲不得不离开这棵树,去寻找下一颗大树。

无论是搭便车,还是离开便车,都是弱势一方利益最大化的动态举措。人们总是希望马儿既能跑,马儿又不吃草;既要收获,又不要成本,所以总喜欢占便宜。

然而,如果搭便车成为所有人的行为准则,没有人愿意做大树,那幺就没有便车可以去搭,结果就是,大家都掉进囚徒困境。

4

囚徒细菌

既然病毒之间的协同作战能够带来巨大利益,病毒和细菌的搭便车结盟也能带来少量增量,为什幺细菌之间不协同率先攻击人体获取营养,而是选择寄生呢?

因为细菌掉进了一个陷阱:每个细菌都想搭别的细菌的便车,占别的细菌的便宜,抱别的细菌的大腿,最后导致没有细菌敢出头。

1
囚徒博弈

?假设细菌A勇敢地率先攻击人体,会首先遭到人体免疫细胞的打击,而如果没有别的细菌的援手,自己就会损失惨重,形成(-2,6)这种害己利他的结果。(图右上)

?旁边观望的细菌B如何选择?很显然,当人体免疫细胞专注于对付细菌A时,自己正好躲过打击,选择寄生反而能吃到更多东西,形成(-2,6)这种落井下石的有利于自己的结果。

?而细菌A知道自己的攻击成果不但没有利于自己,自己反而被人体免疫系统盯上,全部好处却被细菌B获得,就会改变自己的选择,也变成寄生。

?整个博弈的最终纳什均衡就是所有细菌都选择寄生,在人体免疫系统的监视下苟且偷生,甚至做起了益生菌,帮助人体运行,形成(1,1)的收益组合。(图右下阴影)

没有敢于承担第一波打击的带头大哥,没有愿意跟随大哥的小弟,所有博弈者都只顾自己,搭别人的便车,搭便车博弈就会退化成囚徒困境。

2

悬崖(鹰鸽)博弈

为什幺没有出头的细菌?因为经过漫长的人体免疫细胞与细菌之间的悬崖对抗和人类医学的干预,遵循幂律分布的20%左右的攻击性很强的烈性细菌基本被消灭或驯服,剩下的都是一些充满奴性的细菌,每日都在琢磨贪小便宜,得过且过,甚至内讧。

?只要细菌选择攻击策略,免疫细胞就绝不退让,选择反击,哪怕自己受损严重,也一定要让细菌付出惨痛代价,形成(1,-1)两败俱伤的结果。(图左上)

?细菌发现,如果自己选择寄生,免疫细胞并不会耗费自己的资源来打击自己,因为免疫细胞的打击行为也会消耗资源,(2,-1)的结局并不最有利于免疫细胞。(图右上)

?于是免疫细胞选择退让,细菌选择寄生,双方形成(3,1)的收益组合(图右下)

?悬崖逼迫策略就是宁愿玉石俱焚,也不后退,迫使对方先后退。免疫细胞迫使所有细菌选择寄生策略。

悬崖博弈是一方输一方赢,赢得一方获取收益,然而博弈双方总会各有输赢,势均力敌的悬崖博弈很多情况下都是双输的,仅仅因为博弈过程而投入的财力就很可能超过还没有实现的预期收益,在动态演变中蜕变成稳定的囚徒博弈。

战争是最典型的悬崖博弈和囚徒博弈:开始阶段,双方各有输赢,随着资源的消耗,双方慢慢进入僵持阶段,僵持就是双输的囚徒困境,持续的消耗让双方都受不了,但是谁也不敢退出。

悬崖博弈和囚徒博弈是典型的“整体小于部分之和”。

5

囚徒博弈的案例

囚徒困境是人类历史常见现象,几乎无法摆脱的阴影。

1
集体产权会怎样?大锅饭悲剧

为什幺计划经济的工业国家还会发生饥荒?为什幺石油富国委内瑞拉在大规模国有化后,超市会断水断粮?

大锅饭有一个非常明显的特点,用博弈论的行话就是收益矩阵十分特殊:使劲干活的人带来的额外产出,会被平均分摊到n多人身上,导致使劲干活的人本身的收益没有明显增长。

偷懒是最优选择、劳动是最坏选择的囚徒困境

大锅饭体制经过动态演化之后,必然形成一个囚徒困境,而且是人为制造出来的:比谁更偷懒,因为偷懒是最优策略,谁偷懒谁就更健康,职业病更少,死亡率更低,有时间和上级搞好关系;很少人愿意模仿劳动模范,而原先努力工作的人由于长期付出—回报不成比例,慢慢变成单位里的老油条。

即使一开始因为精神感召,有不少努力工作的人,但经过几代适者生存,这类人和他们的精神就会消失得干干净净。

大锅饭悲剧又叫公地悲剧。

2

没有产权会怎样?

大锅饭体制,表面上是集体产权,而结果却是劳动不会带来对称的收益,失误不会带来对称的损失。私有产权和产权清晰带来的最根本的效果是自负盈亏,自己承担自己的生活,这是绝不能推诿的硬激励和硬约束。

假设一个社会既没有私有产权,也没有公有产权,会怎样?

抢夺是最优选择的囚徒困境

任何劳动的风险相当高,因为劳动需要长久的耐心、时间,面临着自然灾害的突发风险。耗费的成本高,而收获却不一定有保障。抢夺别人的劳动果实,耗费的时间短,风险反而低,抢夺的收益明显高于成本。

没有产权,就是鼓励抢夺,而保护产权的法律的经济功能就是提高抢夺的成本,迫使想抢夺的人选择劳动策略。

假设一个社会虽然有物质产权,但不保护知识产权,会怎样?

抄袭是最优策略的囚徒困境

不保护知识产权,不提高创新的收益,不提高抄袭的成本,所有人都会选择抄袭,而社会就停滞不变,没有进步。每个人短暂的小便宜,换来的是社会的衰落。

集体产权鼓励人偷懒,而没有任何产权则鼓励人抢夺和抄袭。

3

改革为什幺伟大?

一项改革建议提出后,大家都知道它的好处,但是没有人愿意率先践行这项改革,为什幺?

因为最先改革的人不但得不到改革的任何好处,相反,会承担改革的所有成本和风险。而大部分人习惯了搭便车,尤其是搭改革者的便车,在没有改革者的情况下,选择观望至少能保留原来的收益,观望就会成为所有人的最优选择。

都选择观望的囚徒困境

促进改革的办法,首先是改革风险承担机制,把第一批改革者的成本降下来,支持改革的人越多,分摊到每个支持者身上的风险和成本就越小。如此一来,少部分风险偏好的人就会率先改革,大部分安全偏好的人则会搭便车,社会就能持续不断地进步。

但如果一个社会的制度故意增加改革者的风险和成本,我们又能怎幺办?许多帝王就是故意这幺做的。

4

帝王控制臣民

《商君书》

古今中外,从《商君书》、《韩非子》,到马基雅维利的《君主论》,都滔滔不绝地向帝王建议弱民、疲民、愚民、分民、辱民五种御下之术。

?枪打出头鸟

控制臣民和奴隶的最简洁、最常用的办法,就是在二八定律基础上,把潜在的20%左右的出头鸟(核心节点)消灭掉。《史记》记载,汉武帝派酷吏消灭地方豪强,或者把地方豪强纳入官僚体制成为权力寻租的共谋者,威逼利诱,双管齐下。

通过悬崖博弈,把出头鸟消灭,绝大部分人由于习惯了搭便车,就丧失反抗能力了。

?等别人出头

枪打出头鸟,是为了让所有潜在的反抗者,知道最先反抗的人成本最高、收益极低。剩下来的风险偏恶、安全偏好的人都不敢出头,而是在等别人出头,他们在观望中慢慢养成新的习惯。

都等着别人出头的囚徒困境

同理,外来入征服者的策略往往是消灭掉国家的最高层,收买国家中下层统治者和聪明人,大部分普通人处于观望状态,这样就可以控制整个国家。

?制造猜忌

管制信息,让臣民无法准确交流,无法建立信任。古代监狱常用的办法,给一点小便宜,让囚犯争夺,彼此坑害。而举报,则把这两种办法融合在一起。

汉武帝为了获取高额税收,下过告缗(min)令,凡是告发他人隐藏了钱财的举报者,可以得到被告发者财产的一半,结果人人自危,彼此猜疑。

互相举报的囚徒困境

除此之外,帝王会不断地侮辱臣民,羞辱他们,让奴隶觉得自己的东西自己本来不配得到,都是帝王恩赐的;让奴隶不断地感恩;让奴隶觉得尊严不能当饭吃。

其实免疫细胞就是这样不断羞辱细菌,让细菌觉得寄生也是不错的状态。

所有博弈最关键的,就是打散对方,将对手原子化、孤立化,使对方互相隔绝、互相猜忌、甚至互相陷害,丧失合作能力之后,势必掉进囚徒困境,无法反抗。被君王分化瓦解的人,渐渐对公共事件失去兴趣,只关心自己一亩三分地,而其它的观望者,都被自己的小小的职业范围困起来。这种社会,就是更大的“囚徒困境”。

6

博弈的演化模型

病毒、细菌和免疫细胞之间的混战、媾和、投降揭示了四种最基本的博弈类型:合作博弈、搭便车博弈、囚徒博弈、悬崖博弈。

博弈的演化路径

1
均衡不等于最优,也可能是陷阱

四种博弈形成四种均衡,总收益和平均收益依次递减,能态逐渐降低,正好构成一个演化序列,逐级上升或下降。实际均衡不一定是最优均衡。均衡首先只是相对于周边范围是局部最优的,数学上,就是此点的导数(斜率)为零,局域极大,而非全局极大。

导数为零

简单来看,合作博弈的均衡是最高级均衡,搭便车博弈半合作是中等均衡,悬崖博弈和囚徒博弈的均衡是低级均衡,同时也是困境和陷阱。

2

形成合作共识非常困难

悬崖博弈和囚徒博弈是竞争关系;搭便车博弈和合作博弈是合作关系。竞争与合作是生物系统和人类社会最基本的两种适应行为。

人与人之间的博弈总是在这四者跳跃,从竞争到合作,从低级向高级进化,或者从高级向低级退化,从合作到竞争,不断轮回。

博弈中最困难,并不是达成均衡,而是从低阶均衡跳跃到高阶均衡,从低能态跳到高能态,从数值较小的解析解变成数值较高的解析解。

战争是典型:战争双方往往两败俱伤,毫无所得,经过冲突和持续不断的损失,双方改变了之前的认知,发现不争斗比争斗要好,合作比不争斗要好,学会承认对方的利益。中美之间的关系就是如此,选择战斗是博弈双方最低能(或者不得已而为之)的策略。

3

升级难,降级易

合作一段时间后,积累了许多利益冲突,如果处理不当,参与者没有协调能力和妥协,合作博弈会不断退化,直到最后大家重新掉进囚徒陷阱里面,重新爆发战争。

高阶均衡向低阶均衡退化的风险始终存在,无法消除。而最难堪的是,一旦我们掉进低阶均衡陷阱,就很难再爬出来,这叫路径依赖。

越高级的均衡需要的条件越苛刻,也就是说,进化很难,需要漫长的时间去尝试,积累经验和规则,而退化很容易,一个意外、一场天灾、一次战争,就可能从合作博弈直接掉进囚徒陷阱。面对COVID-19病毒的攻击,人类合作秩序已经出现明显退化。

病毒合作亲密无间,人类之间勾心斗角。

博弈的演化模型揭示了高阶均衡很难形成,却容易失去,但合作始终值得追求。我们如何进化到合作均衡?动力是什幺?COVID-19病毒向人类提供了重要启示。

7

向病毒学习演化动力学

从囚徒困境演化成合作博弈,就如同从战争走向和平,再变成盟友,中间要经历漫长的认知改变过程,才能让争斗双方承认对方的合理性。

COVID-19病毒展示了它们合作之后的威力,我们可以根据病毒的合作博弈构造一个博弈进化的微分动力学方程:

E:energy,总能量,总收益

C:courage,敢当出头鸟的勇气

F:follow愿意跟随带头大哥做小弟,自发合作,团结一致

T:trust信任是合作的基础

W:willness毅力

α+β+λ=1,人的美德综合起来的完整度

I:information信息自由度,只有信息自由沟通,才能破除猜忌和孤立

G0:give in妥协指数,能在关键时候与队友妥协

如果大家都能遵循这个公式,就能实现合作博弈和搭便车博弈,做大蛋糕,人人受益。

而这个公式的反面就是退化微分动力学,没有敢第一个吃螃蟹或蜘蛛的人,人人只会搭便车,社会就会一退再退,直到每一个人成为另一个人的敌人,堕入社会达尔文主义或者“黑暗森林”法则。

病毒教人类怎幺“做人”

病毒很难称得上是一种生命,它只是一个RNA片段。

人类自诩为万物灵长,擅长运筹帷幄,博弈决胜。

但面对COVID-19病毒,人类并没有显示出高明之处。

今日之病毒已经席卷全球,总感染人数近300万。

这种情况下,人类能做的,是并肩携手共同合作。

但似乎,COVID这当头一棒并没有敲醒人类。

那些把握人类命运者,还在互相甩锅。

这是人类的超级进化,还是基因失控退化返祖?

在这个危急时刻,人类还在像囚徒一样各自为战、互相提防。

一切都在病毒的博弈策略之中:分化对手,彼此猜忌,迫使对手孤立化、原子化,只知道顾自己。

病毒在密切合作,人类却互相攻讦,人不如毒,岂不悲乎!