跳过导航.
主页

量子博弈(quantumgame)

量子, Game

破解“囚徒困境”--2001年校友基金会优秀青年教师奖获得者杜江峰

《新安晚报》11月7日报道

中国科技大学海外校友基金会在母校隆重举行优秀青年教师奖颁奖大会,并捎来了一个“珍藏了很久的消息”:去年摘取此项大奖的杜江峰博士和研究伙伴今年在世界上率先通过实验手段在量子计算机上验证了计算机博弈理论。这一激动人心的研究成果得到了国际权威杂志《自然》的高度赞誉,目前已引起国际同行的重视。

  获奥斯卡奖的电影《美丽心灵》让普通观众对博弈理论有了感性的认识。博弈理论在社会科学、经济学和生物学领域都有极其广泛的应用,所关心的问题简单说来就是大家都很熟悉的“囚徒困境”:在一个游戏中,两个参加者均可选择A或B两种策略,若他们都选择A,那么每人都会得到3个单位的收益;若两个人都选B,则每人只能得到1个单位的收益;若一人选择A,而另一个选择B,那么后者会得到5个单位的收益,前者则什么也得不到。这就告诉我们,如果两个游戏者之间不能互通消息,那么他们就都会选择策略B,因为感觉这样获益会较多。但实际上,他们却不得不陷入到一个困境之中:每人只能得到1个单位的收益,并不如两人都选择A带来的收益多。而量子博弈论则试图解决这一困境。

  对此,在国际量子理论与实验研究方面具有一定影响的中国科大进行了卓有成效的工作,经过艰苦卓绝的努力,杜江峰研究小组首先在理论上解决了“囚徒困境”问题,然后又通过核磁共振设备成功验证了这一理论预言。这意味着一旦对局双方能找到一个新的均衡点,他们都将得到3个单位的收益。这是国际上首次实现的量子博弈实验研究。其研究成果“量子博弈在量子计算机上的实验实现”迅速被刊登在国际权威杂志《物理评论快讯》上,成为国内量子计算实验研究工作在该杂志上首次“亮相”,被审稿者认为“既新颖又有意义”。随后,这项成果又被国际权威学术期刊《自然》的网站、英国科普杂志《新科学家》以及美国物理学会与欧洲物理学会的新闻网站作了专题报道。

  不过,杜江峰教授并没有因此成绩沾沾自喜,也没有对外公布,只是悄悄地给该校海外校友基金会写了封信,感谢海外校友们对其事业的支持。

对杜江峰小组工作的介绍

----“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。

----那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。

----当然,在现实世界里,信任与合作很少达到如此两难的境地。谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这种真实的一面。让我们看看冷战时期两个超级大国将自己锁定在一场40年的军备竞赛中,其结果对双方都毫无益处。还有各国的贸易保护主义的永恒倾向。

“囚徒困境”是博弈论的一个生动例子。在这个例子中,假定游戏的两个参加者都可采取A或B两种策略。如他们都选择A,那么每人都会得到3个单位的收益;如两人都选B,每人只能得到1个单位的收益。若一人选择A,而另一个选择B,那么后者会得到5个单位的收益,前者则什么也得不到。博弈论告诉我们,如两游戏者之间不能互通消息,那么由于对他们每个人而言无论对方的策略是什么,自己选择B所获得的收益总比选择A来得多,所以他们都会选择B。而这样一来他们每人只能得到1个单位的收益,这显然不如两人都选择A带来的收益多。对于双方来说,这是一个无法避免的困境。在这个例子中,当双方都采取B策略时,他们中的任何人独自改变策略都只会使自己收益降低。这种情况称为“纳什均衡”。在博弈论中,寻找一个游戏的“纳什均衡”点往往是进行各种分析的核心步骤。不难看出,在上面的例子中,“两人都选择B”是游戏中唯一的纳什均衡点。

  “量子博弈(quantumgame)”是1999年由艾泽特(J.Eisert)等人提出的。在他们文章所描述的游戏中,游戏者手持服从量子规律的粒子,游戏时所能采取的策略即是对手中的粒子施行自己选定的量子操作。而操作结束后每人手中粒子的状态将决定游戏者的收益。艾泽特指出,在“囚徒困境”游戏中,一旦允许双方手持处在“最大纠缠态”的粒子,并以各种幺正变换作为自己的策略,那么对他们来说,能使自己收益最大的策略将不是前面提到的策略B。对局中将出现一个新的纳什均衡点。这个均衡点对应一个特定的幺正变换。在这个均衡点上,两人都将得到3个单位的收益。这种“双赢”局面的出现意味着在“量子博弈”中游戏者摆脱了前面所说的困境。

  杜江峰小组首先在理论上研究了“囚徒困境”对局中双方手持粒子相互间的量子纠缠程度与对局中纳什均衡点的关系。他们发现,当这个纠缠程度较小时,对局与经典博弈的情况没什么不同,“两人都采取策略B”仍是局中唯一的纳什均衡点。当纠缠程度增大一些时,对局中将出现两个纳什均衡点,从某种意义上说,这时对局处在一种不稳定状态。而粒子的纠缠大到一定程度时,对局中将只有艾泽特所给出的那一个纳什均衡点。

  杜江峰小组是利用核磁共振设备实现量子博弈的。在他们的实验中,氢原子的核自旋状态充当两游戏者手中的粒子。科学家使用一系列射频磁脉冲对这些粒子的状态进行测控。他们成功制备了不同纠缠程度的粒子态,并模拟两个游戏者按不同情况下纳什均衡所对应的策略对这些粒子进行相应的幺正变换。之后,实验者测量了一个游戏者的收益。



评论查看选项

选择您喜欢的显示评论的模式,并点击"保存设置"来激活您所做的改变。

有意思,值得关注。