子博弈精炼纳什均衡,博弈理论的基本要义?
博弈理论是研究决策制定者在相互关联的决策环境中进行策略选择的数学模型和分析方法。其基本要义包括以下几个方面:
1. 参与者:博弈理论关注的是多个决策制定者之间的相互作用和决策选择。这些决策制定者被称为博弈的参与者。
2. 策略:每个参与者在博弈中都有可供选择的策略。策略是参与者为了达到自己的目标而采取的行动或决策。
3. 支付off:博弈的结果会对参与者产生影响,这种影响通常通过支付off来表示。支付off可以是经济效益、利润、效用值等。
4. 博弈形式:博弈形式描述了参与者的策略空间、支付off以及参与者之间的相互依赖关系。常见的博弈形式包括正规博弈、合作博弈、零和博弈等。
5. 均衡概念:博弈理论研究博弈参与者之间的均衡点,即在该点上,没有参与者有动机单方面改变自己的策略。常见的均衡概念包括纳什均衡、博弈树均衡等。
通过研究博弈理论,我们可以分析和预测参与者的策略选择,理解他们之间的相互作用,并找到最优的决策策略。博弈理论在经济学、政治学、生物学等领域都有广泛的应用。
什么是博弈的标准式?
博弈的标准是是著名博弈论专家纳什(John Nash)对博弈论的重要贡献之一。纳什在19世纪50年1951年的两篇重要论文中,在一般意义上给定了非合作博弈及其均衡解,并证明了解的存在性。正是纳什的这一贡献奠定了非合作博弈论的理论基础。纳什所定义的均衡称之谓“纳什均衡”。
(
占优策略均衡和纳什均衡的区别是什么?
简单来说,占优策略是不管对方有什么策略,"本方都有唯一最优的策略,不会随着情况不同改变。而纳什均衡则是,根据对方的选择来决定自己的最优策略,会根据情况而变。所以,占优策略均衡一定是纳什均衡,而纳什均衡却不一定是占优策略均衡。在“囚徒困境”中,不论囚徒B坦白还是不坦白,囚徒A的最优选择都是坦白;同样对于囚徒B来说,不论囚徒A坦白还是不坦白,他的最优策略是担白。因此(坦白,坦白)是策略组合的占优均衡,同时这一策略组合又一定是纳什均衡。因为一个参与者的占优均衡是对基他参与者任何设定策略的最优选择。
谁能把纳什均衡给讲清楚点?
纳什均衡是博弈论中的一个规律,指的是在一个博弈过程中,博弈双方都没有改变自己策略的动力,因为单方面改变自己的策略都会造成自己收益的减少。纳什均衡点可以理解为个体最优解,但并不一定是集体最有解。
为了解释这个问题,我们举两个最典型的例子:囚徒困境和智猪博弈。
囚徒困境囚徒困境是说:有两个小偷集体作案,然后被警察捉住。
警察对两个人分别审讯,并且告诉他们政策:
如果两个人都交代坦白,就可以定罪,两个人各判八年。
如果一个人交代另一个不交代,那么一样可以定罪。但是交代的人从宽处罚,批评教育就释放。不交代的人从严处罚,判十年。
如果两个人都不交代,没法定罪,每个人判一年意思一下。
两个人的收益情况如下所示:
首先我们考虑A的决策。A会想,我如何才能获得更大收益呢? 如果B坦白了,那么我坦白就会判8年,我抗拒就会判十年,我应该坦白;如果B抗拒了,我坦白会判0年,我抗拒会判1年,我还是应该坦白。所以最终A会选择坦白。同样,B也会这样想,因此最终纳什均衡点在两个人都坦白,各判八年这里。
显然,集体最优解在两个人都抗拒,这样一来每个人都判一年就出来了。但是,纳什均衡点却不在这里。而且,在纳什均衡点上,任何一个人都没有改变自己决策的动力。因为一旦单方面改变决策,那个人的收益就会下降。
这与我国开车夹塞的例子很像。如果大家都不夹塞,是整体的最优解,但是按照纳什均衡理论,任何一个司机都会考虑,无论别人是否夹塞,我夹塞都可以使自己的收益变大。于是最终大家都会夹塞,加剧拥堵,反而不如大家都不加塞走的快。
那么,有没有办法使个人最优变成集体最优呢?方法就是共谋。两个小偷在作案之前可以说好,咱们如果进去了,一定都抗拒。如果你这一次敢反悔,那么以后道上的人再也不会有人跟你一起了。也就是说,在多次博弈过程中,共谋是可能的。但是如果这个小偷想干完这一票就走,共谋就是不牢靠的。
在社会领域,共谋是靠法律完成的。大家约定的共谋结论就是法律,如果有人不按照约定做,就会受到法律的惩罚。通过这种方式保证最终决策从个人最优的纳什均衡点变为集体最优点。
智猪博弈智猪博弈是这样一个例子:有一个食槽中装有十份食物,但是按钮在另一端。需要到另一段按一下按钮食物才能掉下来。大猪和小猪都在食槽一端,他们两个人都可以跑到另一端按按钮然后再回来,速度相同,并且都要消耗一定的体力,并且会造成另一只猪先吃食物。
我们假设每只猪跑去按按钮都要消耗2份食物的体力,并且大猪比小猪吃食物快,所以:
如果大猪先吃食物,二者吃食物的比例为9:1
如果小猪先吃食物,二者吃食物的比例为6:4
如果二者同时吃食物,吃食物的比例为7:3
两只猪都可以选择去按按钮,也可以选择等待。在考虑了两只猪消耗的体力因素后,各种决策对应的收益如下所示:
我们来考虑均衡点。小猪会思考:如果大猪去,我跟着去获得收益1,我等着获得收益4,因此我应该等着。如果大猪不去我去,我获得收益-1,如果我们都等着我收益为0,因此我还是应该等着,这样一来,小猪的决策一定是等待。
在小猪等待的情况下,如果大猪去按按钮,获得收益4,如果大猪不去按按钮,获得收益0,因此大猪会选择去按按钮。这个(4,4)的收益就是纳什均衡点。
这和国家或者公司进行基础研究研发新产品很像。比如一款新的芯片研发需要花很多钱,成功后也能获得更大的收益。在这样的情况下,小国家小公司是没有动力进行研发的,他们会等待大国大公司研发好了之后,直接利用现成的技术获得收益。
我们的芯片产业就是这样一个局面,多年以来我们一直认为自己是发展中国家,没有大力推动半导体产业的基础研究,许多人秉着做不如买,买不如租的观点。现在美国对中国展开贸易战,禁止芯片出口,一下子就卡主我们的脖子了。
约翰纳什是一位传奇人物,前两年出车祸去世了。想了解纳什的一生,可以去看看电影《美丽心灵》
如何自学博弈论?
自学博弈论是一个有趣且富有挑战性的过程。以下是一些建议,可以帮助你有效地自学博弈论:
确定学习目标:在开始自学之前,确定清晰的学习目标是非常重要的。这有助于你明确自己想要掌握的博弈论知识和技能,从而更好地安排学习计划。
学习基础知识:了解博弈论的基本概念和术语是开始自学的关键。例如,你需要知道什么是策略、均衡和纳什均衡等。可以通过阅读教科书或在线资源来学习这些基础知识。
研究经典案例:研究经典的博弈论案例可以帮助你更好地理解博弈论的应用和原理。例如,“囚徒困境”、“零和博弈”和“智猪博弈”等都是非常经典的博弈论案例。
数学和经济学基础:博弈论涉及到许多数学和经济学概念,因此掌握这些基础知识对于深入学习博弈论非常重要。如果你对这些概念不熟悉,可以参加一些数学和经济学课程或在线学习资源来帮助你更好地理解博弈论。
还没有评论,来说两句吧...