贝叶斯纳什均衡属于那种博弈中的均衡状态? 贝叶斯纳什均衡计算题

东升百科网 954 2023-06-09 03:00:25

这里已经分享完了模糊而精彩的无限内容，喜欢的请收藏。。

不知怎么的，最近的贝叶斯纳什均衡的例子，贝叶斯纳什均衡很开心，我们来看看木鱼子。

1.贝叶斯纳什均衡是指一组组合:给定自身特征和其他参与者特征的概率分布，每个参与者选择一个策略使自己的期望支付最大化，即没有人有选择其他策略的主动权。

2.动态博弈战略行动在动态博弈中，为了使其他参与者的选择对自己有利，参与者往往会采取一些行动来影响其他参与者对自己行为的预期。

3.这些行为被称为战略转移。

4, 1.先发优势是指在博弈中最先做出战略选择并采取相应行动的参与者能够获得更多的利益。

5.2.可信威胁是指游戏的参与者通过某种行动改变支付函数，从而使其威胁变得可信。

6.参与者为改变游戏结果而采取的措施称为承诺。

7.第四节信息不完全的静态博弈很多情况下，参与者对对手的了解往往是不准确的。

8.这种情况下的博弈是不完全信息博弈。

9.例如，某个市场最初被企业A垄断..

10.现在企业B正在考虑是否进入。

11.企业B知道，企业A是否允许其进入，取决于企业A阻止企业B进入所花费的成本。

12.如果阻挠成本低，那么，如表7-10最后两列所示，企业A的优势策略是阻挠，博弈存在重复淘汰的优势策略均衡——A阻挠，B不进入。

13.如果阻挠成本高，那么，如表7-10的前两列所示，企业A的优势策略是默许B的进入，博弈存在重复淘汰的优势策略均衡——A默许，B进入。

14.企业B不知道的是，企业A的阻碍成本是高还是低。

15.在这里，一个参与者知道但其他参与者不知道的信息称为私人信息。

16.参与者拥有的所有私人信息被称为他的类型。

17.在上面的例子中，阻碍成本是A的私人信息。

18.高阻碍成本和低阻碍成本是两种不同的类型。

19.显然，这里B遇到的是不确定条件下的选择问题。

20，因为B不仅不知道A的类型(高或低)，也不知道不同类型的分布概率。

21、解决这类问题的方法之一，就是把不确定条件下的选择变成风险条件下的选择。

22.在风险条件下，B虽然不知道A的类型，但可以知道不同类型的分布概率。

23.将不确定性下的选择转化为风险下的选择称为哈萨尼变换。

24.根据哈萨尼的方法，给出了所有参与者的真实类型。

25.其他参与者虽然不知道一个参与者的真实类型，但是他们知道这些可能类型的分布概率，这个概率就是公共知识。

26.以上面的例子为例，公知不仅意味着企业B知道企业A的高阻塞成本和低阻塞成本的分布概率，还意味着企业A知道企业B知道这个概率。

27.通过哈萨尼变换，不完全信息博弈变成了完全但不完全的信息博弈。

28.这里的不完全信息是指其他参与者只知道一个参与者某些方面的分布概率，而不知道该参与者在这些方面的真实类型。

29.在上述变换的基础上，哈萨尼提出了贝叶斯纳什均衡。

30.这可以解释为:在不完全信息的静态博弈中，参与者同时行动，没有机会观察他人的选择。

31.给定其他参与者的策略选择，每个参与者的最优策略取决于他自己的类型。

32.因为每个参与者只知道其他参与者相关类型的分布概率，而不知道他们的真实类型，所以他不可能知道其他参与者实际会选择什么策略。

33.但他能正确预测其他参与者的选择与各自相关类型的关系。

34.因此，在给定自己的类型以及其他参与者的类型与策略选择之间的关系的情况下，这个参与者的决策目标是最大化他的期望效用。

35.贝叶斯纳什均衡是一种类型依赖的战略组合。

36.给定自身类型和其他类型参与者的分布概率，这种策略组合使每个参与者的期望效用最大化。

37.回到上面提到的市场进入的例子。

38.在这个例子中，对于挑战者B来说，前垄断者A阻挠成本有两种可能:高成本或低成本。

39.b不知道A的阻塞成本是高还是低，但他知道A在这两种不同阻塞成本下会做出的选择以及不同阻塞成本(类型)的分布概率。

40.假设高成本的概率为x，低成本的概率为(1-x)。

41.如果A的阻挠成本高，A会默许B进场；如果A的阻塞成本低，A就会阻塞B进入市场。

42.在这两种情况下，如表7-10所示，B输入的支付函数分别是get 40和lose 10。

43.所以选择进入的B的期望利润是40x+(-10)(1- x)，选择不进入的B的期望利润是0。

44.简单计算表明，当A的阻碍成本概率大于20%时，挑战者B选择进入的预期收益大于选择不进入的预期收益。

45.这个时候选择进入是B的最佳选择..

46.此时的贝叶斯纳什均衡是挑战者B选择进入，高成本原始垄断者选择默许，低成本原始垄断者选择阻挠。

47.根据参与者类型的公共知识获取参与者行动的概率，并据此决定下一步策略。

48.第五节信息不完全的动态博弈在动态博弈中，行动具有优先性，后一个行动者可以通过观察第一个行动者的行为获得关于第一个行动者的信息，从而确认或修正自己对第一个行动者的判断。

49.如上所述，在信息不完全的条件下，博弈的参与者知道其他参与者可能有哪些类型，也知道不同类型之间的关系和相应的策略选择。

50.但是他们不知道其他参与者的真实类型。

51.在不完全信息静态博弈中，我们通过哈萨尼变换，即通过假设其他参与者知道某个玩家类型的分布概率，得出博弈的贝叶斯纳什均衡结果。

52.在不完全信息的动态博弈中，问题变得简单了。

53.在游戏开始时，一个玩家既不知道其他玩家的真实类型，也不知道其他玩家所属类型的分布概率。

54.他对这个概率分布只有自己的主观判断，也就是有自己的信念。

55.游戏开始后，玩家会根据自己观察到的其他玩家的行为来修正自己的信念。

56、并根据这种不断变化的信念，做出自己的战略选择。

57.不完全信息动态博弈对应的均衡概念是完美贝叶斯均衡。

58.这个概念是完全信息动态博弈的子博弈精炼纳什均衡和不完全信息静态均衡的贝叶斯均衡的结合。

59.具体来说，精炼贝叶斯均衡是所有参与者的策略和信念的组合。

60.它满足以下条件:首先，给定每个参与者对其他类型参与者的信念，该参与者的策略选择是最优的。

61.第二，每个参与者对其他参与者类型的信念，但它是利用贝叶斯法则从观察到的行为中获得的。

62.贝叶斯规则是应用概率统计中观察到的现象来修正概率分布的主观判断(即先验概率)的标准方法。

63.利用上一节的例子，贝叶斯规则的分析思路可以表述如下。

64.挑战者B不知道原来的垄断者A是属于高阻塞成本型还是低阻塞成本型，但B知道如果A属于高阻塞成本型，那么B进入市场时A阻塞的概率是20%(此时A为了维持垄断带来的高利润，不惜成本地极力阻挠)；如果A属于低阻碍成本的类型，那么B进场时A阻碍的概率是100%。

65.博弈开始时，B认为A属于高阻碍成本企业的概率是70%。因此，B估计进场时被A阻挠的概率为:0.7×0.2+0.3×1=0.440.44，这是B给定A的类型先验概率时，A可能采取阻挠的概率。

66.当B进入市场时，A确实进行了阻挠。

67.利用贝叶斯法则，根据可观察到的阻碍行为，B认为A属于高成本企业的概率就变成了A属于高成本企业的概率= 0.7(A属于高成本企业的先验概率)×0.2(高成本企业阻碍新企业进入市场的概率)÷0.44=0.32根据这个新的概率，B估算出A进入市场时受到阻碍的概率。

68.利用贝叶斯法则，根据再次阻挠的可观察行为，B认为A属于高成本企业的概率就变成了A属于高成本企业的概率= 0.32(A属于高成本企业的先验概率)×0.2(高成本企业阻挠新企业进入市场的概率)÷0.744=0.086。就这样，根据A一次次的阻挠行为，B给了A。

69.以上例子说明，在不完全信息动态博弈中，参与者采取的行动具有传递信息的功能。

70.虽然企业A可能是一个高成本企业，但企业A对市场进入的持续阻挠给了企业B一种企业A是一个低成本企业的印象，从而使企业B停止了进入当地市场的行动。

71.需要指出的是，传递信息的行为是需要成本的。

72.如果这种行为没有成本，任何人都可以效仿，那么这种行为就达不到传递信息的目的。

73、只有当行为需要相当大的成本，所以别人不敢轻易效仿时，这种行为才能起到传递信息的作用。

74.信息传递的成本是由信息的不完全性造成的。

但并不意味着信息不完全就一定是坏事。

76.研究表明，在重复次数有限的囚徒困境博弈中，不完全信息可以导致双方的合作。

77.原因是在信息不完全的情况下，参与者不愿意过早地暴露自己的本质，以获取合作带来的长远利益。

78.也就是说，在一段长期的关系中，一个人做好做坏，往往不取决于他的本性是好是坏，而很大程度上取决于别人在多大程度上认为他是个好人。

79.如果别人不知道他们的真面目，一个坏人会长期做好事来掩盖自己。

80.根据参与者类型及其历史行为的公共知识，获得参与者行动的概率，进而决定下一步的策略。

81.这是一种平衡的计算方法。

标签：