与此相区别而又相关的是,理性的刻画在展开型博弈中也遇到了许多难题。我们知道,对完全信息的展开型博弈,它的解是逆向归纳法。但在连锁店博弈和蜈蚣博弈中,逆向归纳法得出的解是直觉上让人难以接受的。所以宾莫尔等人对奥曼的结果提出了强烈批评。在展开型博弈中,对博弈者的理性要求他通常在非均衡路径上也是理性的。用逻辑语言来刻画,这意味着,理论预言某种结果要发生,因为如果它不发生,那么就会发生另外某种结果。这就涉及到对反事实条件句(couterfactual)的不同理解了。更重要的是,如巴素 所表明的,对一些表面上看起来非常合理的性质,竟然不存在任何展开型博弈的解概念能够满足它们。虽然在知识论的框架中也出现了许多正面的结果,但我们尤其需要重视的是,在宾莫尔等人对逆向归纳法的批评中所强调的进化论式的理性可能更具有一般性和可信度。
学习、进化与均衡
博弈论学者,作为研究者或客观观察者,是以一个数学家的面目出现的。假设他知道所有能用他的语言所描述的世界的一切。如果假设博弈者也是很好的数学家,并且没有他不知晓的事情,这就是为博弈论提供知识论基础所采取的正统方式。如果假设博弈者仅仅是很好的数学家,他只知道从他的基本知识中能证明的东西,结果就会大不一样 。如果假设博弈者的计算和推理能力存在计算复杂性的限制,即他只能处理不超过某种复杂程度的问题 ,那么显然这是西蒙所提倡的有限理性的思路了;甚至,我们还可以假设他只能按照研究者给出的某种反应规则进行学习和修正行为,这就进入进化博弈的研究方向了。所以知识论方案可以看作是一种特殊的复杂的学习规则,这个规则使得他们一下子就进化到某种均衡解。原则上,进化博弈是最一般最广义的博弈,因为它不需要假定博弈者满足某种较强的理性,它关心的实质是博弈者(从观察者的角度看)是如何行为的以及这些行为导致的结果。
由于纳什均衡解所要求的理性太强,近年来很多研究集中在它的一般化概念 上,如猜测均衡(conjectural equilibrium)或可理性化的猜测均衡(rationalizable conjectural equilibrium) 、自我肯定均衡(self-confirming equilibrium) 、主观均衡(subjective equilibrium) ,这是一个渊源可上溯到哈耶克 并经汉恩强调的观念。
进化博弈也给纳什均衡提供了另外一种正当性证明,即学习导向均衡 。我们已经提到纳什均衡所要求的理性程度和知识是很强的,而传统博弈论对这些知识来源提供了几种看法,如事前交流、自我实现的预言和焦点解释。但仔细琢磨这些解释,我们都可以无穷回归地提出一个更基本的问题,那就是这些解释赖以成立的知识前提。我们会自然地把它们看作学习和进化过程的结果。一般来说,如米奇西柔 所指出,在现代文献中,学习和进化被模糊地加以区分。关于学习的研究通常假设在一个固定匹配博弈中博弈者可以计算出最优反应,并探讨他们如何更新关于对手的策略的信念;而进化论的研究则并不必然假设博弈者具备最优化的能力,主要分析合理行为通过试错的进化和博弈群体的自然选择。特别地,针对纳什均衡,有众多结果刻画了在什么条件下,均衡解可以看作是进化和学习的收敛结果或统计意义上的结果。
进化博弈 是我们最看好的有广泛发展前景的研究方向,然而此处反而不能详细讨论这个主题了。我们提出一个一般问题。进化博弈在数学上是一个动力系统。我们知道,按照沃尔弗兰姆的看法,所有的动力系统都可以定性地分为四类,即不动点,周期运动,无限周期运动(混沌)和界于混沌与秩序之间的运动。那么,它们和各种解概念之间存在什么样的关系呢?显然,没有一个简单的对应关系。另外,现在的文献过于集中在收敛过程上了,而动力系统向我们揭示出现实世界可能具有出人意料的复杂性。一方面人类社会的博弈历史也体现出这种复杂性,甚至学习和进化本身就会导致这种复杂性;另一方面博弈者是如何应对这种复杂性的尚属于博弈论涉及极少的问题(这显然隐含在学习规则或反应函数的性质中)。
另外需要强调的是,进化博弈模型似乎也仅在解释那些类似太阳每天东边升起西边落下的周而复始环境中的行为方面有很好的说服力。这似乎限制了现有博弈理论及其解概念的应用范围。不过,大部分机制设计问题依然是可以运用均衡解概念的,因为机制设计往往只能从统计意义上来考虑问题。
与知识论框架同样,现在的进化博弈模型还没有很好地处理知识创新和技术进步。这是因为大部分模型通常是在技术不变的假设下,探讨博弈者如何通过试错和学习来选择合理策略与行为的。博弈者的技术决定了他们所处的环境的特征(如可利用的资源),以及他们的行为与环境共同作用所能导致的结果,这是通过结算函数来体现的。包含技术进步的博弈过程的复杂性是显而易见的。
|