在窃贼方面,目标是力图与无辜相混同,避免在摸钟测试中被分离出来而招致惩罚,其博弈中的一切策略选择皆以实现上述目的为依归。本案中,窃贼的战略空间内有两种选择——摸钟/不摸钟。如果相信钟能够识别枉行者、且摸钟/不摸钟的策略选择不能为知县直接从外部清楚地观察[6]从而形成策略选择的独立空间,窃贼能够建立起知县公开表述的话语为真之预期,其认知结构中将有如下判断:摸钟则钟将发出声响,由此导致身份暴露即知县识别成功;不摸钟则钟无声响,无声响即表明无辜,知县识别失败。与之相对应,窃贼对博弈双方策略收益形成以下预期(如图1):
说明:每格第一个数值是位于行位置的窃贼的策略收益,第二个数值是位于列位置的知县的策略收益。由于本博弈为零和博弈,一方所得即为另一方所失,因此窃贼与知县的收益在数值表示上成反数关系,即一方收益为某个正值时,另一方收益则取等量负值。以下各图同。知县为博弈的先行者,其策略选择已先于窃贼的选择而确定为“设钟”。
根据博弈分析的基础性前提,参与人理性意味着他们总是偏好自身更高收益而不是更低收益。在基于“神钟有灵”信念确立的收益预期支配下,由理性人自身行动必须与自身预期相一致的序贯理性[7]所决定,窃贼将选择收益为a的不摸钟策略,以便通过避免摸钟使得“神钟”不发出响声,成功地混迹于无辜之中。由是,立基于钟之发声与否的甄别机制陷于失灵,该策略成为窃贼视角下的占优选。与之相较,收益为-a的摸钟策略是暴露其真实身份的劣战略,窃贼从不摸钟到摸钟策略的转移非但没有使其状况得到进一步改善,反而严重恶化。正如我们没有理由指望理性博弈人会选取恶化自身状况的劣策略却置能最大化自身收益的占优策略于不顾一样,只要窃贼把知县的话“当回事”,把自己对钟的效力判断等同于知县的外在话语形式,他就不会选择收益为-a 的、不满足激励兼容约束条件[8]的摸钟策略。
窃贼的不摸钟策略的占优性是建立在“神钟有灵”的预期之上的,如果这一基础并不存在,那么,其对于各策略的收益判断将发生相应的调整。给定窃贼不具有神灵信仰,他将不会把知县公开表述的话当真,不会依据知县对钟的“神力”描述来确立自己对于摸钟/不摸钟策略的各自收益预期,并决定两策略孰优孰劣。相应地,他的认知结构中也不会有“为盗者(触之),则有声”的判断,即他不会建立“触钟将导致身份暴露”的预期,也不会对摸钟策略赋值为-a。既然窃贼不认为摸钟能使其与无辜区别开来,如果同时其并不相信知县确实是以钟能否发出声响来确定真犯,从而对“摸钟测试”或多或少产生怀疑的话,那么,基于理性人应对“诈局”的风险规避取向,他将赋予不可能因为钟的“神力”发出声响、进而导致身份暴露的安全型策略——摸钟以极高的收益值a;而对根据生活常理和一般人的心理活动规律看来给人“做贼心虚”的印象、在“诈局”之下容易导致知县从中推测出嫌疑人所属类型的不摸钟策略赋值为-a。此时,窃贼对博弈双方策略收益将形成以下预期(如图2):
根据精炼贝叶斯均衡解[9]的要求,行为人的信念与其行动之间必须保持一致,经得起贝叶斯精炼均衡解精炼的均衡策略必须是在给定行为人信念条件下的最优。在上述条件下来确定其策略选择的收敛点,不难发现收益为a的摸钟策略优于收益为-a的不摸钟策略。利用剔除劣战略寻找博弈解的办法,窃贼的均衡策略将是模仿无辜的摸钟;而不摸钟由于不符合行为人不会选取劣策略的博弈理性,不能成为窃贼实际启用的策略。
如果不具有神灵信仰的窃贼不相信钟能够使得“为盗者(触之),则有声”,但是对知县会把钟的“神力”当真、将以钟能否发出声响来识别真犯并不怀疑,即只是觉得“摸钟测试”可笑然而并未察觉“其中有诈”,那么,在其看来,无论摸钟与否,知县都不可能通过钟的发声将其有效分离出来,摸钟/不摸钟策略的收益是相同的,其对双方策略的收益预期则如图3。