坦白从宽、抗拒从严亦是坚持了宽严相济的刑事政策,在司法资源既定的条件下,警察或检察官通过对犯罪嫌疑人坦白从宽来达到提高犯罪惩罚率(从严)的效果。
(二)不同选择、不同博弈
辩诉交易与坦白从宽、抗拒从严的博弈结构相同,本文只分析坦白从宽、抗拒从严的博弈结构。博弈参与者为:警检方与犯罪嫌疑人(被告人);博弈目的为有效惩罚犯罪与有效逃避惩罚;博弈策略为坦白从宽与坦白不从宽;博弈者掌握的信息为非完全信息。
基本假设:警察发现了某犯罪;警察所能使用的司法总资源是既定的;犯罪嫌疑人的目的是最大限度逃避惩罚;警察的目的是实现惩罚的最大化;犯罪嫌疑人和警察的信息是不对称的,即这使非完全信息博弈。问题:警察如何实现惩罚的最大化?
同审查共同犯罪一样,警察有两个选择:第一,对坦白不采取从宽的政策,即使坦白,也不会得到任何减刑,即不采取宽严相济的刑事政策。第二,采取坦白从宽的政策,即采取了宽严相济的刑事政策。
在第一种选择情况下,不论证据确凿与否,犯罪嫌疑人都没有坦白的动力。在前文囚徒困境中已经讨论过,在此不赘述。在第二种情况下,采取坦白从宽、抗拒从严的政策。假设证据确凿的情况下,惩罚值为10年,证据不足的情况下惩罚值为3年。其博弈图2.10所示。证据确凿情况下,坦白惩罚值为8年,证据不足的情况下,坦白惩罚值为5年。
合作博弈是否达成,取决于警察与犯罪嫌疑人是否可以就坦白以及由此减轻的刑罚达成一致。如果要警察接受坦白结果,则意味着在证据不足的情况下,坦白比不坦白实现的惩罚值要大。如果要犯罪嫌疑人接受坦白结果,则意味着在证据不足的情况下,坦白比不坦白实现的惩罚值要大。因此,上图的博弈结果,犯罪嫌疑人肯定不会接受。
关键问题是信息不对称。犯罪嫌疑人不知道警察手中的证据可以达到几年的量刑标准。如果犯罪嫌疑人知道警察手中的证据确凿,毫无疑问会选择坦白,因为即使不坦白,一样会被定罪量刑,而坦白会被减刑。如果犯罪嫌疑人知道警察手中的证据不足,[19]但不知道证据具体达到合作程度,是否坦白就变得不确定。犯罪嫌疑人处境有三种可能:第一,不坦白,警察投入更多的资源破案,最后证据确凿,被量刑10年;第二,不坦白,警察投入更多的资源搜集证据,但无法搜集更多的证据,或警察无力投入更多的司法资源搜集证据,最后无罪释放或量低比坦白后的量刑要轻;第三,坦白,获得减刑,但减刑后的刑罚与不坦白的刑罚相比,或者轻、或者重。因此,选择坦白与否,犯罪嫌疑人需要做概率衡量。如果不坦白,犯罪嫌疑人获得的刑罚值是10*X*Y,X是警察继续搜集证据的概率、Y是继续搜集证据后证据确凿的概率。如果坦白,犯罪嫌疑人获得的刑罚值是10-M,M是被减刑的数值。因此,坦白与否取决于下面的方程:
f=10*X*Y-(10-M)
只有f>0,犯罪嫌疑人才有坦白的可能。同时,犯罪嫌疑人还需要考虑减刑被兑现的可能性(用N标示),因为最后的量刑者是法官,而不是警察。因此,是否坦白公式就相应变更为:
f=10*X*Y-(10-M*N)
从警察角度来看,则相反。只有f<0,才会接受犯罪嫌疑人的坦白,而不继续调查。因此,看起来警察和犯罪嫌疑人似乎永远无法就坦白达成一致。但现实是警察和犯罪嫌疑人经常达成一致,原因在于双方信息不对称,因此,双方对X、Y和N这三个概率的判断不一致。如此,坦白从宽合作博弈的取得根本取决于双方对概率的判断不一致。控辩交易也适用同样的道理。
(三)本节结论
因此,坚持坦白从宽、抗拒从严的刑事政策,即坚持宽严相济的刑事政策有助于警察与犯罪嫌疑人之间合作博弈的达成。警察可以通过相关策略影响犯罪嫌疑人对X、Y和N这三个概率的判断,从而实现让犯罪嫌疑人坦白的目的。