给大家说一下思路(1对1,无失误,8种)
首先无论如何要拿最高分最后一局一定欺骗,拿最低分最后一局一定合作。(提供7轮上下限分数)
第一类就是不会有反馈的人:粉帽子(14,21),黑帽子(-21,0),红帽子(看运气)(-21(概率1/128),21(概率1/128))
逻辑非常简单,所以只需要一直欺骗得到最高分/一直合作得到最低分
第二类就是每一次行动都有反馈的人:蓝帽子(2,17),浅蓝帽子(5,17),绿帽子(-3,17),土黄帽子(-3,17)
蓝帽子即你和你博弈,两合为4,合欺为2,两欺为0,高分选两合,低分1个合欺接两欺。浅蓝约等于蓝,不过低分要2个合欺。土黄帽子高分等同于蓝帽子,低分只要让他欺你合(-1)最多,即第一轮欺骗后面都合作。绿帽子合不变欺变,高分等同于蓝帽子,低分等同于土黄帽子。
第三类橙帽子(-6,15),分两类
高分:
①轮数∈(0,4],等同于第一类,他固定合欺合合
②轮数∈[5,+∞),前四轮欺骗收益9,下一轮欺骗收益至少差3(非末轮须止损2→-1(少3)不然每轮亏2),综合收益6;欺欺欺合收益8。所以前四轮欺欺欺合,后面等同蓝帽子
低分:一直合作