Flash 日记 | 2021-3-11 博弈层级量化

修改于2021/03/181411 浏览研发笔记
比赛招募正在火热进行之中呀。想起之前llmmd同学发过一篇通过精彩对局来研究锅老师小豆丁,看完之后我们自己也受益匪浅。锅老师一直有参与我们的直播活动来我们演播室做客,所以我们和锅老师还是很熟的,因此我也有幸向锅老师做了一下采访,来聊聊锅老师眼中对于对战类游戏的认知是什么样子的。
本想着深入浅出的去聊一下手感啊、习惯啊、练习啊之类的话题,哪想锅老师直接给我抛给了我一个很高深的概念“博弈层级量化“。也就是这次的标题。听他讲完还是能明显感受到,这个内容不仅仅是适合于《Flash Party》的,也是适合任意一种零和博弈游戏的。
什么是博弈论?百度给出的解释是这样的:
博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。博弈论已经成为经济学的标准分析工具之一。在金融学、证券学、生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
什么是博弈层级?
简单的来说就是“我预判了你的预判”,“我预判了你预判了我的预判”,这个过程可以无限衍生下去,那么你所处的层级就会是你在对战中所处的高度,当你的层级在对方之上一层的时候,你将完完全全的碾压对手。
而大家常常所讨论到的“立回”其实就是另外一个有趣的概念——纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。大家熟知的囚徒困境就是纳什均衡的一种范例。
之所以在没有正式交锋之前大家会选择立回,便是因为立回这一行为是在双方意图减少我方风险,放大对方风险时候极容易出现的状态(格斗游戏的纳什均衡?)。
以丘比特的蓄力箭为例聊聊层级
TapTap
其中三角是进攻方(也就是丘比特),方块是防守方(随便谁)。
当在平台上进攻方选择攻击,防守方选择躲避的时候,他们会有多种选择。而在实际战斗当中可以把这件事情看作5层的思维博弈。
第一层:进攻方,选择向对方当前位置进行攻击;
第二层:防守方,躲避当前位置;
第三层:进攻方,判断对方会提前躲避,预先打击躲避的位置(也就是丘比特弓箭向斜上射出,开始产生博弈);
第四层:防守方,判断对方会预先打击躲避位置,选择直接冲向对手;
第五层:进攻方,预判了对方的预判,选择直线攻击(此时第五层和第一层完全相同,之后可以无限衍生);
可以看到第五层和第一层的行为几乎完全相同,但整个过程在高速战斗的对战游戏当中其实已经经过了一次精彩的博弈,不同于慢速卡牌、棋类游戏,在高速战斗当中能够进入第三第四层已经属实难得,在这一层已经可以被誉为高手了。PS,大家常说的乱拳打死老师傅就高手以第四层的思维去衡量第一层的人导致的。
适合什么样的同学学习?
首先最重要的,锅老师在跟我对答的时候也明确的告诉我这个是不适合新手去思考的,新手阶段大家更重要的还是熟悉各个角色的性能与对方角色的性能,至少要先做到能够把一些连段通过下意识就能够释放出来。就好比在玩石头剪刀布之前,你总得先学习如何比划石头、剪刀和布。虽说所有的对战游戏最终都是在有限环境和规则下的石头剪刀布,但对战游戏比石头剪刀布更有趣的地方也在这里,复杂度创造了无限的可能性,让这个博弈的过程在可以理解的范围,并且需要高速思考来快速的产生结论。(这段写的玄乎了……)
最后给大家看看锅老师给我写的手书,因为锅老师本身也是上海《任天堂明星大乱斗》的一名选手,所以当中举出的例子也多以任斗为主(不愧是锅老师啊!):
TapTap
虽然这个博弈比较受限于1v1的情况,不过有趣的思路是触类旁通的!祝大家武运昌隆!
28
5
9