开发团队解释为何国服首测会频繁出现问题

2018/05/232417 浏览综合
大家好,
今天想要和大家聊一聊#COMPASS国服首测遇到的问题。
#COMPASS于2016年12月在日服上线,人气一路高歌猛进。例行维护也只是为了修复一些Bug及开启限时活动事件。游戏服务器在正式运营期间保持稳定运行,玩家们也能愉快地进行匹配对战。
2017年11月,#COMPASS登陆台服,上线第一天就碰到了服务器宕机事故。开发团队紧急处理,仍旧花了不少时间才让台服稳定运行。
2018年4月,#COMPASS国服开启第一次测试。测试第一天就发生了宕机事故。虽然日本开发团队响应很快,但测试期间仍然时不时地会发生服务器宕机问题。非常抱歉,是我们开发团队和运营团队没有做好充足的准备,影响了大家的体验,辜负了国服玩家们的期待。
大家一定很疑惑,为什么日本服务器联机那么顺畅,到了台服就宕机呢?为什么台服有过宕机先例,并且已经修复了,到了国服仍然会宕机呢?其中原因和我们的服务器配置有关,也是摆在开发团队面前的一道技术难题。
日服运营期间开发团队使用的是物理服务器,联机匹配稳定。而台服上线时开发团队选用了云服务器,并且也是开发团队第一次接触云服务器的相关配置,有许多技术问题需要攻克。由于缺乏云服务器的部署经验,也没有足够的真实环境检测,台服上线后我们才发现游戏服务端的代码(原本为物理服务器写的代码)并不能很好地匹配云服务器配置,当单台服务器承载人数过高时,服务器就会宕机。开发团队紧急更换了物理机并着手研究修改服务端代码以匹配云服务器。
经过努力,在日本成功地将一部分物理服务器替换为云服务器,并且线上运行稳定,随即开始准备国服的云服务器配置。开发团队对国服上线非常重视,真实环境的检测更是需要谨慎进行,但在第一次压力测试时仍然碰到了宕机问题。在仔细对比日本和中国的云服务器配置后发现,日本云服务器使用的是DR模式,而国内的云服务商只提供NAT模式,所以开发团队不得不在5月份又对服务端代码进行了修改以适配NAT模式。经过技术人员的压力测试,目前在模拟环境中服务器可以稳定运行。
这次开发团队准备了5台服务器及10台备用服务器,本次测试的目的即是在保证大家正常游戏体验的前提下,对服务端代码修改结果进行真实环境检测,验证是否修改成功。
对于本次测试我们也很忐忑,有过一次失败的经历必然会对玩家们的信心造成打击。技术上的经验不足导致玩家们承受了许多负面体验,我们责无旁贷。为了让#COMPASS上线时能够提供稳定的联机体验,我们恳请大家再一次参与测试,帮助我们一起完善游戏!
谢谢大家!
20
24