英语没过四级,也能和全球玩家开黑
闭门造车也能独自开心的单机游戏时代已经被远远甩在身后,如今只要是个游戏就有天梯有竞技场,团队合作成了也成了游戏的必备要素。然而,新的互联网带来了新的烦恼—— 很多时候,阻止你胜利的不仅是咸鱼一样的游戏技术,还可能是令人着急的英语水平。
眼看着主播们在游戏里呼风唤雨,甚至因为打游戏而喜获一段跨国情缘,而自己却在说完“I'm fine thank you and you?”之后就和队友面面相觑,只好一边感念书到用时方恨少,一边回归熟悉的国服。
祖安永远欢迎你
为了帮助大家走出国门走向世界,和国际友人自由开黑,专注于 PaaS 云服务的大数据公司 LiveData(云上曲率)打破了游戏局内的语言壁垒,利用 Google 发布的机器学习开源框架 TensorFlow 实现了游戏内 23 种语言间的互译。
游戏局内实时翻译
搭载了 LiveData 智能实时翻译(ALT)系统后,来自世界各地的游戏玩家可以自己的母语自由发言,而这些发言都会被自动翻译成用户设备所使用的语言——不管你说的是俄语还是英语,
当语言壁垒被打破,有趣的画面就出现了。
在使用了 ALT 的策略游戏《阿瓦隆之王》全球服里,你能和来自世界各地的玩家一起互相帮助、开展贸易、发动战争。强大的聊天即时翻译功能让聊天成了游戏的重要构成部分,无论是唐诗宋词、还是老铁扎心,全部都能妥妥的翻译。
对战全靠翻译器,再也不怕老外队友会错意,打游戏永远都有主场的味道。
在强大的 ALT 助力下,土生土长的国产游戏《阿瓦隆之王》没有被语言关绊住手脚,而是在国外攻城略地,一举在 13 个国家拿下 AppStore 排名第一。
除了日常聊天,ALT 还在训练时引入了游戏领域语料库,针对口语化、缩略语及非规范聊天文本进行了深度优化,对游戏语言的理解能力堪比多年老玩家。
无论是“Please w8(请等一等)”还是“GG(干得好)”,玩家大可在游戏中延续自己的缩写习惯,甚至偶尔出现拼写错误也不影响模型对语义的理解。
部分 ALT 缩略语示例
与市面上其他翻译产品相比,ALT 模型在游戏领域的表现在权威机器翻译测试 NIST(美国国家标准技术研究所测试) 和 BLEU(双语评估测试)中都获得了更高的分数,已经逼近人工译员表现。用了 ALT,就像和英语专八选手一起打游戏。
在特定语料库上,ALT 得分比 Google 和 Microsoft 更高
ALT 的良好表现,和 ALT 背后强大的 TensorFlow 是分不开的。
ALT 使用了号称“变形金刚”的 Tensor2Tensor(T2T)深度学习系统,该系统利用 Attention 方法来建模序列到序列(Sequence- to-Sequence,Seq2Seq)的问题,在图像分类、语言模型、情感分析、语音识别、文本摘要、机器翻译等领域都有很好的应用效果。
比如,当一个英文句子进入 ALT 时,会进入编码器,被神经网络编码成一个能够映射出句子大致内容的 固定长度的向量, 接着,解码器会将向量再还原成对应的序列数据,由一种语言的序列映射到另一个语言的序列。
T2T 中的英译汉过程示意图
而在具体训练模型的过程中,每个翻译方向的训练语料都有数千万平行句对,相当耗时耗力,但使用了 TensorFlow T2T 模型之后,训练和迭代过程变得更迅速,每个翻译方向的翻译模型在单卡 V100GPU 下不到 24 小时就能完成训练迭代,翻译结果也更加准确了。
玩家到底在想什么?
对于玩家来说,在游戏里自由发言非常重要,而对于游戏策划和运营而言,玩家的发言也是重要的信息来源:新版本是否受欢迎?玩家对游戏的评价是正面还是负面?有哪些地方需要改进?
在搭建 ALT 辅助翻译的同时,LiveData 也利用 TensorFlow 建立了 LSTM(long-short term memory)循环神经网络分析游戏舆情:
分析玩家在游戏内的发言内容(通过算法剔除与游戏不相关的寒暄闲聊部分),并通过机器学习算法将玩家的聊天内容按照话题进行分类,可以看出玩家是否喜欢当前的游戏版本;
利用自然语言处理技术,有重点的分析游戏新版本/新玩法/新道具等特定内容的玩家反馈,可以为下一版本的迭代提供依据;
归纳总结游戏中出现的问题类词语(如bug、crash等),实时监控其频率及趋势,可以及时得到突发问题的预警,快速决策……
利用游戏舆情分析功能,游戏策划和运营能更直接地了解用户的真实想法,进而优化产品。
目前,游戏舆情数据的来源主要有以下几种:
- 游戏聊天数据:游戏中不同频道的聊天数据,包括群组聊天、房间聊天、私信聊天等;
- 应用商店评论数据:涵盖但不限于苹果 App Store、腾讯应用宝、Google Play 商店、手机厂商自带的应用商店等;
- 玩家论坛数据:游戏的官方论坛、玩家们自建论坛等渠道;
- 社交软件聊天数据:通过导入游戏官方 QQ 群、微信群、Facebook 等社交平台的聊天数据。
在获取聊天记录数据后,基于 TensorFlow 建立的机器学习、自然语言和情感分析的协同处理可以提取玩家反馈中的关键信息,准确率可以达到 95% 以上。
和已经存在的翻译模型相比,LiveData 利用 TensorFlow 训练出的“深度定制”翻译模型更适合玩家使用,同时,TensorFlow 开源的机器学习模型也让小游戏厂家能轻松利用玩家大数据,做出更优秀的新版本。
用了 TensorFlow,哪怕英语没过四级,也能走向全球。
目前,我们仍在征集更多杰出的TensorFlow应用案例,你可以扫描海报下方二维码或点击“阅读原文”提交案例参与我们的报道!
或者你对这个项目感兴趣,想要了解更多关于项目的报道,也可以扫描下方二维码或搜索微信号:pingwest-live 添加品玩助手一起聊聊!
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: