0
5月29日~30日,2018第六届TopDigital创新发布盛典暨创新奖颁奖典礼在上海举行。TopDigital追踪数字技术浪潮下的创新发展,覆盖TMT(Technology/Media/Telecom)、ABC(AI/Big Data/Cloud Computing)、大文创、泛金融等行业领域,吸引了来自国内外数百家企业和上千名专业人士参与。
作为国际大会,如何让不同语言文化的参会者实现无障碍沟通是大会的基本。雷锋网了解到,作为此次峰会的合作伙伴,搜狗将全程提供人工智能同传展示。
在国内外专家和企业的高端对话中,搜狗的人工智能同传提供了强力的支持,让与会者无需担心语言问题。会场两侧屏幕上以中英双语实时展示嘉宾发言内容,翻译速度几乎与嘉宾发言速度一致。双语字幕不仅能让与会者高效直观的获取演讲内容,实时文字记录也能为会后的资料整理节省大量的时间。
自2016年诞生以来,搜狗同传已经支持了数百场国内外会议,多次应用于GMIC、中国车联网博览会、世界电信和信息大会、全球人工智能技术大会等前沿国际科技大会,成为国际顶端会议的标配。
2017年,由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办的全球人工智能与机器人峰会(CCF-GAIR)上,搜狗同传也作为合作伙伴为大会提供同传支持。
据了解,搜狗同传不仅能流畅地记录、翻译内容,还能很好地识别词语和句子的停顿。这种复杂的同传工作难度极大,需要覆盖语音断句、语音识别、文本断句、机器翻译等多个技术维度,才能构成稳定可靠的临场表现。
不同于传统的机器翻译,实时翻译技术包括语音识别、机器翻译两个大方向,还有一些细节优化与系统调优。搜狗同传将语音识别与机器翻译技术结合在了一起,希望提供从听到说、能理解会思考的能力。
搜狗的翻译团队在自然语言处理和深度学习方面有非常深厚的积累,与谷歌GNMT的八层结构相比,搜狗同传的神经网络精简为五层,在效率上可获得不小的提高。
在搜狗同传的技术框架中,语音断句算法通过能量检测和基于深度学习模型的方式,对语音信号进行语音和静音的判断,这样可以跳过对静音片段的处理以提升解码效率,同时语音片断可以分割成多句并行识别,大大提高语音识别的效率。
语音识别部分,搜狗同传使用了CLDNN+CTC结合的声学模型和RNNLM语言模型,把经过语音断句后的片段,通过声学模型和语言模型转化成文本,保证识别输出结果更加通顺、流畅,符合正常的发言习惯。
而在语音识别和翻译之间,最关键的桥梁则是文本断句,这个模块是搜狗的语音同传技术可以应用的重要原因。文本断句通过内容平滑技术去掉无意义词语,使句子变得通顺,然后通过规则和模型两种方法进行语句划分并加标点。
搜狗用到了双向 GRU 技术构建编码端的结构。通过 attention 机制在源端和目标端文本间进行对齐并生成当前时刻的句子级向量表示,并送至解码端,解码端逐词解码输出翻译结果。
搜狗同传将语音识别与机器翻译技术结合在了一起,采用端到端的神经网络翻译技术,通过编码端获取源端句子的分布式表示,利用注意力模型聚焦源端,使用循环神经网络生成翻译结果,翻译的结果相比传统机器翻译大约能高出30%~40%。
搜狗同传还创新性地将许多自然语言处理门类中非翻译任务的方法用于机器翻译中,通过向神经网络添加额外的机器学习模块来提升质量,点对点解决神经机器翻译中的具体问题。
例如,搜狗同传使用了如下四类技巧来提升模型质量:
用命名实体标注模型(NER)和神经网络实体翻译器对人名的罕见词进行翻译;
多模型集成(ensemble)来给出最优翻译结果;
重打分/重排序(rescore or rerank)机制选出最优翻译;
采用了Geoffrey Hinton团队提出的网络层正则化(layer normalization)技术,提高模型训练效率,同时改善模型的翻译质量。
除此之外,机器翻译的最终效果不仅和算法相关,还和数据密不可分。对同传来说,人们希望以更加自然、接近人和人交互的方式来进行,同时也希望翻译引擎能更多的理解人的语言需求,在合成时的语言表达更加自然。
搜狗作为一家搜索公司积累的庞大语料库,对机器翻译效果的提升有很大帮助。根据搜狗方面给出的预测数据,目前搜狗语音识别的准确率为97%,支持最快每秒400字的高速听写,语音输入日频次高达3.4亿次,搜狗语音翻译的准确率则可以达到90%。
实现全人类之间的顺畅交流一直是人类的梦想,如今人工智能让人们看到了实现这一梦想的希望,这也是AI翻译让大众持续兴奋、让技术公司和研究人员保持动力的最大原因。
回想一年之前,人们还自信地认为AI取代传统人工同声传译“为时尚早”,但在短短一年时间里,搜狗同传就已经支持了数百场国内外会议,多次应用于前沿国际科技大会,成为国际顶端会议的标配,充分展示了国内企业在人工智能技术领域的发展和实力。
搜狗同传是AI技术落地实际应用的优秀案例,在本次大会的亮相更是反映出AI技术在应对全球跨语言交流、提高人类工作效率方面所具有的巨大潜力,为与会的各界人士对未来人工智能技术的普遍应用带来信心和期待。
相信在未来,搜狗同传会在更多领域大展身手,带动翻译行业产生新的质变。
现在关注“雷锋网”微信公众号(leiphone-sz),回复关键词【2018】,随机抽送价值 3999 元的参会门票 3 张
相关文章:
雷峰网原创文章,未经授权禁止转载。详情见转载须知。