本字幕由TME AI技术生成
人工智能同声传译或抢走高翻饭碗
日本经济新闻近日发表题为AI同声传译将达专家级水平的报道称
日本研发人员正在研究如何让AI对发言者的讲话随听随翻
技术的关键在于掌握预处理技术
对语句进行合理分割
若能利用AI同传将日语顺利译为其他世界主要语言
日本将在国际上占据优势
科学家希望二零二五年能够利用人工智能实现同时同声传译
现阶段语音识别技术已较为完备
未来的目标是提高翻译精度和速度
世界上许多语言与日语具有相同特征
若日语同声传译技术能够实现
若国际前景可能非常广阔
台上演讲者用英语演讲一分钟
AI可随即将日语译文显示在其背后的屏幕上
这正是二二零二零年十一月
日本情报通信研究机构NICT发布会上的一幕
从发言到形成译文仅需大约十秒
而且译文几乎没有错误
一般而言
同声传译需要通过语音识别技术识别讲话内容
在通过应用了AI等技术的翻译软件将其转换成其他语言
现有的机器同传多是等发言者画臂才开始翻译
这样就难以保证同传的顺畅
因为同两位直接用母语交流的人相比
机器同传需要耗费两倍的时间
这种模式难以应用于商业谈判
需要发展新技术来克服其弊端
NICT在二零一九年度之前的国家研究项目中
已经将语音识别技术发展至一定高度
二零二零年度开始
他们将目标定为提高翻译的精度和速度
将来渴望将时差控制在两
三秒内达到真人同声传翻译水平
研发人员正在研究如何让AI对发言者的讲话随听随翻
技术的关键在于掌握预处理技术
对语句进行合理分割
翻译软件主要包括分割语句的预处理技术和翻译引擎两大核心技术
现有技术为保证准确
只能在整句话结束后开始翻译
这样就导致时间间隔过长
如果能在一句话结束之前开始翻译
就能大大缩短等待时间
NICT将译群分割法应用于预处理技术中
实现了较以往的逐句翻译更加精准的译法
与同传译员的实际工作方法相同
这样在保证翻译精度的同时
也缩短了受众等待时间
AI同声传译的研发过程需要用到大量数据
NICT将向同传译员采集其译群分割习惯以及实际形成的译文
该项工作将一直持续至二零二一年底结束
预计将于二零二二年度研发使用译群分割法的AI翻译技术
相比英译日
日译英的同传难度更高
原因在于对日语语句进行预处理分割的难度较大
日语将动词和否定等重要信息放在句尾
所以需要对整句进行预览后才能翻译
相比之下
英语中此类信息的句中位置更加靠前
所以译语翻译
而且日语经常省略主语
AI在补足主语时容易出现错误
为防止出现误意
AI还需具备校准能力
例如事先向AI输入演讲内容相关数据
让其进行自我学习
它就可以做到对内容的整体把握
提高同传准确率
翻译引擎也将得到改良
这是一项应用广泛
不仅限于日
英互译的技术会大大影响翻译精度
如果翻译引擎达不到要求
即便预处理再快
校准功能再强再大
也无济于事
除了试售手机翻译机
NICT翻译引擎还被应用于松下
NTT
都科模和NEC等公司的语言翻译服务中
NICT研究员于天鹰一郎极具信心的表示
该公司的翻译引擎精度能够达到拖页九百分水平
世界各大IT巨头在同传领域竞争激烈
但是NICT仍有胜算
于天鹰一郎指出
美国的微软
谷歌以及中国的百度实力相当
目前都只停留在整句分割的阶段
尚未在一群分割上取得成果
若能利用AI同传将日语顺利译为其他世界主要语言
日本将在国际上占据优势
英语 汉语
法语这些使用者众多的语言有一个共同特点
名词后面紧接动词yeah
世界上约有百分之四十的语言都属于此类型
实际上
还有大约一半的语言与日语语法结构相似
动词放在整句后部
同类型语言之间更加便于同传
如果能够研发出跨语言类型的高性能同传技术
那全球百分之九十的语言都可以实现互译