本篇文章2679字,读完约7分钟
不久前,一名同声传译人员指责IFlytek (002230,诊断单元)犯有“人工智能同声传译欺诈”,这在互联网上引起了轩然大波。人工智能和同声翻译已经成为热门话题。今天,我们来谈谈人工智能翻译能否真正取代同声传译。
同声传译有多难?
第一次世界大战后,同声传译首次出现在巴黎和平会议上,英法两国的代表在同声传译的帮助下完成了紧张的谈判。
今天,这项技术在国际会议上仍然发挥着极其重要的作用。据统计,95%的国际会议都有专业的同声传译人员协助。
同声传译译者可以在舞台上自由运用他们的同声传译技巧,这在平时需要大量的刻苦练习。即使是可以自由使用双语的专业人士也需要在实战前锻炼几年。他们不仅需要提前学习,熟悉会议材料,还需要适应变化的能力。同声传译的工作模式也相当特殊,因为压力大,很多人通常一起工作,在几个小时的过程中,每个人轮流翻译几分钟。
相比之下,普通的解释要简单得多。机器翻译如果能取代同声传译,无疑具有很大的价值。
人工智能翻译的水平是什么?
那么,人工智能同时翻译的能力是什么?它会剥夺同声传译的工作吗?
艾同传今年上半年首次亮相博鳌亚洲论坛。然而,现场配备的系统已经脱离了链条,导致低级错误,如不准确的翻译和词汇的重复。
客观地说,人工智能或机器翻译技术在自然语言处理方面取得了许多突破。这些突破给了人们希望,让人们思考未来,但它们的短期价值更多地体现在辅助翻译领域。
当然,目前机器翻译已经取得了很大的进步,食物、服装、住房、交通等常用生活术语的汉英翻译可以达到大学英语六级水平,可以帮助人们处理一些场景中的语言交流问题。然而,在高水平翻译中,人工同声传译与强调“信、达、雅”之间仍有很大差距。
目前,差距是由现有技术水平的限制决定的。机器翻译,也称为自动翻译,使用计算机将一种语言转换成另一种语言。机器翻译技术的发展与计算机技术、信息论、语言学等学科的发展密切相关。从早期的词典匹配,到语言专家梳理的知识规则,再到基于语料库的统计方法,随着计算能力的提高和多语言信息的积累,机器翻译技术开始在一些场景中提供便捷的翻译服务。
新世纪以来,随着互联网的普及,互联网公司成立了机器翻译研究小组,开发了基于互联网大数据的机器翻译系统,使机器翻译真正实用化,更成熟的自动翻译产品开始出现在市场上。近年来,随着深度学习的发展,机器翻译技术得到了进一步的发展,促进了翻译质量的提高,使翻译更加真实流畅。
机器翻译有什么困难?
这里,我们简单介绍一下机器翻译的难点。机器翻译的整个过程可以分为语音识别转换、自然语言分析、翻译转换和翻译生成。这里,以一个典型的基于规则的机器同声翻译为例(见下图),模块包括:语音识别(语音到文本)、自然语言处理(语法分析、语义分析)、翻译转换、翻译生成和语音生成。主要技术难点是语音识别、自然语言处理和翻译转换。
第一个技术难点是语音识别。在过去的20年里,语音识别技术取得了显著的进步,并开始进入家用电器、汽车、医疗保健和家庭服务等各个领域。常见的应用系统有:
与键盘输入法相比,语音输入系统更符合人们的日常习惯,更自然、更高效;
语音控制系统,即利用语音来控制设备的运行,比手动控制更快、更方便,可用于工业控制、语音拨号系统、智能家电、声控智能玩具等诸多领域;
智能对话查询系统根据客户的声音进行操作,为用户提供自然友好的数据库检索服务,如家庭服务、旅行社服务系统、预订系统、银行服务等。
可以说,语音识别技术和其他自然语言处理技术的结合可以构建许多复杂的应用。
然而,语音识别的主要困难是对自然语言的识别和理解。首先,连续语音必须分解成单词、音素和其他单位。其次,应该建立理解语义的规则。由于语音信息量大,不仅不同说话人的语音模式不同,同一说话人在不同场景下的语音模式也不同。
例如,一个人在自由而严肃地说话时,他的语音特征是不同的。此外,说话人说话时,不同的词可能听起来相似,这也是一种普遍现象。单个字母或单词的语音特征受上下文影响,会改变重音、声调、音量和发音速度。最后,环境噪声和干扰对语音识别也有很大影响,导致识别率低。
第二个技术难点是语义解析,它是智能机器翻译系统的核心部分。目前,机器翻译系统可以分为两类:基于规则的和基于语料库的。前者基于词典和语言知识规则库。后者由划分和注释的语料库组成,主要是统计算法。
机器翻译系统随着语料库语言学的兴起而发展。目前,世界上大多数机器翻译系统都采用基于规则库的策略,一般分为语法型、语义型、知识型和智能型。不同类型的机器翻译系统由不同的组件组成。抽象地说,所有机器翻译系统的处理过程包括以下步骤:分析或理解源语言,在语言的语法、语义和语用层面上进行转换,并根据目标语言的结构规则生成目标语言。
目前,谷歌的在线翻译众所周知,其第一代技术是基于统计的机器翻译方法。其基本原理是收集大量的双语网页作为语料库,然后计算机自动选择词与词之间最常见的对应关系,最后给出翻译结果。
然而,这一技术的应用仍然无法取得令人满意的效果,各种翻译笑话时有发生。由于大规模双语语料库需要基于统计方法建立,翻译模型和语言模型参数的准确性直接取决于语料库的规模和质量,翻译质量直接取决于模型的质量和语料库的覆盖范围。
除了上述传统方法,自2013年以来,随着深度学习研究的巨大进展,基于人工神经网络的机器翻译逐渐出现。目前,长记忆周期和短记忆周期的神经网络广泛应用于机器翻译中。该模型擅长对自然语言进行建模,将任意长度的句子转换成特定维度的浮点向量,同时“记住”句子中更重要的单词,从而可以将“记忆”保存更长的对话时间。该模型解决了自然语言句子的矢量化问题。
其技术核心是通过多层神经网络从语料库中自动学习知识。将一种语言的句子进行矢量化后,在网络中逐层传输,经过多层复杂的传输操作后生成译文。这种翻译方法的最大优点是翻译流畅,更符合语法规范。与以往的翻译技术相比,质量有所提高。
智能同声翻译离我们还有多远?
需要注意的是,很多人误解了机器翻译,认为机器翻译有很大的偏差。事实上,机器翻译使用语言知识,自动识别语法,模拟语义理解并进行相应的翻译。由于语法、语义和语用的复杂性,错误是不可避免的。就现有成果而言,通用机器翻译在整个场景中的翻译质量仍远未达到最终目标。
随着全球网络时代的到来,语言障碍已经成为21世纪社会发展的重要瓶颈。在任何时间、任何地点用任何语言实现无障碍交流是人类追求的梦想。这只是全球化背景下的一个小缩影。在社会快速发展的过程中,机器翻译将发挥越来越重要的作用。
来源:千龙新闻网
标题:人工智能真的可以取代同传翻译吗?
地址:http://www.qinglongs.com/qlwxw/10650.html