交互式机器翻译
编辑交互式机器翻译(IMT),是计算机辅助翻译的一个特定子领域。在这种翻译模式下,协助人类翻译的计算机软件试图通过考虑它所拥有的所有信息来预测用户将要输入的文本。每当这种预测是错误的,并且用户向系统提供反馈时,就会考虑到现有的新信息进行新的预测。这样的过程不断重复,直到提供的翻译符合用户的期望。在翻译一些领域的文本时,交互式机器翻译特别有趣,因为在这些领域中,不允许输出含有错误的翻译,因此需要人类用户来修改系统提供的翻译。在这种情况下,交互式机器翻译已被证明可以为潜在的用户带来好处。然而,实现交互式机器翻译的商业软件很少,该领域的工作大多局限于学术研究。历史上,交互式机器翻译是作为计算机辅助翻译范式的演变而诞生的,其中人类译者和机器翻译系统旨在作为一个串联体工作。这一首次工作在TransType研究项目中得到扩展,由加拿大政府资助。在这个项目中,人类互动的目的是通过在交互式翻译环境中嵌入数据驱动的机器翻译技术,首次产生目标文本,目的是实现双方的最佳状态:自动系统的效率和人类翻译的可靠性。后来,一个由欧盟委员会资助的更大规模的研究项目TransType2扩展了此类工作,分析了将一个完整的机器翻译系统纳入这一过程,目的是产生一个完整的翻译假设,允许人类用户修改或接受。如果用户决定修改假说,系统就会试图xxx地利用这种反馈,以产生一个新的翻译假说,其中考虑到用户引入的修改。最近,同样由欧盟委员会资助的CASMACAT旨在开发新型的人类翻译辅助工具,并将其整合到一个新的工作台中,包括一个编辑器、一个服务器以及分析和可视化工具。该工作台是以模块化的方式设计的,可以与现有的计算机辅助翻译工具相结合。此外,CASMACAT工作平台可以从与人类译者的互动中学习,根据用户的翻译选择即时更新和调整其模型。
最近对人类用户进行广泛评估的工作表明,交互式机器翻译甚至可以由不讲源语言的用户使用,以达到接近专业的翻译质量。此外,它还阐明了一个事实,即交互式场景比传统的编辑后场景更有利。之前描述的方法依赖于一个紧密耦合的基于语料库的机器翻译系统(通常是统计机器翻译系统),该系统被用作玻璃盒,因此继承了翻译系统的缺点,限制了交互式机器翻译在某些场景中的使用。出于这个原因,我们开发了一种使用任何种类的双语资源(不限于机器翻译)作为黑箱来提供交互式机器翻译的方法。由于互动的黑箱性质,这种方法无法从所使用的双语资源中提取尽可能多的信息,但可以使用用户可用的任何资源。Forecat是一个黑箱交互式机器翻译的实现,既可以作为一个网络应用程序(包括一个网页和一个网络服务接口),也可以作为OmegaT的一个插件(Forecat-OmegaT)。
交互式机器翻译的过程
编辑交互式机器翻译过程以系统向用户提出翻译假设开始。然后,用户可以接受正确的完整句子,如果他认为有一些错误,也可以对其进行修改。一般来说,当修改一个给定的单词时,假定该单词之前的前缀是正确的,从而导致从左到右的互动方案。一旦用户修改了被认为不正确的单词,系统就会提出一个新的后缀,也就是句子的剩余部分。这样的过程一直持续到所提供的翻译令用户满意为止。虽然是在词的层面上解释,但前面的过程也可以在字符层面上实现,因此只要人类翻译者输入一个字符,系统就会提供一个后缀。此外,目前正在努力改变典型的从左到右的交互方式。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/175190/