混合机器翻译

混合机器翻译是的方法的机器翻译，其特征是使用多个机器翻译的一个单一的机器翻译系统内接近。开发混合机器翻译系统的动机源于任何一种技术都无法达到令人满意的准确性。许多混合机器翻译系统已经成功地提高了翻译的准确性，并且有几种使用混合方法的流行机器翻译系统。其中包括PROMT、SYSTRAN和Omniscien Technologies（以前为Asia Online）。

方法

编辑

多引擎

编辑

这种混合机器翻译的方法涉及并行运行多个机器翻译系统。通过组合所有子系统的输出来生成最终输出。最常见的是，这些系统使用基于统计和基于规则的翻译子系统，但已经探索了其他组合。例如，研究人员在卡耐基梅隆大学已经取得了一些成功的结合基于实例的，基于转换的，以知识为基础的统计翻译子系统为一体的机器翻译系统。

统计规则生成

编辑

这种方法涉及使用统计数据来生成词汇和句法规则。然后使用这些规则处理输入，就好像它是基于规则的翻译器一样。这种方法试图通过从训练语料库中提取规则来避免创建一组全面，细粒度的语言规则的艰巨而费时的任务。这种方法仍然存在许多正常统计机器翻译的问题，即翻译的准确性将在很大程度上取决于输入文本与训练语料库文本的相似性。结果，该技术在特定领域的应用程序中获得了最大的成功，并且与许多统计机器翻译系统一样，在域适应方面也遇到了同样的困难。

多次通过

编辑

此方法涉及多次串行处理输入。多遍机器翻译系统中最常用的技术是使用基于规则的机器翻译系统对输入进行预处理。基于规则的预处理器的输出将传递到统计机器转换系统，该系统将产生最终输出。该技术用于限制统计系统需要考虑的信息量，从而大大降低了所需的处理能力。它还消除了将基于规则的系统作为语言的完整翻译系统的需要，从而大大减少了构建该系统所需的人力和劳动量。

基于信任

编辑

该方法与其他混合方法的不同之处在于，在大多数情况下，仅使用一种翻译技术。为每个翻译的句子生成一个置信度度量，从中可以决定是尝试第二种翻译技术还是继续进行初始翻译输出。Omniscien Technologies是使用这种方法的一家公司，NMT是主要技术，但是如果置信度得分低于阈值或句子长度非常短（即1或2个单词），则退回到SMT。当常见错误模式（例如多个重复单词）顺序出现时，也将使用SMT，这与注意机制混乱时的NMT一样。

内容由匿名用户提供，本内容不代表vibaike.com立场，内容投诉举报请联系vibaike.com客服。如若转载，请注明出处：https://vibaike.com/111989/