登录/注册

赞 (2) | 阅读 (4)

统计机器翻译

编辑

本词条由“匿名用户” 建档。

统计机器翻译（SMT）是一种机器翻译范例，其中翻译是根据统计模型生成的，统计模型的参数来自对双语文本语料库的分析。统计方法与基于规则的机器翻译方法以及基于示例的机器翻译方法形成对比。沃伦·韦弗（Warren Weaver）于1949年提出了统计机器翻译的最初思想，包括应用克劳德·香农（Claude Shannon）的信息论的思想。IBM的Thomas J. Watson研究中心的研究人...

目录

1 统计机器翻译

2 统计机器翻译好处

3 统计机器翻译缺点

4 实现统计机器翻译的系统

统计机器翻译

统计机器翻译（SMT）是一种机器翻译范例，其中翻译是根据统计模型生成的，统计模型的参数来自对双语文本语料库的分析。统计方法与基于规则的机器翻译方法以及基于示例的机器翻译方法形成对比。

沃伦·韦弗（Warren Weaver）于1949年提出了统计机器翻译的最初思想，包括应用克劳德·香农（Claude Shannon）的信息论的思想。IBM的Thomas J. Watson研究中心的研究人员在1980年代末和1990年代初重新引入了统计机器翻译，并且近年来，机器翻译的兴趣重新兴起。在引入神经机器翻译之前，它是迄今为止研究最广泛的机器翻译方法。

统计机器翻译好处

与基于规则的方法相比，统计机器翻译最常被引用的好处是：

更有效地利用人力和数据资源
- 有许多机器可读格式的并行语料库，甚至还有更多的单语数据。
- 通常，SMT系统不适合任何特定的语言对。
- 基于规则的翻译系统需要手动开发语言规则，这可能成本很高，而且通常无法推广到其他语言。
由于使用语言模型，翻译更加流畅。

统计机器翻译缺点

创建语料库的成本可能很高。
特定错误很难预测和修复。
结果可能具有表面的流利性，从而掩盖了翻译问题。
对于词序明显不同的语言对，统计机器翻译通常效果较差。
由于较小的训练语料库和较大的语法差异，西欧语言之间的翻译所获得的好处不能代表其他语言对的结果。

实现统计机器翻译的系统

Google翻译（从2016年开始过渡到神经机器翻译）
微软翻译器（2016年开始过渡到神经机器翻译）
Omniscien Technologies
SYSTRAN（从2016年开始过渡到神经机器翻译）
Yandex.Translate（在2017年转换为结合了神经机器翻译的混合方法）

内容由匿名用户提供，本内容不代表vibaike.com立场，内容投诉举报请联系vibaike.com客服。如若转载，请注明出处：https://vibaike.com/111986/

交互式机器翻译

交互式机器翻译交互式机器翻译（IMT），是计算机辅助翻译的一个特定子领域。在这种翻译模式下，协助人类翻译的计算机软件试图通过考虑它所拥有的所有信息来预测用户将要输入的文本。每当这种预测是错误的，并且用户向系统提供反馈时，就会考虑到现有的新信息进行新的预测。这样的过程不断重复，直到提供的翻译符合用户...

微软翻译

微软翻译微软翻译，是Microsoft提供的一种多语言机器翻译云服务。微软翻译已跨多个消费者，开发人员和企业产品集成。包括Bing、Microsoft Office、SharePoint、Microsoft Edge、Microsoft Lync、Yammer、Skype Translator、V...

缓存语言模型

缓存语言模型缓存语言模型是一种统计的语言模型。这些发生在计算机科学的自然语言处理子领域中，并通过概率分布将概率分配给给定的单词序列。统计语言模型是语音识别系统和许多机器翻译系统的关键组件：它们告诉这样的系统，哪些可能的输出单词序列是可能的，哪些是不可能的。缓存语言模型的特殊特征是它包含一个缓存组...

混合机器翻译

混合机器翻译混合机器翻译是的方法的机器翻译，其特征是使用多个机器翻译的一个单一的机器翻译系统内接近。开发混合机器翻译系统的动机源于任何一种技术都无法达到令人满意的准确性。许多混合机器翻译系统已经成功地提高了翻译的准确性，并且有几种使用混合方法的流行机器翻译系统。其中包括PROMT、SYSTRAN和...

查看更多

赞 (2)

全球百科,是VIBAIKE微全球百科的简称,成立于2015年,是全球首个专门针对企业、机构、个人服务的付费商业百科平台,全球百科提供更系统的企业百科词条创建、人物百科词条创建、机构微百科创建等百科...

词条目录

统计机器翻译
统计机器翻译好处
统计机器翻译缺点
实现统计机器翻译的系统

轻触这里

关闭目录

目录