Yandex翻译
编辑Yandex 翻译(也称为 Yandex.Perevod)是 Yandex 的一项在线服务,可以机器翻译单词、文本和整个网页。
Yandex翻译历史
编辑该服务于 2011 年推出,最初仅涵盖英语、乌克兰语和俄语。 现在有 98 种语言可用,包括拉丁文和西里尔文的哈萨克文和乌兹别克文。 Yandex 强调,它还希望涵盖稀有语言——包括巴什基尔语、帕皮亚门图语和辛达林语。 2017年,为英俄语组合指定了100万句语料库,相当于TraMOOC项目相应存量的一半左右。
自 2012 年以来,包括离线功能在内的移动应用程序已可用于 Android 和 iOS。
工作原理
编辑Yandex 机器翻译最初是基于统计方法。 2017 年 9 月,Yandex 宣布将为其机器翻译引入混合系统,结合统计和神经功能。
该服务由每种语言的三个主要内部组件组成:翻译模型、语言模型和解码器。
翻译模型是通过选择平行文档以及随后选择句子对和单词对或单词组合对来创建的,即它是一个表格,其中包含系统中的所有单词和短语及其可能的翻译成另一种语言的变体,包括这些变体的概率。 不仅比较单个单词,还会比较几个连续单词的组合。 翻译模型包括每个语言对的一亿个单词和单词组合对。
对于语言模型,系统会检查所需语言的数十万种不同文本,并创建其中使用的所有单词和单词组合及其频率的列表。 这是要翻译成的语言的系统知识。
解码器本身充当翻译器。 对于输入文本的每个句子,它通过组合翻译模型中的短语并按降序概率对它们进行排序来选择所有翻译变体。
解码器使用语言模型估计输出组合的所有变体。 因此,它选择概率(翻译模型)和使用频率(语言模型)最佳组合的句子。
该服务可以尝试自动检测文本的源语言。 但是,他无法将相邻的句子作为上下文。
Yandex 翻译提供了一个编程接口 (REST API) 以在您自己的网站和报价中包含翻译。 Python 有一个易于使用的实现。
Yandex翻译接收
编辑在 2014 年 5 月的一次小型实践测试中,与众多其他提供商相比,Yandex 翻译在锡隆纳古拉大学的翻译学生中只发挥了非常小的作用。 在与谷歌翻译的对比中,Yandex 翻译 2015 在俄克语组合中取得了更好的成绩。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/376626/