n元语法
编辑n 元语言法,是将文本分成片段的结果。 文本被分解,每个 N 连续的片段被组合成 n元语法。 片段可以是字母、音素、单词等。 n元语言法用于密码学和语料库语言学,特别是在计算语言学、定量语言学和计算机取证学中。 单个单词、整个句子或完整的文本被分解成 n 元语言,并汇总在数据集中以供分析或统计评估。
n元语法的类型
编辑重要的 n 元语言是字母组合、二字母组合(有时称为二字母组合)和三字母组合。 花押字由一个片段组成,例如只有一个字母、两个二元组和三个片段的三元组。 一般来说,如果它是一组“许多”片段,也可以说是多重语法。
分析
编辑n元语法分析用于回答特定字母或单词序列后跟特定字母或单词的可能性有多大的问题。 使用的语言对于分析并不重要,但其统计数据是: n元语言法分析适用于每种语言和每种字母表。
因此,分析已经在语言技术领域证明了自己:许多机器翻译方法都是基于通过这种方法获得的数据。
当要针对特定主题检查大量数据(例如电子邮件)时,n元语言分析尤为重要。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/342190/