大词

编辑
本词条由“匿名用户” 建档。
一个大词或二词是一串标记中两个相邻元素的序列,这些标记通常是字母、音节或单词。一个大词是一个n=2的n-gram。在许多应用中,包括在计算语言学、密码学、语音识别等方面,字符串中每个大段的频率分布通常被用于文本的简单统计分析。Gappybigrams或skipingbigrams是允许有间隙的词对(也许是避免连接词,或允许某种模拟的依赖关系,如依赖语法)。细节大词有助于在应用条件概率的关系时,...

什么是大词

编辑

一个大词或二词是一串标记中两个相邻元素的序列,这些标记通常是字母、音节或单词。一个大词是一个n=2的n-gram。在许多应用中,包括在计算语言学、密码学、语音识别等方面,字符串中每个大段的频率分布通常被用于文本的简单统计分析。Gappybigrams或skipingbigrams是允许有间隙的词对(也许是避免连接词,或允许某种模拟的依赖关系,如依赖语法)。细节大词有助于在应用条件概率的关系时,提供一个标记在前面的标记下的条件概率。{displaystyleP(W_{n-1},W_{n})},除以前面标记的概率。应用Bigrams被用于大多数成功的语音识别语言模型中。它们是N-gram的一个特例。大字形频率攻击可用于密码学中,以解决密码图。Bigram频率是统计语言识别的一种方法。逻辑学或娱乐语言学中的一些活动涉及到大词。这些活动包括试图找到以每一个可能的大词开头的英语单词,或含有一串重复大词的单词,如logogogue。

大词

英语中的大词频率

编辑

在一个大型英语语料库中,最常见的字母大词的频率,四舍五入到最接近的小数点。

内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/163789/

(2)
词条目录
  1. 什么是大词
  2. 英语中的大词频率

轻触这里

关闭目录

目录