音高检测算法

编辑
本词条由“匿名用户” 建档。
音高检测算法(PDA)是一种旨在估计准周期或振荡信号的音高或基本频率的算法,通常是语音的数字录音或音符或音调。这可以在时域、频域或两者中进行。PDA用于各种场合(如语音学、音乐信息检索、语音编码、音乐表演系统),因此对算法的要求可能不同。目前还没有一个理想的PDA,所以存在各种算法,大多数算法大致分为以下几类。PDA通常估计准周期性信号的周期,然后将该值倒置以得到频率。 一个简单的方法是...

音高检测算法

编辑

音高检测算法(PDA)是一种旨在估计准周期或振荡信号的音高或基本频率的算法,通常是语音的数字录音或音符或音调。这可以在时域、频域或两者中进行。PDA用于各种场合(如语音学、音乐信息检索、语音编码、音乐表演系统),因此对算法的要求可能不同。目前还没有一个理想的PDA,所以存在各种算法,大多数算法大致分为以下几类。PDA通常估计准周期性信号的周期,然后将该值倒置以得到频率。

一般方法

编辑

一个简单的方法是测量信号的零交叉点之间的距离(即零交叉率)。然而,这对于由不同周期的多个正弦波组成的复杂波形或噪声数据来说效果并不好。然而,在有些情况下,过零率可以是一个有用的衡量标准,例如在一些假定有单一信号源的语音应用中。该算法的简单性使其实现起来很便宜。更复杂的方法是将信号的片段与其他片段进行比较,通过试验期的偏移来寻找匹配。AMDF(平均幅度差值函数)、ASMDF(平均平方平均差值函数)和其他类似的自相关算法就是这样工作的。这些算法对于高度周期性的信号可以给出相当准确的结果。然而,它们有错误检测问题(通常是倍频误差),有时会严重影响到噪声信号(取决于实现方式),而且--在它们的基本实现方式中--不能很好地处理多声道声音(涉及不同音高的多个音符)。目前的时域音高检测器算法倾向于在上述基本方法的基础上,进行额外的改进,使其性能更符合人类对音高的评估。

频域方法

编辑

频域、复音检测是可能的,通常利用周期图将信号转换为频谱的估计。这需要更多的处理能力,因为所需的精度增加,尽管众所周知的FFT的效率,周期图算法的一个关键部分,使它适合于许多目的的效率。流行的频域算法包括:谐波乘积谱;epstral分析和xxx似然,它试图将频域特征与预先定义的频率图相匹配(对检测固定调谐乐器的音高很有用);以及检测由谐波序列引起的峰值。为了改进从离散傅里叶频谱得到的音高估计,可以使用频谱重新分配(基于相位)或Grandke插值(基于幅度)等技术,以超越FFT箱所提供的精度。音高

频谱/时间方法

编辑

频谱/时间音高检测算法,例如YAAPT音高跟踪算法,是基于使用自相关函数(如归一化交叉相关)的时域处理和使用频谱信息的频域处理的组合来识别音高。然后,在从这两个领域估计的候选者中,可以使用动态编程计算出最终的音高轨迹。这些方法的优点是,一个域的跟踪误差可以通过另一个域的处理来减少。

语音音高检测

编辑

语音的基本频率可以从低音调声音的40赫兹到高音调声音的600赫兹不等。自相关方法需要至少两个音高周期来检测音高。这意味着,为了检测40赫兹的基本频率,必须分析至少50毫秒(ms)的语音信号。然而,在50毫秒期间,具有较高基频的语音不一定在整个窗口内具有相同的基频。

内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/168094/

(4)
词条目录
  1. 音高检测算法
  2. 一般方法
  3. 频域方法
  4. 频谱/时间方法
  5. 语音音高检测

轻触这里

关闭目录

目录