关于变速不变调的实现算法
热门软件下载:
1.我听人说的实现方法:找到各个音节片段的间隙,控制间隙的长短来调整速度。问题在于如何找到间隙:对于浊音采用短时能量谱,对于清音采用过零率,但是当原始音频数据的语速很快时,相邻的音节相互重叠,对于浊音的检测就不准确了。
这是我的一个师兄说的,我认为这种方法很有问题。下面说说我想的方法:
对于浊音,可以用自相关函数检测出浊音的重复周期,通过增减重复次数控制语速;对于清音,我还没预想出很好的方法,主要是不知道连续的清音如何分割。
我在google上没查到有用的资料,都是些可以进行变速不变调的软件使用方法,没有具体的实现,不知道变速不变调英文怎么说,所以没查英文网页。哪位大侠可以给点想法或者相关的连接都可以。分不够可以加,今天刚刚超过10000可用分:-)
推荐阅读
time stretching (where a sound is made to last longer, but keeps the same pitch
as the original) is exactly the same process(s) as pitch shifting. if we need to
make a sound twice its current length, pitch shift the sound to twice its
original frequency (ie one octave up) but play back the data at half the
original rate. the same can be done for shortening lengths of sounds but by
halving the frequency and playing at twice the original rate.
when the change in time requires more than a simple doubling or halving of the
frequency, interpolation of the pitch shifted samples is needed.
相关评论