一个包含随机模型的DTW
来源
目的
日语单词识别
思路
DTW。但不是standard DTW。希望引入一些随机模型。
灵感
HMM
成品
在对比了HMM Viterbi Decoding的公式后,发现DTW的cumulative distance公式可以近似仿写成这个形式。于是模仿着引入了output distribution和transfer probability。见文章中“General equation of stochastic dynamic time warping method” section。
参数
- output distribution -> multivariant Gaussian
- transfer probability -> count based on averaged template
实验
feature
LPC + energy
实验一:英语辅音识别
23男性,每人7-10句,每局平均8个词,2.6秒
- Training -> 16人
- Testing -> 7人
实验二:日语单词识别
- Training -> 30男性,共216词
- Testing -> 10男性,共200词 共15分钟左右数据
值得关注的点
- How to create a reference pattern?
- How to calculate transfer probability?
- How to form the stochastic DTW and what’s the relating topology of HMM?