Dynamic Time Warping 動态時間規整算法

2017-11-08 23:50:00

Dynamic Time Warping（DTW）是一種衡量兩個時間序列之間的相似度的方法，主要應用在語音識别領域來識别兩段語音是否表示同一個單詞。

1. DTW方法原理

在時間序列中，需要比較相似性的兩段時間序列的長度可能并不相等，在語音識别領域表現為不同人的語速不同。而且同一個單詞内的不同音素的發音速度也不同，比如有的人會把“A”這個音拖得很長，或者把“i”發的很短。另外，不同時間序列可能僅僅存在時間軸上的位移，亦即在還原位移的情況下，兩個時間序列是一緻的。在這些複雜情況下，使用傳統的歐幾裡得距離無法有效地求的兩個時間序列之間的距離（或者相似性）。

DTW通過把時間序列進行延伸和縮短，來計算兩個時間序列性之間的相似性：

如上圖所示，上下兩條實線代表兩個時間序列，時間序列之間的虛線代表兩個時間序列之間的相似的點。DTW使用所有這些相似點之間的距離的和，稱之為歸整路徑距離(Warp Path Distance)來衡量兩個時間序列之間的相似性。

2. DTW計算方法：

令要計算相似度的兩個時間序列為X和Y，長度分别為|X|和|Y|。

歸整路徑(Warp Path)

歸整路徑的形式為W=w1,w2,...,wK，其中Max(|X|,|Y|)<=K<=|X|+|Y|。

wk的形式為(i,j)，其中i表示的是X中的i坐标，j表示的是Y中的j坐标。

歸整路徑W必須從w1=(1,1)開始，到wK=(|X|,|Y|)結尾，以保證X和Y中的每個坐标都在W中出現。

另外，W中w(i,j)的i和j必須是單調增加的，以保證圖1中的虛線不會相交，所謂單調增加是指：

最後要得到的歸整路徑是距離最短的一個歸整路徑：

最後求得的歸整路徑距離為D(|X|,|Y|)，使用動态規劃來進行求解：

上圖為代價矩陣(Cost Matrix) D，D(i,j)表示長度為i和j的兩個時間序列之間的歸整路徑距離。

3. DTW實作：

matlab代碼：

C++實作：

dtwrecoge.h

View Code

dtwrecoge.cpp

本文轉自阿凡盧部落格園部落格，原文連結：http://www.cnblogs.com/luxiaoxun/archive/2013/05/09/3069036.html，如需轉載請自行聯系原作者

Dynamic Time Warping 動态時間規整算法

繼續閱讀

swmm與lisflood-fp源碼如何一起編譯 CMake指令

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

Windows下VS開發環境環境安裝工程項目設定關于Debug和Release的提示

一文看懂字元串的加減乘除

極大似然法(ML)與最大期望法(EM)

C++ 第十五周報告1--《冒泡法排序》

C++實作簡單順序表

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

C經典書籍筆記——C陷阱與缺陷②(文法陷阱之優先級)一、錯誤案列二、優先級規律

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

線性表之順序表的實作

C++判斷素數、求最大公約數代碼判斷一個數是否為素數求兩個數的最大公約數

SequoiaDB巨杉資料庫C++驅動概述

hdu7108哈希