技術摘要: | ||||||||
一種環境聲音辨識方法,於一環境聲音辨識裝置中執行該方法之下列步驟:將環境聲音轉換成音檔;將音檔取樣及量化而成為向量序量;建立一聲音特徵辭典以產生對應波形式樣之向量序列;將環境聲音之向量序列與對應波形式樣之向量序列進行運算,以獲得包含有一平均值最大能量比率、數個平均值尺度能量值、數個平均值頻率能量值、一平均值尺度質心值、一平均值頻率質心值、一平均值尺度分散值及一平均值頻率分散值之一平均值尺度頻率描述符;以及將平均值尺度頻率描述符進行比對,以分類出平均值尺度頻率描述符之一環境聲音類別。 |
||||||||
解決的問題或達成的功效: | ||||||||
本發明有關一種聲音辨識之領域,特別有關於一種基於新型時頻參數之環境聲音辨識方法。 |
||||||||
應用領域: | ||||||||
聲音辨識之領域 |
||||||||
適用產品: | ||||||||
語音辨識系統 |
||||||||
IPC: | ||||||||
G10L-015/02(2006.01);G10L-015/08(2006.01);G10L-015/28(2013.01) |
||||||||
Claim 1: | ||||||||
1.一種環境聲音辨識方法,於一環境聲音辨識裝置中執行該方法之下列步驟:(a)於一聲音特徵辭典中建立一聲音特徵矩陣,該聲音特徵矩陣係由複數列向量序列所組成,將複數個波形樣式中心位置之每一者、複數個頻率之每一者及複數個波形樣式長度之每一者的組合進行運算以獲得對應波形式樣之該等向量序列;(b)將一疊代向量序列與該等向量序列之每一者進行內積運算,以獲得複數個相似係數與分別對應該等相似係數之複數個內積向量序列,其中在第一次疊代運算時,該疊代向量序列為該至少一聲音訊號向量序列中之一者;(c)將該疊代向量序列與對應最大之該相似係數之內積向量序列進行運算以獲得一相似訊號向量序列,並將該疊代向量序列與該相似訊號向量序列進行減法運算以獲得一剩餘訊號向量序列;(d)以一預定次數重覆執行步驟(b)與(c)而獲得與該預定次數相同數目的該等最大之相似係數,其中在下一次疊代運算時,該疊代向量序列係為該剩餘訊號向量序列;(e)將相同的頻率與波形樣式長度之最大之該等相似係數進行加總,以獲得複數個能量值;(f)將該等能量值、該等頻率與該等波形樣式長度進行運算,以獲得與該至少一聲音訊號向量序列之序列個數相同之至少一尺度頻率描述符,其中該至少一尺度頻率描述符之每一者包含一最大能量比率、複數個波形樣式長度能量值、複數個頻率能量值、一波形樣式長度質心值、一頻率質心值、一波形樣式長度分散值及一頻率分散值;以及(g)將該至少一尺度頻率描述符進行平均值運算以獲得一平均值尺度頻率描述符。 |
||||||||
相關圖片: | ||||||||
| ||||||||
聯繫方式 | ||||||||
|
||||||||