聲紋識別技術是什么？如何進行聲紋識別？

2023-04-27 19:32:47 作者：C-C 4761

1 聲紋識別技術

聲紋識別是指能夠將聲信號轉換成電信號，該電信號是電聲學儀器上顯示的攜帶語言信息的聲波頻譜。同時我們可將人語音中所含特征的集合視作聲紋，不同的個體間的聲紋具有相對穩定性和個體之間的差異性，所有聲紋可用來進行個體識別和同一認定。

QQ截圖20211008162847.png

2 聲紋識別技術流程

聲紋識別包含聲紋預處理、聲紋特征提取和識別方法三個階段。

(1)聲紋預處理

當人表達時，無可避免的周圍會帶有噪聲的語音，聲紋預處理的功能是從嘈雜的語音環境中提取干凈的沒有雜質的語音，這是聲紋識別中的關鍵步驟。具體聲紋預處理方法可分為：數字信號處理和機器學習兩類。

(2)聲紋特征提取

聲紋特征是指能體現說話人個性的特征信息，并用數學方法表達聲學特征、詞法特征、韻律特征、方言信息、通道信息等。采用深度學習算法訓練海量語音數據，過程中綜合采用分類和對比能量損失函數，自動抽象、歸納、總結語音信號中描述身份的特征。研究中較多使用線性預測系數，數據降維則多考慮線性判別分析降維(LDA)。特征提取技術具有較強的泛化能力，在跨信道、不同信噪比、較長時間跨度的情況下，聲紋特征仍然表現出較好的穩定性。

(3)聲紋識別

聲紋識別技術的最后步驟是進行聲紋識別，該流程通過高斯混合通用背景模型(GMM-UBM)、聯合因子分析(JFA)、神經網絡等常用模型來判定說話人的身份。

3 聲紋識別的特點和優勢

聲紋特征以聲音為載體，與指紋、虹膜等其他生物識別技術相比較，聲紋識別技術在采集便利性和識別迅捷性上具備顯著優勢，其僅需監控攝像頭或執法記錄儀等具備麥克風功能的設備，極大提高了遠程采集的成功率及識別的準確性。

QQ截圖20211008162942.png