1 聲紋識別技術
聲紋識別是指能夠將聲信號轉換成電信號,該電信號是電聲學儀器上顯示的攜帶語言信息的聲波頻譜。同時我們可將人語音中所含特征的集合視作聲紋,不同的個體間的聲紋具有相對穩定性和個體之間的差異性,所有聲紋可用來進行個體識別和同一認定。

2 聲紋識別技術流程
聲紋識別包含聲紋預處理、聲紋特征提取和識別方法三個階段。
(1)聲紋預處理
當人表達時,無可避免的周圍會帶有噪聲的語音,聲紋預處理的功能是從嘈雜的語音環境中提取干凈的沒有雜質的語音,這是聲紋識別中的關鍵步驟。具體聲紋預處理方法可分為:數字信號處理和機器學習兩類。
(2)聲紋特征提取
聲紋特征是指能體現說話人個性的特征信息,并用數學方法表達聲學特征、詞法特征、韻律特征、方言信息、通道信息等。采用深度學習算法訓練海量語音數據,過程中綜合采用分類和對比能量損失函數,自動抽象、歸納、總結語音信號中描述身份的特征。研究中較多使用線性預測系數,數據降維則多考慮線性判別分析降維(LDA)。特征提取技術具有較強的泛化能力,在跨信道、不同信噪比、較長時間跨度的情況下,聲紋特征仍然表現出較好的穩定性。
(3)聲紋識別
聲紋識別技術的最后步驟是進行聲紋識別,該流程通過高斯混合通用背景模型(GMM-UBM)、聯合因子分析(JFA)、神經網絡等常用模型來判定說話人的身份。
3 聲紋識別的特點和優勢
聲紋特征以聲音為載體,與指紋、虹膜等其他生物識別技術相比較,聲紋識別技術在采集便利性和識別迅捷性上具備顯著優勢,其僅需監控攝像頭或執法記錄儀等具備麥克風功能的設備,極大提高了遠程采集的成功率及識別的準確性。

(1)聲紋識別的特點
1)交互性。聲音是唯一可雙向傳遞信號的生物特征,既可以接收信息,也可以發出信息,實現交互。
2)便捷性。聲音是唯一周邊無死角的生物特征,可以實現非接觸式采集,方便使用。
3)豐富性。聲音有“形簡意豐”的特點,它雖然只是一個一維信號,但是蘊含著豐富的信息。在相同一段語音中,除了包含說話人信息外,還包含內容、語種、性別、情緒、年齡,甚至包含出生地、身體健康狀況等豐富的信息。
4)變化性。聲音是高可變性與唯一性的完美統一。沒有兩個聲音是完全一樣的,但里面所蘊含的信息,比如你是誰、你的年齡、你的情感等信息卻都是唯一確定的。這種高可變性和唯一性的完美統一使得語音信號自身就具備了很強的防攻擊能力。
(2)聲紋識別的優勢
1)不易丟失。不同于指紋、虹膜、人臉等靜態的生理特征,聲紋作為一種動態的行為特征,不容易丟失,可以做到“失聲(音)不失身(份)”。
2)偽造困難。聲紋蘊含于人的語音當中,而語音是千變萬化的。即便人兩次讀相同的內容,也不可能發出完全相同的聲音。正是聲紋這種“蘊不變于千變萬化之中”的特性,使得聲紋特征更加深層、難以琢磨,偽造起來也更為困難,因而認證強度更高、更安全。
3)隱私性弱。相比在公眾場合下拍照或按手印,采集聲紋可能更容易獲取人們在很多場合下往往不愿意被拍照或者按手印,但采集一段隨機跟讀的聲音,對于大眾更加容易接受。
推薦閱讀:
《AIIA:2019中國聲紋識別產業發展白皮書(44頁).pdf》
《AIIA:中國聲紋識別產業發展白皮書2.0(39頁).pdf》