什么是聲紋識別？應用領域有哪些？

2022-07-12 17:46:06 作者：2200 3538

生物特征識別技術由于其便捷和安全性已經被廣泛地應用在當今社會中,而語音作為一種重要的生物特征,蘊含了非常豐富的信息,且由于智能設備的普及,說話人語音的采集成本也非常低廉。本文將介紹聲紋識別技術，介紹其應用領域、分類等，以供參考。

聲紋識別

1.聲紋識別

聲紋識別，也稱為說話人識別，在英文中對應若干種說法，例如Voice Recognition，SpeakerRecognition，Voiceprint Recognition，Talker Recognition等都是同一個概念，也就是把不同說話人的語音，按照說話人身份區分開來的技術。

聲紋識別是指把聲信號轉換成電信號，再用計算機進行識別。聲紋識別具有一些特殊的優勢：蘊含聲紋特征的語音獲取方便、自然，聲紋提取可在不知不覺中完成，使用者的接受程度高，聲紋辨認和確認的算法復雜度低等。

2.聲紋識別分類

聲紋識別按照其識別的內容，可以分成三類：文本相關(Text-dependent)的聲紋識別、文本無關(Text-independent)的聲紋識別，以及文本提示型(Text-prompted)聲紋識別。

(1)文本相關的聲紋識別，通常稱為“固定文本”的聲紋識別，也就是所需要被識別的音頻，其內容對應的文本總是固定的。在實際應用中，文本相關的聲紋識別主要用于喚醒詞或驗證口令。例如一些智能設備，通常會采用某個固定的較短的喚醒詞作為語音交互的初始步驟。

(2)文本無關的聲紋識別，顧名思義，就是指無論說話人說的是什么內容，都要能夠識別出說話人的身份。文本無關的聲紋識別比文本相關的聲紋識別要困難的多，但其應用也豐富很多，甚至衍生出不少新興的研究方向和應用，例如聲紋分割聚類技術。因此，在學術界和工業界，文本無關的聲紋識別都備受關注。

(3)文本提示型聲紋識別將文本內容限定在某個小規模的集合中。用戶在錄入聲紋的時候，需要對集合中的每一條文本進行錄入。在實際驗證過程中，系統會隨機生成取自該集合的一條文本，要求待驗證者說出該文本。只有當前驗證者提供的驗證語音同時匹配文本和之前錄制語音提取出的聲紋時，才能通過驗證。由于驗證時每次生成的文本都不相同，冒名頂替者就無法事先將目標用戶的對應語音錄制下來，從而避免了相應的風險。

3.聲紋識別的應用領域

目前來說，聲紋識別技術在公安和金融領域比較受青睞。

(1)公安領域：聲紋識別可以用于重點人員布控、偵查破案、反電信欺詐、治安防控、司法鑒定、審訊室建設、網絡身份認證等。

(2)金融領域：聲紋識別技術主要可以用于以下幾個場景：

1) 登錄、支付場景——采用聲紋識別技術，自動匹配用戶個人身份信息，完成登陸、支付的身份驗證，一般采用文本相關的方式，既8位隨機動態數字串或者固定文本。

2)業務核身——采用聲紋識別技術，在業務溝通中完成用戶身份核驗，在自動匹配業務辦理的信息，進行比對，完成業務辦理的身份核驗，一般采用文本無關方式，如開卡開戶。

3) 信貸場景——采用聲紋識別技術，在信審環節對用戶身份進行識別，并查驗是否為黑中介(黑名單用戶)，完成信審身份審核，采用文本無關的方式。

4)金融反洗錢——采用聲紋識別技術，在判定出疑似洗錢行為后對用戶進行電話遠程身份驗證以及自動對用戶信息核對，完成可疑用戶身份核驗，采用文本無關的方式。

以上梳理了聲紋識別技術的定義、分類、應用領域等，希望對你有所幫助，如果你想了解更多相關內容，敬請關注三個皮匠報告的行業知識欄目。

本文由@2200 發布于三個皮匠報告網站，未經授權禁止轉載。

推薦閱讀：

什么是虹膜識別技術?優缺點有哪些?