1.聲紋識別技術應用場景
聲紋識別技術按照其所要識別的任務及應用場景主要分成兩類:聲紋驗證(SpeakerVerification, SV)和聲紋辨認(Speaker
Identification, SI)。
(1)聲紋驗證技術需要解決的問題是:這段話是否由這個特定的人所說。該類任務只關心某個特定的說話人,因此聲紋驗證技術可以看作一個二值判別的問題,只需要輸出“是”或者“否”。聲紋驗證對應的應用主要是喚醒和安全。在一些安全領域,聲紋驗證能夠確保操作來自被授權的用戶,而非冒名頂替者。
(2)與聲紋驗證不同,聲紋辨認需要解決的問題是:這段話是由誰所說。這里的“誰”限定在某個特定的候選說話人(Candidate
Speaker)集合之中。假如這個集合包含了M位說話人,那么聲紋辨別可以看作一個M元分類問題;假如輸入音頻中含有來自這個集合之外的說話人,則可增加一個冒名頂替者(Imposter)的類別,那么此時聲紋辨別可以看作一個M+1元分類問題。沒有冒名頂替者的聲紋辨別稱為“閉集”聲紋辨認;對應的,存在有可能有冒名頂替者的聲紋辨認稱為“開集”聲紋辨別。

2.聲紋識別優勢
(1)非接觸、易接受:
聲紋由于其非接觸性是可以用于遠程領域的生物識別技術。另外蘊含聲紋特征的語音獲取方便、自然。在采集過程中涉及到的用戶個人隱私信息較少,因此更容易被使用者接受。
(2)成本低:
語音采集裝置成本低廉,使用簡單,一個麥克風即可,在使用通訊設備(如電話、手機)時更無需額外的錄音設備。
(3)偽造難:
聲紋信息必須是活體采集,可使聲紋口令動態變化而無需擔心密碼遺忘、丟失和竊取問題,防止錄音假冒。
3.聲紋識別與語音識別
與語音識別(Speech
Recognition)技術不同的是,語音識別是將語音信號識別隱射為對應的文本內容的技術,絕大多數情況下并不關心說話人的身份并需要做到對不同說話人聲音的魯棒性;聲紋技術,尤其是文本無關的聲紋識別技術,則相反,需要在不同的文本內容中穩健地識別出說話人的身份。聲紋識別希望從信號中濾除與文本相關的信息,只保留說話人的身份信息。
以上梳理了聲紋識別的應用場景、優勢等,希望對你有所幫助,如果你想了解更多相關內容,敬請關注三個皮匠報告的行業知識欄目。
本文由@2200 發布于三個皮匠報告網站,未經授權禁止轉載。
推薦閱讀:
什么是虹膜識別技術?優缺點有哪些?
什么是手指靜脈識別技術?原理及應用領域一覽
什么是語音識別技術?原理是什么?應用領域介紹