《順豐 莊思待-智能語音技術在順豐呼叫中心的應用實踐.pdf》由會員分享,可在線閱讀,更多相關《順豐 莊思待-智能語音技術在順豐呼叫中心的應用實踐.pdf(21頁珍藏版)》請在三個皮匠報告上搜索。
1、智能語音技術在順豐呼叫中心的應用實踐智能語音技術在順豐呼叫中心的應用實踐莊思待莊思待 語音語言應用架構負責人語音語言應用架構負責人個人簡介個人簡介 1317年百度在線 17 順豐科技在人工智能應用、云原生、大數據等領域有多年的實踐落地經驗目前在順豐負責語音質檢系統、問答系統、智能搜索、智能呼叫等語音語言類AI應用的系統架構和研發目錄目錄 順豐呼叫中心的智能語音應用 語音合成在外呼中的應用 語音識別的主要應用場景和方案 展望順豐呼叫中心的智能語音應用順豐呼叫中心的智能語音應用智能語音的行業應用順豐呼叫中心的智能語音應用順豐呼叫中心的智能語音應用呼叫中心的場景應用全景圖目錄目錄 順豐呼叫中心的智能
2、語音應用 語音合成在外呼中的應用 語音識別的主要應用場景和方案 展望語音合成在外呼中的應用語音合成在外呼中的應用TTS拼接合成:運算量低 /不連貫,人工介入成本高參數合成:語音連接平穩質量高 /對聲碼器依賴高端到端:對語言學知識要求低 /運算量大,實時性低語音合成在外呼中的應用語音合成在外呼中的應用當前方案基于深度學習的語音合成 將輸入的文本經過前端處理,得到文字對應的音素ids序列 聲學模型,將音素ids序列轉換成語音的特征,例如:mel譜 聲碼器,將語音的特征mel譜轉換成語音數據流。語音合成在外呼中的應用語音合成在外呼中的應用TTS引擎結合實際語音合成效果,聲學模型選取 Fastspee
3、ch2,聲碼器選取HiFigan語音合成在外呼中的應用語音合成在外呼中的應用在測方案目錄目錄 順豐呼叫中心的智能語音應用 語音合成在外呼中的應用 語音識別的主要應用場景和方案 展望語音識別的主要應用場景和方案語音識別的主要應用場景和方案ASR流式語音識別流式語音識別非流式語音識別非流式語音識別可用數據history數據少量future數據全部history+future數據模型精度低高數據輸入N秒/次,如N=0.5一次性輸入完整數據結果獲取實時輸出解碼完成一次性輸出運行效率指標最后一次送入數據到獲得最終結果的時延RTF(受時長影響波動)語音識別的主要應用場景和方案語音識別的主要應用場景和方案非
4、流式ASR在質檢的應用語音識別的主要應用場景和方案語音識別的主要應用場景和方案質檢系統架構語音識別的主要應用場景和方案語音識別的主要應用場景和方案流式ASR在智能應答系統的應用 端點檢測VAD(Voice Activitity Detection):nnVAD 流式ASR(Automatic Speech Recognition):CTC,Attention語音識別的主要應用場景和方案語音識別的主要應用場景和方案流式ASR的接入語音識別的主要應用場景和方案語音識別的主要應用場景和方案流式ASR的接入語音識別的主要應用場景和方案語音識別的主要應用場景和方案接入電話系統語音識別的主要應用場景和方案
5、語音識別的主要應用場景和方案ASR/TTS接入及高可用展望展望 在離線融合,更充分的使用算力資源 LLM 賦能了解更多技術實踐案例了解更多技術實踐案例麥思博(msup)有限公司是一家面向技術型企業的培訓咨詢機構,攜手2000余位中外客座導師,服務于技術團隊的能力提升、軟件工程效能和產品創新迭代,超過3000余家企業續約學習,是科技領域占有率第1的客座導師品牌,msup以整合全球領先經驗實踐為己任,為中國產業快速發展提供智庫。高可用架構主要關注互聯網架構及高可用、可擴展及高性能領域的知識傳播。訂閱用戶覆蓋主流互聯網及軟件領域系統架構技術從業人員。高可用架構系列社群是一個社區組織,其精神是“分享+交流”,提倡社區的人人參與,同時從社區獲得高質量的內容。