當前位置:首頁 > 報告詳情

多說話人分離技術及應用進展-洪青陽.pdf

上傳人: 張** 編號:161402 2024-05-05 21頁 3.38MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文介紹了廈門大學智能語音實驗室在多說話人分離技術及應用方面的研究進展。研究背景中提到,多說話人分離技術應用于會議紀要、轉錄、客服和錄音質檢等多個場景,涉及終端設備智能手機、個人電腦和錄音筆等,支持廠商包括科大訊飛、華為和聲云等。研究從簡單場景到復雜場景,提到了多種架構和算法的發展歷程,以及相關的競賽和數據集。在工業版本中,采用模塊化系統,包括音頻分割、提取說話人表征、聚類等步驟。存在的問題包括語音重疊和說話人混疊,提出了分段判斷和神經網絡分割的解決辦法。最后,介紹了落地應用,如聲云語音轉寫,具有普通話、帶角色分離、長時間離線音頻任務處理等優點。
"多說話人分離技術如何實現實時應用?" "洪青陽合作者團隊在語音識別領域有哪些創新?" "廈門大學智能語音實驗室有哪些領先技術?"
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站