當前位置:首頁 > 報告詳情

快手端到端語音識別技術的探索與實踐-李杰.pdf

上傳人: 2*** 編號:127449 2023-05-01 39頁 7.18MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要介紹了快手直播生態中AI語音技術的應用與研究,由資深語音算法專家李杰博士主講。李杰博士在深度學習語音識別領域有深厚的研究基礎,曾在國際頂會上發表論文十幾篇。2016年加入微軟亞洲互聯網工程院,2017年底加入快手,負責快手語音識別組的技術研發和項目落地,四次獲得公司研發線-技術突破獎。 本次報告主要聚焦在以下技術方向:直播間內容理解、聲學事件檢測、音頻分離、語種識別、語音識別、直播智能剪輯、直播間內容生產、智能變聲。其中,直播間內容理解包括游戲直播間的內容理解和秀場直播間的內容理解。聲學事件檢測包括游戲直播間和秀場直播間的聲學事件檢測。音頻分離方面,首次提出多任務音頻分離,并在薩里大學2018年GCRNN模型基礎上提出FS-Transformer模型和EAD-Conformer模型。語種識別方面,提出動態多尺度卷積模型,并在2020年東方語言識別挑戰賽中達到SOTA結果。語音識別方面,介紹了語音識別在直播場景中的應用,并三次技術方案升級,從TDNN-F混合框架到Fast-Conformer-CTC。直播智能剪輯方面,介紹了直播剪輯的方案和效果展示,包括才藝表演檢測、音效檢測、講解檢測、高能片段檢測等。最后,介紹了智能變聲技術,實現端上實時變聲,并展示了變聲效果。
"快手直播AI語音技術探秘" "直播生態中的AI語音創新應用" "智能變聲技術如何改變直播體驗"
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站