《聲音基礎模型如何推動聲音理解和生成-王育軍.pdf》由會員分享,可在線閱讀,更多相關《聲音基礎模型如何推動聲音理解和生成-王育軍.pdf(28頁珍藏版)》請在三個皮匠報告上搜索。
1、小米的聲音世界-聲音基礎模型推動聲音理解和生成小米技術委員會AI實驗室/王育軍摘要摘要小米為什么做AI聲學語音AI聲學語音的技術和應用聲音基礎模型賦能聲學語音2023360小米為什么做人工智能小米為什么做人工智能(軟件+硬件)AI人車家全生態汽車 手機 X AIoT智能手機銷量全球智能手機銷量全球Top3Top3AIoTAIoT把業務技術裝在把業務技術裝在AIAI的籃子里的籃子里聲學語音算法體系聲學語音算法體系小愛同學語音交互小愛同學語音交互1.36億2億6億79品類5829款拾音降噪拾音降噪拾音降噪拾音降噪聲音情境感知聲音情境感知視覺摳音視覺摳音跨設備聲紋跨設備聲紋聆聽聆聽個性化語音識別技術
2、提升言個性化語音識別技術提升言語障礙用戶體驗語障礙用戶體驗20202020小米黑客馬拉松冠軍小米黑客馬拉松冠軍語音生成語音生成雷總語音祝福雷總語音祝福這一次,雷總喊出了18w+18w+米粉的名字聲音基礎模型聲音基礎模型CEDCEDXiaomi DashengDeep Audio Signal Holistic Embeddings1.2B27萬小時Xiaomi DashengDeep Audio Signal Holistic Embeddings把把AIAI裝到大模型的籃子里裝到大模型的籃子里DashengDasheng的應用的應用 SCARSCARSound Component Analysis&Reconstruction相冊聲音橡皮擦原始視頻提取人聲提取環境音大模型語音合成大模型語音合成Unified ModelUnified Model