1、初敏博士iDSTYunOS讓萬物跟人自由口語交互數據智能時代正在來臨語音識別(ASR)語音合成(TTS)聲紋識別/說話人識別/語種識別/情感識別數據價值發掘智能客服阿里通信視頻云ISV智能法庭語音技術促進行業變革深度學習算法和應用GPU多機多卡中間件語義分析與理解人機對話新一輪入口之爭YunOS手機互聯網汽車其他智能設備智能電視支付寶錢包APPs手機淘寶UC瀏覽器高德地圖狹義語音技術數據智能時代正在來臨自然交互(NUI)成為YunOS的基礎能力YunOS+阿里云,架起人與互聯網服務之間的橋梁Anytime,anywhere,any devices聲學建模技術持續進展各種端接入都能獲得一樣好的效
2、果場景復雜:噪聲/拾音距離/存在音樂及TTS播放干擾/單(多)麥克風錄音業務需求:多喚醒詞快捷喚醒/barge-in任意打斷/one-shot命令直達關鍵技術:KWS/AEC/AGC/VAD/中遠距離聲學模型/噪聲魯棒性本地引擎/云端協同2015.112016.12016.32016.8DNNBLSTMCER相對下降30%LSTMCER相對下降15%DNN+BLSTM解決“零三”問題語音識別核心技術持續提升訓練數據的規模、覆蓋面、新鮮度對模型的效果都有很大影響建立數據回流閉環實驗迭代效率決定最終的學習效果CPU cluster+GPU cluster 的混合模型訓練流程2萬小時語音一輪完整訓練
3、一周內完成數據規模和計算效率至關重要深度學習特征準備GMM-HMM模型訓練深度學習訓練區分度訓練特征準備區分性訓練模型離線測試模型上線和真實數據的采集數據篩選和標注將人的語言形式化成機器能理解的語言SVMCNNCNN用于語音分類BLSTM用于屬性抽取音樂導航高頻測試集效果對比RULEB-LSTM音樂導航中長尾測試集效果對比RULEB-LSTM領域/:圖分類屬性抽取?domain flight_ticket intent search_flight_ticket time 下周二destination /海 airline 國航?domain:flight_ticket,intent:searc
4、h_flight_ticket,slots:airline:?,time”:”?,destination:?深度學習提升自然語言理解能力Ontology驅動的in-domain對話導導航航天天氣氣控控制制電電臺臺音音樂樂跨domain的自由對話對話的打斷與恢復深度學習提升自然語言理解能力內部數內部數據據互聯網互聯網數據數據自自然然語語言言理理解解知識挖掘知識挖掘模型訓練模型訓練問問答答引引擎擎基于知識庫的問答基于知識庫的問答基于知識圖譜的問基于知識圖譜的問答答開放式聊天開放式聊天自助服務機器人 面向開發者的交互開發工具自定義新領域和數據查詢DM 引擎DM ExecutorXmlTask flo
5、w scriptAction&NLGDM XML ParserXmlJSXmlJSGFNLU 引擎JSGF InterpreterNormalizeOpen-Dialogue for Developers小云 for YunOS 手機案例分享小云 for YunOS 互聯網汽車案例分享Pepper powered by NUI platform案例分享 支付寶錢包應用/功能直達案例分享阿里小蜜(手機淘寶)案例分享 阿里云ET案例分享智能語音核心技術研發開發者平臺(SDKAPI)客戶端解決方案NUI servicesNUI 客戶端引擎和SDK語音硬件解決方案語音交互生態圈(合作伙伴)互聯網汽車智能手機智能電視智能音箱機器人其他智能設備NUI服務平臺語音識別語音合成語言理解和對話行業解決方案和產品(合作伙伴)服務智能化解決方案知識問答網上法庭解決方案視頻云語音解決方案個性化、場景化定制工具與合作伙伴共同成長