《阿里智能助理在電商領域的架構構建與實踐(36頁).pdf》由會員分享,可在線閱讀,更多相關《阿里智能助理在電商領域的架構構建與實踐(36頁).pdf(36頁珍藏版)》請在三個皮匠報告上搜索。
1、-在電商領域的架構構建與實踐-陳海青(海青)-阿里集團客戶體驗事業群-智能創新中心基于機器學習的阿里智能助理一、阿里小蜜平臺介紹二、智能人機交互構建技術實踐三、挑戰與未來目 錄content一、阿里小蜜平臺介紹二、智能人機交互構建技術實踐三、挑戰與未來目 錄content背景1從傳統搜索到問答,帶來擬人化體驗的提升2帶來行業模式的變化,應用領域成本的降低3人工智能的熱點領域之一,未來的入口級領域,各大公司競爭激烈基于阿里海量消費數據,結合線上、線下的生活場景需求,以智能+人工的模式提供智能導購、服務、助理的業務體驗電商領域的平臺化開放商家開放-千牛平臺企業開放-釘釘平臺電商領域的私人助理實踐-
2、阿里小蜜阿里小蜜圖片大小統一店小蜜企業釘小蜜阿里小蜜及平臺輸出展示阿里小蜜整體結構體系路由規則意圖識別客戶模型圖像識別語音識別文本模型多輪交互推薦預測多模交互多終端多場景客服領域客服領域客服規則導購領域導購人工導購規則助手領域助手人工助手規則阿里小蜜千牛店小蜜釘釘企業小蜜阿里云服務導購物流聊天其他智能路由圖像識別多輪交互語音識別文本模型用戶模型多模交互推薦預測知識圖譜數據回流多維度數據分析數據挖掘/離線模型機器學習訓練輸出平臺服務層技術層數據層阿里小蜜平臺一、阿里小蜜平臺介紹二、智能人機交互構建技術實踐三、挑戰與未來目 錄content語音識別(ASR)自然語言理解(NLU)智能人機交互的基本
3、技術流程對話管理(DM)文本轉語音(TTS)自然語言生成(NLG)語音輸入文本語義表示語義表示文本語音輸出上下文上下文智能人機交互分層策略語義意圖面向目標非面向目標問答型任務型語聊型明確意圖隱式意圖語義意圖識別:目標和非目標任務的細分意圖的明確與推理匹配面向3類業務劃分并建立技術體系:問答型:“密碼忘記怎么辦?”任務型:“我想訂一張明天從北京到杭州的機票”語聊型:“我心情不好”語義意圖結合傳統機器學習算法以及深度學習算法的語義意圖識別方法語義意圖識別的基本技術流程Query+Context分詞詞性標注以及NER意圖識別分類對話管理系統意圖語義表示意圖屬性抽取上下文模型領域數據模型意圖識別分類多
4、分類模型(有監督的分類算法,依據具體場景進行選型BayesKnn最大熵):適用于相對簡單場景且分類數穩定領域二分類模型(按照意圖領域做成多個二分類模型 SVM):適用于領域分類相對獨立,并且經常需要新增修改的場景,能做到相互獨立傳統機器學習深度學習深度學習多分類模型(CNNDNNLSTM):適用于較大數據量積累場景結合用戶行為特征的深度學習意圖預測模型:由于文本缺失、不明確或者不完整的情況下,增加用戶行為特征進行意圖分類預測深度學習模型意圖數據積累初步建模 保證相關性用戶問句和知識點標題的相似度用戶問句和歷史問句的相似度保證相關性保證多樣性預留位置展示 保證多樣性隨機展示(均勻采樣)按歷史的知
5、識點使用頻次來推薦結合用戶行為特征的深度學習意圖預測模型用戶點擊數據用戶行為序列用戶相關特征Query+Context深度學習模型深度學習模型意圖識別方案采用阿里云飛天一部大規模機器學習平臺PAI進行模型訓練和在線預測PAI-Machine Learning Platform四種主流的問答匹配技術基于模板式匹配(Rule-Based)基于檢索的模型(Retrieval model)基于統計機器翻譯模型(SMT)基于深度學習模型(Deep Learning)1234分策略模塊技術選型根據不同分策略模塊分別進行技術選型:問答型:基于知識圖譜+傳統檢索模型的方式任務型:slots filling語聊
6、型:傳統檢索模型+Deep Learning方式問答型領域技術構建基于知識圖譜+傳統檢索模型的方式語義挖掘語 義 挖 掘同義語義挖掘詞和短語挖掘文本相似同義語義挖掘、相似詞挖掘、構造模式(pattern)相似詞挖掘主要是選取標簽中的業務詞作為種子,例如:通過Word2Vec擴展相近詞匯,用于詞語的歸一化同義語義挖掘旨在挖掘同義問法Pattern構造潛在語義分析聚類種子詞獲取深度挖掘模式匹配知識圖譜構建美妝時尚上下文語義算法組件在線語料百科數據社區問答淘寶問答開放數據客服聊天詞條數據垂直網站商品標題問答結構化標題答案來源標簽答案類型相關問題信息抽取問答挖掘表示理解檢索實體分析句子成分上下文挖掘新
7、詞發現詞關系挖掘同義相關上下文詞庫結構化標題答案來源標簽相關詞條相關問題行業詞庫問答服務開放服務主題過濾類目標題關鍵詞情感評價數據清洗分布式索引圖數據庫存儲語料平臺優化提升問答語料爬蟲抓取dump爬蟲抓取dumpIopen組件通過多數據源完成實體和結構化短句的挖掘與積累,并最終生成知識圖譜或可用語料構建完成的知識圖譜示例基于實體、核心語義、動作和知識點的關系知識圖譜構建的圖計算模型優點圖狀結構支持實體間的上下文與推理把核心知識的維護帶給業務的成本降低到最小,不需要維護復雜相似問法,通過技術挖掘生成可擴展圖結構;精確匹配率相比之前的機器人匹配模型提升10%+,提升用戶體驗缺點模型構建初期會損失一
8、定的覆蓋率為保證精準度會提升檢索模型的閥值,目前檢索模型的匹配量占到全局匹配的5%-10%提問處理模塊:1.文本預處理(指代消解)2.分詞處理(中、英、俄)3.Bi-Gram糾錯搜索召喚模塊:1.基于open search的檢索召回答案處理模塊:1.答案內容組裝渲染2.問答日志記錄計算模塊:1.相似度計算2.情感分析3.文本屬性識別索引模塊:1.語料索引構建結構化知識庫權重訓練模塊提問回答檢索計算模型(Retrieval Model)任務型領域技術構建slots filling任務型技術方案機票構建領域意圖樹(如右圖)通過slots filling的方式進行不斷判斷、填充、轉移和完結購買出發地
9、到達地時間任務型技術方案輸入:Query中slot屬性的抽取輸出:對話系統匹配響應結果處理過程:獲取意圖樹的屬性進行填充填槽之后判斷意圖樹中填寫狀態根據設定的狀態結果進行返回領域數據輸入對話系統Slots Filling上下文模型輸出語聊型領域技術構建傳統檢索模型+Deep Learning方式Seq2Seq模型語聊型技術方案Rerank Generation離線數據結果分策略技術構建體系語義意圖面向目標非面向目標問答型任務型語聊型明確意圖隱式意圖一、阿里小蜜平臺介紹二、智能人機交互構建技術實踐三、挑戰與未來目 錄content挑戰與未來目前智能人機交互機器人的智能程度還比較低,還有很長一段路要走在工業領域由于涉及的領域以及復雜度情況很多,需要進行不斷的細分并通過不同的方案來解決挑戰未來在技術領域知識體系的不斷構建完善,以及Deep Learning更好的結合與發展是未來一段時間的方向隨著學術和工業領域的不斷緊密結合,未來人機交互會在更多的場景被應用,并且會進一步提升