1、機器閱讀在智能銀行中的應用深度剖析與實踐上下求索:智能銀行建設的痛點與思考鉤深極奧:機器閱讀介紹與剖析遍地開花:落地實現,案例剖析與展望010203互聯網銀行的挑戰全國執業,沒有網點依賴流量,客戶增長快業務迭代快快快數據增長快快快制度,流程繁多人力不足,傳統人效低互聯網銀行強監管合規金融業務復雜智能銀行趨勢銀行1.0銀行2.0銀行3.0銀行4.0網點人工服務自助機具服務電子銀行服務智能銀行服務受到時間、空間限制打破使用時間約束打破時間、空間約束擺脫固定入口,全面脫媒征信服務賬戶服務理財服務支付服務銀行客戶客戶對金融服務的本質需求從未改變,只是使用“摩擦”隨著科技發展越來越小。銀行4.0:開放、
2、智能的時代語音是未來十年最重要的交互入口當前近30%的手機搜索由語音完成,到2020年,比例將達50%50%80%約80%的受訪問用戶認為通過語音方式進行線上購物體驗令人滿意52%超過52%亞馬遜智能語音設備的所有者每日都會使用這些設備1億亞馬遜在3年內售出了超過1億臺配備智能語音系統Alexa-equipped的設備5G+AI+IoT=愿景:基于自然語言的動態銀行用戶各種終端金融,生活,辦公場景賬戶管理資產管理交易支付商務辦公客服出行智能應用銀行金融能力智能報表智能輔助決策智能審計合規智能商務辦公智能客服智能核身智能業務辦理智能反欺詐賬戶能力資金能力支付能力風控能力金融大腦從類腦認知科學演化
3、智能大腦架構感知認知執行(聽)語言(看)圖形圖像(觸)傳感信號(說)語言(干)動手理解決策可交互-類腦-架構InteractableBrain-LikeArchitecture自然語言處理圖形圖像深度學習知識圖譜非結構化數據結構化數據微智能+AI服務交付個性化感知認知執行Interaction交互Action執行Brain-Like類腦思考IBA架構API+Data系統對話+視覺用戶端到端的智能交付才是王道系統執行(認知)類腦思考(認知)類腦交互(認知)感官交互(感知)機器對話理解意圖理解意圖轉化多輪對話自然語言生成機器寫作對話回復生成智能調用智能API調用智能服務調度智能WebWebJS動作
4、渲染機器視覺圖形圖像識別人臉識別智能語音語音識別語音合成聲紋識別智能問答一問一答結構化知識問答閑聊問答自主決策現實認知主動推薦自主學習自主演進學習對抗學習交互(I)思考(B)執行(A)+=完整智能體驗用戶系統數據輔助決策智能報表數據洞察機器閱讀語義提取語義分類文本比對機器閱讀在智能銀行中的應用深度剖析與實踐上下求索:智能銀行建設的痛點與思考鉤深極奧:機器閱讀介紹與剖析遍地開花:落地實現,案例剖析與展望010203QA,NLU,機器閱讀?差異可以問答形式提供服務文本文本信息提取,分類,比對模型構建問答模型機器閱讀QA問答形式提供服務結構化數據、文本、半結構化表格差異相同差異對自然語言的理解針對長
5、文本(書面)文本信息提取,分類,比對模型比較短語語義相似度機器閱讀NLU對自然語言的理解針對短語(非書面)差異相同a=q-f(D,A)答案提問文章候選答案面向場景的能力分類語義提取01語義分類02文本比對03機器閱讀=面向交付的智能應用能力語義提?。航榻B按某種業務理解的關注點,從大段文本中自動提取目標語句(段,句子等)大段文本關注點目標語句用戶AI系統結構分析特征理解語句提取用戶語義提?。涸韥碜跃W絡一維匹配模型二維匹配模型問題的整體語義編碼問題的每個詞語義編碼文檔向量化處理問題向量化處理特征理解的匹配加入深層網絡的推理優點實現成熟,結構清晰數據充足時,準確率高泛化能力強,與領域幾乎無關適用場
6、景文檔數據充足問題明確限制數據量少時,效果不佳文檔數據分布影響效果語義提?。涸?2)結構分析引入結構分析的半自動模型學習數據分布的分類業務A模型基礎模型A(一維匹配).業務N模型基礎模型C(二維匹配)基礎模型B(一維匹配).預訓練基礎模型擇優選取增量訓練生產業務模型文檔數據分布特征語義分類:介紹按業務理解的一組分類語義標簽,將多個文本按其語義歸類到對應的1個或多個標簽多個文本打上標簽的文本用戶AI系統維度分析特征理解打標簽用戶語義分類:方法一來自網絡基于LSTM+Attention向量化處理DL分類器優點實現簡單,結構清晰支持單分類,多分類泛化效果良好適用場景每個分類標簽的數據充足分類標簽分
7、布均勻限制數據量較少(某些標簽可能就12條數據)分類標簽分布不均勻語義分類:方法二基于數據增廣+弱分類器AdaBoost來自網絡NL數據增廣弱分類器向量數據增廣優點具備可解釋性支持單分類,多分類數據量少適用適用場景每個分類標簽的數據較少分類標簽分布不均衡限制與數據分布相關,對單個弱分類器泛化較弱與數據增廣效果相關動態生成弱分類器的性能隨機同義詞替換隨機同義詞插入隨機交換隨機刪除不均衡數據抽樣Adasyn等語義分類:模型路由數據增廣+弱分類器LSTM+Attention維度分析數據維度模式基于數據維度分析的模型選擇業務A模型基礎模型(增廣弱分類器).業務N模型基礎模型(LSTM+Att)生產+訓
8、練數據分布均衡性量級等根據維度模型選擇基礎模型文本比對:介紹將兩個認為是相同業務含義的文本進行比較,提取其結構,措辭,語義的差異并解釋兩個文本差異描述用戶AI系統結構比對措辭比對語義比對用戶文本比對:原理結構比對措辭比對語義比對文本段句切分句向量處理句向量聚類段句文檔定位句分詞(去停用詞)詞文檔定位詞向量處理詞向量聚類文本相似度段句自然語序的差異文檔中有多少處相似句子的表達句中詞的自然語序的差異文檔中有多少處相似詞(語境無關)的表達相同文檔定位的句/詞語義的是否一致以及語義差異程度機器閱讀在智能銀行中的應用深度剖析與實踐上下求索:智能銀行建設的痛點與思考鉤深極奧:機器閱讀介紹與剖析遍地開花:落
9、地實現,案例剖析與展望010203面向場景的應用型AI能力實現AI模型AI工程化+模型管理模型訓練微服務化面向開發類腦思考(B)交互(I)執行(A)用戶智能訓練工程師智能應用開發工程師語義提取語義分類文本比對IBA架構算法工程師IBA框架開發工程師IBA架構的實現:訓練與管理Brain-Like類腦思考服務Action執行服務算法工程師智能應用開發工程師機器閱讀能力語義提取語義分類文本比對模型倉庫業務指令(機器閱讀能力)研發模型路由智能訓練工程師訓練開發業務A模型基礎模型.業務N模型業務A執行邏輯執行路由業務N執行邏輯.模型代碼模型資源業務N-參數文件業務N-模型文件生產調用低頻最高頻高頻屏蔽
10、模型開發復雜性屏蔽算法理解復雜性IBA架構的實現:微服務化運行Interaction交互服務Action執行服務Brain-Like類腦思考服務對話式任務意圖理解意圖轉化多輪對話智能WebWebJS動作渲染智能語音語音識別語音合成Chat服務交互Channel路由模型倉庫發消息收消息JS執行插件發自然語言對話的音頻文件或待處理文本接收WebJS的JSON數據,執行JS執行插件,展示結果完成意圖識別,并完成ChatOps指令和參數的生成調用語音識別獲得識別自然語言調用語音合成獲得語音播放文件根據ChatOps指令調用對應能力以及該能力對應業務的模型資源x將處理結果轉化成WebJS的JSON數據,
11、通過交互服務返回給前端機器閱讀語義提取語義分類文本比對用戶待處理文本比對源(僅比對)提取源(僅提取)根據能力與業務從模型倉庫加載指定模型爬蟲爬蟲是提取和比對的常見來源系統直接從業務系統調取文本數據案例:智能合同比對效果比對效率大幅提升(50倍+)低遺漏率(3%)低誤識率大幅釋放人力成本業務目標銀行IT建設會涉及供應商合同(如軟件委托研發合同等),根據合規需要,同時電子合同和紙制合同,且需完全一致要避免逆流程,違規,無效的合同條款。使用能力文本比對語義分類該能力輸出兩份合同的結構,措辭,語義的差異部分該能力將差異部分按語義按約束類型,風險級別等進行分類,為合同管理提供依據案例:金融產品咨詢效果全
12、新產品周級交付同步更新0訓練高準確率(85%+)大幅度釋放人力成本業務目標金融產品往往因為業務,政策,合規等需要,經常性更新其內容,而傳統客服往往依賴人工更新,效率低且不及時,致使客戶無法及時獲得信息,銀行也可能因為客戶投訴面臨風險使用能力語義提取語義分類智能問答產品團隊更新產品說明書,該能力提取核心產品關注點該能力根據產品描述,對產品進行業務領域分類,為產品管理提供依據(不同領域產品管理的差異)將用戶提問提取特征,從語義提取結果中找到最優答案案例:處罰風險參考評估效果效率大幅提升(100倍+)高準確率(96%+)大幅釋放人力成本及時提供避險依據業務目標銀保監會會定期公布對全國的銀行,保險公司
13、的處罰決定。對于強監管的企業而言,這些處罰決定就是風險尺,及時理解是十分必要的。但傳統上依賴審計人員解讀,而對產品團隊而言往往缺乏認知實現罰單信息的提取,并自動按處罰風險依據分類,同時為產品團隊提供風險評估參考使用能力語義分類智能報表該能力根據罰單多個維度的語義信息,按處罰風險依據進行分類(可能有上百分類標簽)該能力根據用戶的統計需求,對罰單的多個維度信息(包括分類標簽)進行統計,提供評估參考依據智能問答該能力根據用戶提問,回復罰單相關的內容案例:輔助IT治理效果效率大幅提升(20倍+)高準確率(90%+)大幅釋放人力成本業務目標1.科技預算的分配和使用,項目關系等往往依賴專家經驗來盤點2.運
14、維過程中大量生產問題的復盤,需要識別全行關鍵或普適性問題3.架構方案評審往往依賴專家經驗,專家往往是瓶頸,輔助專家完成初步評審并給出建議使用能力語義提取智能報表1.從科技預算規劃/各種單據中提取信息2.該能力從架構方案中,提取架構關注點3.該能力從生產問題提取問題關注點1.該能力提供對科技預算的各種維度統計2.該能力對生產問題按多個維度提供報表3.該能力對架構方案關注點提供統計結果語義分類1.對科技預算按項目,類型等進行分類2.該能力將生產問題按業務,技術等維度進行分類3.該能力對架構關注點按優劣,錯誤等進行分類NEXT:智能的AI能力編排智能合同比對文本比對語義分類AI能力之間連接=更加智能
15、的應用風控點管理語義提取智能問答金融產品咨詢語義提取語義分類處罰風險評估語義分類智能問答輔助IT治理語義提取語義分類智能報表智能問答智能報表智能報表編排邏輯(人工編碼)智能應用開發工程師編排邏輯(算法編排)AI系統?多個AI能力組合連接方能交付應用價值NEXT:降低應用型AI門檻系統執行(認知)類腦思考(認知)類腦交互(認知)感官交互(感知)機器對話理解意圖理解意圖轉化多輪對話自然語言生成機器寫作對話回復生成智能調用智能API調用智能服務調度智能WebWebJS動作渲染機器視覺圖形圖像識別人臉識別智能語音語音識別語音合成聲紋識別智能問答一問一答結構化知識問答閑聊問答自主決策現實認知主動推薦自主學習自主演進學習對抗學習數據輔助決策智能報表數據洞察機器閱讀語義提取語義分類文本比對Thank you!