9-4NLP技術在短視頻場景中的應用實踐.pdf

編號:29704 PDF 25頁 1.76MB 下載積分:VIP專享
下載報告請您先登錄!

9-4NLP技術在短視頻場景中的應用實踐.pdf

1、YOUR LOGO NLP技術在短視頻場景中的 應用實踐 愛奇藝 苗艷軍 簡介 實體識別 實體鏈接 內容標簽 分享大綱 NLP 數據挖掘 分詞詞典情感詞典 同義詞典糾錯詞典 知識圖譜 中文詞法分析分詞詞性標注實體識別實體鏈接詞權重 NLP應用研發 內容標簽機器翻譯標題生成輿情分析標題相似度 深度語義表示詞標題文本封面圖視頻理解多模態 文本糾錯事件聚合查詢理解語音助手Query生成 隨刻推薦用戶畫像 廣告國際站 搜索 客服中心BI 知識付費樂高 審核平臺 支持業務 實體識別 實體識別 短視頻場景下實體類型 影視綜名、人名、音樂名、游戲名、角色名、 難點 歧義性大 實體詞與普通詞的歧義 電影:狙擊

2、手、英雄、功夫 電視?。籂攤儍?、懸崖 明星:黎明、寧靜 實體詞與實體詞的歧義 笑傲江湖(電視劇? 電影? 綜藝? 文學?) 訓練語料獲取困難 需兼顧模型效果和推理速度 綜藝 電視劇 電影 相聲 文學 實體識別 主流模型 CRF、BILSTM-CRF、BERT-CRF、 業務中的考量 訓練數據如何生成? 如何兼顧效果和速度? 日調用高峰10億以上 如何提升泛化能力? 新實體不斷出現 訓練數據構造 原則 盡量標注模型識別不夠好的句子 利用更多信息輔助文本標注 方法 基于搜索用戶點擊行為的實體標注 基于短視頻內容理解的實體標注 借助知識圖譜信息輔助標注 標題:笑傲江湖:令狐沖獨孤九劍一出,向問天都不

3、是對手,真是精彩! 視頻幀 OCR:笑傲江湖 2:東方不敗 電影 模型選擇:LSTM vs SRU = (+ ) x= = (+ ) = -1+ (1 ) = tanh() + (1 ) = (-1,+ ) = (-1,+ ) = (-1,+ ) = (-1,+ ) = tanh() = -1+ a) LSTM 可并行計算 b) SRU(Simple Recurrent Unit) 無法并行計算 x 1 x + x tanh -1 1- + x1- x tanh x + x tanh -1 -1 C 1,2,., = 實體識別模型:BISRU-CRF Embedding , , O O O OutputCRF Input Text w1 w2 w3 w4 wn-3 wn-2 wn-1 wn word O O O character sru-based O O O BISRUBISRU fe

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(9-4NLP技術在短視頻場景中的應用實踐.pdf)為本站 (X-iao) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站