當前位置:首頁 > 報告詳情

5-1 騰訊文本理解系統 TexSmart 中的細粒度實體識別關鍵技術.pdf

上傳人: 云閑 編號:102340 2021-01-01 60頁 5.52MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要介紹了騰訊AI Lab高級研究員蔣海云關于文本理解系統TexSmart中的細粒度實體識別關鍵技術。TexSmart系統能夠對中文和英文兩種語言的文本進行詞法、句法和語義分析。細粒度實體識別是TexSmart系統的特色之一,支持上千種實體類型,類型之間具有層級結構。文章詳細介紹了基于知識庫的組合方法、基于相似實體推斷的遠程監督方法和基于多源融合的Zero-shot方法。其中,基于知識庫的組合方法通過無監督和有監督的組合方法預測細粒度的類別分布;基于相似實體推斷的遠程監督方法通過相似實體推斷解決歧義問題;基于多源融合的Zero-shot方法通過引入輔助信息,如上下文一致性、類型層級結構和背景知識,提高模型在零樣本情況下的細粒度實體識別性能。
騰訊AI Lab的TexSmart系統有哪些特色功能? 細粒度命名實體識別(NER)在實際應用中面臨哪些挑戰? 基于多源融合的零樣本細粒度實體識別方法有哪些創新點?
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站