(1)大規模多形態高性能采集技術:分布式鏈接實時消重技術、海量網頁文本實時消重技術、網頁正文智能抽取技術、網頁模板自動分類技術、靜態、動態網頁自適應采集技術、動態網頁自動采集技術,主要應用在大數據服務平臺的云監測、內容安全、云搜索等產品;互聯網內容服務平臺的統一信息資源庫產品
(2)基于平衡語料庫的文本智能分析技術:平衡語料庫自動構建技術、基于平衡語料庫的新詞、敏感規則自動發現以及關鍵詞自動抽取技術;主要應用在大數據服務平臺的云監測、內容安全、云搜索等產品;互聯網內容服務平臺的統一信息資源庫產品、內容管理系統等產
品
(3)大規?;ヂ摼W敏感信息實時監測技術:高效的文本敏感信息識別技術、基于局部上下文特征、依存關系與BERT驗證的錯別字監測技術、句子負面信息發現技術;主要應用在大數據服務平臺的云監測、內容安全、云搜索等產品;互聯網內容服務平臺的統一信息資源庫產品、內容管理系統等產品
(4)政務領域智能搜索技術:政務領域通用詞和特定網站關鍵詞的融合技術、智能化檢索技術;主要應用在大數據服務平臺云搜索產品
(5)集約化環境下數字內容全生命周期管理技術:基于動態網絡環境自適應的海量數據資源匯集技術、基于多元模型自適應的一體化混合型存儲技術、數字內容資源結構化提取、
多終端同步及高性能發布技術、全生命周期的安全控制技術、基于微服務架構的彈性可伸
縮平臺和開放接口技術;主要應用在互聯網內容服務平臺的內容管理系統、統一信息資源庫等產品
(6)一體化在線政務服務平臺的異構數據交換關鍵技術:基于版式智能文檔的數據交換技術、多源異構數據交匯技術;主要應用在互聯網內容服務平臺的統一信息資源庫、公共服務等產品
