《拓爾思-深度報告:語義智能領軍者大數據+AI雙輪驅動打開公司廣闊空間-221129(41頁).pdf》由會員分享,可在線閱讀,更多相關《拓爾思-深度報告:語義智能領軍者大數據+AI雙輪驅動打開公司廣闊空間-221129(41頁).pdf(41頁珍藏版)》請在三個皮匠報告上搜索。
1、證券研究報告|深度報告|軟件開發 http:/ 1/41 請務必閱讀正文之后的免責條款部分 拓爾思(300229)報告日期:2022 年 11 月 29 日 語義智能領軍者,大數據語義智能領軍者,大數據+AI 雙輪驅動打開公司廣闊成長空間雙輪驅動打開公司廣闊成長空間 拓爾思拓爾思深度報告深度報告 投資要點投資要點 公司是國內最早從事自然語言處理(公司是國內最早從事自然語言處理(NLP)技術研發的企業,在語義智能領域)技術研發的企業,在語義智能領域具備深厚技術積累,形成大數據、人工智能、網絡安全三大核心業務。公司經具備深厚技術積累,形成大數據、人工智能、網絡安全三大核心業務。公司經過多年的商業化
2、探索,應用場景從政府、公安,向金融、知識產權等多領域延過多年的商業化探索,應用場景從政府、公安,向金融、知識產權等多領域延伸,并且未來在虛擬人、人形機器人領域伸,并且未來在虛擬人、人形機器人領域應用前景廣闊。對標國外搜索引擎數應用前景廣闊。對標國外搜索引擎數據庫龍頭據庫龍頭 Elasticsearch 和知識圖譜服務廠商龍頭和知識圖譜服務廠商龍頭 Palantir,我們認為公司在信創,我們認為公司在信創浪潮驅動下,有望保持業務快速增長,并通過業務場景延伸打開成長空間。浪潮驅動下,有望保持業務快速增長,并通過業務場景延伸打開成長空間。對標對標 Elasticsearch,公司搜索引擎數據庫有望加
3、速國產替代,公司搜索引擎數據庫有望加速國產替代 大數據時代下,對半/非結構化數據的檢索和分析需求加速成長,傳統的關系型數據庫難以滿足通用/專業信息檢索需求,搜索引擎數據庫應用優勢突顯,全球潛在市場空間約 450億美元,核心市場規模達 80億美元。對標國外搜索引擎數據庫龍頭 Elasticsearch,公司自主研發海貝大數據管理系統核心代碼自主率達到100%,可實現國外產品的平滑替代,完全滿足信創需求并且在中文全文檢索具備顯著優勢。知識圖譜引導認知智能發展,對標知識圖譜引導認知智能發展,對標 Palantir 公司成長空間廣闊公司成長空間廣闊 知識圖譜以 NLP 為核心技術,旨在將多模態信息數據
4、進行挖掘后以知識形態進行存儲,賦予 AI 認知理解和自主推理決策的功能,被認為是實現強人工智能的關鍵技術。對標國外龍頭廠商 Palantir,公司人工智能產品結合大數據技術支撐,在金融、公安、政府等多領域應用前景廣闊,伴隨 AI 商業化進程的加速,未來相關業務有望實現加速成長。公司業務場景持續延伸,產品公司業務場景持續延伸,產品 SaaS 化進程推動業務成長化進程推動業務成長 NLP 及知識圖譜技術在虛擬人、人形機器人領域應用前景廣闊,公司積極布局技術研發,與國內外頭部廠商形成深度合作,未來有望帶來業務新增量;公司持續推進產品 SaaS化轉型,近年來云和數據服務收入占比持續升高,驅動公司產品盈
5、利能力的不斷提升。盈利預測與估值盈利預測與估值 我們預計公司 2022-2024 年實現營業收入分別為 13.11/16.45/20.40 億元,同比增長分別為 27.41%/25.48%/24.02%;對應歸母凈利潤分別為 3.15/4.01/5.14 億元,同比增速分別為 28.24%/27.32%/28.04%,對應 EPS為 0.44/0.56/0.72 元,對應 PE分別為 27.76/21.80/17.03 倍。首次覆蓋予以“買入”評級。風險提示風險提示 1、行業競爭加劇帶來的風險;2、新業務開拓進展不及預期帶來的風險;3、宏觀經濟下行導致業務波動帶來的風險。投資評級投資評級:買入
6、買入(首次首次)分析師:程兵分析師:程兵 執業證書號:S1230522020002 基本數據基本數據 收盤價¥12.24 總市值(百萬元)8,748.98 總股本(百萬股)714.79 股票走勢圖股票走勢圖 相關報告相關報告 財務摘要財務摘要 Table_Forcast(百萬元)2021A 2022E 2023E 2024E 營業收入 1028.71 1310.64 1644.57 2039.58(+/-)(%)-21.44%27.41%25.48%24.02%歸母凈利潤 245.75 315.15 401.25 513.77(+/-)(%)-34.57%28.24%27.32%28.04%每
7、股收益(元)0.34 0.44 0.56 0.72 P/E 35.60 27.76 21.80 17.03 資料來源:浙商證券研究所 -31%-13%6%24%42%61%21/1122/0122/0222/0322/0422/0522/0622/0722/0822/0922/1022/11拓爾思深證成指拓爾思(300229)深度報告 http:/ 2/41 請務必閱讀正文之后的免責條款部分 投資案件投資案件 我們與市場的觀點的差異我們與市場的觀點的差異(1)市場普遍對于公司搜索引擎數據庫的產品性能及國產化替代前景保持懷疑態度,我們認為公司目前是國內搜索引擎數據庫的領軍者,有能力打破市場擔憂。
8、目前公司搜索引擎數據庫已實現核心技術全部自主可控,并且可以實現海外產品的平滑替代,產品性能優勢顯著、客戶置換成本低疊加國家對數據安全可靠的要求不斷提升,未來公司大數據產品及服務業務完全有望進入加速成長階段。(2)市場對于公司以語義智能為核心的人工智能產品服務應用前景保持懷疑態度,我們認為隨著 AI 商業化進程加速,公司未來將會成為強人工智能時代 AI 商業化的強有力競爭者。不同于語音智能,公司深耕語義智能賽道,融合了信息挖掘、知識存儲等技術,均是未來元宇宙(虛擬人)、人形機器人等領域的核心技術,目前公司已經與相關賽道頭部廠商建立深度合作,未來人工智能業務有望實現加速成長。股價上漲的催股價上漲的
9、催化因素化因素 搜索引擎數據庫國產替代政策出臺推動行業發展加速,搜索引擎數據庫國產替代政策出臺推動行業發展加速,公司在大數據搜索引擎領域技術優勢顯著,可平滑替代海外龍頭產品,2022年 11 月 17日中國信通院召開國內首次“搜索型數據庫”技術研討會,標志著我國對搜索引擎數據庫國產替代關注度提升,未來相關政策出臺有望推動行業加速發展,公司大數據產品服務在政府、公安、金融等領域已有成熟應用和高粘客戶積累,未來有望受益政策加速成長。語義語義智能智能產品產品發布發布及及應用場景應用場景持續持續延伸延伸,公司深耕語義智能賽道,NLP技術被認為是人工智能“皇冠上的明珠”,目前公司相關產品服務已在政務、公
10、安、互聯網等領域有成熟應用,未來公司業務有望隨著 AI 商業化進程和下游需求的擴張,產品服務延伸到知識產權、虛擬人、機器人等領域,打開公司成長空間。風險提示風險提示 行業競爭加劇帶來的風險:行業競爭加劇帶來的風險:政務、金融等信息化分為多個細分領域,細分領域競爭有加劇的可能;另外公司向其他行業滲透將面對細分領域已有競爭者的競爭。新業務開拓進展不及預期帶來的風險:新業務開拓進展不及預期帶來的風險:公司在專利檢索、虛擬人、機器人等創新業務均有開展,而且在行業內也屬于率先開拓相關業務的探索者。未來業務拓展中可能遇到困難,導致業務拓展進度存在不確定性。宏觀經濟下行導致業務波動帶來的風險:宏觀經濟下行導
11、致業務波動帶來的風險:公司業務產品與下游政府及商業客戶的戰略轉型規劃關系較為緊密,宏觀經濟下行可能導致企業自身財力受影響或政府在大數據、人工智能方面預算縮緊,導致下游景氣度提升緩慢,未來仍有波動可能。EZhV8VqUiZlXnPoMoM7NdN8OnPoOtRpNiNmNoMfQnNnQ7NqQzQxNmNnRNZoNtP拓爾思(300229)深度報告 http:/ 3/41 請務必閱讀正文之后的免責條款部分 正文目錄正文目錄 1 對標對標 Elasticsearch,公司搜索引擎數據庫有望加速國產替代,公司搜索引擎數據庫有望加速國產替代.6 1.1 大數據時代,搜索引擎數據庫邁入快速發展階段
12、.6 1.1.1 搜索引擎數據庫專注信息檢索,解決大數據時代信息復雜關聯問題.6 1.1.2 搜索引擎以全文檢索技術為核心,未來滿足多樣化應用需求.7 1.2 美國 Elasticsearch 為搜索引擎數據庫龍頭,應用場景豐富.9 1.3 搜索引擎數據庫國產替代進程加速,公司行業積累深厚產品優勢顯著.11 1.3.1 數據安全要求加速數據庫國產替代,公司 G 端客戶比例較高有望率先受益.11 1.3.2 公司實現搜索引擎數據庫核心技術自主可控,滿足信創和國產化替換需求.12 1.4 公司持續延伸大數據業務新場景,知識產權業務有望貢獻新增量.14 1.4.1 專利處理需求快速成長創造專利代理市
13、場廣闊空間,NLP 技術應用前景可期.14 1.4.2 公司布局專利搜索引擎賽道,基因專利檢索云服務平臺有望賦能行業效率提升.16 2 知識圖譜引導認知智能發展,對標知識圖譜引導認知智能發展,對標 Palantir 公司成長空間廣闊公司成長空間廣闊.17 2.1 堅持“語義智能+”為核心戰略,公司 AI 產品應用空間廣闊.17 2.2 對標美國 Palantir,從市場規模和產品邊際貢獻率出發看公司成長空間.17 2.2.1 業務從 G 端向 B 端延伸,穩步發展成為知識圖譜領域獨角獸.17 2.2.2 營收規模持續成長,邊際貢獻率升高彰顯產品化能力.20 2.2.3 業務潛在規模廣闊,政府+
14、商業端客戶雙輪驅動打開成長空間.21 2.3 知識圖譜應用領域廣泛,有助于公司提高核心競爭力.22 2.3.1 知識圖譜應用前景廣闊,市場有望迎來加速發展.22 2.3.2 公司人工智能產品持續迭代提升,成為政府、金融等多行業決策大腦.24 3 公司業務場景持續延伸,產品公司業務場景持續延伸,產品 SaaS 化進程推動業務成長化進程推動業務成長.26 3.1 虛擬人作為元宇宙核心角色,公司深度布局虛擬人“靈魂”.26 3.2 人形機器人風起,公司聯手賽道頭部玩家入局有望受益行業發展.29 3.3 云和數據服務轉型加速,SaaS 化進程加速有望助力公司提升盈利能力.31 4 拓爾思,三十年耕耘成
15、就語義智能領軍者拓爾思,三十年耕耘成就語義智能領軍者.33 4.1 深耕語義智能賽道,打造完整業務版圖.33 4.2 公司股權結構穩定,核心團隊經驗優勢豐富,研發實力雄厚.34 4.3 公司營收穩健成長,費用結構合理,發展步伐堅定.35 4.4 公司覆蓋多行業優質客戶,現金流保持健康.36 5 盈利預測與估值盈利預測與估值.37 5.1 盈利預測.37 5.2 投資建議與估值.38 6 風險提示風險提示.39 拓爾思(300229)深度報告 http:/ 4/41 請務必閱讀正文之后的免責條款部分 圖表目錄圖表目錄 圖 1:搜索引擎分布式索引哈希分片過程圖.6 圖 2:全文搜索引擎工作原理.7
16、 圖 3:全文檢索系統的基本結構與功能.7 圖 4:2022 年全球搜索引擎數據庫各細分市場規模(單位:億美元).8 圖 5:Elasticsearch 產品應用場景.9 圖 6:半/非非結構化數據量爆發式成長.9 圖 7:阿里云 Elasticsearch 日志數據查詢界面.10 圖 8:Elastic 監測工具 Kibina 界面.10 圖 9:2021 年公司營業收入分行業占比結構.12 圖 10:2021年中國智能語音語義市場份額.12 圖 11:2022-2030 年中國 NLP 市場規模與增長預測.12 圖 12:中國專利申請量持續高速增長.14 圖 13:2011-2022 年中
17、國知識產權代理市場規模統計及預測.15 圖 14:中國專利代理機構數量快速增長.15 圖 15:各行業對專利提供“研發情報價值”態度.15 圖 16:弱人工智能和強人工智能的對比.17 圖 17:Palantir 公司發展歷程.18 圖 18:Palantir 2018-2022H1 營業收入及毛利率.20 圖 19:Palantir2018-2022H1 毛利率.20 圖 20:2019Q1-2022Q3 Palantir 產品邊際貢獻率.21 圖 21:拓爾思營業收入剔除營業成本及銷售費用后余值占比.21 圖 22:Palamtir 產品潛在市場規模(TAM)結構(2020 年).21 圖
18、 23:Palantir 政府及商業業務收入結構.21 圖 24:2021 年中國知識圖譜市場行業結構.23 圖 25:20192026 年中國知識圖譜核心市場規模及預測.23 圖 26:2019-2026年中國按行業分知識圖譜核心市場規模增長趨勢(單位:億元).24 圖 27:公司安拓知識圖譜平臺.24 圖 28:虛擬人整體市場規模趨勢及預測.27 圖 29:語義智能構成數字虛擬人“大腦”.28 圖 30:公司所處虛擬人產業鏈環節.28 圖 31:全球服務型機器人市場規模增長趨勢及預測.29 圖 32:我國服務型機器人市場規模增長趨勢及預測.29 圖 33:人形機器人人機交互模塊.29 圖
19、34:小米人形機器人 CyberOne 情緒感知模塊.30 圖 35:特斯拉機器人 AI 智能交互架構.30 圖 36:2018-2022H1 公司云和數據業務收入規模及占比.32 圖 37:2015-2023年中國 SaaS 行業市場規模及預測.32 圖 38:2011-2020 年中美兩國 SaaS 占 IT 投入比例.32 圖 39:公司產品矩陣.33 圖 40:公司發展歷程.33 圖 41:公司員工教育程度結構.35 圖 42:公司 2017-2022H1 營業收入情況.35 拓爾思(300229)深度報告 http:/ 5/41 請務必閱讀正文之后的免責條款部分 圖 43:公司 20
20、17-2022H1 歸母凈利潤情況.35 圖 44:公司 2018-2021 各項費率結構.36 圖 45:公司 2017-2022H1 毛利率、凈利率情況.36 圖 46:公司貨幣資金儲備(單位:百萬元).36 表 1:五類非關系型數據庫對比.6 表 2:全球數據庫使用度排名(截至 2022 年 11月).7 表 3:數據庫與搜索引擎的特點對比.10 表 4:我國數據安全相關政策梳理.11 表 5:公司擁有多款大數據相關產品.13 表 6:公司海貝大數據管理系統與 Elasticsearch 搜索引擎產品對比.13 表 7:公司海貝大數據管理系統特點.14 表 8:公司基因專利檢索云服務平臺
21、產品可實現多種功能服務.16 表 9:Palantir 行業拓展時間表.18 表 10:Palantir Gotham平臺應用工具.19 表 11:Palantir Foundry平臺應用工具.19 表 12:Palantir 產品核心競爭力梳理.20 表 13:Palantir 公司典型客戶與業務關系.22 表 14:知識圖譜主流產品形態梳理.23 表 15:公司水晶球分析師平臺產品優勢.25 表 16:近期全國部委及各省市元宇宙專項政策.26 表 17:虛擬人應用領域、場景及角色.27 表 18:公司虛擬人技術應用場景及客戶.28 表 19:公司 TRS 小思智能問答機器人功能及優勢亮點.
22、30 表 20:公司擁有多款 SaaS產品.31 表 21:公司前五大股東明細(截至 2022H1).34 表 22:公司主要子公司主營業務布局.34 表 23:公司主要行業客戶及覆蓋情況.36 表 24:可比公司估值分析(Palantir、Elasticsearch).38 表 25:可比公司估值分析(科大訊飛、美亞柏科).39 表附錄:三大報表預測值.40 拓爾思(300229)深度報告 http:/ 6/41 請務必閱讀正文之后的免責條款部分 1 對標對標 Elasticsearch,公司搜索引擎數據庫有望加速國產替代,公司搜索引擎數據庫有望加速國產替代 1.1 大數據時代,搜索引擎數據
23、庫邁入快速發展階段大數據時代,搜索引擎數據庫邁入快速發展階段 1.1.1 搜索引擎數據庫專注信息檢索,解決大數據時代信息復雜關聯問題搜索引擎數據庫專注信息檢索,解決大數據時代信息復雜關聯問題 搜索引擎數據庫是一類專門用于數據內容搜索的非關系數據庫。搜索引擎數據庫是一類專門用于數據內容搜索的非關系數據庫。搜索引擎數據庫使用索引對數據中的相似特征進行歸類,并提高搜索能力。搜索引擎數據庫經過優化,以處理可能很長、半結構化或非結構化的數據,它們通常提供專業的方法,例如全文搜索、復雜搜索表達式和搜索結果排名。表1:五類非關系型數據庫對比 分類分類 模型模型 優勢優勢 劣勢劣勢 典型系統典型系統 搜索引擎
24、數據庫搜索引擎數據庫 倒排索引倒排索引 可處理半結構化與非結可處理半結構化與非結構化數據,檢索效率構化數據,檢索效率高,且支持復雜查詢高,且支持復雜查詢 Solr、Elasticsearch、海貝大數據平臺海貝大數據平臺 鍵值數據庫 哈希表 查找速度快 數據無結構化,通常只被當做字符串或者二進制數據 Redis 列存儲數據庫 列式數據存儲 查找速度快;支持分布橫向擴展;數據壓縮率高 數據插入效率偏低,按行的數據操作性能受限 HBase 文檔型數據庫 鍵值對擴展 數據結構要求不嚴格;表結構可變;不需要預先定義表結構 查詢性能不高,缺乏統一的查詢語法 MongoDB、CouchDB 圖數據庫 圖結
25、構 針對關聯關系的建模、操作非常高效 對高度結構化的數據處理能力不如關系型數據庫 Neo4j、JanusGrapgh、Stellar DB 資料來源:清華大學人工智能研究院,浙商證券研究所整理 搜索引擎搜索引擎的的本質是根據用戶的輸入完成分詞匹配。本質是根據用戶的輸入完成分詞匹配。搜索是以 token 詞為最基本的搜索單元,一個搜索語句經過搜索引擎的分詞器會產生幾個 token,利用分詞去構建對應的倒排倒排索引索引,在用戶搜索的時候,搜索對應的分詞器分出的一個 token 時和索引中所存儲的一個分詞找到需要的文檔。這種索引方式不需要去遍歷所有的文檔,而只需要遍歷索引詞,即可以滿足對應的效果,大
26、大提高了搜索速度。圖1:搜索引擎分布式索引哈希分片過程圖 資料來源:一種智能搜索引擎的設計與實現,浙商證券研究所整理 目前國外廠商占據搜索引擎引擎數據庫行業領先地位。目前國外廠商占據搜索引擎引擎數據庫行業領先地位。目前全球范圍內主要全文搜索引擎有:Lucene、Elasticsearch、Splunk、Solr。其中 Lucene 是一個開放源代碼的全文檢索拓爾思(300229)深度報告 http:/ 7/41 請務必閱讀正文之后的免責條款部分 引擎工具包,不是一個完整的全文檢索引擎,而是一個全文檢索引擎的架構,ES和 Solr均基于此架構。根據 DB-Engines 的排名顯示,Elasti
27、csearch 自 2016 年至今始終是最受歡迎的企業搜索引擎,其次是 Splunk 和 Solr。表2:全球數據庫使用度排名(截至 2022年 11月)排名排名 廠商廠商 數據庫類型數據庫類型 得分得分 排名排名 廠商廠商 數據庫類型數據庫類型 得分得分 1 Oracle 關系型 1241.69 8 IBM Db2 關系型 149.56 2 MySQL 關系型 1205.54 9 Microsoft Access 關系型 135.03 3 Microsoft SQL Server 關系型 912.51 10 SQLite 關系型 134.63 4 PostgreSQL 關系型 623.16
28、 14 Splunk 搜索引擎 94.23 5 MongoDB 分布式文件存儲 477.90 24 Solr 搜索引擎 51.33 6 Redis 鍵值數據庫 182.05 48 OpenSearch 搜索引擎 10.30 7 Elasticsearch 搜索引擎搜索引擎 150.32 57 Algolia 搜索引擎 7.83 資料來源:DB-Engines,浙商證券研究所整理 1.1.2 搜索引擎以全文檢索技術搜索引擎以全文檢索技術為核心,未來滿足多樣化應用需求為核心,未來滿足多樣化應用需求 全文檢索技術是搜索引擎數據庫的技術源頭。全文檢索技術是搜索引擎數據庫的技術源頭。計算機的索引程序通過
29、掃描源文本中的每一個詞,對每個詞構建索引,并指出該詞在源文本中出現的次數和出現的位置,當用戶檢索數據時,計算機檢索程序對預先構建好的索引文件來進行查找,并把檢索的結果反饋給用戶的檢索方式。全文檢索的核心技術通常包括索引建立和索引檢索兩個功能:(1)索引索引建立:建立:索引是指掃描源文檔后建立索引文件。首先將不同格式的文檔數據進行格式化,抽取其中的文本文件,然后把每一個不同的字符都保存為一個字表,并且記錄下相同的字在文檔中出現的所有位置。(2)檢索檢索檢索:檢索:指基于預先構建的索引文件的位置匹配。全文搜索引擎通常由五部分組成全文搜索引擎通常由五部分組成:數據采集數據采集、數據處理數據處理、數據
30、索引、數據搜索和用戶數據索引、數據搜索和用戶接口。接口。在結構方面,全文檢索系統的核心應該具備文本分析引擎、索引引擎、查詢引擎、對外接口和外層應用系統。在功能方面,全文檢索系統應該具備索引建立、增量索引、索引優化、查詢結果返回等功能,外層則應有各種不同的應用。圖2:全文搜索引擎工作原理 圖3:全文檢索系統的基本結構與功能 資料來源:大數據搜索引擎原理分析,浙商證券研究所整理 資料來源:大數據搜索引擎原理分析,浙商證券研究所整理 拓爾思(300229)深度報告 http:/ 8/41 請務必閱讀正文之后的免責條款部分 目前全文檢索技術主要發展方向體現在以下幾個方面目前全文檢索技術主要發展方向體現
31、在以下幾個方面:(1)智能檢索:智能檢索:傳統的全文檢索是基于關鍵詞進行匹配,常出現查全率和查準率不高的問題。在信息量呈爆炸式增長的大數據時代,利用關鍵詞匹配的全文檢索存在很大的局限性。智能檢索技術中,除了分詞詞典外還包括同音詞典、同義詞典、相關級詞典等,能夠形成一個較完整的概念網絡和知識體系,提供較為智能的知識提示。(2)數據挖掘同信息檢索技術相結合:數據挖掘同信息檢索技術相結合:數據挖掘則主要包括分類、聚類自動摘要和相似性查詢等方面,幫助用戶更好地發現、組織和表示信息,通過提取知識來滿足更高層次的檢索需求。自動摘要技術可自動地從原始文獻中摘取文章摘要,幫助用戶快速對檢索結果進行相關度評價;
32、相似性檢索根據文檔內容特征來對與之相關或者相似的文檔進行檢索,可用于去重分析和用戶個性化反饋。(3)垂直領域數據庫:垂直領域數據庫:目前通用搜索引擎很難收集全所有主題的網絡信息且成本較高,對于專業性要求更高的主題難以做到精確搜索。因此垂直主題的搜索引擎以其高度的目標化和專業化在各類搜索引擎中占據了一席之地。(4)分布式全文檢索技術分布式全文檢索技術:分布式系統的本質就是網絡互連的多個服務器共同處理某些任務。傳統的集中式全文檢索系統已經不能滿足大容量數據的存儲需求,數據量和訪問量的爆發式增長對系統的高效率和擴展性提出了更高的要求,僅僅依靠單臺服務器運行的檢索服務已經很難滿足要求。因此,為了提高檢
33、索效率,企業為了節省成本普遍選擇通過機器組成分布式集群來滿足服務器的性能要求。搜索引擎數據庫潛在市場規模搜索引擎數據庫潛在市場規模約約 450 億美元,發展空間廣闊。億美元,發展空間廣闊。根據 IDC 測算,2022 年全球搜索引擎數據庫的市場規模約為 450億美元,其中搜索系統、內容分析和認知/AI 軟件平臺的市場規模約 80億美元;IT 運營管理約 90億美元;大數據和分析軟件(高級預測分析、空間和位置分析、非關系分析數據存儲、分析數據的集成和完整性)約 230億美元;安全分析(安全信息和事件管理、政策和合規、取證和事件調查)約 50億美元。圖4:2022年全球搜索引擎數據庫各細分市場規模
34、(單位:億美元)資料來源:IDC,浙商證券研究所整理 拓爾思(300229)深度報告 http:/ 9/41 請務必閱讀正文之后的免責條款部分 1.2 美國美國 Elasticsearch 為搜索引擎數據庫龍頭,應用場景豐富為搜索引擎數據庫龍頭,應用場景豐富 Elasticsearch(ES)是一個伴隨著大數據存儲以及快速檢索的需求所產生的分布式、可擴展、實時的搜索與數據分析引擎。ES使用 Lucene 搜索庫作為其核心,又同時避免了Lucene 復雜的操作方式,能夠存儲結構化和非結構化的大數據,并且實現對其存儲數據的全文檢索,速度達到毫秒級。它還包括了結構化搜索、數據分析、復雜語言處理、對象
35、間關聯關系等內容,可以通過數據建模在生產環境中配置和監視大數據集群。其特色包括:1)分布式的文件實時存儲工具,并且保證每個字段都能被索引和檢索;2)分布式的實時搜索引擎,并具備數據實時分析功能;3)可拓展到上百臺服務器,處理PB 級別的結構化或非結構化數據。圖5:Elasticsearch 產品應用場景 資料來源:阿里云開發者社區,浙商證券研究所整理 非結構化數據量的爆發式成長,疊加信息檢索準確度需求增加,驅動非結構化數據量的爆發式成長,疊加信息檢索準確度需求增加,驅動 Elasticsearch 業業務快速成長。務快速成長。從數據結構角度看,web2.0 時代非結構化數據量的爆發拉動了對非關
36、系型數據庫需求,極大提高了系統對數據庫高并發讀寫、可擴展性和高可用性的要求。此外,在對海量數據存儲和訪問效率上方面,傳統的關系型數據庫也難以滿足需求。根據浪潮信息數據,非結構化數據自 2015 年開始呈幾何倍數增長,包括 HTML、JSON、文檔、圖片、音視頻等形式,預計未來還將加速爆發。圖6:半/非非結構化數據量爆發式成長 資料來源:浪潮信息企業互聯網化下的數據平臺升級,浙商證券研究所整理 拓爾思(300229)深度報告 http:/ 10/41 請務必閱讀正文之后的免責條款部分 Elasticsearch 在信息檢索性能上相比在信息檢索性能上相比數據庫自身的搜索功能數據庫自身的搜索功能優勢
37、顯著優勢顯著。功能上,數據庫的首要目的是存儲數據,其自身的模糊搜索功能沒有索引,無法實現對搜索詞的邏輯及范圍搜索,因此無法對查詢條件進行延伸分析。而對于搜索引擎和搜索引擎數據庫來說,全文檢索才是目的,因此其更關注信息搜集和關聯等能力,靈活度也更高,在檢索時無需精確的數據結構,可以對查詢條件進行延伸解析,比如近義詞和聯想等功能。表3:數據庫與搜索引擎的特點對比 數據庫數據庫 搜索引擎搜索引擎 核心目標 數據存儲 全文檢索 查詢條件 對關鍵詞沒有限制,但需要明確的數據結構 關鍵詞一般數目有限但無需十分精確,對輸入的文檔會進行分詞,不需要明確數據結構 檢索方式 全表掃描 需要索引,以倒排索引方法為主
38、 查詢速度 取決于數據庫大小和數據讀取速度,時間從幾秒到幾分鐘不等 非???,秒級 搜索結果 實時性更好;無法對檢索條件進行近義詞分析和聯想 因為有創建索引的過程,實時性不如數據庫及時;會對查詢條件進行延伸解析 資料來源:Github,浙商證券研究所整理 目前,Elasticsearch 實時全文搜索引擎框架已經被廣泛使用。GitHub 使用 Elasticsearch 對超過 1300 億行的源碼進行檢索,并且用戶量和數據量還在持續增長;維基百科使用 Elasticsearch 對 PB 級數據實現了全文檢索、高亮展示關鍵詞、針對輸入的關鍵詞進行搜索建議等功能;英國衛報使用 Elasticse
39、arch 來處理海量訪客日志,并實時把公眾對文章的看法反饋給編輯;StackOverflow 通過使用 Elasticsearch 把全文搜索、地理位置和其他相關信息進行結合,實現 more-like-this 功能。圖7:阿里云 Elasticsearch 日志數據查詢界面 圖8:Elastic監測工具 Kibina界面 資料來源:阿里云,浙商證券研究所整理 資料來源:Elasticsearch官網,浙商證券研究所整理 拓爾思(300229)深度報告 http:/ 11/41 請務必閱讀正文之后的免責條款部分 1.3 搜索引擎數據庫國產替代進程加速,公司行業積累深厚產品優勢顯著搜索引擎數據庫
40、國產替代進程加速,公司行業積累深厚產品優勢顯著 1.3.1 數據安全要求加速數據庫國產替代,公司數據安全要求加速數據庫國產替代,公司 G端客戶比例較高有望率先受益端客戶比例較高有望率先受益 數據庫是我國信創重點,數字安全法出臺將加速國產替代。數據庫是我國信創重點,數字安全法出臺將加速國產替代。2021 年是我國數據安全的政策元年,2021 年 9 月我國第一部數據安全的專門立法數據安全法正式出臺,個人信息保護法于同年 11 月起正式施行。從國家層面,未來各監管部門將加大對數據安全監管力度。從企業層面,數據安全責任也將從過去被動地接受機構風險監督,逐漸轉向主動合規建設。根據 Gartner 報告
41、,數據庫的高技術壁壘導致 Oracle、IBM、微軟等海外大廠長期霸占數據庫市占率排行的前幾名,我國數據庫產品的市占率雖然在過去十幾年間有了大幅提升,但仍然于海外大廠產品有著較大差異,國產化率相對較低,屬于重點關注領域。表4:我國數據安全相關政策梳理 發布時間發布時間 數據安全政策文件數據安全政策文件 政策內容摘要政策內容摘要 2022.04 電力可靠性管理辦法(暫行)自 2022年 6月 1日起施行,辦法新增“第七章 網絡安全“專章,并重點提出了網絡安全防護、網絡安全監測、風險評估、隱患排查治理、網絡安全責任落實等電力行業網絡安全相關要求。2022.04 工業互聯網專項工作組2022年工作計
42、劃 從夯實基礎設施、深化融合應用、強化技術創新、培育產業生態、提升安全保障、完善要素保障等方面,提出了網絡體系強基、標識解析增強、平臺體系壯大、數據匯聚賦能、新型模式培育、融通賦能“舉手”等 15大類任務 83項具體措施。2021.12 網絡安全審查辦法 掌握超過 100萬用戶個人信息的網絡平臺運營者赴國外上市,必須要向網絡安全審查辦公室申報網絡安全審查。2021.12 互聯網信息服務算法推薦管理規定 旨在規范互聯網信息服務算法推薦活動,維護國家安全和社會公共利益,保護公民、法人和其它組織的合法權益,促進互聯網信息服務健康發展。2021.08 汽車數據安全管理若干規定(試行)為了規范汽車數據處
43、理活動,包括汽車設計、生產、銷售、使用、運維等過程中的涉及個人信息數據和重要數據進行安全監管,保護個人、組織的合法權益,維護國家安全和社會公共利益,促進汽車數據合理開發利用。2021.08 中華人民共和國個人信息保護法 為了保護個人信息權益,規范個人信息處理活動,促進個人信息合理利用,根據憲法,制定本法。個人信息是以電子或者其他方式記錄的與已識別或者可識別的自然人有關的各種信息,不包括匿名化處理后的信息。2021.08 兒童個人信息網絡保護規定 鼓勵互聯網行業組織指導推動網絡運營者制定兒童個人信息保護的行業規范、行為準則等,加強行業自律,履行社會責任。2021.07 關鍵信息基礎設施安全保護條
44、例 對事關國計民生、涉及大規模數據的重要領域的信息基礎設施加強安全保護 2021.06 中華人民共和國數據安全法 為了規范數據處理活動,保障數據安全,促進數據開發利用,保護個人、組織的合法權益,維護國家主權、安全和發展利益,制定本法。資料來源:公司年報,浙商證券研究所整理 公司政府客戶比例高且信息敏感度高,有望率先受益于國產化需求。公司政府客戶比例高且信息敏感度高,有望率先受益于國產化需求。從 1985年開始,公司前身依托自身在中文檢索領域的專業優勢便開始為人民日報社提供新聞資料檢索系統服務;公司于 1995年搭建了數據庫服務器并開始為新華社服務。公司公司的檢索產品很早的檢索產品很早完成了政府
45、客戶的驗證流程,具備了先發優勢。完成了政府客戶的驗證流程,具備了先發優勢。公司自 04 年開始,陸續為國家知識產權局、國寶局等優質國家機構提供企業搜索服務,并且開始覆蓋金融、能源、公共安全等涉密領域,涉及公安、軍工客戶。2021 年公司政府及公共安全業務收入占比達到 58.81%。公司深耕語義智能賽道,處于行業領先者地位。公司深耕語義智能賽道,處于行業領先者地位。根據 IDC 數據顯示,2021 年我國語音語義市場規模達 21.7 億美元,其中科大訊飛占據 13.7%的市場規模位居第一。公司以 2.9%的市場份額占比位居第四,考慮語義智能相比于語音智能,結合了語言理解、知識獲取等更高級別的人工
46、智能技術,未來發展空間廣闊。拓爾思(300229)深度報告 http:/ 12/41 請務必閱讀正文之后的免責條款部分 圖9:2021年公司營業收入分行業占比結構 圖10:2021年中國智能語音語義市場份額 資料來源:公司年報,浙商證券研究所整理 資料來源:IDC中國,浙商證券研究所整理 自然語言處理市場預計未來幾年內保持高增長速度,到自然語言處理市場預計未來幾年內保持高增長速度,到 2030 年是市場規模有望突破年是市場規模有望突破2000 億。億。隨著 NLP 技術在金融、政務、教育、醫療等諸多行業應用落地的加速,預計未來中國 NLP 市場規模將加速成長。根據賽迪研究院預測,2022年相關
47、市場規模約為 174.5 億元,并在未來幾年內保持約 36.5%的復合增長率,預計到 2030 年,我國 NLP 市場規模將突破 2000億,達到 2105 億元。圖11:2022-2030年中國 NLP 市場規模與增長預測 資料來源:賽迪研究院,浙商證券研究所整理 1.3.2 公司實現搜索引擎數據庫核心技術自主可控,滿足信創和國產化替換需求公司實現搜索引擎數據庫核心技術自主可控,滿足信創和國產化替換需求 公司信創生態完備,數據庫核心技術自主可控。公司信創生態完備,數據庫核心技術自主可控。公司多次被大數據相關產業聯盟評為領軍企業,深度參與到中國數據庫標準制定。產品方面,公司海貝數據庫是目前國內
48、少有從底層數據收集,到分詞和索引算法,以及儲存技術的國產數據庫引擎。其核心代碼自主率達到 100%,且通過多家國家機構認證,可徹底擺脫對 Elasticsearch 和 Lucene 等國外數據庫的技術依賴。拓爾思(300229)深度報告 http:/ 13/41 請務必閱讀正文之后的免責條款部分 表5:公司擁有多款大數據相關產品 類別類別 產品產品 功能功能 主要客戶主要客戶 大數據-通用產品 TRS 海貝大數據管理系統 全文檢索引擎(可實現圖文檢索)信用中國、國家市場監督管理總局、公安部等 TRS 網絡信息雷達系統 大數據采集 中央辦公廳、中宣部、國家統計局、農業銀行、中石油等 TRS 分
49、布式數據整合系統 大數據治理整合 大數據-行業專用產品 TRS 海云-集約化智能門戶平臺 政府集約化智能門戶平臺 中央人民政府門戶網站、外交部全球網站群、首都之窗等 TRS 海融-智能媒體融合平臺 智能媒體融合 經濟日報、浙江日報、新疆日報、西藏網、中國建筑集團、航空工業集團等 數據安全產品 數據安全交換產品,數據安全分析產品 數據傳輸與交換的安全與分析 公安部、人民銀行、工商銀行、海關總署等 資料來源:公司年報,浙商證券研究所整理 在大數據領域,拓爾思突破異構數據對大數據搜索引擎的限制,為索引數據加密提供全方位安全保障,實現 了文本、圖像特征、二進制的統一索引和跨數據類型跨語言的檢索,并采取
50、最新的集群技術提高了 可支持的數據規模和多用戶并發檢索性能,為數據安全和信創領域應用提供全面保障。2021 年公司 基于技術突破迭代創新推出了 TRS 海貝大數據管理系統 V9.0、TRS 數據中臺等核心產品。同時公司 研發完成了面向云原生支撐的技術中臺和 AI 驅動的數據中臺,推出了 TRS 數星智能風控大數據平臺、TRS 數家開放服務平臺、TRS 網察大數據分析平臺等 SasS 數據智能服務平臺產品。表6:公司海貝大數據管理系統與 Elasticsearch 搜索引擎產品對比 海海貝貝 Elasticsearch 數據規模 億萬億 億百億 并發支持 可伸縮 較強 分詞器 單一分詞器處理全語
51、種 多語種支持(分別處理)查詢語法 Lucene語法/TRS語法 支持段句位等專業表達式 Lucene語法/JSON 圖像檢索 支持 不支持 易用性 全中文可視化數據管理后臺 Kibana 冷熱分區 支持 不支持 讀寫分離 支持 不支持 訪問隔離 支持 不支持 數據加密 支持,并支持國產加密卡 不支持 安全控制 支持 不支持 資料來源:公司官網,浙商證券研究所整理 公公司司海貝海貝大數據搜索引擎產品在自主可控、數據安全、綜合能力等層面均具備顯著優大數據搜索引擎產品在自主可控、數據安全、綜合能力等層面均具備顯著優勢勢。產品支持所有數據類型,功能完備,安全可靠,兼容 ES常用接口,對接主流生態,具
52、備良好的產品力,未來有望在信創浪潮下實現國產化平滑替代。拓爾思(300229)深度報告 http:/ 14/41 請務必閱讀正文之后的免責條款部分 表7:公司海貝大數據管理系統特點 特點特點 具體描述具體描述 自主可控 海貝是目前國內少有的從底層分詞算法到全文搜索引擎,以及上層系統都完全自研的純國產搜索引擎數據庫,已完成與龍芯、海光、飛騰等國產芯片以及中標麒麟、統信 UOS等國產操作系統的適配工作,完全滿足信創要求和國產化替換需求。數據安全 海貝采用多副本機制解決數據的可用性問題,通過數據校驗以及 WAL技術解決數據的完整性問題,通過完善的權限管理機制、HTTPS、加密存儲等機制解決數據訪問和
53、數據存儲的機密性問題。加密可以配合國產加密卡達到金融級數據安全,還具有黑白名單、用戶隔離、刪除保護等安全機制。綜合能力 海貝對系統資源的使用更加合理可控,復雜搜索響應性能更優,不會出現因為數據索引、超長表達式檢索、通配符檢索等操作導致系統無法響應的情況。海貝提供了更加專業的段句位檢索、XML檢索,支持度量衡數據的數值區間檢索等高級功能。生態兼容 海貝具有高度開放性,不僅兼容 ES常用接口,還可對接 Hadoop、Spark/SparkSQL、OpenStreetMap等。資料來源:公司官網,浙商證券研究所整理 1.4 公司持續延伸大數據業務新場景,知識產權業務有望貢獻新增量公司持續延伸大數據業
54、務新場景,知識產權業務有望貢獻新增量 1.4.1 專利處理需求快速成長創造專利代理市場廣闊空間,專利處理需求快速成長創造專利代理市場廣闊空間,NLP 技術應用前景可期技術應用前景可期 國家政策層面支持發展知識產權行業,中國專利申請量持續成長。國家政策層面支持發展知識產權行業,中國專利申請量持續成長。2021 年國家提出“知識產權強國戰略”,力圖實現從“中國制造”到“中國創造”的創新驅動轉型。通過知識產權強國建設綱要(2021-2035)以及“十四五”國家知識產權保護和運用規劃等綱領性文件,未來中國知識產權發展將致力于實現知識產權“得到更好保護”、“形成更好市場價值”、“發揮更強經濟支撐”、“具
55、備更強影響力”的發展目標,成為真正的“知識產權強國”。中國專利申請量于 2011年躍居全球第一,并在近幾年內保持快速增長態勢,2021年中國專利申請量達到 495.7 萬件,2008-2021 年間復合增長率達到 18%。根據世界知識產權組織數據,中國 2020 年發明、實用新型和外觀這三項專利的申請總量分別達到 149.71 萬件、292.7 萬件和 77.0 萬件,同比增長 6.9%、29.0%和 8.3%,均顯著高于全球增速。預計未來幾年中國專利數量仍將保持快速增長,并將成為拉動經濟增長不可或缺的力量。圖12:中國專利申請量持續高速增長 資料來源:智慧芽2022中國支持產權年度調研報告,
56、浙商證券研究所整理 拓爾思(300229)深度報告 http:/ 15/41 請務必閱讀正文之后的免責條款部分 專利申請數量快速成長拉動知識產權代理市場需求。專利申請數量快速成長拉動知識產權代理市場需求。知識產權代理是指代理當事人處理知識產權事務的行為,主要包括國內外專利代理和商標代理、版權登記代理。專利代理的業務范圍包括專利申請、專利訴訟、專利戰略布局、專利咨詢等方面的業務內容。國家政策支持疊加制度不斷完善,知識產權國家政策支持疊加制度不斷完善,知識產權代理業務迅速發展。代理業務迅速發展。根據共研網數據統計顯示,2021 年中國支持產權代理行業市場規模約為 511.89 億元,并預計 202
57、2 年市場規模將超過 600億元,未來將伴隨著知識產權市場的成長而保持較快增長態勢。圖13:2011-2022年中國知識產權代理市場規模統計及預測 資料來源:共研網,浙商證券研究所整理 專利代理機構數量快速增長。專利代理機構數量快速增長。國家知識產權局數據統計顯示,截至 2021 年底,我國專利代理機構數量達到 3934家(不含港澳臺地區),執業專利代理師達 26840 人,行業發展勢頭迅猛。專利為各科技創新賽道提供高情報價專利為各科技創新賽道提供高情報價值,值,專利信息檢索專利信息檢索查詢創造新需求。查詢創造新需求。在生物、新材料、新能源等高新科技領域,企業依賴專利情報所提供的重要價值,專利
58、工作支撐企業研發創新成為近年來專利工作的重要價值探索。對于專利代理機構來說,專利服務涉及專利信息的檢索、匹配等工作,NLP 技術可講傳統專利數據庫中的非結構化信息轉化為結構化數據,可大幅提升知識產權服務的效率提升和質量提高。圖14:中國專利代理機構數量快速增長 圖15:各行業對專利提供“研發情報價值”態度 資料來源:國家知識產權局,浙商證券研究所整理 資料來源:智慧芽2022中國支持產權年度調研報告,浙商證券研究所 拓爾思(300229)深度報告 http:/ 16/41 請務必閱讀正文之后的免責條款部分 1.4.2 公司布局專利搜索引擎賽道,基因專利檢索云服務平臺有望賦能行業效率提升公司布局
59、專利搜索引擎賽道,基因專利檢索云服務平臺有望賦能行業效率提升 公司自主研發公司自主研發基因專利檢索云服務平臺基因專利檢索云服務平臺,為生物技術發展創新提供有力支撐。,為生物技術發展創新提供有力支撐。公司聯合知識產權出版社,基于生物技術領域產業發展及用戶需求,在強化搜索引擎技術與數據資源優勢基礎上,研發能夠提供序列檢索與基因專利檢索的 SaaS云服務系統。平臺涵蓋全球 40 多個國家和組織的生物序列相關專利數據及 32個公共資源庫,通過對區域創新趨勢和區域頭部專利申請人的分析,幫助用戶識別潛在的創新者和未來可能合作的重要伙伴。公司可實現基因專利信公司可實現基因專利信息的結構化處理和檢索結果呈現,
60、大幅提升專利服務效率。息的結構化處理和檢索結果呈現,大幅提升專利服務效率。公司基因專利檢索云服務平臺可實現基因序列檢索、專利檢索、序列檢索結果、序列比對等多項功能,支持融合檢索及圖形展示,在幫助用戶分析行業發展趨勢、輔助生物醫學技術創新、領域研究新方向研判等場景均具備廣闊應用前景。表8:公司基因專利檢索云服務平臺產品可實現多種功能服務 產品功能產品功能 功能描述功能描述 基因序列檢索 支持五種檢索策略,可通過調整檢索條件、序列條件、專利條件和算法條件,實現精準檢索?;驅@麢z索 支持通過專利申請號、公開號、分類號和關鍵詞實現一鍵檢索基因專利數據;支持二次檢索和檢索結果收藏。序列搜索結果 檢索結
61、果展示序列相關專利的申請號、序列號、發明專利、序列描述、相似度信息,支持序列查看、收藏、圖形展示和下載。序列詳覽 支持查看基因專利著錄項目、權利要求、說明書、專利全文 PDF以及序列文件。序列比對 在序列檢索界面即可實現序列比對的功能。常用工具 提供多種生物序列轉換工具,包括中文氨基酸轉換、DNA序列清理、EMBL格式轉換為 FASTA格式等。檢索歷史 可進行檢索追溯和分析,并支持分別查看序列檢索和專利檢索。資料來源:公司宣傳材料,浙商證券研究所整理 公司基于公司基于 NLP 核心技術積累,未來有望向專利檢索領域更多細分場景延伸。核心技術積累,未來有望向專利檢索領域更多細分場景延伸。除基因之外
62、,高端制造、新能源、新材料等領域專利信息檢索均存在信息非結構化、專業程度高,數據挖掘和分析難度大的特征,公司在自然語言處理領域具備技術優勢,未來有望基于在基因領域的產品研發經驗積累,向更多細分場景延伸。拓爾思(300229)深度報告 http:/ 17/41 請務必閱讀正文之后的免責條款部分 2 知識圖譜引導認知智能發展,對標知識圖譜引導認知智能發展,對標 Palantir 公司成長空間廣闊公司成長空間廣闊 2.1 堅持堅持“語義智能語義智能+”為核心戰略為核心戰略,公司公司 AI 產品應用空間廣闊產品應用空間廣闊 AI 正處于弱人工智能向強人工智能發展階段,核心為認知和理解能力的提正處于弱人
63、工智能向強人工智能發展階段,核心為認知和理解能力的提升,升,NLP和和 CV 為兩大發展方向。為兩大發展方向。目前 AI 發展處于弱人工智能階段,在設計的程序范圍內決策并采取行動,不具備獨立意志且應用場景延伸性較差,代表性的有 AlphaGo(圍棋領域)、Siri(語音對話)等;強人工智能則是指具有獨立意志,能在設計的程序范圍外自主決策并采取行動的人工智能,能幫助人們綜合多方信息進行判斷決策,真正提升人類的工作效率,代表性的有通用機器人、高級別自動駕駛等。語言和感知是人類思維認知的基礎,也是語言和感知是人類思維認知的基礎,也是 AI 發展的兩大核心內容。發展的兩大核心內容。目前 AI發展有五大
64、核心內容,即計算機視覺、機器學習、自然語言處理、機器人和語音識別,分別對標人類的感知、思維、語言理解、運動控制和交互這五大維度。目前國內外廠商在 AI 各方向上均取得持續進展,未來有望打開商業化空間。圖16:弱人工智能和強人工智能的對比 資料來源:CSDN,浙商證券研究所整理 公司專攻語義智能賽道,是國內最早從事自然語言處理(公司專攻語義智能賽道,是國內最早從事自然語言處理(NLP)研發的企業之)研發的企業之一一,核核心競爭力顯著。心競爭力顯著。公司所專注的語義智能位于人工智能中的認知智能領域,即讓計算機來理解人類語言或其他符號表面數據內含的確切意義,提取出信息或知識,進而進行推理、分析、決策
65、,達到、接近或者超過人類的智慧水平。2.2 對對標美國標美國 Palantir,從市場規模和產品邊際貢獻率出發看公司成長空間,從市場規模和產品邊際貢獻率出發看公司成長空間 2.2.1 業務從業務從 G端向端向 B 端延伸,穩步發展成為知識圖譜領域獨角獸端延伸,穩步發展成為知識圖譜領域獨角獸 美國美國 Palantir(帕蘭提爾)(帕蘭提爾)公司,專注于大數據分析,客戶從公司,專注于大數據分析,客戶從 G端政府部門延伸到端政府部門延伸到 B端企業,逐步成長為細分賽道巨頭。端企業,逐步成長為細分賽道巨頭。Palantir 成立于 2003 年,專注于大數據分析并以此為核心,通過深入分析用戶業務結構
66、,將海量數據有機結合并挖掘數據中的價值,為決策者提供決策依據。公司分別于 2008 年和 2016 年,發布數據平臺 Palantir Gotham和 Palantir Foundry,分別面向公司的政府端客戶和商業客戶提供圖分析服務。拓爾思(300229)深度報告 http:/ 18/41 請務必閱讀正文之后的免責條款部分 圖17:Palantir公司發展歷程 資料來源:Palantir公司官網,浙商證券研究所整理 公司發展路線清晰,“公司發展路線清晰,“G端端-大大 B-小小 B”戰略成效顯著?!睉鹇猿尚э@著。Palantir 最初為美國情報部門開發軟件,以協助反恐調查和行動,客戶主要為國
67、土安全部、國家安全局、聯邦調查局等政府部門,而后公司逐步從 TO G 向 TO B 拓展,客戶涵蓋金融、醫療、傳媒等眾多行業,其中不乏空中客車、可口可樂、摩根大通等全球行業巨頭。表9:Palantir行業拓展時間表 年份年份 政府端政府端 商業領域商業領域 2008年 法律、國防、政務決策 2009年 能源 銀行 2010年 公共衛生 2011年 社會公平 石油、天然氣 2012年 行政管理 2013年 金融監管 投資、食品生產、保險、媒體、制藥 2014年 IT服務 2015年 零售 2016年 汽車、航空航天 2017年 航運、通信 2018年 海關 化學制品、道路/鐵路建設、家居產品 2
68、019年 交通運輸、財政事務 軟件服務、工業集團、專業服務、電力、礦業 資料來源:Palantir公司招股說明書,浙商證券研究所整理 公司以公司以 Gotham和和 Foundry 兩大平臺為核心,持續完善行業解決方案,構建完整業務兩大平臺為核心,持續完善行業解決方案,構建完整業務生態版圖。生態版圖。公司基于 Gotham和 Foundry兩大產品線擁有十余種解決方案,且兩大平臺分工明確,Gotham面向政府客戶,而 Foundry以商業客戶為主。Gotham大數據分析平臺建立真實世界事物特征及彼此聯系,深度應用到國防、安大數據分析平臺建立真實世界事物特征及彼此聯系,深度應用到國防、安保、反恐
69、等政府端事物領域。保、反恐等政府端事物領域。Gotham的運行以多源數據為起點,包括結構化的數據(日志、財務數據報表、電子表格等)和非結構化數據(視頻、郵件、文件、圖片等)。Gotham可以對這些源數據進行建模,將多個數據源整合成簡潔、一致的數據。傳統數據建模通常圍繞表單中靜態的行和列展開,這種做法其實對于操作人員對數據在實際場景中的理解和應用并不友好。Gotham的厲害之處在于它在建模時已經運用了真實拓爾思(300229)深度報告 http:/ 19/41 請務必閱讀正文之后的免責條款部分 世界的現實事物的特征和彼此間的聯系,如“人群”、“組織”等,這便大大提高了建模的靈活性,使模型有了實際
70、意義。Gotham可以將用戶數據更新實時同步,將用戶行為自動記錄、歸因分析并存儲,形成“動態本體”。表10:Palantir Gotham平臺應用工具 應用工具應用工具 主要功能主要功能 Graph 將數據可視化,用戶可以創建、編輯數據,解析重復的對象,支持時間分析 Gaia 共享實時地圖,跟蹤實時數據,以便團隊協同和情報收集 Dossier 實時寫作文件編輯器,可以實時協作以共享文件和發現情報 Stencil 結構化的表單輸入工具,支持協作數據輸入和報告創作 Video 支持用戶查看視頻素材,并使用地理空間信息等疊加來增強原始素材 Table 交互式的自上而下的分析應用程序,可針對大型、弱信
71、號、基于時間的數據集提供靈活的搜索功能 Ava AI 系統,可掃描數十億個數據點,幫助研究人員發現數據的模式和聯系 Forward 一種特殊配置,可以在不穩定的網絡環境中支持操作的連續性 Mobile 可以通過移動設備將 Gotham帶到現場,以提供對實時分布式操作的支持,包括通過 IOS或安卓系統歸檔現場報告、上傳視頻等 資料來源:Palantir公司官網,浙商證券研究所整理 Palantir Foundry 起步于金融欺詐識別服務,功能模塊不斷擴展,應用場景日漸豐起步于金融欺詐識別服務,功能模塊不斷擴展,應用場景日漸豐富。富。Palantir Foundry前身為 Palantir Met
72、ropolis,最初面向企業客戶尤其是金融行業的欺詐行為識別需求,后續業務逐漸拓展至 36 個行業,可以連接到企業數據、專業數據和公共數據集,實現數據集成、信息管理和定量分析,并發現趨勢、關系和異常情況并進行預測。在后端平臺,Foundry將多個來源的結構化數據整合到連貫的模型中,并對模型執行復雜計算,同時共享和迭代分析產品;在前端應用程序,它提供了一套集成的應用程序,讓用戶可以建立交互。表11:Palantir Foundry平臺應用工具 應用工具應用工具 主要功能主要功能 Monocle 用戶可以通過圖形界面理解和管理 Foundry中的數據沿襲、跟蹤數據運行狀況等 Contour 用戶通
73、過 Contour的點擊界面回答分析性問題,并發布結果報告 Object Explorer 允許用戶與用工廠、其它客戶等表示的數據進行交互,搜索索引數據并瀏覽這些對象之間的連接 Fusion 電子表格環境,用戶可以創建新的數據集并生成融合工作表等 Workshop 應用程序構建器,用戶可以在低代碼、無代碼的環境中構建可讀可寫數據的交互式工作流 Vertex 機構供應鏈的虛擬化引擎,用戶可以模擬并更改執行“假設分析”Code Authoring 用戶可以使用自己選擇的編程語言編寫數據轉化代碼,并使用分布式版本控制進行協作 Quiver 多維制圖應用程序,用于分析超大時間序列數據集 AI/ML 顯
74、示模型關鍵信息,包含繪圖、參數、驗證統計階段等,提供歷史數據 Code Workbooks 高級分析和數據科學組件,可以編寫代碼并可視化其分析結果圖 Reports 允許用戶發布其工作,該文檔隨基礎數據的變化而動態更新 資料來源:Palantir公司官網,浙商證券研究所整理 拓爾思(300229)深度報告 http:/ 20/41 請務必閱讀正文之后的免責條款部分 從 Palantir的產品可以歸納出,公司的核心優勢在于對實際業務場景和數據(包含結構化和非結構化數據)邏輯的理解更深入,公司用過底層的數據關聯推理和知識圖譜構建,突破了人工智能在垂直領域間的壁壘,真正意義上打通了數據“上下游”之間
75、的關系。表12:Palantir 產品核心競爭力梳理 核心競爭力核心競爭力 優勢描述優勢描述 大數據架構 構建敏捷的大數據架構,數據規??蓴U展,具有實時性和靈活性 數據整合與存儲 多領域、多維度的數據整合及關聯存儲,可抽象出各類數據資源間關聯關系 數據分析 模型動態且可針對不同場景快速定制 可視化 面向人機共生,通過構建全局分析鏈,將人的決策和大數據技術進行深度融合 資料來源:Palantir公司官網,浙商證券研究所整理 2.2.2 營收規模持續成長,邊際貢獻率升高彰顯產品化能力營收規模持續成長,邊際貢獻率升高彰顯產品化能力 Palantir 年營收能力持續成長,毛利率穩中有升,支撐百億美元市
76、值。年營收能力持續成長,毛利率穩中有升,支撐百億美元市值。Palantir 在 2022年 H1 實現營業收入 9.19億美元,20182021 年營業收入實現約 37.23%的復合增長率,公司在業務成長的過程中毛利率穩中有升,2022 年上半年毛利率達到 78.61%,截至 2022年11月 18 日,公司總市值達 185億美元。圖18:Palantir 2018-2022H1營業收入及毛利率 圖19:Palantir2018-2022H1毛利率 資料來源:Wind,浙商證券研究所整理 資料來源:Wind,浙商證券研究所整理 邊際貢獻率持續提升,邊際貢獻率持續提升,Palantir 公司產品
77、化能力不斷提升。公司產品化能力不斷提升。Palantir 在歷次公司財報中將“邊際貢獻率”(Contribution Margin)作為公司的重要經營指標。邊際貢獻率定義為“收入減去收入成本(Cost of Revenue)、營銷費用(剔除股權激勵后)之后與收入的比值”。邊際貢獻率的提升反映出公司軟件產品的前期部署流程的優化,客戶的使用門檻也邊際貢獻率的提升反映出公司軟件產品的前期部署流程的優化,客戶的使用門檻也將降低,這將極大地有利于公司軟件產品規?;瘮U張的能力。將降低,這將極大地有利于公司軟件產品規?;瘮U張的能力。Palantir 業務邊際貢獻率接近業務邊際貢獻率接近 60%,公司產品化能
78、力優勢顯著。,公司產品化能力優勢顯著。Palantir 產品邊際貢獻率在 2019Q3至 2020Q4 實現快速增長,從 15%提升至 61%。公司產品化能力不斷提升,有助于降低產品部署的可變成本,利于新客戶拓展及公司業務向新垂直行業場景滲透。拓爾思(300229)深度報告 http:/ 21/41 請務必閱讀正文之后的免責條款部分 圖20:2019Q1-2022Q3 Palantir產品邊際貢獻率 圖21:拓爾思營業收入剔除營業成本及銷售費用后余值占比 資料來源:Palantir公司財報,浙商證券研究所整理 資料來源:拓爾思公司財報,浙商證券研究所整理 對比對比 Palantir,拓爾思產品
79、化仍有成長空間。,拓爾思產品化仍有成長空間。由于 Palantir 與拓爾思財務準則上存在不一致,我們選擇營業收入減去營業成本及銷售費用后的余值再除以營業收入作為參考指標。經計算,公司 2018-2021 年這一指標從 41.00%上升至 50.62%,考慮往年第四季度屬于公司業績集中確認期,預計 2022 該指標較去年仍有提升。我們認為隨著公司產品我們認為隨著公司產品 SaaS 化化的持續推進,公司產品的規?;芰⒉粩嘣鰪姷某掷m推進,公司產品的規?;芰⒉粩嘣鰪?。2.2.3 業務潛在規模廣闊,政府業務潛在規模廣闊,政府+商業端客戶雙輪驅動打開成長空間商業端客戶雙輪驅動打開成長空間
80、 產品潛在市場規模超千億,政府與商業客戶發展并駕齊驅。產品潛在市場規模超千億,政府與商業客戶發展并駕齊驅。據 Palantir 估計,2020年公司軟件在全球商業領域和政府部門的總潛在市場規模(TAM)約為 1190 億美元,其中商業領域的 TAM 約為 560 億美元,政府部門領域的 TAM 約為 630 億美元,而在政府部門領域,公司預計美國政府部門和國際政府部門的 TAM 分別約為 260 億美元和 370 億美元。在商業領域 Palantir 產品涵蓋數據管理、集成和編制、應用程序開發、安 全、系統和服務管理、分析和人工智能、供應鏈管理、企業資源管理以及內容和工作流管理 領域。政府部門
81、方面,公司客戶包括美國陸軍、海軍和空軍、美國特種作戰司令部疾病控制中心等眾多政府部門。圖22:Palamtir 產品潛在市場規模(TAM)結構(2020年)圖23:Palantir政府及商業業務收入結構 資料來源:Palantir公司財報,浙商證券研究所整理 資料來源:Wind,浙商證券研究所整理 拓爾思(300229)深度報告 http:/ 22/41 請務必閱讀正文之后的免責條款部分 標準化產品標準化產品+定制化服務有望成為行業未來理想解決方案定制化服務有望成為行業未來理想解決方案,多源數據將成為賽道玩家,多源數據將成為賽道玩家核心競爭力核心競爭力。在發展早期,Palantir 也采用項目
82、制針對每個客戶提供定制化產品,后續逐漸轉向構建通用軟件平臺,并將可復用的功能構建成為應用程序,Gotham和 Foundry 兩大產品便是這一思想的體現。在數據處理層面,Palantir 產品融合了各種不同類型的數據源,其中 Gotham Video 產品融合了視頻數據、時間序列數據與其他標記數據,Gotham Graph 產品則融合調查報告、統計信息、視頻、操作數據等,并最終構建成為知識圖譜。表13:Palantir公司典型客戶與業務關系 客戶客戶 客戶簡介與業務關系客戶簡介與業務關系 Airbus 空中客車公司是全球航空航天及相關服務的領導者,2016 年引入 Foundry 作為核心數據
83、平臺??湛褪褂?Palantir 的軟件來支持商用飛機項目,以幫助提高運營效率和生產率并且改進飛機設計。BP(英國石油)BP 是世界上最大的能源公司之一,與 Palantir 公司合作,為其油氣生產團隊建立了一個數據分析平臺并成為 BP 石油和天然氣生產數據結構的關鍵組成部分,能夠輔助決策,支持整個生產的安全和效率。Credit Suisse AG 瑞士信貸公司是全球領先金融服務提供商,2013 年開始使用 Foundry 分析合規和金融市場出現的風險,集成和分析來自 100 多個系統的數據,Palantir 的軟件也是在其業務中管理貿易、合規和市場風險的努力的重要組成部分。Danish Na
84、tional Police 2016 年,Palantir 開始與丹麥國家警察合作,滿足丹麥議會對隱私和公民自由保護的需求。截至 2020年,丹麥的 8000 多名官員、調查人員和分析人員使用 Palantir 的軟件分析來自十多個警察系統的情報并用于復雜的刑事調查,包括涉及縱火、毒品走私和洗錢的案件。FCA US FCA是一家北美汽車制造商,業務涉及設計、制造、銷售或分銷克萊斯勒、道奇、菲亞特和阿爾法羅密歐等品牌汽車和部分配件。2017 年以來,FCA使用 Foundry支持關鍵的汽車制造、質量和安全舉措。Fiserv Fiserv長期以來是全球支付和金融技術的領導者,自 2013 年開始使
85、用 Palantir 軟件,作為其技術轉型的一個關鍵要素,包括實現風險管理、智能定價以及為客戶開發數據驅動產品。Merck KGaA 默克公司是一家領先的科技公司,業務涵蓋醫療保健、生命科學和性能材料領域。Palantir 的軟件為默克公司提供數據集成和高級分析平臺,用戶利用 Palantir 的軟件開發商業和供應鏈應用程序,并開發新的軟件應用程序用于整個業務。Scuderia Ferrari Scuderia Ferrari 即法拉利車隊。自 2017 年以來,Scuderia Ferrari 的工程師通過將不同的數據源整合成一個統一的數字雙元,來提高數據驅動性能分析。United Stat
86、es Department of Defense 2008 年,部署在中東各地的美國陸軍特種作戰指揮官開始使用 Palantir 軟件來協助任務規劃和作戰行動。今天,美國陸軍的每個營都使用 Palantir 軟件進行情報分析。美國海軍、空軍和海軍陸戰隊以及其他國防機構也都使用 Palantir 的軟件。資料來源:Palantir招股說明書,浙商證券研究所整理 2.3 知識圖譜應用領域廣泛,有助于公司提高核心競爭力知識圖譜應用領域廣泛,有助于公司提高核心競爭力 2.3.1 知識圖譜應用前景廣闊,市場有望迎來加速發展知識圖譜應用前景廣闊,市場有望迎來加速發展 知識圖譜是新一代的知識工程技術,知識圖
87、譜是新一代的知識工程技術,以以 NLP 為底層技術,捕捉為底層技術,捕捉數據、信息等內容并數據、信息等內容并梳理,組合成圖譜形式梳理,組合成圖譜形式,為,為 AI 提供知識儲備提供知識儲備。除了前文提到的專業搜索引擎外,知識圖譜的主流產品形態可按通用型與垂直行業型劃分,通用知識圖譜強調知識廣度,逐漸演變為通用互聯網知識圖譜,包含搜索引擎、智能推薦、智能問答等。垂直行業知識圖譜強調知識深度,用于問答、輔助決策與業務分析,是支持 Al 大腦深度思考的知識庫基礎。拓爾思(300229)深度報告 http:/ 23/41 請務必閱讀正文之后的免責條款部分 表14:知識圖譜主流產品形態梳理 產品形態產品
88、形態 知識范圍知識范圍 目標目標 特征特征 舉例舉例 網絡搜索引擎 廣域網中的通用知識 形成通用知識圖譜,使檢索更準確并進行相關推薦 通用性強,適合綜合領域,對數據獲取能力要求高 百科詞條搜索、關鍵詞相關推薦與問答 知識圖譜可視化 廣域網或局域網中 的通用知識 知識關聯網絡的直觀展示 屬于知識圖譜行業解決方案/大數據產品中的子模塊,產生人機交互的節點 可視化大屏 行業知識圖譜 某一領域內的數據、專業知識組合形成知識資源 將數據與知識轉換為行業知識庫,服務于輔助問答、推理、決策和判斷 側重于行業知識應用,行業屬性強,依賴于專家數據標注,且數據標準特殊,需單獨構建行業知識庫 行業知識圖譜 解決方案
89、 內部搜索引擎 局域網中的專業知識 形成某一領域或企業內部的知識搜索庫,以搜索為核心 通用性收縮,專業性變強 企業內部的業務 知識檢索與問答 大數據知識圖譜 某一領域內的大數據成為知識資源 數據治理,進行知識與關系抽取,服務后續應用與業務分析 數倉與 BI數據分析形式的引申,變為以大數據組織形式的純知識搜索引擎 數據中臺/平臺等大數據產品的知識圖譜模塊 資料來源:艾瑞咨詢,浙商證券研究所整理 知識圖譜技術應用受行業信息化成熟度及需求影響較大,整體規模處于起步階段,未知識圖譜技術應用受行業信息化成熟度及需求影響較大,整體規模處于起步階段,未來產品專業化和場景化趨勢明確。來產品專業化和場景化趨勢明
90、確。目前知識圖譜的應用逐漸從搜索引擎向各細分行業滲透,但應用受行業信息化與數字化基礎、數據質量、場景明確程度、客戶方需求等多因素影響,在各細分行業的滲透進程不一?;ヂ摼W與金融為主要應用場景,在信創浪潮下政務、公安等有望提供市場推力,國內互聯網與金融為主要應用場景,在信創浪潮下政務、公安等有望提供市場推力,國內知識圖譜市場規模有望加速成長。知識圖譜市場規模有望加速成長。據艾瑞咨詢數據統計,在 2021 年知識圖譜核心市場中,金融和互聯網行業占總市場的 35.6%。我們認為我們認為,隨著政務數字化建設的完善,隨著政務數字化建設的完善疊加信創浪疊加信創浪潮潮,政務,政務、公安等行業對、公安等行業對知
91、識圖譜的業務需求會知識圖譜的業務需求會進一步擴大進一步擴大。根據艾瑞咨詢數據,2021 年中國知識圖譜核心市場規模為 107億元,預計到 2026 年達到 296 億元,2021-2026 年CAGR 約為 22.5%。圖24:2021年中國知識圖譜市場行業結構 圖25:20192026年中國知識圖譜核心市場規模及預測 資料來源:艾瑞咨詢,浙商證券研究所整理 資料來源:艾瑞咨詢,浙商證券研究所整理 公安、金融成為知識圖譜商業化應用先頭陣地,公司長期布局具備先發優勢。公安、金融成為知識圖譜商業化應用先頭陣地,公司長期布局具備先發優勢。艾瑞咨詢數據統計顯示,公安、金融、互聯網等細分行業未來幾年均有
92、望迎來知識圖譜商業化應用的加速發展期,其中,由于公安、金融領域數字化和信息化程度較高,且數據挖掘需求較大,短期內有望成為知識圖譜應用的先頭陣地。拓爾思(300229)深度報告 http:/ 24/41 請務必閱讀正文之后的免責條款部分 圖26:2019-2026年中國按行業分知識圖譜核心市場規模增長趨勢(單位:億元)資料來源:艾瑞咨詢,浙商證券研究所整理 2.3.2 公司人工智能產品持續迭代提升,成為政府、金融等多行業決策大腦公司人工智能產品持續迭代提升,成為政府、金融等多行業決策大腦 AI 進入大數據時代,行業數據作為知識圖譜的核心壁壘,公司競爭優勢明顯。進入大數據時代,行業數據作為知識圖譜
93、的核心壁壘,公司競爭優勢明顯。公司從2010 年開始便自主投資建設大數據中心,目前已具備數千億數據量的數據索引、標記、查詢、挖掘分析能力,萬億級數據總量的秒級檢索能力,日均億級數據獲取能力。業內領先的數據分析能力支撐公司多個專業化的數據智能服務,支撐政府、媒體、金融、公安、商業等多行業用戶的智能分析需求。公司安拓知識圖譜平臺融合大數據等核心技術,構建大規模領域知識圖譜。公司安拓知識圖譜平臺融合大數據等核心技術,構建大規模領域知識圖譜。安拓知識圖譜平臺融合了大數據、可視化和知識圖譜相關技術,能夠構建形成大規模領域知識圖譜,實現知識構建管理、知識語義檢索、智能文本提取、智能問答與推薦、圖譜關系分析
94、、地理空間分析等,在知識構建、知識圖譜應用、領域知識圖譜覆蓋等方面均具有優勢。目前產品已應用于政府、國家安全、公安、軍事和企業等多個領域。圖27:公司安拓知識圖譜平臺 資料來源:公司官網,浙商證券研究所整理 拓爾思(300229)深度報告 http:/ 25/41 請務必閱讀正文之后的免責條款部分 水晶球分析師平臺面向各業務領域專業分析師,支撐專項水晶球分析師平臺面向各業務領域專業分析師,支撐專項研究工作。研究工作。通過 TRS水晶球分析師平臺,分析師可以通過平臺釆集多源異構數據,形成業務領域對象結構化知識。平臺提供知識瀏覽和編輯、對象檢索、關系圖分析、地圖分析、統計分析等功能,可以結合時間軸
95、、對象瀏覽、直方圖、數據流等方式多角度探查數據。表15:公司水晶球分析師平臺產品優勢 優勢 具體描述 基于動態本體的數據模型 TRS 水晶球數據模型構建“動態本體”的基礎模型,將多數據源集成統一,發掘數據背后的知識??勺匪莸臄祿姹?所有的數據被存儲在平臺的版本數據庫中。數據的改變無論是來自數據源還是來自用戶,版本數據庫記錄著每一個數據的改變。智能挖掘擴展 支持外部系統數據、本地資源庫數據、個人零散數據的整合,并進行深度分析和挖掘。強大的可視化分析 將不同的數據模型分解成兩兩相連的關聯關系,通過圖形的方式對信息元之間的關系進行描述和展現。開放可擴展性平臺 水晶球分析師平臺是一個層級可擴展平臺,
96、從初級的數據集成,持續客戶化來構建用戶定制接口,已基本實現了平臺開放。資料來源:公司官網,浙商證券研究所整理 拓爾思(300229)深度報告 http:/ 26/41 請務必閱讀正文之后的免責條款部分 3 公司業務場景持續延伸,產品公司業務場景持續延伸,產品 SaaS 化進程推動業務成長化進程推動業務成長 3.1 虛擬人作為元宇宙核心角色,公司深度布局虛擬人“靈魂”虛擬人作為元宇宙核心角色,公司深度布局虛擬人“靈魂”2022 年全國出臺年全國出臺各項各項元宇宙政策,虛擬現實產業發展進入快車道。元宇宙政策,虛擬現實產業發展進入快車道。戰新元宇宙統計數據顯示,今年全國各地相繼出臺市級、區級元宇宙發
97、展專項政策,對元宇宙產業發展提出針對性的指導和鼓勵政策,旨在未來 35 年內構建完善的元宇宙產業生態,推動數字經濟發展,加快虛擬現實技術在各行業和場景下的商業化應用。表16:近期全國部委及各省市元宇宙專項政策 出臺時間出臺時間 出臺地區出臺地區/部委部委 政策名稱政策名稱 相關要點相關要點 2021.11 北京市 關于加快北京城市副中心元宇宙創新引領發展的八條措施 北京通州區提出對在元宇宙應用創新中心新注冊并租賃自用辦公場地的重點企業進行 50%、70%、100%三擋補貼;在產業空間上,規劃“1 個創新中心+N 個特色主題園區”的元宇宙產業空間布局。2022.01 工信部 工信部召開的中小企業
98、發展 情況發布會上 工信部表示,要特別注重培養一批深耕專業領域工業互聯網、工業軟件、網絡與數據安全、智能傳感器等方面的“小巨人”企業,培育一 批進軍元宇宙、區塊鏈、人工智能等新興領域的創新型中小企業。2022.03 廈門 廈門市元宇宙產業發展三年行動計劃(2022-2024年)圍繞元宇宙關鍵技術對 NFT、VR/AR、智能芯片、智能算法等進行協同攻關;強化創新鏈與產業鏈協同,打造高端協作研究平臺;積極推動科研院所和企業聯合打造元宇宙應用平臺,推動三維數字空間、虛擬數字人和 NFT 數字資產在城市管理、民生服務等領域的開發應用。2022.07 上海 上海市培育“元宇宙”新賽道行動方案(2022-
99、2025年)提出發揮上海在 5G、應用場景、在線新經濟等方面優勢,力爭打造 10 家具有國際競爭力的頭部企業、100 家“專精特新”企業,推出 50+示范場景、100+標桿性產品和服務,到 2025年產業規模達到 3500億。2022.08 武漢 武漢市元宇宙產業創新發展實施方案(2022-2024年)(征求意見稿)力爭到 2024 年,元宇宙關鍵技術顯著突破、場景應用廣泛鋪開、創新企業高度集聚、重點平臺加快布署,對實體經濟、產業轉型升級起帶動和促進作用;組建成立 1個元宇宙研究院,建成 2個以上元宇宙產業孵化基地,聚焦 10個行業領域打造 30 個以上元宇宙場景應用示范項目,培育集聚 100
100、 家以上元宇宙核心企業。2022.09 河南 河南省元宇宙產業發展行動計劃 未來三年計劃建成 10 個左右國內一流的元宇宙技術研究和創新平臺,初步建立開放協同的元宇宙技術創新體系;在工業制造、文化旅游、公共服務、社會治理、社交娛樂、教育、醫療等領域打造 100個元宇宙示范應用場景;打造一批軟硬件研發、測試驗證等公共服務平臺,行業治理及安全保障體系初步建立。2022.09 工信部、教育部、文化和旅游部等五部門 虛擬現實與行業應用融合發展行動計劃(20222026年)到 2026 年,我國虛擬現實產業總體規模超過 3500 億元,虛擬現實終端銷量超過 2500萬臺,培育 100 家具有強創新能力和
101、行業影響力的骨干企業,打造 10 個具有區域影響力、引領虛擬現實生態發展的集聚區,建成 10個產業公共服務平臺。資料來源:工信部,浙商證券研究所整理 數字虛擬人的廣義定義為數字化外形的虛擬人物,數字虛擬人的廣義定義為數字化外形的虛擬人物,其核心價值在于其核心價值在于打破物理界限提供打破物理界限提供擬人服務與體驗。擬人服務與體驗。隨著人工智能技術不斷迭代,數字虛擬人將成為虛擬世界中人機互動、人際互動的重要橋梁,解決用戶虛擬環境下工作、娛樂等需求。虛擬人應用場景不斷拓展,可賦能多行業領域。虛擬人應用場景不斷拓展,可賦能多行業領域。隨著虛擬人技術結合實際應用場并形成行業應用解決方案,目前已經出現了娛
102、樂型虛擬人、教育型虛擬人、助手型虛擬人、影視虛擬人等,虛擬人已覆蓋影視、傳媒、游戲、金融、文旅等領域,且可以根據用戶實際需求提供定制化服務。拓爾思(300229)深度報告 http:/ 27/41 請務必閱讀正文之后的免責條款部分 表17:虛擬人應用領域、場景及角色 領域 場景 角色 影視 數字替身特效幫助導演實現現實拍攝中無法表現的內容和效果 數字替身、虛擬演員 傳媒 定制化虛擬主持人/主播/偶像,支持從音頻/文本內容一鍵生成視頻,實現節目內容快速自動化生產,打造品牌特有 IP形象,實現互動 虛擬主持人 虛擬直播、虛擬偶像 游戲 數字人游戲角色提供更強代入感,提高可玩性 數字角色 金融 智能
103、理財顧問、智能客戶等角色,實現以客戶為中心的、智能高效的人性化服務 智能客服、智能理財顧問 文旅 博物館、科技館等虛擬小劇場、虛擬導游、虛擬講解員 虛擬導游/講解員 教育 基于 VR/AR場景式教育,虛擬倒是幫助構建自適應/個性化學習環境 虛擬教師 醫療 以數字人實現家庭陪護/家庭醫生/心理咨詢,關注家庭成員身心健康 心理醫生、家庭醫生 零售 電商直播場景,虛擬人與真人主播互動 顧客服務/商家管理虛擬人 資料來源:中國人工智能產業發展聯盟,浙商證券研究所整理 數字虛擬人應用向多元化發展,潛在市場規模超千億。數字虛擬人應用向多元化發展,潛在市場規模超千億。目前虛擬人應用逐漸從娛樂化,向工具化、基
104、建化的形式滲透,應用場景的豐富度和深度均不斷提升。根據速途元宇宙研究院預測,2022年我國虛擬人整體市場規模將達到約 242.3 億元,到 2030年這一市場規模有望超 3000億元。我們預計未來幾年內,隨著我們預計未來幾年內,隨著 NLP 等人工智能技術的不斷迭代,數等人工智能技術的不斷迭代,數字虛擬人經濟將從目前的字虛擬人經濟將從目前的 IP 經濟向人機交互發展,行業有望迎來經濟向人機交互發展,行業有望迎來爆發。爆發。圖28:虛擬人整體市場規模趨勢及預測 資料來源:速途元宇宙研究院,浙商證券研究所整理 公司依托自然語言處理與行業知識圖譜技術積累,積極布局虛擬人賽道,為數字虛擬公司依托自然語
105、言處理與行業知識圖譜技術積累,積極布局虛擬人賽道,為數字虛擬人提供人提供“大腦大腦”。公司與騰訊等國內頂級數字人形象團隊簽訂戰略合作協議,實現虛擬人形象與大腦的有機結合。公司虛擬數字人 SaaS 平臺已成為客戶訂購虛擬數字人的全鏈服務平臺。公司已成功注冊“拓宇宙”商標,未來持續深入元宇宙領域的實踐與探索。拓爾思(300229)深度報告 http:/ 28/41 請務必閱讀正文之后的免責條款部分 圖29:語義智能構成數字虛擬人“大腦”圖30:公司所處虛擬人產業鏈環節 資料來源:公司年報,浙商證券研究所 資料來源:公司年報,浙商證券研究所 公司服務型虛擬人產品已在部分行業成功實踐,未來有望滲透更多
106、垂直應用場景。公司服務型虛擬人產品已在部分行業成功實踐,未來有望滲透更多垂直應用場景。目前公司已落地了一批服務型虛擬人項目,覆蓋了直播帶貨、智能播報、智能問答等領域,其中與廣東省共建“南方鄉村振興新農人 AI 數智賦能平臺”,定位在農產品 直播內容智能創作的 AIGC 在線服務平臺,面向農產品電商主播提供直播腳本智能創作、帶貨虛擬人全鏈租用等知識賦能服務。2022 年北京冬奧會期間,公司發布虛擬人“小思”,實現自動采編、智能寫稿、虛擬播報等全自動功能,通過自然語言處理、知識圖譜、機器學習和音視頻分析等技術,在“虛擬人代替人”進程中邁出了重要一步。表18:公司虛擬人技術應用場景及客戶 功能類型
107、客戶 涉及 NLP 技術代替人的主要功能 智能問答 中國中醫科學院 中醫中藥問答 中國標準化研究院 國家標準問答 人民衛生出版社 小艾機器人 時代經濟出版社 審計問答 中國日報 外國來華辦事問答 吉林政務問答 小吉智能機器人 智能比對 國家知識產權局 實用新型機檢報告 南方電網 南方電網科技查新 人民出版社 金典語義對比 文匯新民報業 文字作品互聯網傳播監測與版權保護平臺 事件智能分析 新華社 2019兩會分析 浙江日報集團 熱點分析、事件分析 魯能俱樂部 足球情感分析 智能內容寫作 浙報 機器人自動寫稿 專利開發公司 專利說明書自動概述、標題重構 經濟日報 財經快訊、CPI數據解讀 知識圖譜
108、 社會出版社 政區大典 民航科學院 民航不安全飛行事件本體 某部 英文人物畫像 中國外文局 外交人物機構關系圖譜 圖像識別 國家知識產權局 外觀檢索 某部 深度艦船分類檢索 專利出版社 商標近似檢索 長江日報 圖片三鑒、政治人物識別 資料來源:公司年報,浙商證券研究所整理 拓爾思(300229)深度報告 http:/ 29/41 請務必閱讀正文之后的免責條款部分 簽約藍色光標,服務虛擬人率先落地。簽約藍色光標,服務虛擬人率先落地。2022 年 2 月,公司與藍色光標達成戰略合作,依托在虛擬主播、智能問答機器人、智能創作、專業領域虛擬人等方面的成功經驗,結合藍色光標在虛擬及混合現實空間營銷、智能
109、虛擬人領域的業務基礎,雙方將大力推動元宇宙相關業務開拓。公司將以“虛擬人+”場景為突破口,首先落地服務虛擬人,應用布局將優先面向金融、傳媒、政府、營銷等行業的專業服務場景。3.2 人形機器人風起,公司聯手賽道頭部玩家入局有望受益行業發展人形機器人風起,公司聯手賽道頭部玩家入局有望受益行業發展 全球全球“機器換人“機器換人”進程加速,服務”進程加速,服務機器人市場規模穩定增長,機器人市場規模穩定增長,未來人形機器人有望深未來人形機器人有望深入各細分消費端場景入各細分消費端場景。人口老齡化趨勢下全球醫療和公共衛生需求持續旺盛,疊加疫情期間大量面對面場景被無接觸服務替代,接待機器人、遞送機器人、測溫
110、機器人和新零售機器人等需求增加,服務機器人市場潛力巨大。全球服務型機器人潛在市場規模超全球服務型機器人潛在市場規模超 200 億美元,國內市場有望迎來加速發展階段。億美元,國內市場有望迎來加速發展階段。根據中國電子學會統計數據,預計到 2023 年全球服務型機器人市場規模將達到 201.8 億美元,20162023 年 CAGR 約為 24.72%;預計到 2023年我國服務型機器人市場規模將突破600億,達 613.5 億元人民幣,20162023 年 CAGR 約為 37.87%。圖31:全球服務型機器人市場規模增長趨勢及預測 圖32:我國服務型機器人市場規模增長趨勢及預測 資料來源:中國
111、電子學會,浙商證券研究所整理 資料來源:中國電子學會,浙商證券研究所整理 語音語義分析作為人機交互核心途徑,幫助機器人具備聽、說、理解和思考的能力。語音語義分析作為人機交互核心途徑,幫助機器人具備聽、說、理解和思考的能力。語音語義模塊包含了語音識別和語義分析兩部分,涉及聲學信號(聲源定位、語音增強等)、模式識別(聲紋識別、語音識別等)、自然語言處理(自然語言理解、自然語言生成等)和 語音合成等技術。圖33:人形機器人人機交互模塊 資料來源:搜狐科技,浙商證券研究所整理 拓爾思(300229)深度報告 http:/ 30/41 請務必閱讀正文之后的免責條款部分 小米、特斯拉相繼發布商用人形機器人
112、產品,小米、特斯拉相繼發布商用人形機器人產品,國內外科技國內外科技大廠加速布局,行業有望加大廠加速布局,行業有望加速發展速發展。2022年 8月小米發布人形機器人 CyberOne,搭載自研 MiAI 環境語義識別引擎和MiAI 語音情緒識別引擎,能夠實現 85 種環境音識別和 6大類 45 種人類情緒識別。特斯拉發布的人形機器人擎天柱 Optimus,承接自動駕駛技術,AI 智能的核心 Transformer 架構同樣是 NLP 領域的標志性研究成果。圖34:小米人形機器人 CyberOne情緒感知模塊 圖35:特斯拉機器人 AI 智能交互架構 資料來源:小米官網,浙商證券研究所 資料來源:
113、Tesla AI Day,浙商證券研究所 公司深耕公司深耕 NLP 賽道,語義智能技術優勢顯著。賽道,語義智能技術優勢顯著。公司在 NLP、知識圖譜、OCR、圖像視頻結構化領域均具備自主可控的底層技術并處于行業領先地位,公司未來有望依托語音語義智能交互,尤其是中文交互領域的技術優勢,賦能人形機器人在知識儲備、智能交互、自主決策等方面的能力提升。公司自研面向中文的智能問答云服務系統“公司自研面向中文的智能問答云服務系統“TRS 小思智能問答機器人”。小思智能問答機器人”。公司該產品綜合運用 NLP、知識表示與推理等技術,通過語法語義分析、問題分類與解析等一系列處理流程,實現問題解答與人機交互,目
114、前廣泛應用于政務智能問答、企業智能客服以及金融、醫療、教育等領域的知識百科問答。表19:公司 TRS小思智能問答機器人功能及優勢亮點 功能 優勢與亮點 語義理解不同問法 基于 NLU 的問答引擎,識別問句意圖與關鍵術語,從而將各種問法歸集為相同的意思 上下文記憶 關鍵術語的上下文記憶,可在連續會話中省略相同實體 實體限定 利用實體限定功能輕松實現“魚丸粗面”的對話場景 知識構建 可針對 Excel、Word等文件進行信息抽取,快速形成問答知識庫 多租戶 提供租戶機制,每個租戶有獨立的知識庫,語義庫以及詞典,每個租戶有專屬的問答入口 遠程服務 提供基于 JSONP 的對外服務接口,可跨域調用,降
115、低與業務系統的集成成本,并提供 Web、微信等多種訪問方式 FAQ與 KGAQ雙引擎 FAQ與 KGAQ雙引擎融合計算綜合評分,通過投票機制給出標準答案與相關推薦問題 資料來源:公司官網,浙商證券研究所整理 公司加強與公司加強與 AI 及機器人廠商深度合作,未來有望成為人形機器人語義智能賽道領軍及機器人廠商深度合作,未來有望成為人形機器人語義智能賽道領軍者。者。在與 AI 廠商合作方面,公司和北京一流科技等 AI 廠商共同合作研究人形機器人軟件技術以及推廣應用。一流科技立足于通用性深度學習標準框架的研發和推廣使用,獨創了拓爾思(300229)深度報告 http:/ 31/41 請務必閱讀正文之
116、后的免責條款部分 自動數據模型混合并行、靜態調度、去中心化和全鏈路異步流式執行四大核心技術,力爭打造人工智能深度學習框架產品的引領者和事實工業標準。公司通過與 AI 廠商的深度合作,可將在自身在自然語言處理、知識圖譜領域深厚的積淀與 AI 廠商在深度學習引擎領域的技術優勢結合起來,構建機器人軟件大腦,研發云端協同的 AI 算法框架以及面向特定領域的知識圖譜技術,培育 AI算法集市,設計算法模塊共享、交易、分成機制,為機器人廠商提供中立、開放的軟件生態并延伸應用場景。公司持續加強與國內頭部機器人廠商合作。公司持續加強與國內頭部機器人廠商合作。公司數字經濟研究院成立機器人研究中心,和優必選、小鵬等
117、企業進行研究和探索。優必選作為國內外領先的機器人廠商,產品在兒童陪伴、教育等領域均具備顯著優勢,拓爾思基于多年 NLP 的深厚積淀,能夠進一步機器人的思考和交互能力,為用戶提供更擬人化的陪伴和交互體驗。3.3 云和數據服務轉型加速,云和數據服務轉型加速,SaaS 化進程加速有望助力公司提升盈利能力化進程加速有望助力公司提升盈利能力 公司多款產品實現全面公司多款產品實現全面 SaaS 化,云和數據業務加速發展為公司提供充足動力?;?,云和數據業務加速發展為公司提供充足動力。2022年上半年,公司的“數家-資訊大數據平臺”、“數星-智能風控平臺”、“金融風險監測平臺”、“網察-輿情大數據分析平臺”以
118、及“開源情報分析平臺”等均已經實現了產品的全面 SaaS 化,未來隨著公司大數據、人工智能業務在應用場景上的延伸,預計將推出更多SaaS 產品,進一步提升 SaaS 產品收入比例。表20:公司擁有多款 SaaS產品 產品 主要業務 數家媒體資訊大數據 云服務平臺 基于內容資訊領域的大數據智能服務平臺,平臺匯聚了全網新聞資訊類的內容數據,以“多維知識庫+智能語義”的方式對文章進行結構化標引,為媒體提供高信源、精加工的資訊內容服務。數星智能風控 大數據平臺 圍繞海量異構數據,全面監控海量金融實體多維風險。平臺提供智能多維標簽、預警信號推送、風險事件跟蹤、風險傳導關聯、綜合異構圖譜等貫穿多場景全流程
119、風險管理功能,提升金融機構風控能力,在風控、合規、投研、監管等核心金融場景得到廣泛應用。網脈云服務平臺 新一代全端友好性分析工具,主要面向企業、媒體、政府行業企業級客戶提供專業的網站、APP、小程序分析服務,通過精準分析提高網站、APP、小程序友好性,幫助企業運營進而提升網絡營銷的有效性和便利性。網察大數據分析平臺 從網絡輿情線索發現、實時預警、分析研判、綜合報告等環節為用戶提供全面、及時、準確的服務。聚合網絡新聞、微博、微信、境外媒體等多渠道海量數據,以信息監測、態勢感知、關系挖掘、事件追蹤、傳播分析、智庫共享等為目標,解決跨輿論場的網絡信息洞察、分析、研判,實現從數據到智能決策的一體化大數
120、據輿情服務。資料來源:公司官網,浙商證券研究所整理 公司堅持優先發展云和數據智能服務戰略,云和數據服務收入持續增長。公司堅持優先發展云和數據智能服務戰略,云和數據服務收入持續增長。公司20182021 年云和數據業務收入高速增長,2021年相關收入達 3.78 億元,占營業收入比例達到 36.84%。在 2022 年經營計劃中,公司明確提出支持優先發展云和數據智能服務戰略,預計未來將持續保持較快增長態勢。拓爾思(300229)深度報告 http:/ 32/41 請務必閱讀正文之后的免責條款部分 圖36:2018-2022H1公司云和數據業務收入規模及占比 資料來源:公司年報,浙商證券研究所整理
121、 SaaS 商業模式優勢突出,國內市場空間廣闊,公司業務轉型有望打開成長空間。商業模式優勢突出,國內市場空間廣闊,公司業務轉型有望打開成長空間。根據艾媒咨詢統計數據,2021 年中國 SaaS行業市場規模達 322.6 億元,預計到 2023年將達到約 555 億元,近幾年保持約 30%的復合增長率。與美國對比,頭豹研究院數據顯示,2020年中國 SaaS 行業占 IT 整體支出比例為 1.3%,相比于 2011年的 0.1%大幅增長,但相對于美國 2020年的 5.4%仍有很大提升空間??紤]美國 SaaS 產業起步較早,企業數字化程度更高,未來中國企業 SaaS有望加速滲透,市場規模前景可期
122、。圖37:2015-2023年中國 SaaS行業市場規模及預測 圖38:2011-2020年中美兩國 SaaS占 IT投入比例 資料來源:艾媒咨詢,浙商證券研究所整理 資料來源:頭豹研究院,浙商證券研究所整理 SaaS 商業模式具備多重優勢,公司加速轉型有望進一步提升核心競爭力。商業模式具備多重優勢,公司加速轉型有望進一步提升核心競爭力。公司加速業務云轉型,整個商業模式正由銷售解決方案、軟件產品全面轉向 SaaS 服務模式。傳統的數字政府、融媒體等行業解決方案的生產由重建設轉向重運營、重增值服務,通過疊加專業領域的數據服務,進一步深化服務能力。我們預計未來公司在專利、虛擬人、機器人等新領域業務
123、開拓中也將采用 SaaS 服務模式,提升公司 SaaS 營收占比的同時,進一步完善業務生態,提升行業競爭力。拓爾思(300229)深度報告 http:/ 33/41 請務必閱讀正文之后的免責條款部分 4 拓爾思,三十年耕耘成就語義智能領軍者拓爾思,三十年耕耘成就語義智能領軍者 4.1 深耕語義智能賽道,打造完整業務版圖深耕語義智能賽道,打造完整業務版圖 深耕深耕 NLP 領域領域 30 年年,公司發展成為國內政務領域公司發展成為國內政務領域 NLP 龍頭廠商龍頭廠商。公司以“語義智能+”為發展戰略深耕多年,主要業務覆蓋內容安全和互聯網空間治理、數字政府和數據智能三大板塊,向以黨政機關及企事業單
124、位為主的下游客戶提供大數據檢索、智能風控營銷、輿情監控等服務。在數據安全領域,子公司天行網安提供數據安全傳輸和交換產品及服務。公司以深耕多年的大數據積累與行業領先的 NLP 技術成為國內政府政務領域 NLP 龍頭,多年以來一直保持行業領先的市場地位。公司人工智能和大數據核心技術具有跨行業/領域的通用普適性,因此公司技術產品和服務所支持的業務應用落 地場景眾多,涵蓋多個行業/領域,大型或頭部企業級客戶超過 8000 家。在具體客戶應用中,公司技術產品的交付部署 模式包括私有云、混合云和公有云等模式或多模式的融合,滿足客戶從通用到個性的完整需求。圖39:公司產品矩陣 資料來源:公司 2022年半年
125、度報告,浙商證券研究所整理 公司深耕公司深耕 NLP 賽道三十余年,持續迭代構建牢固護城河。賽道三十余年,持續迭代構建牢固護城河。公司于 1993 年成立,堅持圍繞自然語言處理技術,積極自主研發大數據和人工智能技術,具備自然語言處理領域自主可控的全產業鏈能力。目前公司及全資/控股子公司擁有 600 余項軟件著作權。圖40:公司發展歷程 資料來源:公司官網,浙商證券研究所整理 拓爾思(300229)深度報告 http:/ 34/41 請務必閱讀正文之后的免責條款部分 4.2 公司股權結構穩定,核心團隊經驗優勢豐富,研發實力雄厚公司股權結構穩定,核心團隊經驗優勢豐富,研發實力雄厚 公司股權結構穩定
126、,通過收購方式進一步完善業務矩陣。公司股權結構穩定,通過收購方式進一步完善業務矩陣。公司實控人為董事長李渝勤,公司前五大股東持股比例達 47.79%,其中第一大股東為信科互動科技發展有限公司,持股比例為 33%,整體股權結構保持穩定。表21:公司前五大股東明細(截至 2022H1)排名 股東名稱 持股比例(%)1 信科互動科技發展有限公司 33%2 北京北信科大資產管理有限公司 6.17%3 博泰精選 1號私募證券投資基金 4.98%4 珠池新機遇私募投資基金七期 2.01%5 香港中央結算有限公司 1.63%資料來源:Wind,浙商證券研究所整理 公司通過并購業務完善公司業務版圖。公司通過并
127、購業務完善公司業務版圖。公司于 2014年收購天行網安 100%股權,后者是國內最早從事網絡信息安全的企業,產品應用場景覆蓋公安、政府和教育等行業,此舉使公司擁有行業級產品應用,為公司產品近公安領域打下了堅實基礎;公司自 2013 年持續參股并至 2018 年持有廣州科韻 86.4%股權,后者的大數據一體化平臺聚焦于公共安全和政府領域的應用。公司目前有天行網安、廣拓公司、金新網銀等子公司,各子公司業務布局各有側重,支撐公司構建了完善的業務生態,未來有望持續賦能公司主營業務向更多垂直行業的細分場景延伸。表22:公司主要子公司主營業務布局 子公司 主要業務 天行網安 提供數據安全傳輸和交換產品及服
128、務 廣拓公司 研發和銷售知識圖譜技術和大數據分析軟件 金新網銀 開發和提供以金融科技為業務主營方向的大數據智能服務產品 成都子公司 從事國內西部市場的營銷拓展和技術研發工作,并承建公司西部區域總部及大數據研發和運營服務基地 項目 資料來源:公司財報,浙商證券研究所整理 公司技術人員儲備豐富,研發能力突出。公司技術人員儲備豐富,研發能力突出。截至 2021年末,公司在職員工合計 1631人,其中技術人員達 1458人,占比達 89.39%。學歷為大學本科及以上的員工數量達到1348 人,占比達 82.65%,預計公司未來通過儲備高學歷技術人才,進一步提升產品研發實力,推動業務向更多應用場景延伸。
129、拓爾思(300229)深度報告 http:/ 35/41 請務必閱讀正文之后的免責條款部分 圖41:公司員工教育程度結構 資料來源:公司年報,浙商證券研究所整理 4.3 公司營收穩健成長,費用結構合理,發展步伐堅定公司營收穩健成長,費用結構合理,發展步伐堅定 公司主營業務收入持續增長,未來業務擴張有望持續提升盈利能力。公司主營業務收入持續增長,未來業務擴張有望持續提升盈利能力。公司 2021年實現營業收入 10.29 億元,同比均有所下降,系 2021年公司營業收入不再包含程度子公司2020 年配套商業房產項目收入和原控股子公司奈特康賽的互聯網營銷收入所致,剔除上述影響后 2021 年主營業務
130、收入實現同比增長 31.83%,保持穩健成長。公司 2022H1實現營業總收入 4.25億元,歸母凈利潤 0.74億元,同比分別增長 8.53%和 36.19%。公司產品 SaaS化轉型有望驅動業務盈利能力進一步增強,基于公司在專利、虛擬人、機器人等領域的持續探索和布局,看好公司未來打開成長空間。圖42:公司 2017-2022H1營業收入情況 圖43:公司 2017-2022H1歸母凈利潤情況 資料來源:Wind,浙商證券研究所整理 資料來源:Wind,浙商證券研究所整理 公司各項費用結構穩定,毛利率與凈利率有望進一步提升。公司各項費用結構穩定,毛利率與凈利率有望進一步提升。2021年公司銷
131、售、研發和管理費用率分別為 11.50%、9.53%和 14.83%,2018至 2021年各項費率保持穩定。公司2021 年毛利率和凈利率分別為 62.13%和 24.12%,近年來穩中有升,公司未來通過云及SaaS 產品收入比重的持續加大,毛利率及凈利率有望繼續提升。拓爾思(300229)深度報告 http:/ 36/41 請務必閱讀正文之后的免責條款部分 圖44:公司 2018-2021各項費率結構 圖45:公司 2017-2022H1毛利率、凈利率情況 資料來源:Wind,浙商證券研究所整理 資料來源:Wind,浙商證券研究所整理 4.4 公司覆蓋多行業優質客戶,現金流保持健康公司覆蓋
132、多行業優質客戶,現金流保持健康 公司客戶優質且粘性高,行業覆蓋度持續提升。公司客戶優質且粘性高,行業覆蓋度持續提升。公司目技術產品和服務所支持的業務應用落 地場景眾多,涵蓋多個行業/領域,目前服務大型或頭部企業級客戶超過 8000 家。在具體客戶應用中,公司技術產品的交付部署模式包括私有云、混合云和公有云等模式或多模式的融合,滿足客戶從通用到個性的完整需求,并且企業復購率高,客戶粘性好。表23:公司主要行業客戶及覆蓋情況 行業行業 覆蓋情況覆蓋情況 制造、能源 服務包括南方電網、國家電網、海爾集團、海信集團等眾多企業客戶 互聯網、傳媒 融媒體行業服務已覆蓋 72%的中央媒體,61%的省級媒體,
133、40%的行業媒體機構用戶 金融 產品和服務應用于 5大國有銀行、3大政策性銀行、50%的股份制商業銀行、主要交易所及國家監管機構和約 300家地方金融監管部門等客戶 政府 數字政府和公共服務領域的產品+云服務+解決方案業務體系已覆蓋 80%的中央和國務院機構,60%的省級政府,50%的地市級政府 公共安全 目前已服務國內千余家機構用戶,包括互聯網空間治理和監管機構、黨政機關、媒體機構、教育機構、大中型企業等。資料來源:公司 2022半年報,浙商證券研究所整理 貨幣資金貨幣資金儲備充足,公司已為新業務布局做好準備。儲備充足,公司已為新業務布局做好準備。2022Q3,公司現金儲備達 3.85 億元
134、,現金儲備維持健康狀態??紤]公司收入集中在第四季度,且未來將持續投入開拓新業務場景,看好公司基于現金儲備優勢,加速新業務方面的拓展并保持良好運營狀態。圖46:公司貨幣資金儲備(單位:百萬元)資料來源:Wind,浙商證券研究所整理 拓爾思(300229)深度報告 http:/ 37/41 請務必閱讀正文之后的免責條款部分 5 盈利預測與估值盈利預測與估值 5.1 盈利預測盈利預測 營業收入:營業收入:公司是國內最早從事自然語言處理(NLP)技術研發的企業之一,主營業務包括人工智能產品及服務、大數據產品及服務和數據安全產品及服務等。公司近年來穩步發展,產品服務在政府、公安、金融、傳媒等領域均具備競
135、爭優勢,2021 年營業收入達 10.29 億元。公司持續開辟新業務場景,未來有望將產品服務應用到知識產權、虛擬人、機器人等新賽道,我們預測公司 2022-2024 年營收持續提升,增長率分別為 27.41%、25.48%和 24.02%,對應營收為 13.11億元、16.45 億元和 20.40 億元。大數據服務:大數據服務:根據中國信息通信研究院數據顯示,2021 年中國數字經濟規模達到 7.1 萬億美元,同比增加約 15.42%,且在未來幾年將保持增長態勢。數字化轉型正由效率變革向 價值變革、由企業內向產業鏈價值鏈拓展,面向實體經濟的工業/產業互聯網平臺快速發展。公司基于自主建設的大數據
136、中心及語義智能技術,積累了海量數據資產,同時公司是最早從事中文全文檢索技術研發的企業,具有全球領先的智能檢索技術,對標國外龍頭廠商 Elasticsearch,其搜索引擎業務在 2019-2021 財年實現營業收入4.28/6.08/8.62 億美元,同比增長 57.41%/42.30%/41.72%,公司作為國內少數的搜索引擎數據庫供應商,在國產搜索引擎數據庫 0到 1的過程中有望驅動相關業務在未來實現高增長,同時知識產權等領域有望提供業務新動能,公司預計 2022-2024 年大數據服務業務收入增速為 30.18%、26.84%和 24.69%。人工智能產品:人工智能產品:公司在自然語言處
137、理(NLP)領域有多年的技術及業務積累,在NLP、知識圖譜、OCR、圖像視頻結構化領域均實現核心技術的自主可控,處于行業領先地位。根據賽迪研究院預測,我國 NLP 市場規模將在未來幾年內保持約 36.5%的復合增長率,并處于快速產業化應用階段,公司 2021年人工智能軟件產品及服務業務實現營收 1.81億元,同比增長 51.95%,公司基于 NLP、知識圖譜核心技術開發的人工智能產品及服務,在金融反欺詐、情報分析、人機交互等領域有望打開市場應用空間,對標海外龍頭公司 Palantir,其在 2019-2021年實現營業收入 7.43/10.93/15.41 億美元,同比增長 24.71%/47
138、.15%/41.11%。我們認為隨著垂直行業人工智能商業化進程的加速,以及公司相關產品服務不斷延伸應用場景,未來有望保持持續增長態勢。我們預計 2022-2024 年公司相關業務營收增速分別為 41.27%、38.72%和 36.38%。網絡安全產品:網絡安全產品:公司全資子公司天行網安是國內最早從事網絡安全和數據交換的企業,在數據視頻交換、單向導入等方面具有雄厚技術實力,目前形成了邊界安全、物聯網安全、大數據安全三大陣營完整產品線和解決方案,并在政府、公安、軍隊和金融等行業領域得到廣泛應用與認證。公司 2021 年網絡安全產品業務實現收入 1.43億元,同比增長 7.63%,根據 IDC 預
139、測,2026年中國網絡安全 IT 支出規模將達到 318.6億美元,2022-2026 五年 CAGR 約 21.6%,市場空間廣闊。我們認為公司有望受益信創浪潮,以及網絡安全領域需求持續提升,實現相關業務穩定增長態勢。我們預計2022-2024 年公司相關業務營收增速分別為 21.66%、19.53%和 16.96%。系統集成及其它:系統集成及其它:該項業務主要為配合公司前述幾項業務,2021年實現營業收入 1.90億元,同比增長 210.72%。未來營收有望隨著公司前述三大業務規模的成長而增加,但隨著公司加速產品 SaaS化轉型進程,系統集成業務增速可能逐步放緩。預計 2022-2024
140、年相關業務營收增速分別為 11%、10%和 9%。拓爾思(300229)深度報告 http:/ 38/41 請務必閱讀正文之后的免責條款部分 毛利率:毛利率:2019-2021 年公司的毛利率分別為 61.75%、58.07%和 62.13%,2021 年公司大數據、人工智能、安全產品和系統集成及其它各項業務毛利率分別為 70.81%、73.75%、73.72%和 18.76%,其中大數據軟件產品及服務的毛利率同比提升了 7.8%,未來隨著公司產品 SaaS化轉型的持續推進,產品服務趨向標準化,毛利率有望持續持續提升。我們預計公司 2022-2024 年毛利率分別為 63.65%、64.92%
141、和 65.97%。費用率:費用率:銷售費用率方面,2019-2021 年公司銷售費用率分別為 17.05%、11.05%和11.50%,考慮公司業務規模成長疊加產品服務標準化程度的提升,公司有望保持銷售費用率在穩定水平,預計 2022-2024 年公司銷售費用率分別為 11.27%、11.39%和11.33%;管理費用率方面,2019-2021 年公司管理費用率分別為 15.58%、8.10%和14.83%,其中 2020 年由于包含地產業,費用率有出現一定波動,務考慮公司未來整體管理結構穩定,預計 2022-2024 年管理費用率分別為 15.00%、14.10%和 14.00%;研發費用率
142、方面,公司 2019-2021 年研發費用率分別為 9.45%、6.26%和 9.53%,考慮公司未來計劃持續投入新產品服務的技術研發,預計將持續儲備核心技術人才,預計2022-2024 年研發費用率為 12.13%、12.01%、11.88%。5.2 投資建議與估值投資建議與估值 估值方面,我們以行業相關性為標準,分別從國外和國內選取可比公司進行分析。國外公司方面,我們選取了海外搜索引擎數據庫龍頭公司 Elasticsearch,以及知識圖譜龍頭廠商 Palantir,由于上述兩家可比公司均未實現盈利,因此我們采用 PS估值法進行分析??紤]公司相比于 Palantir 和 Elasticse
143、arch 能夠實現穩定盈利,且國內大數據及人工智能市場快速發展,搜索引擎國產化替代進程加速,公司較兩家國外可比公司應當獲得更高的 PS 倍數估值。表24:可比公司估值分析(Palantir、Elasticsearch)股票代碼 公司名稱 市值 營業收入(億)PS 2022E 2023E 2024E 2022E 2023E 2024E PLTR.US Palantir 153.31億美元 19.01 USD 23.31 USD 28.67 USD 8.06 6.58 5.35 ESTC.N Elasticsearch 56.61億美元 10.85 USD 14.24 USD 18.60 USD
144、5.22 3.98 3.04 平均值 6.64 5.28 4.20 300229.SZ 拓爾思 87.49 億人民幣 13.11 RMB 16.45 RMB 20.40 RMB 6.67 5.32 4.29 資料來源:Wind,Bloomberg,浙商證券研究所整理(注:截至 2022年 11月 29日)國內方面,我們選取人工智能及大數據領域的科大訊飛、美亞柏科作為可比公司進行分析。參考可比公司,考慮公司在語義智能領域的技術壁壘深厚,并且在政府、公安等領域有多年服務經驗和高粘客戶積累,未來有望在信創浪潮驅動下將業務快速拓展到其他領域,我們基于公司 2022 年行業平均 36.54 倍 PE。首
145、次覆蓋給予“買入”評級。拓爾思(300229)深度報告 http:/ 39/41 請務必閱讀正文之后的免責條款部分 表25:可比公司估值分析(科大訊飛、美亞柏科)股票代碼 公司名稱 市值(億人民幣)營業收入(億人民幣)PE 2022E 2023E 2024E 2022E 2023E 2024E 002230.SZ 科大訊飛 749.89 235.70 306.88 395.62 40.32 29.16 22.00 300188.SZ 美亞柏科 106.34 28.12 33.48 39.82 32.76 25.13 19.44 平均 36.54 27.15 20.72 300229.SZ 拓爾
146、思 87.49 13.11 16.45 20.40 27.76 21.80 17.03 資料來源:Wind,浙商證券研究所整理(注:截至 2022年 11月 29日)6 風險提示風險提示 1、行業競爭加劇帶來的風險:、行業競爭加劇帶來的風險:政務、金融等信息化分為多個細分領域,細分領域競爭有加劇的可能;另外公司向其他行業滲透將面對細分領域已有競爭者的競爭。2、新業務開拓進展不及預期、新業務開拓進展不及預期帶來的風險帶來的風險:公司在專利檢索、虛擬人、機器人等創新業務均有開展,而且在行業內也屬于率先開拓相關業務的探索者。未來業務拓展中可能遇到困難,導致業務拓展進度存在不確定性。3、宏觀經濟下行導
147、致宏觀經濟下行導致業務波動帶來的風險:業務波動帶來的風險:公司業務產品與下游政府及商業客戶的戰略轉型規劃關系較為緊密,宏觀經濟下行可能導致企業自身財力受影響或政府在大數據、人工智能方面預算縮緊,導致下游景氣度提升緩慢,未來仍存在波動的可能。拓爾思(300229)深度報告 http:/ 40/41 請務必閱讀正文之后的免責條款部分 Table_ThreeForcast 表附錄:三大報表預測值表附錄:三大報表預測值 資產負債表 利潤表 (百萬元)2021 2022E 2023E 2024E (百萬元)2021 2022E 2023E 2024E 流動資產流動資產 1583 1686 2020 25
148、52 營業收入營業收入 1029 1311 1645 2040 現金 491 544 711 1094 營業成本 390 476 577 694 交易性金融資產 414 398 406 402 營業稅金及附加 11 29 43 40 應收賬項 326 378 499 602 營業費用 118 148 187 231 其它應收款 33 53 61 74 管理費用 153 197 232 286 預付賬款 3 8 5 8 研發費用 98 159 198 242 存貨 94 132 125 170 財務費用 20 24 22 18 其他 222 172 214 203 資產減值損失 27 (10)(
149、1)12 非流動資產非流動資產 2143 2334 2501 2583 公允價值變動損益 4 4 4 4 金額資產類 0 0 0 0 投資凈收益 19 17 14 11 長期投資 77 79 78 79 其他經營收益 39 32 32 34 固定資產 298 321 381 367 營業利潤營業利潤 274 341 437 566 無形資產 302 417 536 648 營業外收支 4 4 4 4 在建工程 0 0 0 0 利潤總額利潤總額 279 345 442 570 其他 1466 1516 1505 1488 所得稅 31 27 37 52 資產總計資產總計 3726 4020 45
150、21 5135 凈利潤凈利潤 248 318 405 519 流動負債流動負債 484 467 557 654 少數股東損益 2 3 4 5 短期借款 10 4 5 6 歸屬母公司凈利潤歸屬母公司凈利潤 246 315 401 514 應付款項 214 251 310 370 EBITDA 353 438 533 667 預收賬款 1 0 1 1 EPS(最新攤?。?.34 0.44 0.56 0.72 其他 259 212 241 278 非流動負債非流動負債 664 657 663 661 主要財務比率 長期借款 0 0 0 0 2021 2022E 2023E 2024E 其他 664
151、657 663 661 成長能力成長能力 負債合計負債合計 1148 1124 1220 1315 營業收入-21.44%27.41%25.48%24.02%少數股東權益 14 17 21 26 營業利潤-32.11%24.26%28.27%29.40%歸屬母公司股東權益 2563 2878 3280 3793 歸屬母公司凈利潤-34.57%28.24%27.32%28.04%負債和股東權益負債和股東權益 3726 4020 4521 5135 獲利能力獲利能力 毛利率 62.13%63.65%64.92%65.97%現金流量表 凈利率 24.12%24.28%24.63%25.43%(百萬元
152、)2021 2022E 2023E 2024E ROE 10.33%11.52%12.95%14.43%經營活動現金流經營活動現金流 189 325 416 542 ROIC 9.36%11.78%12.93%14.05%凈利潤 248 318 405 519 償債能力償債能力 折舊攤銷 81 69 69 79 資產負債率 30.82%27.96%26.99%25.62%財務費用 20 24 22 18 凈負債比率 1.43%0.55%0.67%0.78%投資損失(19)(17)(14)(11)流動比率 3.27 3.61 3.62 3.90 營運資金變動(103)(24)(68)(24)速動
153、比率 3.08 3.33 3.40 3.64 其它(39)(44)2(38)營運能力營運能力 投資活動現金流投資活動現金流(754)(238)(229)(143)總資產周轉率 0.31 0.34 0.39 0.42 資本支出 89(43)(84)(13)應收賬款周轉率 3.38 4.10 4.13 4.08 長期投資(157)(1)1 0 應付賬款周轉率 1.59 2.05 2.06 2.04 其他(686)(193)(146)(130)每股指標每股指標(元元)籌資活動現金流籌資活動現金流 756(34)(20)(16)每股收益 0.34 0.44 0.56 0.72 短期借款 8(6)1(1
154、)每股經營現金 0.26 0.46 0.58 0.76 長期借款 0 0 0 0 每股凈資產 3.59 4.03 4.59 5.31 其他 756(28)(22)(17)估值比率估值比率 現金凈增加額現金凈增加額 190 53 167 383 P/E 35.60 27.76 21.80 17.03 P/B 3.41 3.04 2.67 2.31 EV/EBITDA 18.51 17.88 14.38 10.94 資料來源:浙商證券研究所 拓爾思(300229)深度報告 http:/ 41/41 請務必閱讀正文之后的免責條款部分 股票投資評級說股票投資評級說明明 以報告日后的 6 個月內,證券相
155、對于滬深 300指數的漲跌幅為標準,定義如下:1.買 入:相對于滬深 300 指數表現20以上;2.增 持:相對于滬深 300 指數表現1020;3.中 性:相對于滬深 300 指數表現1010之間波動;4.減 持:相對于滬深 300 指數表現10以下。行業的投資評級:行業的投資評級:以報告日后的 6 個月內,行業指數相對于滬深 300 指數的漲跌幅為標準,定義如下:1.看 好:行業指數相對于滬深 300指數表現10%以上;2.中 性:行業指數相對于滬深 300指數表現10%10%以上;3.看 淡:行業指數相對于滬深 300指數表現10%以下。我們在此提醒您,不同證券研究機構采用不同的評級術語
156、及評級標準。我們采用的是相對評級體系,表示投資的相對比重。建議:投資者買入或者賣出證券的決定取決于個人的實際情況,比如當前的持倉結構以及其他需要考慮的因素。投資者不應僅僅依靠投資評級來推斷結論。法律聲明及風險提示法律聲明及風險提示 本報告由浙商證券股份有限公司(已具備中國證監會批復的證券投資咨詢業務資格,經營許可證編號為:Z39833000)制作。本報告中的信息均來源于我們認為可靠的已公開資料,但浙商證券股份有限公司及其關聯機構(以下統稱“本公司”)對這些信息的真實性、準確性及完整性不作任何保證,也不保證所包含的信息和建議不發生任何變更。本公司沒有將變更的信息和建議向報告所有接收者進行更新的義
157、務。本報告僅供本公司的客戶作參考之用。本公司不會因接收人收到本報告而視其為本公司的當然客戶。本報告僅反映報告作者的出具日的觀點和判斷,在任何情況下,本報告中的信息或所表述的意見均不構成對任何人的投資建議,投資者應當對本報告中的信息和意見進行獨立評估,并應同時考量各自的投資目的、財務狀況和特定需求。對依據或者使用本報告所造成的一切后果,本公司及/或其關聯人員均不承擔任何法律責任。本公司的交易人員以及其他專業人士可能會依據不同假設和標準、采用不同的分析方法而口頭或書面發表與本報告意見及建議不一致的市場評論和/或交易觀點。本公司沒有將此意見及建議向報告所有接收者進行更新的義務。本公司的資產管理公司、
158、自營部門以及其他投資業務部門可能獨立做出與本報告中的意見或建議不一致的投資決策。本報告版權均歸本公司所有,未經本公司事先書面授權,任何機構或個人不得以任何形式復制、發布、傳播本報告的全部或部分內容。經授權刊載、轉發本報告或者摘要的,應當注明本報告發布人和發布日期,并提示使用本報告的風險。未經授權或未按要求刊載、轉發本報告的,應當承擔相應的法律責任。本公司將保留向其追究法律責任的權利。浙商證券研究所浙商證券研究所 上??偛康刂罚簵罡吣下?729 號陸家嘴世紀金融廣場 1號樓 25層 北京地址:北京市東城區朝陽門北大街 8號富華大廈 E座 4層 深圳地址:廣東省深圳市福田區廣電金融中心 33層 上??偛苦]政編碼:200127 上??偛侩娫挘?8621)80108518 上??偛總髡妫?8621)80106010 浙商證券研究所:https:/