《海天瑞聲-自動駕駛剛需稀缺的AI數據標注“智能工廠”-221105(22頁).pdf》由會員分享,可在線閱讀,更多相關《海天瑞聲-自動駕駛剛需稀缺的AI數據標注“智能工廠”-221105(22頁).pdf(22頁珍藏版)》請在三個皮匠報告上搜索。
1、 公司公司報告報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 1 海天瑞聲海天瑞聲(688787)證券證券研究報告研究報告 2022 年年 11 月月 05 日日 投資投資評級評級 行業行業 計算機/IT 服務 6 個月評級個月評級 買入(首次評級)當前當前價格價格 63.58 元 目標目標價格價格 93.64 元 基本基本數據數據 A 股總股本(百萬股)42.80 流通A 股股本(百萬股)26.54 A 股總市值(百萬元)2,721.22 流通A 股市值(百萬元)1,687.49 每股凈資產(元)19.09 資產負債率(%)3.83 一年內最高/最低(元)113.00
2、/35.65 作者作者 繆欣君繆欣君 分析師 SAC 執業證書編號:S1110517080003 張若凡張若凡 分析師 SAC 執業證書編號:S1110521090001 資料來源:聚源數據 相關報告相關報告 股價股價走勢走勢 自動駕駛剛需,稀缺的自動駕駛剛需,稀缺的 AI 數據標注“智能工廠”數據標注“智能工廠”海天瑞聲:國內領先的海天瑞聲:國內領先的 AI 訓練數據專業提供商。訓練數據專業提供商。公司致力于為 AI 產業鏈上的各類機構提供算法模型開發訓練所需的專業數據集。公司所提供的訓練數據覆蓋智能語音(語音識別、語音合成等)、計算機視覺、自然語言等多個核心領域,全面服務于人機交互、自動駕
3、駛、智能家居、智慧城市等多種創新應用場景。其中智能語音為公司的優勢領域,產品線已包含 190個主要語種及方言。公司的產品和服務已獲得字節跳動、阿里巴巴、騰訊、百度、科大訊飛、??低?、微軟、亞馬遜、三星、中國科學院、清華大學等國內外客戶的認可,應用于其研發的個人助手、智能音箱、語音導航、搜索服務、短視頻、虛擬人、自動駕駛、機器翻譯等多種產品相關的算法模型訓練過程中。公司客戶累計數量 740 家,覆蓋了科技互聯網、社交、IoT、自動駕駛、智慧金融等領域的主流企業,教育科研機構以及部分政企機構。自動駕駛或將加速落地,公司有望迎來自動駕駛或將加速落地,公司有望迎來首個行業級數據業務首個行業級數據業務
4、高增長。高增長。根據IDC 發布的中國自動駕駛汽車市場數據追蹤報告,2022 年一季度 L2 級自動駕駛在乘用車市場的新車滲透率達 23.2%,整個市場處于 L2 向 L3+級別發展的階段。隨著激光雷達的鋪貨、成本的降低以及自動駕駛相關政策性文件的推出或將加速 L3+級別自動駕駛的落地。自動駕駛技術的迭代需依賴大量的數據進行訓練,數據貫穿研發、測試、量產、運營維護等全生命周期。此外,伴隨智能網聯汽車傳感器數量的快速增加,自動駕駛車輛的數據生成量也將呈現指數級增長,這都將帶來大量的數據處理需求。公司強力布局自動駕駛業務,開啟車載語音數據及 DMS/OMS 數據業務并日臻成熟,艙外視覺場景數據業務
5、亦基本實現全覆蓋。公司已設立獨立自動駕駛事業部并配置專項研發、銷售、產品、項目交付團隊,通過快速迭代平臺工具及算法迅速提升自動駕駛業務競爭力,實現自動駕業務的快速擴張,2022 年前三季度已驗收訂單與截止三季度末在手訂單合計約 5,000 萬元,同比增長超 200%。我們認為,在自動駕駛整體加速落地的大背景下,公司自身自動駕駛數據業務能力構建基本完成,預期將同步實現快速提升,有望帶動整體業務實現高速增長。對標對標 Scale.AI,人機協同降本增效,有望提升毛利率。,人機協同降本增效,有望提升毛利率。公司今年 6 月上線第三代自動駕駛標注平臺,已基本實現自動駕駛艙外視覺場景的全覆蓋。并將于年底
6、前上線第四代自動駕駛數據處理平臺,將進一步升級工具和算法功能,可支持各類型傳感器及多傳感器融合的數據處理、BEV(鳥瞰圖)標注、點云疊加標注等多類前沿標注需求;同時算法中臺能力也將持續提升。我們認為,公司自動駕駛數據標注過程中算法的引入有望降低公司的人工成本,從而提升業務毛利率。數安合規將重塑數安合規將重塑自動駕駛自動駕駛數據產業格局。數據產業格局。今年 8 月末,自然資源部發布相關通知,規定了從事測繪相關工作的內資企業需獲得相應資質方能準入,外商投資企業則不能申請、應委托具有相應資質的單位開展相應測繪活動。這意味著未取得測繪資質的企業將不得從事自動駕駛艙外數據的處理(包括但不限于采集、標注等
7、)工作,進一步提高了行業準入門檻。我們認為,未來擁有測繪資質的企業將能夠更快搶占自動駕駛數據市場。公司已于今年 6 月獲批乙級測繪資質,同時受中國移動、中國互聯網投資基金戰略股東加持,相信將為其自動駕駛領域業務的拓展奠定更好的基礎。2022 年上半年境外市場簽單額同比增長近年上半年境外市場簽單額同比增長近 2.5 倍,前三季度境外基礎訓練倍,前三季度境外基礎訓練數據業務收入同比增長近數據業務收入同比增長近 140%。近年來,公司力拓全球市場,使之成為公司收入和毛利的重要支撐。2022 年,公司已啟動更為全面的全球化發展戰略,從品牌升級、體系搭建、團隊建設、營銷推廣等多維度升級海外市場布局,預期
8、未來將繼續成為公司收入和毛利增長的重要引擎。我們預計,公司 2022-2024 年營收分別為 2.65/3.97/6.09 億元,歸母凈利潤為 0.14/0.62/1.31 億元,對應當前市值 PE 分別為 191/43/20 倍。-46%-32%-18%-4%10%24%38%52%2021-112022-032022-07海天瑞聲滬深300 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 2 2022 年收入拐點已現,可持續增長預期高,年收入拐點已現,可持續增長預期高,2023 年有望迎來利潤釋放。年有望迎來利潤釋放??紤]自動駕駛行業數據業務有較高成長性
9、,本報告采用考慮自動駕駛行業數據業務有較高成長性,本報告采用分部分部估值法:估值法:基礎數據業務:考慮公司語音方面積累深厚,尤其是多語種方面的積累和能力,可以更好服務境外公司全球化布局。公司從 2021 年開始制定了更為全面的全球化發展戰略,從品牌升級、體系搭建、團隊建設、營銷推廣等多維度升級海外市場布局,大大提升海外客戶觸達和服務能力,2022 年上半年境外業務增勢顯著,考慮以上情況,對該部分適用 PE 估值方法。根據我們預測,2023 年基礎數據業務凈利潤達 0.54 億元,參考可比公司中科創達/四維圖新/德賽西威 PE 估值平均 45.51x,考慮公司境外基礎數據業務增速較快給予該業務
10、2023 年 50 x P/E,對應市值 27 億元。智能駕駛行業數據業務:考慮自動駕駛的高景氣度,公司對自動駕駛平臺的持續高投入,且獲得乙級測繪資質,公司計算機視覺業務營收有望迎來高增長,考慮該業務的高投入及高成長性,對公司該部分適用 PS 估值方法。根據我們預測,2023 年公司智能駕駛行業數據業務營收達 1.09 億元,參考可比公司格靈深瞳/中科創達/虹軟科技 PS 估值平均 10.29x,鑒于公司智能駕駛行業數據業務為新業務且增速較快,給予該業務 2023 年 12x P/S,對應市值 13.08 億元。綜上,結合基礎數據業務 PE 估值以及智能駕駛行業數據業務 PS 估值,給予公司目
11、標市值 40.08 億元,目標價 93.64 元,首次覆蓋,給予“買入”評級。風險風險提示提示:技術迭代風險;匯率波動風險;新客戶收入占比較低的風險;市場競爭加劇風險。財務數據和估值財務數據和估值 2020 2021 2022E 2023E 2024E 營業收入(百萬元)233.37 206.48 264.70 397.32 608.92 增長率(%)(1.76)(11.53)28.20 50.10 53.26 EBITDA(百萬元)132.00 97.49 19.18 76.56 159.17 歸屬母公司凈利潤(百萬元)82.08 31.61 14.00 62.31 130.86 增長率(%
12、)0.61(61.49)(55.72)345.25 110.00 EPS(元/股)1.92 0.74 0.33 1.46 3.06 市盈率(P/E)32.62 84.71 191.29 42.96 20.46 市凈率(P/B)6.11 3.32 3.28 3.13 2.84 市銷率(P/S)11.47 12.97 10.11 6.74 4.40 EV/EBITDA 0.00 33.43 110.81 27.44 12.82 資料來源:wind,天風證券研究所 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 3 內容目錄內容目錄 1.AI 基礎數據服務行業龍頭
13、,向自動駕駛領域拓展基礎數據服務行業龍頭,向自動駕駛領域拓展.5 1.1.海天瑞聲:國內領先的 AI 訓練數據專業提供商.5 1.2.疫情影響減弱,營收有望進入快速增長期.7 2.AI 基礎數據市場規模高增長,預計基礎數據市場規模高增長,預計 21-25 年年 CAGR 達到達到 43.2%;行業數據橫向拓展將進;行業數據橫向拓展將進一步擴充市場空間一步擴充市場空間.8 3.自動駕駛或將加速落地,公司有望迎來首個行業級數據業務高增長自動駕駛或將加速落地,公司有望迎來首個行業級數據業務高增長.10 3.1.政策推動、激光雷達成本下降,自動駕駛加速落地.10 3.2.高級別自動駕駛依賴高質量數據標
14、注.12 3.3.人工智能介入數據標注實現降本增效.13 3.4.對標 Scale.AI:海天瑞聲自動駕駛數據標注自動化研發加速.14 4.智能語音優勢明顯,智能語音優勢明顯,2022 年上半年境外市場簽單額同比增長近年上半年境外市場簽單額同比增長近 2.5 倍,前三季度境外倍,前三季度境外基礎訓練數據業務收入同比增長近基礎訓練數據業務收入同比增長近 140%.16 4.1.小語種優勢明顯,打造語音技術壁壘.16 4.2.公司積極布局海外市場,2022 年上半年境外市場簽單額同比增長近 2.5 倍,前三季度境外基礎訓練數據業務收入同比增長近 140%.17 5.盈利預測與估值盈利預測與估值.1
15、8 6.風險提示風險提示.20 圖表目錄圖表目錄 圖 1:海天瑞聲發展歷程.5 圖 2:公司數據資源覆蓋的應用場景.6 圖 3:訓練數據生產過程示意圖.6 圖 4:海天瑞聲產品服務矩陣.7 圖 5:22 前三季度疫情壓力下營收同比增長 27.82%.7 圖 6:高研發投入致凈利潤有所下降.7 圖 7:2018-2022H1 綜合毛利率變化.8 圖 8:2019-2022Q1-Q3 公司三費/總營收比率.8 圖 9:大數據產業圖譜與數據服務關系鏈.9 圖 10:模型訓練需要大量數據支撐.9 圖 11:自建標注團隊問題多.9 圖 12:中國 AI 基礎數據市場規模(億元).10 圖 13:2021
16、Q1-2022Q1 中國 L2 級自動駕駛乘用車滲透率.11 圖 14:激光雷達市場規??焖偬嵘?11 圖 15:全球自動駕駛汽車出貨量保持高增長(千輛).12 圖 16 AWS 自動駕駛開發工作流.12 圖 17:公司融資輪數及金額(百萬美元).13 圖 18:Scale.AI 自動駕駛數據標注技術.14 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 4 圖 19:“Scale Rapid”快速標注服務.14 圖 20:海天瑞聲 3D 點云標注平臺.14 圖 21:今年來公司持續加大研發投入(百萬元).15 圖 22:22 年上半年,,公司計算機視覺類業
17、務營收占比快速上升.15 圖 23:語音識別加工環節示例.17 圖 24:語音合成加工環節示例.17 圖 25:2018-2022H1 公司境外收入比重.18 表 1:公司細分產品/服務類別及介紹.5 表 2:公司限制性股票激勵計劃智能駕駛數據業務考核目標.15 表 3:自然資源部測繪工作準入資質相關文件.16 表 4:同行業國內外競爭對手的對比情況.17 表 5:2022-2024 年公司盈利預測與估值(百萬元).18 表 6:可比公司估值.19 表 7:可比公司估值.19 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 5 1.AI 基礎數據服務行業基礎
18、數據服務行業龍頭,向自動駕駛領域拓展龍頭,向自動駕駛領域拓展 1.1.海天瑞聲:國內海天瑞聲:國內領先的領先的 AI 訓練數據專業提供商訓練數據專業提供商 致力于為致力于為 AI 產業鏈產業鏈各類各類機構提供專業數據集。機構提供專業數據集。海天瑞聲是我國領先的訓練數據專業提供商。自 2005 年成立以來,公司致力于為 AI 產業鏈上的各類機構提供算法模型開發訓練所需的專業數據集。公司所提供的訓練數據覆蓋智能語音(語音識別、語音合成等)、計算機視覺、自然語言等多個核心領域,全面服務于人機交互、智能駕駛、智能家居、智慧城市等多種創新應用場景。其中智能語音為公司的優勢領域,截至 2022H1,產品線
19、已包含190 個主要語種及方言。圖圖 1:海天瑞聲發展歷程海天瑞聲發展歷程 資料來源:公司官網、公司公告、天風證券研究所 公司研發、生產的訓練數據覆蓋了智能語音、計算機視覺及自然語言處理三大公司研發、生產的訓練數據覆蓋了智能語音、計算機視覺及自然語言處理三大 AI 核心領核心領域域,廣泛應用于算法模型的開發、訓練、優化、應用場景拓展等環節。目前,公司提供的訓練數據廣泛應用于眾多主流 AI 產品及終端應用的訓練過程中,覆蓋了個人助手、智能音 箱、語音導航、搜索服務、短視頻、虛擬人、智能駕駛、機器翻譯等眾多應用場景。表表 1:公司細分產品公司細分產品/服務類別及介紹服務類別及介紹 應用領域應用領域
20、 產品產品/服務細分類別服務細分類別 產品產品/服務內容服務內容 智能語音 語音識別 語音識別采集 為客戶提供設計、原料音頻采集、加工、質檢等全流程數據開發服務,形成語音識別所需的訓練數據。語音識別轉寫 基于客戶提供的原料音頻數據,執行轉寫、標注、質檢等數據加工服務,形成與音頻文件對應的、帶時間戳和特征標簽的文本,與音頻文件一同構成語音識別算法所需的訓練數據。語音合成 使機器將文字信息轉化為流暢的語音“朗讀”出來。計算機視覺 計算機視覺 通過設計訓練數據集結構、采集、加工、質檢;或者對客戶提供的圖像、視頻文件執行加工、質檢工作,最終形成客戶所需的計算機視覺訓練數據。自然語言 自然語言 通過設計
21、訓練數據集結構、采集、加工、質檢;或者對客戶提供的自然語言文本執行加工、質檢工作,最終形成客戶所需的自然語言訓練數據。資料來源:公司招股說明書、天風證券研究所 時間時間事件事件2005年公司成立于北京服務20+國家、地區,提供本地化項目服務語言服務能力:20+語言服務45個國家及地區,提供本地化項目服務語言服務能力:80+語種及語言歐洲語言學家團隊建立,進一步拓展海外市場,引進全球優秀人才聯合清華大學、廈門大學等高校,面向全球范圍發起OLR競賽語言服務能力:110+語種及方言2018年入選國家規劃布局內重點軟件企業入選工信部新一代人工智能產業創新重點任務揭榜單位獲得國家專精特新“小巨人”企業資
22、質登錄科創板,成為AI訓練數據服務領域國內A股上市企業服務全球70余個國家及地區,提供本地化項目定制服務語言服務能力:170+語種及方言語言服務能力:190個語種及方言公司客戶數量達740家1,050+自有知識產權的訓練數據標準化產品集公司成功入選中國國際大數據產業博覽會“十佳大數據案例”2022年6月2007年2010年2016年2020年2021年 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 6 圖圖 2:公司數據資源覆蓋的應用場景公司數據資源覆蓋的應用場景 資料來源:公司公告、天風證券研究所 公司的訓練數據生產過程主要包括四個環節:設計(訓練數據集
23、結構設計)、采集(獲取原料數據)、加工(數據標注)及質檢(各環節數據質量、加工質量檢測),通過設計訓練數據集結構、組織原料數據采集、對取得的原料數據進行加工,最終形成可供算法模型訓練使用的專業數據集。圖圖 3:訓練數據生產過程示意圖訓練數據生產過程示意圖 資料來源:公司公告、天風證券研究所 與多家大型科技公司合作。與多家大型科技公司合作。海天瑞聲的產品和服務已獲得字節跳動、阿里巴巴、騰訊、百度、科大訊飛、??低?、微軟、亞馬遜、三星、中國科學院、清華大學等國內外客戶的認可,應用于其研發的個人助手、智能音箱、語音導航、搜索服務、短視頻、虛擬人、智能駕駛、機器翻譯等多種產品相關的算法模型訓練過程中
24、。截止 2022 年 6 月 30 日公司客戶累計數量 740 家,覆蓋了科技互聯網、社交、IoT、智能駕駛、智慧金融 等領域的主流企業,教育科研機構以及部分政企機構。公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 7 圖圖 4:海天瑞聲產品服務矩陣海天瑞聲產品服務矩陣 資料來源:公司公告、天風證券研究所 1.2.疫情影響減弱,營收有望進入快速增長期疫情影響減弱,營收有望進入快速增長期 海外海外疫情影響下公司疫情影響下公司 2020-2021 年業績承壓,年業績承壓,2022 年疫情影響減弱,營收有望進入快速年疫情影響減弱,營收有望進入快速增長階段。增長階段
25、。公司 2019-2021 年總營收分別為 2.38、2.33、2.06 億元,2019-2021 年凈利潤分別為 0.82、0.82、0.32 億元。2020-2021 年公司收入略有下滑,其主要原因在境外新冠肺炎疫情出現重大反復的大背景下,公司境外業務遭受一定沖擊。與此同時,行業競爭態勢進一步加劇,帶來了一定的價格競爭壓力。并且公司各項投入尤其是研發投入逆勢提升,由此導致公司利潤明顯承壓。2022 年前三季度,在國內疫情壓力下,公司營收較去年在國內疫情壓力下,公司營收較去年仍仍實現同期增長實現同期增長 27.82%。此外,公司持續加大研發投入,研發費用共計 6414 萬元,占當期營業收入的
26、比例達到 38.37%,研發投入較 21 年同期同比增長 64.26%,研發投入和研發投入占收入比例均創公司歷史新高。圖圖 5:22 前三季度疫情壓力下營收同比增長前三季度疫情壓力下營收同比增長 27.82%圖圖 6:高研發投入致凈利潤有所下降高研發投入致凈利潤有所下降 資料來源:WIND、天風證券研究所 資料來源:WIND、天風證券研究所 公司公司 22H1 綜合毛利率有所回升綜合毛利率有所回升。2021 年公司綜合毛利率為 64.01%,較 2020 年的 67.70%下降 3.69 個百分點??傮w來看,境外收入的下降使高毛利收入版塊占比下降,行業競爭態勢又進一步加劇,帶來了一定的價格競爭
27、壓力,同時公司承接部分戰略性項目,綜合導致237.56233.34206.48167.1623.31%-1.78%-11.51%27.82%2019202020212022Q1-3營業總收入(百萬元)YOY81.5982.0831.6118.6321.53%0.61%-61.49%-27.39%2019202020212022Q1-3凈利潤(百萬元)YOY 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 8 定制類項目的毛利率出現一定程度的下降。但受益于公司各業務線自有知識產權訓練數據產品的持續儲備,保持公司保持較高的產品收入貢獻,使公司綜合毛利率仍保持整體
28、較高水平。2022 年年中期中期公司毛利率為公司毛利率為 66.38%,相較于,相較于 21 年底有所回升,我們認為原因可能為年底有所回升,我們認為原因可能為境外訂單帶來的高毛利相關。境外訂單帶來的高毛利相關。圖圖 7:2018-2022H1 綜合毛利率變化綜合毛利率變化 資料來源:WIND、天風證券研究所 堅持堅持技術技術+產品雙輪驅動,公司產品雙輪驅動,公司加大加大研發投入。研發投入。2022 年前三季度研發費用率達 38.37%,研發費用共計 6413.50 萬元,研發投入較 21 年同期同比增長 64.26%,原因是公司為持續提升數據處理智能化水平,進行包括第三代智能駕駛標注平臺上線、
29、第四代智能駕駛標注平臺研發啟動等在內的自研數據業務技術平臺能力迭代,支撐國家級課題項目研究,加大智能語音和計算機視覺領域多語種多模態訓練數據集產品儲備,公司在基礎研發和產品研發領域均繼續加大投入,研發人員數量大幅增長,截至 22 年 9 月 30 日,公司研發人員數量公司研發人員數量增至增至 94 人,同比增加人,同比增加 49.21%。管理費用率達 21.34%,系公司管理架構及激勵體系升級等原因導致。銷售費用率為 7.88%,小幅上升。圖圖 8:2019-2022Q1-Q3 公司三費公司三費/總營收比率總營收比率 資料來源:WIND、天風證券研究所 2.AI基礎數據市場規模高增長基礎數據市
30、場規模高增長,預計,預計21-25年年CAGR達到達到43.2%;行業數據橫向拓展將進一步擴充市場空間行業數據橫向拓展將進一步擴充市場空間 AI 基礎數據服務與數據治理產業鏈結構為:1)上游:數據源與數據產能;2)中游:數據產品開發工具與管理服務;3)下游:人工智能應用。處于中游的兩類服務商中,AI 基礎數據服務商使用數據采集與標注工具處理圖片、語音、文本等非結構化數據,面向 AI 的數據治理服務商則負責使用數據治理的各組件管治多源異構數據,使其形成數據資產,從而提高數據質量。二者處理后的數據可直接為下游的 AI 訓練所用,使 AI 應用落地能夠省時70.25%67.70%64.01%66.3
31、8%2019202020212022H117.55%18.64%29.31%38.37%3.89%4.77%7.03%7.88%13.29%11.00%17.06%21.34%2019202020212022Q1-3研發費用率銷售費用率管理費用率 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 9 省力。圖圖 9:大數據產業圖譜與數據服務關系鏈大數據產業圖譜與數據服務關系鏈 資料來源:艾瑞網公眾號、天風證券研究所,注:以上廠商及行業為不完全列舉,排名不分先后,僅供參考。模型訓練需大量數據支撐模型訓練需大量數據支撐。根據 Dimensional Researc
32、h 的全球調研報告,72%的受訪者認為至少使用超過 10 萬條訓練數據進行模型訓練,才能保證模型有效性和可靠性,96%的受訪者在訓練模型的過程中遇到訓練數據質量不佳、數量不足、數據標注人員不足等難題。為應對訓練數據所帶來的多方面挑戰,AI 企業開始從第三方購買原料數據收集、訓練數據生產和數據專家咨詢等服務,調研結果指出,外包服務能夠有效加快算法模型落地應用的速度。圖圖 10:模型訓練需要大量數據支撐模型訓練需要大量數據支撐 圖圖 11:自建標注團隊問題多自建標注團隊問題多 資料來源:Dimensional Research、天風證券研究所 資料來源:Dimensional Research、天
33、風證券研究所 2025 年中國年中國 AI 基礎數據市場規?;A數據市場規?;蚧驅⒊?120 億。億。2020 年中國 AI 數據服務行業研究報告分析認為,在人工智能下的各場景需求劇增的情況下,作為 AI 技術的底層支撐,數據服務尤為重要。伴隨技術的成熟、平臺的布局,未來市場發展潛力將不斷拓展,AI 數據服務+各場景將成為可能。根據 IDC 發布的2021 年中國人工智能基礎數據服務市場研究報告,預計中國 AI 基礎數據服務市場規模近 5 年來的復合年增長率達到 47%,預期 2025 年將突破 120 億元,達到中國人工智能市場支出總額的約 10%。10%19%43%28%1000萬10
34、0萬-1000萬10萬-100萬10萬66%51%50%28%27%4%0%20%40%60%80%數據偏差或錯誤數據量不足數據不可直接使用缺少標注團隊缺少標注工具未曾遇到問題 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 10 圖圖 12:中國中國 AI 基礎數據市場規模(億元)基礎數據市場規模(億元)資料來源:IDC、天風證券研究所 AI 基礎數據市場規模的高速增長一方面得益于數據對于基礎數據市場規模的高速增長一方面得益于數據對于 AI 應用的重要性提升,另一方面應用的重要性提升,另一方面則得益算法模型持續更新帶來的增量數據需求則得益算法模型持續更新帶
35、來的增量數據需求 1)“二八定律”凸顯“二八定律”凸顯 AI 時代數據重要性。時代數據重要性。AI 系統是由代碼和數據組成,國際權威 ML 學者吳恩達認為如果沒有高質量的數據集,AI 系統就會失敗。此外,其一直強調“以數據為中心的 AI”,提出了著名的“二八定律”,即 80%的數據+20%的模型=更好的機器學習,突顯數據對于 AI 系統的重要性。2)根據麥肯錫報告,深度學習模型對訓練數據的數據量、多樣性和更新速度方面提出較高要求。為充分發揮技術潛能,深度學習模型需要海量且涵蓋圖像、視頻及語音在內等多種類型的訓練數據進行模型訓練。此外,人工智能技術要求算法模型根據潛在的應用場景變化而持續更新,因
36、此,算法模型所使用的訓練數據亦需要定期更新。具體而言,約 1/3 的算法模型每月至少更新一次,約 1/4 的算法模型每日至少更新一次,算法模型持續更新的特點將進一步拓展各領域訓練數據的需求空間。行業數據橫向拓展將進一步擴充市場空間。行業數據橫向拓展將進一步擴充市場空間。除基礎數據市場外,AI 技術已在科技互聯網、社交、IoT、智能駕駛等多個領域實現技術落地,AI+垂直場景相結合的趨勢、以及這些垂直行業自身的蓬勃發展將有望釋放海量的訓練數據需求。我們認為,當 AI+模式更加深入地擴展到工業、金融、醫療等更多領域時,或將呈現出更加宏大的增量商業價值和潛力。而這些因素,有望對 AI 數據領域帶來更大
37、的增量市場空間。3.自動駕駛或將加速落地,公司有望迎來首個行業級數據業務高自動駕駛或將加速落地,公司有望迎來首個行業級數據業務高增長增長 3.1.政策推動、激光雷達成本下降,自動駕駛加速落地政策推動、激光雷達成本下降,自動駕駛加速落地 L2 級自動駕駛滲透率穩步上升,市場整體向級自動駕駛滲透率穩步上升,市場整體向 L3+發展。發展。目前在乘用車市場上實現落地的自動駕駛技術處于 L2 級水平,市場滲透率正穩步提升。實現的功能包括縱向的全速自適應巡航、橫向的車道保持、低速場景的自動泊車等。根據 IDC 發布了中國自動駕駛汽車市場數據追蹤報告,2022 年第一季度 L2 級自動駕駛在乘用車市場的新車
38、滲透率達 23.2%,整個市場處于 L2 向 L3+級別發展的階段。隨著激光雷達的鋪貨、成本的降低以及自動駕駛相關政策性文件的推出或將加速 L3+級別自動駕駛的落地。1829.3447.8372.5196.44123.3647.60%63.00%51.60%33.00%27.90%21.60%0.00%10.00%20.00%30.00%40.00%50.00%60.00%70.00%202020212022202320242025市場規模(億元)YOY 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 11 圖圖 13:2021Q1-2022Q1 中國中國
39、L2 級自動駕駛乘用車滲透率級自動駕駛乘用車滲透率 資料來源:IDC、天風證券研究所 激光雷達降本后激光雷達降本后有望迅速有望迅速鋪開。鋪開。根據艾瑞咨詢的報告,車載激光雷達市場有望自 2021 年4.6 億元增長至 2025 年 54.7 億元,實現 85.8%的年復合增長率。主機廠對激光雷達功能開發的深入及激光雷達成本的降低,激光雷達搭載車型數量將在短時間內保持較高增速。隨著激光雷達成本的降低以及鋪貨或將加速 L3+級自動駕駛的落地。圖圖 14:激光雷達市場規??焖偬嵘杭す饫走_市場規??焖偬嵘?資料來源:艾瑞咨詢微信公眾號、天風證券研究所 政策政策落地落地或進一步或進一步加速中國加速中國
40、高級別自動駕駛落地。高級別自動駕駛落地。深圳經濟特區智能網聯汽車管理條例于 22 年 8 月 1 日開始實施,是全國首個明確 L3 級以上自動駕駛定義、適用范圍的文件。條例 針對 L3-L5 級別自動駕駛汽車進行規定,提到在全域開放的行政區開展道路測試,開放 L5 級別不配備駕駛人的車輛路測等。2022 年 8 月 23 日,上海市人民政府辦公廳引發上海市加快智能網聯汽車創新發展實施方案,方案 提到至 2025 年,上海市初步建成國內領先的智能網聯汽車創新發展體系。產業規模力爭達到 5000 億元,具備組合駕駛輔助功能(L2 級)和有條件自動駕駛功能(L3級)汽車占新車生產比例超過 70%,具
41、備高度自動駕駛功能(L4 級及以上)汽車在限定區域和特定場景實現商業化應用。核心技術研發取得重大進展,核心裝備初步實現自主配套。我們預計兩個文件的發布落地有望為國家層面及其他城市推出相關政策提供參考,從而進一步推動 L3+自動駕駛落地。7.5%13.0%16.0%21.5%23.2%2021Q12021Q22021Q32021Q42022Q14616024837254755.10%50.20%47.00%20212022E2023E2024E2025E市場規模(千萬元)同比增長率(%)公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 12 圖圖 15:全球自動
42、駕駛汽車出貨量保持高增長全球自動駕駛汽車出貨量保持高增長(千輛)(千輛)資料來源:IDC、天風證券研究所 3.2.高級別自動駕駛依賴高質量數據標注高級別自動駕駛依賴高質量數據標注 自動駕駛性能依賴高質量數據。自動駕駛性能依賴高質量數據。L3 級別以上的自動駕駛系統主要由感知、定位、預測、決策和控制五部分構成,每部分均不可或缺。其對于計算機視覺技術的需求依賴度較高,系統需要對傳感器采集的點云圖像數據進行實時處理,構建車輛行駛環境,為預測和決策做依據,這對自動駕駛性能考驗極大,因此,我們認為,如何在提高自動駕駛數據識別速度及準確度非常關鍵。在自動駕駛模型訓練中主要包含算法和訓練數據兩大部分,因各家
43、廠商算法大同小異,且存在很多開源的,算法難以區分高下。根據英特爾推算,在全自動駕駛時代,每輛汽車每天產生的數據量將高達 4000GB,但這些數據中,可用于訓練的價值數據約只占不到 5%,使得海量數據處理具有難度,因此在算法拉不開差距的情況下,訓練數據就成了關鍵訓練數據就成了關鍵,且模型訓練過程中涉及的數據集覆蓋面越廣,標注越精細,分類越準確、類型越多,自動駕駛性能就越好。因為訓練數據集非常重要,大多數車企都是圍繞訓練數據集工作的,數據集是源動力,下圖是亞馬遜 Web 服務公司(AWS)的自動駕駛開發工作流,關鍵的環節就是數據的搜集與處理。圖圖 16 AWS 自動駕駛開發工作流自動駕駛開發工作流
44、 資料來源:AWS 官網、天風證券研究所 3284196476863162.50%133.33%142.86%81.30%20202021202220232024L3-L5級自動駕駛YOY 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 13 3.3.人工智能介入數據標注實現降本增效人工智能介入數據標注實現降本增效 平臺能力是衡量一家專業數據服務商在開展智能駕駛數據業務方面的核心要素。平臺能力是衡量一家專業數據服務商在開展智能駕駛數據業務方面的核心要素。數據處理平臺是否具備較強競爭力,首先要看其功能點的覆蓋程度,覆蓋的功能類型越豐富,其可處理的數據場景、以及
45、可滿足的客戶需求就會越多。在智能駕駛領域,目前同時具備 2D標注、3D 點云標注、2D-3D 聯合標注以及 3D 語義分割標注的供應商比較有限,能以最快速度覆蓋更多功能需求的數據服務商將能更好掌握智能駕駛數據市場的主動權以及議價能力。第二個評價要素是平臺的產出效率。平臺的智能化程度越高,對人的依賴程度越低,在提高平臺的生產效率的同時可以大幅降低生產成本。第三是平臺友好度,即平臺操作的便捷性。便捷性越強,標注員上手越快,標注效率則越高。從長期看,數據處理平臺除了覆蓋數據標注需求外,如何能與客戶的算法平臺連接,做好數據管理的工作,進而加速數據訓練迭代,也將是評判平臺能力的因素。高級別自動駕駛時代,
46、傳統依賴人工進行標注的方式效率極低,無法準確、快速的對每天所產生的海量數據進行標注。此背景下,AI 介入、“人機協同”的方式能夠快速的識別并標注數據。全球范圍內,典型公司有 Scale.AI,是一家利用人工智能和機器學習技術幫助企業解決各種問題,并提升工作效率的公司。Scale.AI 2016 年成立至今總融資年成立至今總融資 6.03 億美元,最億美元,最新估值達新估值達 73 億美元。億美元。Scale.AI 是一家人工智能創業公司,其通過提供以數據為中心的可組合平臺來管理整個機器學習生命周期,從而加速人工智能的發展。它將機器學習技術與人工相結合,為人工智能應用奠定了堅實的基礎,并為各行各
47、業的客戶提供服務。此外,Scale.AI 的機器學習技術與人工相結合的形式也獲得了市場的認可,從成立至今 6 年時間里共獲得 7 輪融資。2021 年 4 月,Scale.AI進行了 E 輪融資,金額 3.25 億美元,歷經 7 輪融資(2021 年 8 月進行第七輪融資,未披露金額),總融資額 6.03 億美元。根據 Growjo 網站數據及估算,Scale.AI 最新估值達 73億美元,年收入達 2.4 億美元。圖圖 17:公司融資輪數及金額(百萬美元)公司融資輪數及金額(百萬美元)資料來源:Crunchbase、天風證券研究所 Scale.AI 自動化自動化質量質量標注標注工具效率可提升
48、工具效率可提升 10 倍倍。公司成立初期就開始專注開發數據標注業務,打造專業的數據標注平臺。傳統數據標注的背后往往需要大量的標注員對數據進行人工標注,而 Scale.AI 正試圖使用自動化系統完成大部分標記和識別工作并且推出“Scale Rapid”快速數據標注服務,其自動化質量標注工具效率可提升 10 倍。0.124.518100155325種子輪A輪B輪C輪D輪E輪 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 14 圖圖 18:Scale.AI 自動駕駛數據標注技術自動駕駛數據標注技術 圖圖 19:“Scale Rapid”快速標注服務”快速標注服務
49、 資料來源:Scale.AI 官網、天風證券研究所 資料來源:Scale.AI 官網、天風證券研究所 3.4.對標對標 Scale.AI:海天瑞聲自動駕駛數據標注自動化研發加速:海天瑞聲自動駕駛數據標注自動化研發加速 公司積極布局自動駕駛業務。公司積極布局自動駕駛業務。22 年上半年,公司設立了智能駕駛事業部,設置了專職的研發、銷售、產品、項目交付團隊。2022 年上半年公司在智能駕駛領域,圍繞構建極具競爭力的綜合性、規?;?、自動化數據處理能力體系綜合性、規?;?、自動化數據處理能力體系這一目標,持續加大算法及平臺工具研發投入,并于今年 6 月完成公司第三代智能駕駛標注平臺上線。22 年下半年公
50、司將繼續持續加大智能駕駛研發投入,預計將于年底上線第四代智能駕駛標注平臺預計將于年底上線第四代智能駕駛標注平臺,其將進一步完善 3D功能,更好服務于智能駕駛業務拓展。2022 年 1-9 月智能駕駛行業數據領域新增客戶 14個,前三季度驗收訂單額及截至三季度末在手訂單額總計約 5000 萬元,同比增長超過 200%。算法算法介入介入數據標注過程,提數據標注過程,提高高標注效率及準確性標注效率及準確性,有望提升毛利率,有望提升毛利率。截止 2022 年 3 月,公司的自動駕駛標注方案已覆蓋全景語義分割、2D 圖像標注、2D/3D 融合標注、3D 點云標注等,已基本實現智能駕駛艙外視覺場景的全覆蓋
51、。除標注場景覆蓋全外,算法的引入也使得公司標注平臺更加高效、準確,例如,在進行 3D 點云連續幀標注時,前兩幀通過人工標注的物體,自動化工具通過預測算法自動預測第三幀上此物體的位置。算法的介入不僅對標注員的工作起到校正的作用,且效率和準確率都有極大的保證。我們認為,自動我們認為,自動駕駛數據標注過程中算法的引入駕駛數據標注過程中算法的引入有望有望降低公司的人工成本,從而提升產品毛利率。降低公司的人工成本,從而提升產品毛利率。圖圖 20:海天瑞聲:海天瑞聲 3D 點云標注平臺點云標注平臺 資料來源:機器之心官網、天風證券研究所 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息
52、披露和免責申明 15 重點投入重點投入對智能駕駛數據對智能駕駛數據平臺平臺能力能力。2022 年,公司啟動第四代智能駕駛標注平臺建設,旨在支撐智能駕駛全應用場景下的數據處理、支持各類型傳感器及多傳感器融合的數據處理、支持 BEV(鳥瞰圖)標注和點云疊加標注等新晉需求、完善算法中臺并整合當前主流的神經網絡算法架構和海量的自有數據庫以提升模型訓練、調優、適配能力,整體上不斷提升包括智能駕駛數據業務在內的綜合性數據處理智能化水平。近年來,公司持續加大研發投入,2022 年前三季度,公司研發費用為 0.64 億元,占營收達 38.37%,同比增長 64.26%;另外,計算機視覺類業務營收占比不斷提升,
53、截止 22 年上半年已達 18.44%。圖圖 21:今年來公司持續加大研發投入今年來公司持續加大研發投入(百萬元)(百萬元)圖圖 22:22 年上半年,年上半年,,公司計算機視覺類業務營收占比快速上升公司計算機視覺類業務營收占比快速上升 資料來源:WIND、天風證券研究所 資料來源:WIND、天風證券研究所 公司股權激勵針對考核公司股權激勵針對考核智能駕駛數據業務智能駕駛數據業務團隊單獨考核,體現智能駕駛數據業務重要性。團隊單獨考核,體現智能駕駛數據業務重要性。2022 年 4 月,公司發布限制性股票激勵計劃(草案),其中第二類激勵對象著力于智能駕駛數據業務的開展并兼顧公司現有業務擴張,共 1
54、9 人。表表 2:公司限制性股票激勵計劃公司限制性股票激勵計劃智能駕駛數據業務智能駕駛數據業務考核目標考核目標 歸屬期歸屬期 對應考核年度對應考核年度 智能駕駛數據業務評分(智能駕駛數據業務評分(C)目標值(目標值(Cm)觸發值(觸發值(Cn)第一歸屬期 2022 年 100 分 80 分 第二歸屬期 2023 年 100 分 80 分 考核指標考核指標 業績完成度業績完成度 業務單元層面歸屬比例(業務單元層面歸屬比例(Y)智能駕駛數據業務評分(C)CCm Y=100%CnCCm Y=C/Cm*100%CCn Y=0 資料來源:公司公告、天風證券研究所 數安合規將重塑自動駕駛數據產業格局數安合
55、規將重塑自動駕駛數據產業格局。2022 年 8 月-9 月,自然資源部先后發布了自然資源部關于促進智能網聯汽車發展維護測繪地理信息安全的通知和自然資源違法行為立案查處工作規程(試行),分別明確了測繪地理信息數據采集和管理等相關法律法規以及測繪資質相關的處罰行為和處罰方式。通知規定了“需要從事相關數據收集、存儲、傳輸和處理的車企、服務商及智能駕駛軟件提供商等,屬于內資企業的,應依法取得相應測繪資質,或委托具有相應測繪資質的單位開展相應測繪活動;屬于外商投資企業的,應委托具有相應測繪資質的單位開展相應測繪活動,由被委托的測繪資質單位承擔收集、存儲、傳輸和處理相關空間坐標、影像、點云及其屬性信息等業
56、務及提供地理信息服務與支持”。規程(試行)也明確了“測繪項目的招標單位讓不具有相應資質等級的測繪單位中標,或者讓測繪單位低于測繪成本中標的,責令改正,可以處測繪約定報酬二倍以下的罰款。招標單位的工作人員利用職務上的便利,索取他人財物,或者非法收受他人財物為他人謀取利益的,依法給予處分;構成犯罪的,依法追究刑事責任”。我們認為,這意27.3541.743.560.5264.148.17%52.48%4.32%39.14%64.26%20182019202020212022Q1-3研發費用YOY80.49%77.60%72.33%71.30%10.33%11.10%11.54%18.44%2019
57、202020212022H1數據資源相關的應用服務營收自然語言計算機視覺智能語音類產品 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 16 味著未取得測繪資質的企業將不得從事自動駕駛艙外數據的處理(包括但不限于采集、標注等)工作,進一步提高了行業準入門檻。未來擁有測繪資質的企業將能夠更快搶占自動駕駛數據市場。公司已于今年 6 月獲批乙級測繪資質,同時受中國移動、中國互聯網投資基金戰略股東加持,相信將為其自動駕駛領域業務的拓展奠定更好的基礎。表表 3:自然資源部測繪工作準入資質相關文件自然資源部測繪工作準入資質相關文件 時間時間 文件文件 內容內容 2022
58、 年 8 月 30 日 自然資源部關于促進智能網聯汽車發展維護測繪地理信息安全的通知 明確測繪地理信息數據采集和管理等相關法律法規,其中提到:第一條:“智能網聯汽車安裝或集成了衛星導航定位接收模塊、慣性測量單元、攝像頭、激光雷達等傳感器后,在運行、服務和道路測試過程中對車輛及周邊道路設施空間坐標、影像、點云及其屬性信息等測繪地理信息數據進行采集、存儲、傳輸和處理的行為,屬于中華人民共和國測繪法規定的測繪活動”;第二條:“對智能網聯汽車運行、服務和道路測試過程中產生的空間坐標、影像、點云及其屬性信息等測繪地理信息數據進行收集、存儲、傳輸和處理者,是測繪活動的行為主體,應遵守相關規定并依法承擔相應
59、責任”;第三條:“需要從事相關數據收集、存儲、傳輸和處理的車企、服務商及智能駕駛軟件提供商等,屬于內資企業的,應依法取得相應測繪資質,或委托具有相應測繪資質的單位開展相應測繪活動;屬于外商投資企業的,應委托具有相應測繪資質的單位開展相應測繪活動,由被委托的測繪資質單位承擔收集、存儲、傳輸和處理相關空間坐標、影像、點云及其屬性信息等業務及提供地理信息服務與支持?!?022 年 9 月 23 日 自然資源違法行為立案查處工作規程(試行)規程(試行)明確指出,“測繪項目的招標單位讓不具有相應資質等級的測繪單位中標,或者讓測繪單位低于測繪成本中標的,責令改正,可以處測繪約定報酬二倍以下的罰款。招標單位
60、的工作人員利用職務上的便利,索取他人財物,或者非法收受他人財物為他人謀取利益的,依法給予處分;構成犯罪的,依法追究刑事責任?!辟Y料來源:中國政府網、自然資源部網站、天風證券研究所 4.智能語音優勢明顯,智能語音優勢明顯,2022 年上半年境外市場簽單額同比增長年上半年境外市場簽單額同比增長近近 2.5 倍,前三季度境外基礎訓練數據業務收入同比增長近倍,前三季度境外基礎訓練數據業務收入同比增長近 140%4.1.小語種優勢明顯,打造語音技術壁壘小語種優勢明顯,打造語音技術壁壘 公司提供的智能語音類產品包括語音識別、語音合成兩個技術領域。公司通過設計(設計訓練數據集結構、供發音人朗讀錄制的語料文本
61、或對話場景、發音人分布、錄音設備場景等)、采集(定義合適的發音人、選取錄音設備及軟件、組織發音人朗讀錄制音頻)、加工(對音頻文件進行切分、標注各類聲音特征,形成帶時間戳和特征標簽的文本和標注文件等)、質檢(對數據集進行質量檢測,如音字一致性、標注準確率檢查等)等訓練數據集生產環節;或者針對客戶提供的原料音頻文件執行加工、質檢工作,最終形成客戶所需的智能語音訓練數據。公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 17 圖圖 23:語音識別加工環節示例語音識別加工環節示例 圖圖 24:語音合成加工環節示例語音合成加工環節示例 資料來源:公司招股說明書、天風證券
62、研究所 資料來源:公司招股說明書、天風證券研究所 語音語言學領域的專業知識是構建高質量語音識別算法和語音合成算法的關鍵要素。語音語言學領域的專業知識是構建高質量語音識別算法和語音合成算法的關鍵要素。經過多年積累,公司積累有深厚的語音語言學基礎研究成果,并已將其運用至構建高質量的智能語音訓練數據。在語音語言學基礎研究領域,公司擁有豐富的多語種語言學家團隊資源積累和多語種發音詞典積累,以及不斷創新的發音詞典構建技術和流程技術。公司小語種優勢明顯,系公司的主要技術壁壘之一。公司小語種優勢明顯,系公司的主要技術壁壘之一。截止至 22 年 6 月 30 日,公司已經擁有 190 個語種/方言的覆蓋能力,
63、不僅包括含英、法、德、意、西、日、韓等常見語種,還包括東南亞、一帶一路等國家地區的罕見小語種,尤其在亞洲小語種的服務上具備競爭優勢。同時,公司已積累下超過 100 個語種/方言的發音詞典,覆蓋希伯來語、烏爾都語、緬甸語、阿姆哈拉語、普什圖語、阿爾巴尼亞語、格魯吉亞語等小語種,累計詞條數超過1,000 萬條,可支撐構建高質量的智能語音訓練數據,是公司的主要壁壘及核心技術之一。表表 4:同行業國內外競爭對手的對比情況同行業國內外競爭對手的對比情況 海天瑞聲海天瑞聲 Appen 慧聽科技慧聽科技 標貝科技標貝科技 應用領域覆蓋 智能語音、計算機視覺、自然語言 智能語音、計算機視覺、自然語言 智能語音
64、、計算機視覺、自然語言、音樂 智能語音、計算機視覺、自然語言、音樂 語音/方言覆蓋能力 190 個 235+個 20+個 10+個 已取得專利授權 28 項 2 項 2 項 6 項 擁有的成品訓練數據集數量 1054 個 250+個 45 個 179 個 計算機軟件著作權 159 項 未公開披露 14 項 30 項 資料來源:公司公告、天風證券研究所 4.2.公司積極布局海外市場,公司積極布局海外市場,2022 年上半年境外市場簽單額同比增長近年上半年境外市場簽單額同比增長近 2.5倍,前三季度境外基礎訓練數據業務收入同比增長近倍,前三季度境外基礎訓練數據業務收入同比增長近 140%公司積極布
65、局海外市場,公司積極布局海外市場,2022 年上半年境外市場簽單額同比增長近年上半年境外市場簽單額同比增長近 2.5 倍,前三季度境倍,前三季度境外基礎訓練數據業務收入同比增長近外基礎訓練數據業務收入同比增長近 140%。根據IDC Worldwide Artificial Intelligence Spending Guide的預測,2025 年全球人工智能市場規模將達到 2,218.7 億美元,基礎數據服務板塊也將是其重要的組成部分之一,因此,人工智能在全球有著廣闊的市場空間。近年來,公司力拓全球化市場,旨在使之成為支撐公司收入增長的重要引擎。公司在全球化市場競爭中,除了長期合作的良好口碑
66、,在語音方面也積累深厚,尤其是多語種方面的積累和能力,可以更好服務境外公司全球化布局。截至今年 6 月 30 日,公司已覆蓋超過190 種語種/方言,不僅包括含英、法、德、意、西、日、韓等常見語種,還包括東南亞、一帶一路等國家地區的罕見多語種,尤其在亞洲多語種的服務上具備競爭優勢。除核心業 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 18 務能力外,公司也從 2021 開始制定了更為全面的全球化發展戰略,從品牌升級、體系搭建、團隊建設、營銷推廣等多維度升級海外市場布局,大大提升海外客戶觸達和服務能力,2022 年上半年境外市場簽單額同比增長近 2.5 倍
67、,前三季度境外基礎訓練數據業務收入同比增長近 140%。圖圖 25:2018-2022H1 公司境外收入比重公司境外收入比重 資料來源:海天瑞聲招股說明書、公司公告、天風證券研究所 5.盈利預測與估值盈利預測與估值 整體估值:整體估值:關鍵假設:關鍵假設:1)考慮公司智能語音業務實力強,與字節跳動、阿里巴巴、騰訊、百度、科大訊飛、以及眾多海外大型客戶存在持續性良好合作關系,且公司海外訂單恢復,2022 年上半年境外市場簽單額同比增長 2.5 倍,前三季度境外基礎訓練數據業務收入同比增長近140%,公司智能語音類業務或將保持穩定發展;2)考慮自動駕駛的高景氣度,公司對自動駕駛平臺的持續高投入以及
68、數安合規政策帶來的新的行業機會,公司自動駕駛業務營收有望迎來高速增長;3)考慮公司以多模態數據為代表的新興數據需求不斷增長、以及海外計算機視覺數據需求的增長,公司計算機視覺業務營收或將迎來快速增長;4)考慮公司積極開拓自然語言方向的客戶需求,尤其在發音詞典數據、手語語料數據、機器翻譯平行語料數據等方面開拓效果顯著,公司自然語言業務或將保持穩定增長。表表 5:2022-2024 年公司盈利預測與估值(百萬元)年公司盈利預測與估值(百萬元)2021 2022E 2023E 2024E 營業總收入 206.48 264.70 397.32 608.92 YOY-11.51%28.20%50.10%5
69、3.26%毛利率 64.01%62.00%54.60%53.70%凈利潤 31.61 13.99 62.31 130.86 YOY-61.49%-55.72%345.27%110.00%智能語音類產品營收 149.35 158.20 193.16 260.53 YOY-17.52%6%22%35%毛利率 65.21%70%66%61%計算機視覺營收 23.83 27.66 44.38 85.89 YOY-7.99%16%60%94%毛利率 55.43%58%57%58%31.00%49.60%35.86%27.75%57.14%69.00%50.40%64.14%72.25%42.86%201
70、82019202020212022H1境外境內 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 19 自然語言營收 25.15 32.70 44.14 59.59 YOY 52.89%30%35%35%毛利率 61.34%65%60%57%數據資源相關的應用服務營收 8.15 7.34 6.97 7.32 YOY-18.01%-10%-5%5%毛利率 75.26%75%75%75%智能駕駛行業數據業務營收 38.81 108.67 195.61 YOY 180%80%毛利率 27%30%40%資料來源:WIND、天風證券研究所 估值與投資建議估值與投資建議:
71、考慮自動駕駛行業數據業務有較高成長性,本報告采用考慮自動駕駛行業數據業務有較高成長性,本報告采用分部分部估值法:估值法:基礎數據業務:基礎數據業務:考慮公司語音方面積累深厚,尤其是多語種方面的積累和能力,可以更好服務境外公司全球化布局。公司從 2021 年開始制定了更為全面的全球化發展戰略,從品牌升級、體系搭建、團隊建設、營銷推廣等多維度升級海外市場布局,大大提升海外客戶觸達和服務能力,2022 年上半年境外業務增勢顯著,考慮以上情況,對該部分適用 PE 估值方法。根據我們預測,2023 年基礎數據業務凈利潤達 0.54 億元,參考可比公司中科創達/四維圖新/德賽西威 PE 估值平均 45.5
72、1x,考慮公司境外基礎數據業務增速較快給予該業務 2023 年 50 x P/E,對應市值 27 億元。表表 6:可比公司估值可比公司估值 證券代碼證券代碼 公司名稱公司名稱 2022E P/E 2023E P/E 2024E P/E 300496.SZ 中科創達 58.09 42.30 31.62 002405.SZ 四維圖新 90.10 53.03 34.92 002920.SZ 德賽西威 59.76 41.20 30.69 平均 69.32 45.51 32.41 資料來源:WIND、天風證券研究所,數據來源于 WIND 一致預期(截至 2022 年 11 月 04 日)智能駕駛行業數據
73、業務:智能駕駛行業數據業務:考慮自動駕駛的高景氣度,公司對自動駕駛平臺的持續高投入,且獲得乙級測繪資質,公司計算機視覺業務營收有望迎來高增長,考慮該業務的高投入及高成長性,對公司該部分適用 PS 估值方法。根據我們預測,2023 年公司智能駕駛行業數據業務營收達 1.09 億元,參考可比公司格靈深瞳/中科創達/虹軟科技 PS 估值平均 10.29x,鑒于公司智能駕駛行業數據業務為新業務且增速較快,給予該業務 2023 年 12x P/S,對應市值 13.08 億元。表表 7:可比公司估值可比公司估值 證券代碼證券代碼 公司名稱公司名稱 2022E P/S 2023E P/S 2024E P/S
74、 688207.SH 格靈深瞳 13.11 9.25 6.92 300496.SZ 中科創達 9.14 6.63 4.92 688088.SH 虹軟科技 18.92 14.99 11.20 平均 13.73 10.29 7.68 資料來源:WIND、天風證券研究所,數據來源于 WIND 一致預期(截至 2022 年 11 月 04 日)綜上,結合基礎數據業務 PE 估值以及智能駕駛行業數據業務 PS 估值,給予公司目標市值40.08 億元,目標價 93.64 元,首次覆蓋,給予“買入”評級。公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 20 6.風險提示風
75、險提示 1)技術迭代風險:技術迭代風險:由于人工智能行業整體發展較為迅速,應用領域和應用場景不斷拓展,下游需求隨著行業發展不斷發生變化,公司進行數據開發所需的各項技術也面臨著快速迭代更新的風險。如果公司無法保持對行業發展趨勢的洞察能力以及對研發人才的有效組織和研發經費的經濟投入,則可能導致公司在行業技術快速迭代過程中無法持續保持技術先進性和技術優勢,進而對公司的客戶拓展、產品創新和經營業績造成不利影響。2)匯率波動風險:匯率波動風險:公司積極拓展境外客戶,2022H1 公司境外收入占總營收 57.14%,該收入采用外幣結算,并受人民幣匯率水平變化的影響。3)新客戶收入占比較低的風險:新客戶收入
76、占比較低的風險:2022 年上半年,公司收入主要來自老客戶、占比達到95.82%,新客戶收入占比較低。若老客戶降低對公司產品、服務的采購量或公司未能維持與老客戶的合作關系,則公司的經營情況或將受到不利影響。4)市場競爭加劇風險:市場競爭加劇風險:近年來 AI 基礎數據服務領域公司不斷增多由于整體行業較新,行業標準和法律監管仍處于規范階段,因此整體行業目前處于高速發展但較為無序的狀態,導致市場競爭加劇。公司如果不能持續有效地制定并實施業務發展規劃,則將受到競爭者的挑戰,從而面臨市場競爭加劇而導致的經營狀況下滑、市場地位下降和可能失去主要客戶的風險,進而影響公司的盈利能力和發展潛力。公司報告公司報
77、告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 21 財務預測摘要財務預測摘要 資產資產負債表負債表(百萬元百萬元)2020 2021 2022E 2023E 2024E 利潤利潤表表(百萬元百萬元)2020 2021 2022E 2023E 2024E 貨幣資金 40.26 277.70 43.24 57.07 106.83 營業收入營業收入 233.37 206.48 264.70 397.32 608.92 應收票據及應收賬款 62.78 90.20 64.21 68.23 134.75 營業成本 75.38 74.31 100.59 180.39 281.94 預
78、付賬款 9.99 2.11 7.95 7.09 16.41 營業稅金及附加 2.03 1.45 2.09 3.18 4.81 存貨 3.13 8.55 5.42 39.67 38.64 銷售費用 11.13 14.52 19.85 29.78 44.67 其他 334.18 425.26 463.84 479.31 512.79 管理費用 25.67 35.22 62.62 57.62 63.38 流動資產合計流動資產合計 450.35 803.82 584.66 651.37 809.41 研發費用 43.50 60.52 92.65 78.75 85.70 長期股權投資 0.00 0.00
79、 0.00 0.00 0.00 財務費用 2.15 1.14 0.43 0.47 4.44 固定資產 23.57 24.72 224.23 213.74 203.24 資產/信用減值損失(1.50)(5.36)(2.35)(2.18)(2.10)在建工程 0.00 0.00 0.00 0.00 0.00 公允價值變動收益 1.09(0.08)8.00 9.00 10.00 無形資產 1.16 4.42 3.57 2.73 1.88 投資凈收益 8.39 11.35 12.00 7.80 8.62 其他 0.89 2.59 56.66 51.22 45.65 其他(24.69)(19.98)0.
80、00 0.00 0.00 非流動資產合計非流動資產合計 25.62 31.74 284.47 267.68 250.77 營業利潤營業利潤 90.22 33.39 4.12 61.75 140.50 資產總計資產總計 477.35 840.66 869.13 919.05 1,060.19 營業外收入 0.66 0.48 10.00 10.00 10.00 短期借款 0.00 0.00 0.00 0.00 0.00 營業外支出 0.07 0.04 0.13 0.13 0.09 應付票據及應付賬款 7.14 11.39 16.55 23.54 39.12 利潤總額利潤總額 90.81 33.82
81、 14.00 71.63 150.41 其他 17.29 18.08 37.38 39.12 78.11 所得稅 8.73 2.22 0.00 9.31 19.55 流動負債合計流動負債合計 24.44 29.47 53.93 62.66 117.23 凈利潤凈利潤 82.08 31.61 14.00 62.31 130.86 長期借款 0.00 0.00 0.00 0.00 0.00 少數股東損益 0.00 0.00 0.00 0.00 0.00 應付債券 0.00 0.00 0.00 0.00 0.00 歸屬于母公司凈利潤歸屬于母公司凈利潤 82.08 31.61 14.00 62.31
82、130.86 其他 0.00 0.00 0.00 0.00 0.00 每股收益(元)1.92 0.74 0.33 1.46 3.06 非流動負債合計非流動負債合計 0.00 0.00 0.00 0.00 0.00 負債合計負債合計 39.39 34.75 53.93 62.66 117.23 少數股東權益 0.00 0.00 0.00 0.00 0.00 主要財務比率主要財務比率 2020 2021 2022E 2023E 2024E 股本 32.10 42.80 42.80 42.80 42.80 成長能力成長能力 資本公積 186.21 511.87 511.87 511.87 511.8
83、7 營業收入-1.76%-11.53%28.20%50.10%53.26%留存收益 219.58 251.19 260.44 301.66 388.22 營業利潤-1.41%-62.99%-87.66%1398.50%127.52%其他 0.07 0.06 0.09 0.07 0.07 歸屬于母公司凈利潤 0.61%-61.49%-55.72%345.25%110.00%股東權益合計股東權益合計 437.96 805.91 815.20 856.40 942.96 獲利能力獲利能力 負債和股東權益總計負債和股東權益總計 477.35 840.66 869.13 919.05 1,060.19
84、毛利率 67.70%64.01%62.00%54.60%53.70%凈利率 35.17%15.31%5.29%15.68%21.49%ROE 18.74%3.92%1.72%7.28%13.88%ROIC 235.25%49.10%-5.52%17.54%41.92%現金流量表現金流量表(百萬元百萬元)2020 2021 2022E 2023E 2024E 償債能力償債能力 凈利潤 82.08 31.61 14.00 62.31 130.86 資產負債率 8.25%4.13%6.21%6.82%11.06%折舊攤銷 3.58 3.31 11.34 11.34 11.34 凈負債率-9.19%-
85、34.35%-5.30%-6.66%-11.33%財務費用 1.89 1.04 0.43 0.47 4.44 流動比率 11.47 23.28 10.84 10.40 6.90 投資損失(8.39)(11.35)(12.00)(7.80)(8.62)速動比率 11.39 23.03 10.74 9.76 6.57 營運資金變動(31.92)(55.08)(9.76)(23.51)(31.09)營運能力營運能力 其它 3.94 14.93 8.00 9.00 10.00 應收賬款周轉率 4.39 2.70 3.43 6.00 6.00 經營活動現金流經營活動現金流 51.18(15.55)12.
86、01 51.81 116.94 存貨周轉率 43.72 35.37 37.89 17.62 15.55 資本支出 1.60 7.31 210.00 0.00 0.00 總資產周轉率 0.53 0.31 0.31 0.44 0.62 長期投資 0.00 0.00 0.00 0.00 0.00 每股指標(元)每股指標(元)其他(168.98)(91.36)(450.42)(16.40)(18.44)每股收益 1.92 0.74 0.33 1.46 3.06 投資活動現金流投資活動現金流(167.38)(84.04)(240.42)(16.40)(18.44)每股經營現金流 1.20-0.36 0.
87、28 1.21 2.73 債權融資(2.15)(0.23)(1.35)(0.47)(4.44)每股凈資產 10.23 18.83 19.05 20.01 22.03 股權融資(0.08)325.65(4.71)(21.11)(44.30)估值比率估值比率 其他(3.58)12.17 0.00 0.00 0.00 市盈率 32.62 84.71 191.29 42.96 20.46 籌資活動現金流籌資活動現金流(5.80)337.59(6.05)(21.58)(48.74)市凈率 6.11 3.32 3.28 3.13 2.84 匯率變動影響 0.00 0.00 0.00 0.00 0.00 E
88、V/EBITDA 0.00 33.43 110.81 27.44 12.82 現金凈增加額現金凈增加額(122.01)238.00(234.46)13.83 49.76 EV/EBIT 0.00 34.45 271.26 32.22 13.80 資料來源:公司公告,天風證券研究所 公司報告公司報告|首次覆蓋報告首次覆蓋報告 請務必閱讀正文之后的信息披露和免責申明 22 分析師聲明分析師聲明 本報告署名分析師在此聲明:我們具有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任能力,本報告所表述的所有觀點均準確地反映了我們對標的證券和發行人的個人看法。我們所得報酬的任何部分不曾與,不與,也將
89、不會與本報告中的具體投資建議或觀點有直接或間接聯系。一般聲明一般聲明 除非另有規定,本報告中的所有材料版權均屬天風證券股份有限公司(已獲中國證監會許可的證券投資咨詢業務資格)及其附屬機構(以下統稱“天風證券”)。未經天風證券事先書面授權,不得以任何方式修改、發送或者復制本報告及其所包含的材料、內容。所有本報告中使用的商標、服務標識及標記均為天風證券的商標、服務標識及標記。本報告是機密的,僅供我們的客戶使用,天風證券不因收件人收到本報告而視其為天風證券的客戶。本報告中的信息均來源于我們認為可靠的已公開資料,但天風證券對這些信息的準確性及完整性不作任何保證。本報告中的信息、意見等均僅供客戶參考,不
90、構成所述證券買賣的出價或征價邀請或要約。該等信息、意見并未考慮到獲取本報告人員的具體投資目的、財務狀況以及特定需求,在任何時候均不構成對任何人的個人推薦??蛻魬攲Ρ緢蟾嬷械男畔⒑鸵庖娺M行獨立評估,并應同時考量各自的投資目的、財務狀況和特定需求,必要時就法律、商業、財務、稅收等方面咨詢專家的意見。對依據或者使用本報告所造成的一切后果,天風證券及/或其關聯人員均不承擔任何法律責任。本報告所載的意見、評估及預測僅為本報告出具日的觀點和判斷。該等意見、評估及預測無需通知即可隨時更改。過往的表現亦不應作為日后表現的預示和擔保。在不同時期,天風證券可能會發出與本報告所載意見、評估及預測不一致的研究報告。
91、天風證券的銷售人員、交易人員以及其他專業人士可能會依據不同假設和標準、采用不同的分析方法而口頭或書面發表與本報告意見及建議不一致的市場評論和/或交易觀點。天風證券沒有將此意見及建議向報告所有接收者進行更新的義務。天風證券的資產管理部門、自營部門以及其他投資業務部門可能獨立做出與本報告中的意見或建議不一致的投資決策。特別聲明特別聲明 在法律許可的情況下,天風證券可能會持有本報告中提及公司所發行的證券并進行交易,也可能為這些公司提供或爭取提供投資銀行、財務顧問和金融產品等各種金融服務。因此,投資者應當考慮到天風證券及/或其相關人員可能存在影響本報告觀點客觀性的潛在利益沖突,投資者請勿將本報告視為投
92、資或其他決定的唯一參考依據。投資評級聲明投資評級聲明 類別類別 說明說明 評級評級 體系體系 股票投資評級 自報告日后的 6 個月內,相對同期滬 深 300 指數的漲跌幅 行業投資評級 自報告日后的 6 個月內,相對同期滬 深 300 指數的漲跌幅 買入 預期股價相對收益 20%以上 增持 預期股價相對收益 10%-20%持有 預期股價相對收益-10%-10%賣出 預期股價相對收益-10%以下 強于大市 預期行業指數漲幅 5%以上 中性 預期行業指數漲幅-5%-5%弱于大市 預期行業指數漲幅-5%以下 天風天風證券研究證券研究 北京北京 ??诤??上海上海 深圳深圳 北京市西城區佟麟閣路 36 號 郵編:100031 郵箱: 海南省??谑忻捞m區國興大道 3 號互聯網金融大廈 A 棟 23 層 2301 房 郵編:570102 電話:(0898)-65365390 郵箱: 上海市虹口區北外灘國際 客運中心 6 號樓 4 層 郵編:200086 電話:(8621)-65055515 傳真:(8621)-61069806 郵箱: 深圳市福田區益田路 5033 號 平安金融中心 71 樓 郵編:518000 電話:(86755)-23915663 傳真:(86755)-82571995 郵箱: