1、1證券研究報告作者:行業評級:上次評級:行業報告|請務必閱讀正文之后的信息披露和免責申明強于大市強于大市維持2023年7月4日(評級)分析師 孫謙SAC執業證書編號:S1110521050004分析師 黃海利 SAC執業證書編號:S1110522090003行業深度研究數據研究數據研究 科技專題科技專題AI產業人士看大模型發展趨勢產業人士看大模型發展趨勢摘要摘要2請務必閱讀正文之后的信息披露和免責申明人工智能是當今最熱門的技術領域之一,也是中國互聯網公司的重要戰略方向。本報告基于對人工智能是當今最熱門的技術領域之一,也是中國互聯網公司的重要戰略方向。本報告基于對9位來自中國位來自中國AI科技團
2、隊的產業人士問卷科技團隊的產業人士問卷調研,分析了中國調研,分析了中國AI產業在資源投入、模型發展、數據隱私保護和行業合作等方面的表現,以及面臨的挑戰和機遇。用科學數據證據給產業在資源投入、模型發展、數據隱私保護和行業合作等方面的表現,以及面臨的挑戰和機遇。用科學數據證據給讀者提供全面的視角洞察中國讀者提供全面的視角洞察中國AI產業的發展現狀和未來趨勢。產業的發展現狀和未來趨勢。億級資金有望注入,團隊擴容力度加大。億級資金有望注入,團隊擴容力度加大。根據公司戰略定位和發展重點,在技術研發、算力資源投入、數據采集與標注以及市場推廣與商業化擴展方面存在投入差異。同時,AI人力資源也在不斷擴張,采取
3、多元化的策略來吸引和培養人才。AI模型新發布可期,復雜數據處理升級。模型新發布可期,復雜數據處理升級。下半年有多個AI模型發布計劃,涵蓋自然語言處理、計算機視覺和跨模態領域。在模型發布中,Transformer架構是主流選擇。數據挑戰、模型優化和商業化仍是AI團隊面臨的瓶頸。雖然大模型在應用場景中擴展,并非模型規模越大越好,也需綜合考慮數據和模型的質量。數據多樣性、數據合作和數據隱私保護是中國數據多樣性、數據合作和數據隱私保護是中國AI公司在數據領域的關鍵關注點公司在數據領域的關鍵關注點。數據多樣性與合作是關鍵,共享數據合作是重要趨勢。圖像和自然語言數據集普及度高,物體檢測數據集應用較少。中國
4、AI公司重視數據安全與隱私保護,采取多層防護措施、動態處理與隱私保護并重,以用戶為中心保護用戶數據。AI硬件投入將繼續保持強勁的發展勢頭硬件投入將繼續保持強勁的發展勢頭。服務器部署反映算力需求,大部分公司有服務器擴張計劃。不同公司在計算資源的使用量、成本和供應商選擇上存在差異,反映出它們在AI技術發展上的投入和戰略規劃。中國本土公司在半導體領域的發展也不容忽視。AI商業化需要持續投入和優化,而營銷策略中突出大模型的創新性和應用價值是至關重要的商業化需要持續投入和優化,而營銷策略中突出大模型的創新性和應用價值是至關重要的。按交易量費和定制開發費是中國AI科技團隊主要的收費模式,顯示出對需求敏感性
5、和靈活盈利模式的重視。調研結果還揭示了AI服務費用反映了模型復雜性、服務質量和市場競爭的因素,需要綜合評估選擇。AI的跨行業應用和行業合作是推動技術發展和創新的關鍵。的跨行業應用和行業合作是推動技術發展和創新的關鍵。AI應用有廣闊的發展空間,需要各行業積極與AI公司合作推動數字化和智能化轉型,同時加強數據隱私保護。我們認為,未來行業整合、競爭加劇和新興創業公司崛起的可能性較大。風險提示風險提示:樣本代表性風險,人工智能行業發展不及預期,商業模式仍不明朗,法律風險:樣本代表性風險,人工智能行業發展不及預期,商業模式仍不明朗,法律風險PZ8ZnXgVjZbYAZdUgV8OaO7NtRnNmOpM
6、eRnNqPfQoOsPbRnMtPvPpMpMuOrNoO3請務必閱讀正文之后的信息披露和免責申明億級資金有望注入與團隊擴容力度加大億級資金有望注入與團隊擴容力度加大2023年億級資金有望注入,資源投入差異初顯布局重點科技公司AI團隊擴容力度加大從架構到發布,從訓練到優化從架構到發布,從訓練到優化Transformer為主流模型架構,適應復雜任務AI模型新發布可期,復雜數據處理升級分布式訓練與模型并行訓練廣泛普及,積極探索新的訓練技術模型優化與數據問題是制約模型發展的公認瓶頸數據集的創新、融合和保障數據集的創新、融合和保障資料來源多樣化、混合化、開放化圖像、語言、問答數據集主導,物體檢測集暫
7、露頭角重視數據隱私保護,全方位實踐AI發展的底層引擎發展的底層引擎計算硬件計算硬件服務器部署反映算力需求,增長意愿仍顯熱絡計算資源使用量有顯著差異,2023年擴增平均幅達20%2023年AI科技公司計算資源硬件擴增情況GPU單價成本高昂,英偉達為供應商首選,本土公司成長不容小覷算力戰爭:硬件和軟件相輔相成大模型商業化落地現狀與趨勢大模型商業化落地現狀與趨勢按交易量費、定制開發費是主要的收費模式訂閱收費與API收費標準AI科技公司活躍用戶總量與月度調用量大模型垂直應用行業部署與應用成熟度從“人”“貨”“場”看客戶拓展策略與成功要素中國中國AI領域的未來:整合,競爭,開放性與創新領域的未來:整合,
8、競爭,開放性與創新目錄目錄億級資金有望注入與團隊擴容力度加大億級資金有望注入與團隊擴容力度加大14請務必閱讀正文之后的信息披露和免責申明52023年億級資金有望年億級資金有望注入,資源投入差異初顯布局重點注入,資源投入差異初顯布局重點66.7%33.3%0.0%億級千萬級百萬級資金投入是AI團隊發展的重要保障,66.7%的調研公司在的調研公司在AI領域的投資都領域的投資都達到了億級規模達到了億級規模。據中國信通院公布的測算數據,2021年中國人工智能產業規模為4041億元,同比增長33.3%。據德勤,2020年百度、騰訊、阿里巴巴等企業在人工智能領域的投資金額再創新高,達到1748億元。Q:貴
9、公司大模型資金投入是多少量級?:貴公司大模型資金投入是多少量級?Q:貴公司各類資源投入占總投入比重是多少?(:貴公司各類資源投入占總投入比重是多少?(%)中國AI科技公司在技術研發、算力資源投入、數據采集及標注以及市場推廣與商業化擴展方面的投入比重差異,體現了他們的戰略定位和發展重點。技術研發與創新是技術研發與創新是AI公司持續領先的核心驅動力,占據資源投入的最大比重(公司持續領先的核心驅動力,占據資源投入的最大比重(avg34%)。)。算力資源投入(算力資源投入(avg32%)則是AI研發的基礎設施,云計算、分布式計算、AI芯片等在支撐大數據處理和模型訓練方面發揮著關鍵作用。阿里巴巴的阿里云
10、,百度的百度云,華為的云服務等,都在擴充算力資源,以滿足AI應用的需求,比如,百度開發了百度機器學習BML(Baidu Machine Learning)平臺,提供從開發到部署一站式服務,阿里云為用戶提供了阿里云機器學習PAI平臺,華為云ModelArts是面向AI開發者的一站式開發平臺。數據采集與標注則是數據采集與標注則是AI算法訓練的關鍵(算法訓練的關鍵(avg19%)。一些科技公司利用自身的生態系統進行大量的數據采集,并通過人工或半人工方式進行數據標注。例如百度EasyData智能數據服務平臺提供便捷的數據采集方案,豐富的數據標注模板及工具,支持將采集、標注、加工等處理后的高質量數據直接
11、對接至EasyDL、BML等百度AI開發平臺,服務于后續的模型訓練輸出更高精度的模型效果。市場推廣與商業化擴展則是市場推廣與商業化擴展則是AI技術走向市場、實現價值的關鍵環節。技術走向市場、實現價值的關鍵環節。資料來源:問卷調研、百度云官網、華為云官網、阿里云官網、百度大腦官網等、天風證券研究所6科技公司科技公司AI團隊擴容力度加大團隊擴容力度加大相對薄弱的培養環節相對薄弱的培養環節提供內部的專業培訓和發展機會提供內部的專業培訓和發展機會(33.3%):內部培訓能夠快速提升員工的專業技能,符合公司的發展需求。這表明尚有一些公司在這方面可能有所欠缺。關注員工工作生活平衡,為員工創造良好工作環境關
12、注員工工作生活平衡,為員工創造良好工作環境(22.2%):員工的工作滿意度和工作效率往往與工作環境和工作生活平衡密切相關。這個比例較低可能意味著許多公司需要更加重視員工的工作生活平衡。提供了明確的職業發展路徑和晉升機會提供了明確的職業發展路徑和晉升機會(11.1%):提供明確的職業發展路徑和晉升機會能夠激發員工的積極性和忠誠度,增強歸屬感,此比例最低可能反映出一些公司在職業規劃方面還有待完善。88.9%計 劃 人 員 擴 容計 劃 人 員 擴 容88.9%的參訪公司表示未來有人員擴充計劃,按照擴充比例分布來看,AI大模型大軍擴容激進,其中一家公司近乎人員翻倍的計劃。Q:據您了解,據您了解,貴公
13、司大模型相關工作人員數量?貴公司大模型相關工作人員數量?Q:據您了解,據您了解,貴公司未來是否有人員擴充計劃?計劃擴容幅度是多少?貴公司未來是否有人員擴充計劃?計劃擴容幅度是多少?采取哪些措施培養采取哪些措施培養AI人才?人才?自人工智能技術開始興起,中國的科技公司已迅速躋身全球人工智能開發的前列。國內各大科技巨頭積極推動AI發展,通過人力資源的擴張和大額資金的注入,以鞏固其在市場上的領先地位。人才的重要性不言而喻,是AI創新的主要推動力。B公司 C公司 A公司 D公司 H公司 G公司 E公司I公司J公司人員擴容計劃不了解人員擴張規模100%+-10-15%10%20%50%50%30%與高校
14、、研究機構等開展合作培養有專門的AI人才培養項目或計劃在招聘時有針對性的吸引高級AI人才加入提供了具有競爭力的薪酬待遇來吸引或留住高級人才提供外部的專業培訓和發展機會設立激勵機制來鼓勵員工的創新和突破性成果提供內部的專業培訓和發展機會關注員工工作生活平衡,為員工創造良好工作環境提供了明確的職業發展路徑和晉升機會人才培養措施:中國中國AI科技團隊正在采取多元化的策略來吸引和培養人才科技團隊正在采取多元化的策略來吸引和培養人才據與調人士:大部分公司選擇與高?;蜓芯繖C構合作(88.9%),對學生進行實地培訓,這種方式既能拓寬人才來源,也可以讓人才更早地適應實際工作環境。一部分公司會專門設計一套系統的
15、AI人才培養計劃(55.6%),包括提供內外部的專業培訓、設立激勵機制等,旨在發掘和提升員工的潛力。除了培養內部人才,這些公司在招聘時也會針對高級AI人才制定吸引策略(55.6%),如提供具有競爭力的薪酬待遇。資料來源:問卷調研,天風證券研究所1000人從架構到發布,從訓練到優化從架構到發布,從訓練到優化27請務必閱讀正文之后的信息披露和免責申明8Transformer為主流模型架構,適應復雜任務為主流模型架構,適應復雜任務選擇合適的模型架構是至關重要的一步,模型的架構決定了它處理數據和學習任務的能力。在對9家中國AI團隊的調研中,我們發現Transformer架構是這些架構是這些公司最大模型
16、普遍采用的架構公司最大模型普遍采用的架構,這一發現揭示了Transformer架構在當下AI領域的重要地位。在未來的一段時間內,在未來的一段時間內,Transformer可能會保持相對的領導地位??赡軙3窒鄬Φ念I導地位。2017年transformer架構首次被提出,至此以后該架構構成了現代AI訓練神經網絡的基石,從google的BERT到現在OPEN AI的GPT4,都是基于Transformer的自注意力機制上建立的??v觀國內公司,例如百度在2021年7月5日提出的Ernie便采用了Transformer作為其表示模塊,并在該基礎上提出了“Continual Multi-Paradigm
17、s Unified Pre-training Framework”的預訓練框架,并訓練出了Ernie3.0,直到2023年3月24日,百度又在基于Ernie和PLATO的基礎上訓練并推出了NLP大模型文心一言。Transformer Transformer 架構圖架構圖百度百度Ernie3.0Ernie3.0架構圖架構圖資料來源:問卷調研,百度深度學習研究院、Attention is all you need-Googel Ashish Vaswani等、ERNIE 3.0:LARGE-SCALE KNOWLEDGE ENHANCED PRE-TRAINING FOR LANGUAGE UND
18、ERSTANDING AND GENERATION-Yu Sun等、天風證券研究所9AI模型新發布可期模型新發布可期,復雜數據處理升級,復雜數據處理升級 據與調人士,大模型預計發布的領域主要集中在自然語言處理(據與調人士,大模型預計發布的領域主要集中在自然語言處理(NLP)、計算機視覺()、計算機視覺(CV)和跨模態三個方面。目前,)和跨模態三個方面。目前,NLP和和CV是人工智能領域較成熟和活躍的兩是人工智能領域較成熟和活躍的兩個方向個方向,而跨模態是近年來興起的一個新興方向。這些領域都擁有豐富的數據資源和多樣化的應用場景,為大模型的發展提供了基礎和動力。大模型的發布呈現出多樣化和細分化的趨
19、勢大模型的發布呈現出多樣化和細分化的趨勢。據與調人士結果,有5家公司計劃發布NLP模型(最大參數量級1萬億),6家公司計劃發布CV模型(最大參數量級1萬億),4家公司計劃發布跨模態模型(最大參數量級1萬億)。有趣的是,調研中的公司都沒有科學計算模型發布的計劃。大模型的發布頻率呈現出加速的趨勢大模型的發布頻率呈現出加速的趨勢。中國的AI團隊在2023年開始密集發布各類模型。清華智譜AI研發的GLM-130B 于3月14開啟內測,并開源了單卡版模型GLM-6B;百度于3月 16 日推出了其最新的生成式人工智能產品和知識增強型大語言模型(LLM)ERNIE Bot;商湯科技4月10日公布“日日新Se
20、nseNova”大模型體系,推出自然語言處理、內容生成、自動化數據標注、自定義模型訓練等多種大模型及能力;阿里云4月11日推出語言大模型“通義千問”;科大訊飛5月6日星火認知大模型正式對外發布,時隔一個月,6月9日又推出星火大模型V1.5;北京智源研究院6月9日發布了全面開源的“悟道3.0”系列大模型及算法QQ:據您了解,據您了解,貴公司貴公司20232023年是否有發布新模型的計劃?預計發布模型參年是否有發布新模型的計劃?預計發布模型參數量是多少?數量是多少?20232023年中國大模型密集發布年中國大模型密集發布企業模型發布計劃NLPCV跨模態科學計算BCADHGEIJ占比89%56%67
21、%44%0%5.6千億2千億3千億-1萬億1萬億1萬億-平均參數量最大參數量資料來源:問卷調研,百度深度學習研究院、阿里云官網、商湯、智譜AI等、天風證券研究所10分布式訓練與模型并行訓練廣泛普及,積極探索新的訓練技術分布式訓練與模型并行訓練廣泛普及,積極探索新的訓練技術Q:據您了解,據您了解,貴公司在大模型訓練方面有哪些創新技術或方法?貴公司在大模型訓練方面有哪些創新技術或方法?分布式訓練分布式訓練利用數據并行或者模型并行的策略將一個大型的模型劃分為多個部分,分配到不同的設備上進行訓練,從而提高訓練效率和模型規模。優勢:優勢:可以訓練超大規模的模型,突破單個設備的內存和計算能力的限制,同時也
22、可以加速訓練過程。模型并行訓練模型并行訓練利用圖切分算法,指將一個模型的計算圖按照層次或者功能劃分為多個部分,然后根據子圖之間的依賴關系,在不同的設備上按照順序或者并發地執行。優勢:優勢:處理非常深或者寬的網絡結構,克服單個設備內存不足的問題。數據并行訓練數據并行訓練利用數據切分算法,將一個大批量的數據切分為多個小批量的數據,然后根據數據之間的獨立性,在不同的設備上并行地執行前向和反向傳播。優勢:優勢:提高設備的利用率,加速訓練過程,同時也可以增加批量大小,提高模型的泛化能力。稀疏計算技術稀疏計算技術在訓練或者推理時利用模型中存在的稀疏性(如零值或者低值)來減少計算量和內存占用的一種技術。優勢
23、:優勢:稀疏計算技術的優勢是可以大幅降低模型的存儲和計算成本,提高模型的性能和效率?;旌暇扔柧毣旌暇扔柧氃谟柧殨r在模型中同時使用16位和32位浮點類型,從而加快運行速度,減少內存使用的一種訓練方法。優勢:優勢:利用現代硬件(如NVIDIA GPU或者Cloud TPU)對低精度運算的支持,提高運算速度和吞吐量,同時也可以節省內存空間和帶寬,從而增大批量大小或者模型規模。壓縮算法深度學習硬件跨架構轉移學習自適應優化算法混合精度訓練稀疏計算技術數據并行訓練模型并行訓練分布式訓練77.78%100%67%67%67%56%22%22%22%資料來源:問卷調研,Azure Machine Lear
24、ning、OPEN MLSYS、TensorFlow、天風證券研究所11模型優化與數據問題是制約模型發展的公認瓶頸模型優化與數據問題是制約模型發展的公認瓶頸Q:據您了解,據您了解,貴公司在訓練大模型時,主要面臨哪些挑戰?貴公司在訓練大模型時,主要面臨哪些挑戰?數據挑戰、模型優化與商業化挑戰數據挑戰、模型優化與商業化挑戰數據是訓練深度學習模型的關鍵。數據是訓練深度學習模型的關鍵。在訓練深度學習模型時,大量高質量的數據是非常關鍵的。獲取這樣的數據通常需要投入大量的時間和資源。此外,數據的清洗和標注也是一個重大的挑戰,需要大量的人力進行操作。模型優化是模型優化是AI團隊面臨的問題。團隊面臨的問題。A
25、I模型優化主要是為了使模型在不同的硬件平臺上快速運行,包括算法層面的優化、框架層面的優化以及硬件層面的優化等手段。商業化受到關注。商業化受到關注。業務應用和商業化也逐漸成為科技公司關注的焦點,據與調人士結果,6家公司都面臨著同樣的問題。33%56%67%100%100%算力不足訓練時間過長業務應用和商業化問題數據數量質量問題模型優化問題Q:您認為大模型發展最確定的趨勢是什么?:您認為大模型發展最確定的趨勢是什么?88.9%更多的應用場景11.1%更大的模型應用拓展重于模型規模應用拓展重于模型規模大模型的應用場景將持續擴展。大模型的應用場景將持續擴展。據調研,88.89%的受訪人士認為大模型將會
26、有更多的應用場景。這一趨勢的背后是深度學習技術在語音識別、圖像識別、自然語言處理等領域的突破。我們推斷垂直商業化將成為科技公司的主要關注點,僅有11%的公司認為更大規模的模型會成為趨勢。參數量不是衡量模型好壞的唯一標準參數量不是衡量模型好壞的唯一標準。模型參數越大,訓練的成本也越高。并且在大模型訓練領域中,存在著邊際效應遞減的現象。以谷歌發布的擁有1.6萬億參數的Switch Transformer為例,當谷歌把參數量提升了一個量級后,確實會對性能有所提升,但是此時帶來的性能收益已經遠不及以前。有時候在更多數據上訓練的較小模型表現更好,而不是在較少數據上訓練的較大模型。例如,DeepMind的
27、Chinchilla模型擁有700億個參數,并在1.4萬億個token上進行了訓練,而2800億參數的Gopher模型在3000億個token上進行了訓練。在隨后的評估中,Chinchilla的表現優于Gopher??梢妳盗考壊⒉荒芡耆珱Q定模型的高低。資料來源:問卷調研,天風證券研究所數據集的創新、融合和保障數據集的創新、融合和保障312請務必閱讀正文之后的信息披露和免責申明1322%67%100%100%外采合作伙伴提供的數據公開數據集自有數據資料來源多樣化、混合化、開放化資料來源多樣化、混合化、開放化Q:據您了解,據您了解,貴公司目前使用的主要資料來源是什么?貴公司目前使用的主要資料來源
28、是什么?公開數據集和自有數據集的使用仍然占據主導,合作伙伴的數據源和外采數據的利用則更側重于補充和優化。公開數據集和自有數據集的使用仍然占據主導,合作伙伴的數據源和外采數據的利用則更側重于補充和優化。數據多樣性與合作是關鍵。數據多樣性與合作是關鍵。據與調人士結果,公司都同時采用自有數據集和公開數據集。這意味著他們將自己收集和整理的數據與來自公開資源的數據結合使用,以期在模型訓練和優化中獲得更好的效果。這種混合使用數據的方式可以增強數據的多樣性和全面性,從而提高模型的魯棒性和泛化能力。共享數據合作是重要趨勢。共享數據合作是重要趨勢。據與調人士結果,6家公司選擇采用合作伙伴提供的數據源(占67%)
29、。公司間數據的交換和合作在AI領域的重要性不容小覷。通過與合作伙伴共享數據,可以擴大數據規模,增加數據的維度和深度,以支持更復雜、更精細的模型訓練。例如,Snowflake 數據云平臺在全球擁有超過 8,000 家客戶(截至2023年4月30日),Snowflake 與 NVIDIA 合作將通過數據云平臺把定制化的生成式 AI 應用帶到不同的垂直領域,從而進一步幫助客戶改變這些行業。外采數據潛力有待挖掘。外采數據潛力有待挖掘。據與調人士結果,只有2家公司選擇了外采數據,占比為22%。這可能反映了大部分公司依賴于內部和合作伙伴的數據源,或出于數據安全性、質量和可用性等因素的考慮。而較少去尋求外部
30、數據市場的支持。外采可以補充公司自身難以獲得的數據,從而優化模型效果。D公司在數據獲取方面具有較強的能力和意識,資料來源類型最為豐富,同時擁有4類數據源。自有數據集自有數據集:來源于公司自身的產品和服務;這些數據集通常比公開數據集更加具有針對性和實用性?;旌蠑祿瘎t結合了公開數據集和自有數據集的優點,可以在保持模型泛化性能的同時,滿足特定任務的需求。公開數據集公開數據集:從公開渠道獲取的數據集;具有較大的規模和多樣性,但質量相對較低,可能存在噪聲、偏差或過時等問題。合作伙伴提供的數據源合作伙伴提供的數據源:與其他機構或企業進行合作或交換而獲得的數據源;通常是針對相關領域或任務的數據,具有較高的
31、可靠性和實用性,但獲取條件較為苛刻,可能存在隱私、安全或法律等風險。外采數據:外采數據:從第三方機構或平臺購買或租賃而獲得的數據;巨有較高的補充性通常是針對缺失或不足的。資料來源:問卷調研,天風證券研究所14圖像、語言、問答數據集主導,物體檢測集暫露頭角圖像、語言、問答數據集主導,物體檢測集暫露頭角QQ:據您了解,據您了解,貴公司使用的數據集類型是什么?貴公司使用的數據集類型是什么?88.9%88.9%圖像數據集圖像數據集88.9%88.9%自然語言數據集自然語言數據集88.9%88.9%問答數據集問答數據集55.6%55.6%物體檢測數據集物體檢測數據集數據集決定模型性能與適用范圍數據集決定
32、模型性能與適用范圍圖像和自然語言數據集普及度高。圖像和自然語言數據集普及度高。圖像數據集、自然語言數據集和問答數據集在這些公司中使用較為普及,占比達到了88.9%。我們認為原因可能是,視覺識別和自然語言處理是主要關注的AI研究方向。同時,這也反映了圖像和自然語言數據在AI應用中的重要性。物體檢測數據集應用較少。物體檢測數據集應用較少。據與調人士結果,僅5家公司使用物體檢測數據集。物體檢測在自動駕駛、安全監控等領域有重要應用,這表明上述領域可能并非所有公司的重點研究方向,或者他們正在尋找其他類型的數據來訓練相關模型。不同企業數據集規模有所差異。不同企業數據集規模有所差異。從數據集的規模來看,各企
33、業數據集優勢有所差異。據與調人士結果,B企業重圖像和自然語言數據集,C企業重圖像和問答數據集,A企業問答和物體檢測數據集較為豐富,D企業在圖像和問答數據集較有優勢。這體現了不同公司依據其業務方向和專業優勢選擇數據集類型,以滿足特定應用需求。QQ:貴公司使用的數據集規模有多大?:貴公司使用的數據集規模有多大?圖像數據集自然語言數據集問答數據集物體檢測數據集企業萬張圖象TB文本萬個問答萬個物體類別B40000500+C15000-200001.57000-8000A千萬級5億級億級D1000002020000002H50110010G1000.51020E5002005025I50J80520圖像
34、或視頻計算機視覺領域或任務,如圖像分類、目標檢測、人臉識別、視頻理解等。具有較高的多樣性和規模,但也需要較高的處理和標注成本。LabelmeImageNetLSUNMS COCO文本或語音自然語言處理領域或任務的數據,如文本分類、情感分析、機器翻譯、語音識別等。具有較高的復雜性和豐富性,但也需要較高的理解和分析能力Enron DatasetAmazon ReviewGoogle Books Ngrams問題和答案問答系統領域或任務的數據,如知識問答、閱讀理解、對話系統等。具有較高的實用性和價值,但也需要較高的邏輯和推理能力。cMedQA2.0Chinese-Medical-Question-A
35、nswering-System物體位置類別物體檢測領域或任務的數據,如行人檢測、車輛檢測、行為識別等。具有較高的精確性和難度,但也需要較高的計算和存儲資源。Objects365VEDAIDOTA包含任務類型特點公開集舉例資料來源:問卷調研,天風證券研究所15重視數據隱私保護,全方位實踐重視數據隱私保護,全方位實踐中國中國AIAI公司在數據安全與隱私保護方面表現出高度的重視與嚴謹的態度,采取了一公司在數據安全與隱私保護方面表現出高度的重視與嚴謹的態度,采取了一系列有效的措施:系列有效的措施:多層防護措施保障數據安全性。多層防護措施保障數據安全性。據與調人士,大多數公司采取了多層防護措施來防止數據
36、在存儲與處理過程中的未經授權的訪問,比如使用加密技術來保護數據在傳輸過程中的安全。顯示了中國AI公司對于數據安全性的高度重視,以及在技術手段上的實力與應對能力。動態處理與隱私保護并重。動態處理與隱私保護并重。據與調人士,半數的公司定期對數據安全與隱私保護政策進行審查與更新,并且在處理用戶數據時,實施了嚴格的數據脫敏與匿名化措施。這種動態的、嚴格的處理方式,既保證了數據的使用效率,又兼顧了用戶隱私的保護。用戶為中心,保護用戶數據。用戶為中心,保護用戶數據。據與調人士,22%的公司在數據收集過程中,得到了用戶的明確同意,并設立了專門的數據保護團隊來確保數據安全與隱私。用戶在任何時候都可以查看、更正
37、和刪除個人數據,同時,一旦出現數據安全漏洞,這些公司也會及時通知用戶。這種以用戶為中心的方式,不僅符合了法律規定,也提高了用戶對公司的信任度。員工培訓促進安全文化。員工培訓促進安全文化。據與調人士,11%的公司為內部員工提供了關于數據安全與隱私保護的培訓,這一舉措顯示了這些公司對于創建安全文化的重視,也為員工提供了必要的知識與技能,以更好地保護用戶數據的安全與隱私。國家法規介入,國家法規介入,AIGCAIGC數據安全需重視數據安全需重視在大模型的訓練中應當通過數據安全技術保證所取用戶的個人隱私信息不被其他終端獲取或應用于其他用途。2023年5月10日國家網信辦起草了生成式人工智能服務管理辦法(
38、征求意見稿),其中第五條明確表示了利用生成式人工智能產品提供聊天和文本、圖像、聲音生成等服務承擔該產品生成內容生產者的責任,另外涉及到個人信息的,也應當承擔個人信息處理者的法定責任,履行個人信息保護義務。這在法規上要求了未來AIGC的內容應當具有穩定性和準確性,并且保證用戶信息的隱私性。Q:據您了解,據您了解,公司在數據安全、隱私保護等方面做了以下哪些措施公司在數據安全、隱私保護等方面做了以下哪些措施?資料來源:問卷調研,國家網信辦、天風證券研究所11%22%22%22%22%56%56%56%67%67%使用加密技術來保護數據在傳輸過程中的安全在數據存儲和處理方面,采用了多層防護措施以防止未
39、經授權的訪問在處理用戶數據時,實施了嚴格的數據脫敏和匿名化措施定期對其數據安全和隱私保護政策進行審查和更新與相關政府機構合作,以確保遵守國家關于數據安全和隱私保護的法規大模型在數據收集過程中,獲得了用戶的明確同意設有專門的數據保護團隊來確保數據安全和隱私向用戶提供了查看、更正和刪除個人數據的途徑出現數據安全漏洞時,是否會及時通知用戶為內部員工提供了關于數據安全和隱私保護的培訓AI發展的底層引擎發展的底層引擎計算硬件計算硬件416請務必閱讀正文之后的信息披露和免責申明17服務器部署反映算力需求,服務器部署反映算力需求,增長意愿仍顯熱絡增長意愿仍顯熱絡Q:據您了解,據您了解,貴公司大模型服務器使用
40、數量是多少?今年是否有增加服貴公司大模型服務器使用數量是多少?今年是否有增加服務器的計劃?務器的計劃?人工智能技術的發展在很大程度上取決于算力的支持,而服務器是提供算力的關鍵設施。本調研結果顯示,中國AI科技團隊都在大規模地部署和使用服務器,且大部分公司仍有服務器擴張的計劃,并且擴張幅度都不小。據與調人士:服務器擁有情況:服務器擁有情況:大多數公司的AI服務器數量在1萬臺以下。B公司和C公司擁有服務器數量位居頭部,遠超其他公司。其他公司主要分布在2000臺以內。服務器的擴張計劃:服務器的擴張計劃:B公司、A公司和I公司的擴張計劃最為激進,計劃增加萬臺以上的服務器數量。其他公司計劃擴張1000-
41、2000臺的規模。服務器數量的多少和擴張計劃的存在,都反映出這些公司在AI技術發展上的投入和決心。特別是互聯網巨頭,他們的服務器數量和擴張計劃顯示出其在AI領域的領先地位和雄心壯志。而其他公司,盡管服務器數量相對較少,但也通過擴張計劃展示了對AI發展的期待和支持。我們認為,調研結果揭示了中國AI科技公司在算力部署上的實力和意愿,預示了中國AI技術將有望繼續保持強勁的發展勢頭。資料來源:問卷調研,天風證券研究所25%38%13%25%1千臺以下1千-1萬臺1萬-10萬臺10萬臺以上企業服務器數量(臺)今年計劃擴增數量(臺)B100000100000C1600002000A2000030000G2
42、0001000I200010000D1000-20001000E1000-20002000H5001000J200-300-0%50%100%B公司C公司A公司D公司H公司G公司E公司I公司J公司GPU預計擴增CPU預計擴增TPU年預計擴增存儲設備預計擴增18計算資源使用量有顯著差異,計算資源使用量有顯著差異,2023年擴增平均幅預達年擴增平均幅預達25%Q:據您了解,據您了解,貴公司最大模型用到以下哪些計算資源硬件?貴公司最大模型用到以下哪些計算資源硬件?Q:據您了解,據您了解,2023年貴公司預計增加計算資源硬件的幅度是多少?年貴公司預計增加計算資源硬件的幅度是多少?計算資源直接影響到模型
43、的訓練效率和實用性,重要性不言而喻。計算資源直接影響到模型的訓練效率和實用性,重要性不言而喻。GPUGPU:仍然是最主流的計算硬件之一。仍然是最主流的計算硬件之一。尤其是對于互聯網和云服務等領域的企業,GPU可以提供高性能和高效率的AI訓練和推理服務。據與調人士,B公司、A公司、D公司在這方面表現突出,其GPU使用數量均超過1萬張,明顯高于其他公司。而在未來的擴增計劃中,8家公司表示將有所增加(平均幅度40%),其中C公司的擴增計劃最為激進,預計GPU數量將翻倍,這表明他們對AI技術的投資意愿強烈。CPUCPU:使用情況分化明顯。使用情況分化明顯。據與調人士,A公司和B公司同樣表現出強大的實力
44、,其CPU數量均達到萬級。在未來的擴增計劃中,平均增幅為19%。B公司和J公司的計劃較為激進,預計擴增30%,顯示出這兩家公司在大數據處理和高性能計算領域的野心。TPUTPU:使用相對較少使用相對較少。據與調人士,D公司和E公司的數量約是平均值的兩倍,這兩家公司在機器學習和深度學習方面的需求可能是導致TPU使用較多的主要原因。在未來擴增計劃上,E公司預計會增加25%,遠高于其他公司,反映了其在深度學習領域的發展計劃。存儲設備:使用分布較為均衡。存儲設備:使用分布較為均衡。尤其是對于數據密集型的AI應用場景,存儲設備可以提供快速和安全的數據訪問和傳輸。據與調人士,C公司和E公司的存儲設備數量約是
45、平均值的兩倍,顯示了他們在大數據處理和存儲方面的強大能力。在未來的擴增計劃中,多數公司都表示將有所增加,平均增長率約為20%,我們認為這可能表明,他們都認識到了大數據時代數據存儲設備的重要性。隨著隨著AIAI技術的發展,我們預期這些公司會繼續擴大對這些計算資源的投入,并根據自身技術的發展,我們預期這些公司會繼續擴大對這些計算資源的投入,并根據自身的業務需求和戰略方向進行調整。的業務需求和戰略方向進行調整。資料來源:問卷調研,天風證券研究所TPU 78%(張量處理單元)是Google專門為機器學習工作負載設計的處理器。TPU專為大規模矩陣運算和高吞吐量的低延遲運算優化。GPU 100%(圖形處理
46、單元)在AI領域具有重要的作用,特別是在處理深度學習和機器學習任務時。GPU可以并行處理大量的計算任務,這使得它們在處理圖像和視頻數據時具有顯著的優勢。存儲設備存儲設備89%存儲設備可以緩存AI大模型的參數和中間結果,減少內存訪問損失和計算開銷,提高模型的推理速度。CPU 100%(中央處理單元)在處理更為復雜和多變的計算任務時,CPU具有更好的靈活性。在AI領域,CPU常常被用于處理不適合在GPU或TPU上運行的任務,或是在資源有限的環境下運行輕量級的模型。192023年年AI科技公司計算資源硬件擴增情況科技公司計算資源硬件擴增情況40%100%030%15%30%40%25%40%0%25
47、%50%75%100%0500010000150002000025000B公司C公司A公司D公司H公司G公司E公司I公司J公司目前使用量2023年預計擴增30%00%15%10%10%20%20%30%0%25%50%75%100%0100000200000300000400000500000B公司C公司A公司D公司H公司G公司E公司I公司J公司GPUGPU(張)(張)CPU(張)(張)TPU(張)(張)0%00%15%15%15%25%20%20%0%25%50%75%100%0100020003000B公司C公司A公司D公司H公司G公司E公司I公司J公司存儲設備(存儲設備(TB)00%02
48、0%20%20%20%20%20%0%25%50%75%100%050010001500B公司C公司A公司D公司H公司G公司E公司I公司J公司Q:據您了解,據您了解,2023年貴公司預計會增加以下哪些計算資源?年貴公司預計會增加以下哪些計算資源?資料來源:問卷調研,天風證券研究所20GPU單價成本高昂,英偉達為供應商首選,本土公司成長不容小覷單價成本高昂,英偉達為供應商首選,本土公司成長不容小覷Q:據您了解,貴公司:據您了解,貴公司GPU和和TPU的單價成本是多少元?的單價成本是多少元?高效處理并行運算,高效處理并行運算,GPU投入不容小覷:投入不容小覷:據與調人士,企業平均的GPU和TPU成
49、本分別為7.39萬元和2.29萬元,盡管GPU的成本較高,但其在處理并行運算,尤其是深度學習算法方面的性能表現卓越,使得這一額外的投入成為企業無法避免的支出。Nvidia GPU主導市場,多元選擇依然存在:主導市場,多元選擇依然存在:從市場占有率來看,GPU仍然是深度學習中最受歡迎的處理器架構。Nvidia在GPU領域具有較強的競爭優勢和品牌影響力,實際應用中多元化的供應商選擇依然存在。據與調人士,所有9家公司都選擇了nvidia的GPU作為主要方案,AMD的GPU也得到了一些公司(C、D、H)的青睞。華為和寒武紀,國內華為和寒武紀,國內GPU市場嶄露頭角:市場嶄露頭角:中國國內的華為和寒武紀
50、也開始在GPU市場中嶄露頭角。他們的產品分別被兩家公司選擇為GPU供應商。NVIDIA A100和和H100受青睞,受青睞,C公司投入領先公司投入領先:在具體型號上,NVIDIA的A100和H100平均持有量分別是3250張和2300張,這也證明了這兩款產品在市場上的普遍認可。特別是C公司表現出在硬件投入方面的雄心壯志,他們目前擁有的A100和H100總量最高(總量超過1萬張)。TPU2.3萬平均成本GPU7.4萬平均成本Q:據您了解,貴公司采用的:據您了解,貴公司采用的GPU是由哪家供應商提供?是由哪家供應商提供?100%33.3%33.3%22.2%11.1%11.1%資料來源:問卷調研,
51、天風證券研究所B公司C公司D公司H公司G公司E公司I公司J公司A100A800A800Avg.(2300張)A100Avg.(3250張)21算力戰爭:硬件和軟件相輔相成算力戰爭:硬件和軟件相輔相成國內外各型號國內外各型號AI芯片算力表芯片算力表在國內AI芯片市場,單卡AI芯片算力最高的是華為旗下海思的昇騰910,在半精度下可以達到320TFLOPS的計算速度,與Nvidia的A100 PCle版本持平。在國外AI芯片市場,Nvidia遙遙領先,其H100 NVL版本在半精度下算力可以達到3958TFLOPS,是AMD Instinct MI250X的10.33倍,華為昇騰910的12.4倍,
52、在算力方面Nvidia在全球市場的地位顯而易見。根據AMD官網發布消息,今年下半年預計推出的Instinct MI300有8倍于MI250X的計算性能,旨在挑戰Nvidia的H100系列。另外,雖然芯AMD的MI300系列在算力速度上跟上了Nvidia系列,但是上層的軟件架構同樣重要,過去十年取得的AI進步大部分是通過CUDA庫完成的,其他廠商想要挑戰Nvidia的主導地位除了在算力方向的提升,同樣要加強軟件生態的建設,這是一個投入巨大并且漫長的過程,在短時間內Nvidia市場地位無法撼動。Q:貴公司采用的:貴公司采用的GPU是由哪家供應商提供?是由哪家供應商提供?供應商供應商型號型號INT8
53、INT8FP16FP16國內華為昇騰910640TOPS320TFLOPS寒武紀思元290512 TOPS-百度昆侖芯二代AI芯片-128 TFLOPS國外NvidiaA100 80GB PCIe624 TOPS312 TFLOPSA100 80GB SXM1248 TOPS624 TFLOPSH100 SXM3,958 TOPS1,979 TFLOPSH100 PCIe3,026 TOPS1,513 TFLOPSH100 NVL7,916 TOPS3,958 TFLOPSAMDInstrinct MI250362.1 TOPs362.1 TFLOPsInstrinct MI250X383 T
54、OPs383 TFLOPsInstrinct MI300計劃今年下半年推出,預計有MI250X系列8倍的人工智能訓練性能華為昇騰計算能力追上華為昇騰計算能力追上A100 PCle1A100 PCle1CUDACUDA軟件生態打造軟件生態打造NvidiaNvidia護城河護城河資料來源:問卷調研,Nvidia、AMD、新智元、異騰、寒武紀、昆侖芯官網等、天風證券研究所大模型商業化落地現狀與趨勢大模型商業化落地現狀與趨勢522請務必閱讀正文之后的信息披露和免責申明23按交易量費、定制開發費是主要的收費模式按交易量費、定制開發費是主要的收費模式Q:據您了解,據您了解,貴公司大模型商業化主要采用哪種商
55、業模式?貴公司大模型商業化主要采用哪種商業模式?交易量收費100%定制開發收費100%88.9%服務收費77.8%訂閱服務收費 訂閱收費訂閱收費客戶可以根據需要選擇不同的訂閱級別,如基本、標準或高級。訂閱費用通常按月或按年收取,并根據所需服務的數量和類型進行定價。交易量收費交易量收費根據客戶每月使用的API調用或交易量收取費用。定價標準通常是按交易量計算,例如每千個API調用收取一定的費用。定制開發費用定制開發費用如果客戶需要特定領域的AI模型,公司通常會收取定制開發費用。定價標準通常取決于開發的難度和時間成本。服務費用服務費用提供數據處理、標注和質量控制服務等。66.7%22.2%11.1%
56、0.0%0.0%一般較為滿意無法評價非常滿意不滿意Q:您認為貴公司大模型商業化投資回報如何?:您認為貴公司大模型商業化投資回報如何?全面覆蓋常見的付費模式,凸顯需求敏感性和盈利模式靈活性。全面覆蓋常見的付費模式,凸顯需求敏感性和盈利模式靈活性。定制化解決方案是主要收入來源定制化解決方案是主要收入來源。據與調人士這種收費模式已全面覆蓋所有公司,例如美國的OpenAI就采取了類似的商業模式。說明相關AI科技團隊主要依靠為客戶提供定制化的AI解決方案來獲取收入,而不是提供標準化的AI產品或平臺。數據相關服務是重要的收入來源。數據相關服務是重要的收入來源。AI科技團隊提供AI解決方案的同時,也需要提供
57、數據相關的服務,如數據采集、清洗、標注、質量控制等,這些服務往往需要大量的人力和時間成本。訂閱收費模式已興起訂閱收費模式已興起。提供基于云端或SaaS的AI服務,體現了這些公司對長期客戶的關注,通過提供持續的服務,建立起穩定的客戶關系。讓客戶可以按需使用AI能力,而不是一次性購買。盡管對目前商業化投資回報的評價多為中性,但這并沒有阻止他們在商業化道路上的探索。AI商業化是一個長期過程,需要持續投入和優化。資料來源:問卷調研,天風證券研究所24訂閱收費與訂閱收費與API收費標準收費標準Q:據您了解,據您了解,貴公司大模型訂閱收費標準是多少?貴公司大模型訂閱收費標準是多少?Q:據您了解,據您了解,
58、貴公司交易量收費標準是多少?貴公司交易量收費標準是多少?免費量8400超出后月度收費75元年度收費800元Avg.Avg.Avg.按請求次數收費88.9%按計算資源使用量收費66.7%按使用時間收費55.6%1K Token0.053元Avg.1 次0.05元Avg.AI服務費用反映其模型復雜性、服務質量和市場競爭,需要綜合評估選擇服務費用反映其模型復雜性、服務質量和市場競爭,需要綜合評估選擇大模型在開發和運行所消耗的資源,無論是在算力還是存儲空間方面,都是非常龐大的。因此,AI團隊需要以某種形式來收回這些資源的投入,從而形成了各種不同的收費標準。對于不同的收費標準進行比對,有助于我們更好的理
59、解和評估各家公司的服務價值。調研結果顯示,大多數公司采用的是訂閱收費和API收費的模式。訂閱收費模式訂閱收費模式:據與調人士結果,7家團隊采用了訂閱收費的標準,其中免費量1000到20000次(平均8400次),月度收費平均價格50-100元(平均75元),年度收費價格600-1000元(平均800元)。訂閱收費模式能讓用戶更清楚的知道他們需要支付的費用,并且在一定范圍內,可以無限制的使用AI服務,有利于培養用戶的付費習慣。API收費模式收費模式:據與調人士結果,與調團隊都采用了API收費的模式,其中按照請求次數收費的團隊占比88.9%,按照計算資源使用量收費占比66.7%,按照使用時間收費占
60、比55.6%。API收費模式為用戶提供了靈活性,他們可以根據實際需求來付費。全球范圍內的類似收費模式:全球范圍內的類似收費模式:Google Cloud、Amazon Web Services(AWS)和Microsoft Azure等。他們的費用通?;贏PI調用次數、數據處理量或使用的計算資源。具體的費用標準可以在他們的官方網站上找到,但總的來說,他們的費用往往更高,主要是由于他們所使用的模型更加復雜,以及他們的服務通常包括了更多的增值服務。AI服務費用反映背后因素:服務費用反映背后因素:無論是在中國還是在全球范圍內,AI服務的費用標準通常反映了其背后的模型復雜性、服務質量以及市場競爭程度
61、。因此,選擇哪一種服務不僅要看價格,還要考慮其背后的技術支持、服務質量以及具體的需求。資料來源:問卷調研,天風證券研究所25AI科技公司活躍用戶總量與月度調用量科技公司活躍用戶總量與月度調用量Q:據您了解,據您了解,貴公司貴公司API月度用量是多少?月度用量是多少?Q:據您了解,據您了解,貴公司貴公司AI應用活躍用戶總量是多少?應用活躍用戶總量是多少?API調用量和用戶活躍度的關系調用量和用戶活躍度的關系針對用戶的訂閱和企業的API收費大模型商業化的主要收入來源,因此API月度調用量和AI應用活躍用戶數是衡量API使用情況和AI應用影響力的重要指標。雖然大規模API調用量通常與較高的用戶活躍度
62、相關,但調研結果顯示,API調用量和用戶活躍度并不總是成正比。因此,在發展過程中需要平衡API調用量和用戶活躍度,不能僅僅依賴于調用量來評估AI應用的影響力和價值。API提供方服務模式的影響提供方服務模式的影響API提供方的服務模式對提供方的服務模式對API調用量和用戶活躍度之間的關系產生影響。調用量和用戶活躍度之間的關系產生影響。API提供方可以直接面向終端用戶、企業客戶或開發者,或同時擁有這兩種模式。不同的服務模式會導致API調用量和用戶活躍度之間的差異。因此,API提供方需要根據具體情況制定適合的服務模式,以提供優質的服務,吸引和留住用戶。API調用與用戶活躍度的平衡發展是調用與用戶活躍
63、度的平衡發展是AI團隊業務發展的重要因素。團隊業務發展的重要因素。不僅要關注API調用量的增長,還要注重提供優質的服務,吸引用戶并保持用戶的活躍度。同時,根據不同的服務模式制定相應的策略,以實現平衡發展。接入量級百分比公司平均月度用量萬億級11.1%C公司40萬億億級22.2%B公司、A公司5.5億萬級44.4%H公司、G公司、I公司、J公司22.5萬不確定22.2%D公司、E公司-活躍用戶百分比公司平均活躍用戶千萬級11.1%G公司2千萬百萬級22.2%B公司、A公司250萬十萬級22.2%C公司、D公司50萬萬級33.3%H公司、J公司、I公司3萬不確定11.1%E公司-資料來源:問卷調研
64、,天風證券研究所26大模型垂直應用行業部署與應用成熟度大模型垂直應用行業部署與應用成熟度Q:據您了解,貴公司大模型商業應用和部署中,應用于以下哪些行業?備注:滲透率=選擇該行業部署樣本數量/參與調研的樣本總數Q2:據您了解,貴公司大模型在該領域的最成熟的應用包括以下哪些?備注:成熟度=該行業選擇占比超過50%的應用數量/該行業常見應用數量滲滲透透度度應用成熟度應用成熟度金融政府教育影視游戲電信交通醫療電商能源建筑資料來源:問卷調研,天風證券研究所行業行業滲透率滲透率成熟度成熟度最成熟應用最成熟應用金融78%80%交易分析政府67%67%公共安全影視游戲56%71%游戲開發、營銷、影視制作、分析
65、教育56%40%個性化教育電信44%100%電信客服營銷推廣電子商務44%100%客戶服務交通44%75%智能交通管理醫療44%50%影像分析制造44%40%故障檢測、工業安全能源22%20%能源管理建筑11%100%公共安全制造27客戶拓展策略與成功要素客戶拓展策略與成功要素Q:據您了解,據您了解,貴公司在客戶拓展方面采取了哪些策略?貴公司在客戶拓展方面采取了哪些策略?舉辦線上/線下活動100%合作伙伴推廣100%社交媒體營銷78%67%內容營銷Q:據您了解,據您了解,您認為在大模型商業化過程中,哪些因素是關鍵您認為在大模型商業化過程中,哪些因素是關鍵的成功要素?的成功要素?資料來源:問卷調
66、研,天風證券研究所100%89%67%44%22%技術創新客戶服務產品性能營銷策略價格優勢人人大模型可以應用于多種場景和領域,但并不意味著它可以面向所有類型的客戶。大模型可以應用于多種場景和領域,但并不意味著它可以面向所有類型的客戶。不同的客戶有不同的需求、預算、能力和偏好,因此大模型商業化需要明確目標不同的客戶有不同的需求、預算、能力和偏好,因此大模型商業化需要明確目標客戶群體,并根據其特點提供個性化服務??蛻羧后w,并根據其特點提供個性化服務。例如,OpenAI在公開GPT-3論文后,開放了模型的API申請通道,鼓勵研究者、開發者、企業從業者研究“好玩”的GPT-3應用,以此促動大模型的產業
67、場景發展。OpenAI通過設置不同等級的API訪問權限和收費標準,區分了不同層次的客戶,并根據其反饋和需求進行持續優化。貨貨大模型的核心競爭力在于其技術優勢和應用價值,因此在營銷策略中,需要突出大模型的核心競爭力在于其技術優勢和應用價值,因此在營銷策略中,需要突出創新性、性能、效率、通用性等特點,以及其在不同場景和領域中帶來的效果提創新性、性能、效率、通用性等特點,以及其在不同場景和領域中帶來的效果提升、成本降低、體驗優化等價值。升、成本降低、體驗優化等價值。例如:華為在推出盤古NLP后,通過發表白皮書、舉辦開發者大會、參與國際評測等方式,展示了盤古NLP的技術特色和優勢,如超大規模參數、海量
68、數據訓練等。華為云還通過案例分析、數據對比、用戶評價等方式,展示了盤古NLP在能源、零售、金融、工業、醫療等領域中的應用效果和價值。場場大模型作為一種新型高端技術,需要選擇合適的營銷渠道和形式,以便有效地傳大模型作為一種新型高端技術,需要選擇合適的營銷渠道和形式,以便有效地傳達信息和影響力。達信息和影響力。據與調人士,9家公司都選擇了線上線下活動和合作伙伴推廣的方式進行營銷。線上活動包括發布白皮書、舉辦技術分享會、參與國際競賽、開放社區等;線下活動包括舉辦技術論壇、參與行業展會、組織開發者大賽等。合作伙伴推廣包括與行業領先企業或機構建立合作關系,共同探索大模型的應用場景和商業模式。中國中國AI
69、領域的未來:領域的未來:整合,競爭,開放性與創新整合,競爭,開放性與創新628請務必閱讀正文之后的信息披露和免責申明29行業合作與應用擴展優先,整合與競爭并行,創新不止行業合作與應用擴展優先,整合與競爭并行,創新不止Q:據您了解,據您了解,貴公司未來貴公司未來1年大模型發展的目標是年大模型發展的目標是?22%22%56%78%89%提高準確率降低成本改善數據隱私保護擴大應用領域加強與行業合作11%56%56%78%100%0%20%40%60%80%100%政策嚴格監管新興創業公司崛起行業更加合作與開放行業巨頭競爭加劇橫向整合和縱向拓展Q:未來:未來2年,關于中國年,關于中國AI大模型行業的競
70、爭格局,您認同以下哪些?大模型行業的競爭格局,您認同以下哪些?AI應用有廣闊的發展空間應用有廣闊的發展空間,行業合作擴大影響力和覆蓋面價值。,行業合作擴大影響力和覆蓋面價值。AI不再僅僅是科技領域的專利,其跨行業的應用潛力正在逐步得到挖掘。各行業積極尋求與AI公司的合作,以此驅動行業的數字化和智能化轉型。對于AI公司來說,加強與各行業的合作,不僅能夠擴大他們的商業模式和營收來源,也有助于他們更好地理解并滿足市場需求。數據隱私保護的重視也在加強。數據隱私保護的重視也在加強。隨著數據安全和隱私問題日益突出,公眾對于數據隱私保護的關注度也在逐步提高。面對這樣的形勢,近半數與調AI公司表示,他們將在未
71、來一年推進數據隱私保護工作,旨在建立起更加健全的數據安全防護體系。降低成本和提高模型準確率并不是這些公司的主要發展目標降低成本和提高模型準確率并不是這些公司的主要發展目標。我們認為可能因為在大模型領域,大模型發展初期,成本不是制約其發展的主要問題,公司們更加注重的是如何將AI技術融入更多的實際應用中,創造更大的商業價值我們認為,未來兩年的主要趨勢預計將是行業的橫向和縱向整合,競爭的我們認為,未來兩年的主要趨勢預計將是行業的橫向和縱向整合,競爭的加劇,以及行業的進一步開放與新興創業公司的崛起。加劇,以及行業的進一步開放與新興創業公司的崛起。行業的橫向和縱向整合將是未來的一個主要趨勢。行業的橫向和
72、縱向整合將是未來的一個主要趨勢。AI公司將尋求在AI的不同子領域之間以及在AI產業鏈的上下游之間進行整合,以便提高效率,擴大規模,增強競爭力。隨著技術的發展和市場的成熟,行業競爭預計將會加劇。這不僅表現在行業巨頭之間的競爭,也表現在他們與新興創業公司之間的競爭。行業將會變得更加開放。行業將會變得更加開放。有一半的受訪者認為,新型的創業公司將會崛起。這預示著,在未來的AI領域,我們可能會看到更多富有創新的新企業出現。這些新興創業公司的崛起,將為行業注入新的活力和創新,也將為消費者帶來更多的選擇和更好的體驗。關于行業監管,大部分受訪者對此持樂觀態度關于行業監管,大部分受訪者對此持樂觀態度。我們認為
73、,適度的政策監管有助于保護消費者權益,保障數據安全,促進行業健康發展。資料來源:問卷調研,天風證券研究所風險提示風險提示1.1.樣本代表性風險:樣本代表性風險:本報告基于產業問卷調研,由于樣本量不足以覆蓋所有中國AI科技公司的多樣性和復雜性,被調研產業人士不能代表所在公司全貌,因此存在樣本代表性風險。2.2.人工智能行業發展不及預期:人工智能行業發展不及預期:人工智能發展受到輿論道德爭議,導致行業發展速度受限。3.3.商業模式仍不明朗:商業模式仍不明朗:AIGC應用處于起步階段,商業模式尚未得到有效驗證。4.4.法律風險:法律風險:對AIGC技術相關應用可能暗藏數據安全、著作權侵權、深度偽造、
74、商業機密泄露、違法信息傳播等風險。31請務必閱讀正文之后的信息披露和免責申明股票投資評級自報告日后的6個月內,相對同期滬深300指數的漲跌幅行業投資評級自報告日后的6個月內,相對同期滬深300指數的漲跌幅買入預期股價相對收益20%以上增持預期股價相對收益10%-20%持有預期股價相對收益-10%-10%賣出預期股價相對收益-10%以下強于大市預期行業指數漲幅5%以上中性預期行業指數漲幅-5%-5%弱于大市預期行業指數漲幅-5%以下投資評級聲明投資評級聲明類別類別說明說明評級評級體系體系分析師聲明分析師聲明本報告署名分析師在此聲明:我們具有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任
75、能力,本報告所表述的所有觀點均準確地反映了我們對標的證券和發行人的個人看法。我們所得報酬的任何部分不曾與,不與,也將不會與本報告中的具體投資建議或觀點有直接或間接聯系。一般聲明一般聲明除非另有規定,本報告中的所有材料版權均屬天風證券股份有限公司(已獲中國證監會許可的證券投資咨詢業務資格)及其附屬機構(以下統稱“天風證券”)。未經天風證券事先書面授權,不得以任何方式修改、發送或者復制本報告及其所包含的材料、內容。所有本報告中使用的商標、服務標識及標記均為天風證券的商標、服務標識及標記。本報告是機密的,僅供我們的客戶使用,天風證券不因收件人收到本報告而視其為天風證券的客戶。本報告中的信息均來源于我
76、們認為可靠的已公開資料,但天風證券對這些信息的準確性及完整性不作任何保證。本報告中的信息、意見等均僅供客戶參考,不構成所述證券買賣的出價或征價邀請或要約。該等信息、意見并未考慮到獲取本報告人員的具體投資目的、財務狀況以及特定需求,在任何時候均不構成對任何人的個人推薦??蛻魬攲Ρ緢蟾嬷械男畔⒑鸵庖娺M行獨立評估,并應同時考量各自的投資目的、財務狀況和特定需求,必要時就法律、商業、財務、稅收等方面咨詢專家的意見。對依據或者使用本報告所造成的一切后果,天風證券及/或其關聯人員均不承擔任何法律責任。本報告所載的意見、評估及預測僅為本報告出具日的觀點和判斷。該等意見、評估及預測無需通知即可隨時更改。過往
77、的表現亦不應作為日后表現的預示和擔保。在不同時期,天風證券可能會發出與本報告所載意見、評估及預測不一致的研究報告。天風證券的銷售人員、交易人員以及其他專業人士可能會依據不同假設和標準、采用不同的分析方法而口頭或書面發表與本報告意見及建議不一致的市場評論和/或交易觀點。天風證券沒有將此意見及建議向報告所有接收者進行更新的義務。天風證券的資產管理部門、自營部門以及其他投資業務部門可能獨立做出與本報告中的意見或建議不一致的投資決策。特別聲明特別聲明在法律許可的情況下,天風證券可能會持有本報告中提及公司所發行的證券并進行交易,也可能為這些公司提供或爭取提供投資銀行、財務顧問和金融產品等各種金融服務。因此,投資者應當考慮到天風證券及/或其相關人員可能存在影響本報告觀點客觀性的潛在利益沖突,投資者請勿將本報告視為投資或其他決定的唯一參考依據。