《資訊科技行業大模型深度:DeepSeek帶來互聯網新格局-250215(23頁).pdf》由會員分享,可在線閱讀,更多相關《資訊科技行業大模型深度:DeepSeek帶來互聯網新格局-250215(23頁).pdf(23頁珍藏版)》請在三個皮匠報告上搜索。
1、海外行業深度報告|資訊科技業 證券研究報告 請閱讀最后評級說明和重要聲明 1/23 行業評級 推薦(維持)報告日期 2025 年 02 月 15 日 相關研究相關研究 【興證海外 TMT】AI 手機深度:智能機邁入 2.0 時代-2024.11.22【興證海外 TMT】中概互聯網 2024 年中期投資策略:核心資產的再次修復-2024.07.12【興證海外 TMT】AI 手機深度:智能機邁入 2.0 時代-2024.11.22【興證海外 TMT】中概互聯網 2024 年中期投資策略:核心資產的再次修復-2024.07.12 分析師:洪嘉駿分析師:洪嘉駿 S0190519080002 BPL82
2、9 S0190519080002 BPL829 分析師:翁嘉源分析師:翁嘉源 S0190523060002 請注意:翁嘉源并非香港證券及期貨事務監察委員會的注冊持牌人,不可在香港從事受監管的活動。 S0190523060002 請注意:翁嘉源并非香港證券及期貨事務監察委員會的注冊持牌人,不可在香港從事受監管的活動。 大模型深度:大模型深度:DeepSeekDeepSeek 帶來互聯網新格局帶來互聯網新格局 投資要點:投資要點:DeepSeekDeepSeek 之前:預訓練是模型能力提升的主要路徑。之前:預訓練是模型能力提升的主要路徑。模型訓練通常分為兩個主要階段:預訓練和后訓練,此前行業中,預
3、訓練階段消耗的資源遠遠超過后訓練階段。而模型預訓練階段的能力提升 主要依賴于兩個關鍵因素的增強:一是強大的訓練算力,二是海量且高質量的數據。模型訓練通常分為兩個主要階段:預訓練和后訓練,此前行業中,預訓練階段消耗的資源遠遠超過后訓練階段。而模型預訓練階段的能力提升 主要依賴于兩個關鍵因素的增強:一是強大的訓練算力,二是海量且高質量的數據。DeepSeekDeepSeek 的意義在于指明了強化學習的正確路徑。的意義在于指明了強化學習的正確路徑。2024 年 9 月 OpenAI 推出ChatGPT-o1,該模型發現在后訓練中用強化學習在足夠強的模型上進行訓練,能夠使得模型學會推理,并在模型能力上
4、有明顯提升。但o1 閉源使得行業復現難度大。而DeepSeek-R1 在 2025 年 1 月發布后,將“強化學習”的方式與推理模型 R1 進行開2024 年 9 月 OpenAI 推出ChatGPT-o1,該模型發現在后訓練中用強化學習在足夠強的模型上進行訓練,能夠使得模型學會推理,并在模型能力上有明顯提升。但o1 閉源使得行業復現難度大。而DeepSeek-R1 在 2025 年 1 月發布后,將“強化學習”的方式與推理模型 R1 進行開源,真正意義上實現了“技術平權”。源,真正意義上實現了“技術平權”。訓練模型以提升其能力出現了一條更具性價比的路徑。訓練模型以提升其能力出現了一條更具性價
5、比的路徑。雖 DeepSeek 并未披露其 R1 強化學習階段的成本,但如論文AI capabilities can be significantly improved withoutexpensive retraining 所論述:“后訓練階段的開發成本投入相對較低,微調成本通常小于原始訓練成本的 1%,但即使這樣,也能顯著增強模型能力?!彪m DeepSeek 并未披露其 R1 強化學習階段的成本,但如論文AI capabilities can be significantly improved withoutexpensive retraining 所論述:“后訓練階段的開發成本投入相對較
6、低,微調成本通常小于原始訓練成本的 1%,但即使這樣,也能顯著增強模型能力?!盌eepSeekDeepSeek 到來的思考:到來的思考:思考一:大模型差距大幅度縮短,模型能力將迎來一輪新爆發。思考一:大模型差距大幅度縮短,模型能力將迎來一輪新爆發。新范式后,預新范式后,預訓練不是廠商“All in AI”的唯一解。對于 AI 的后發者,加大強化學習的資金投入成了性價比更高的路徑。訓練不是廠商“All in AI”的唯一解。對于 AI 的后發者,加大強化學習的資金投入成了性價比更高的路徑。思考二:思考二:ChatbotChatbot 的入口之爭將更加激烈。的入口之爭將更加激烈。推理模型的到來讓
7、AI 大模型的產品推理模型的到來讓 AI 大模型的產品能力邁上一個臺階,而不限于非推理模型擅長的情感聊天。其處理復雜任務的能力邁上一個臺階,而不限于非推理模型擅長的情感聊天。其處理復雜任務的能力使其成為真正意義上的“效率工具”,并初步展現出個人 AI 助理的雛形。這一趨勢預示 Chatbot 產品的使用頻率和用戶規模將大幅提升。能力使其成為真正意義上的“效率工具”,并初步展現出個人 AI 助理的雛形。這一趨勢預示 Chatbot 產品的使用頻率和用戶規模將大幅提升。思考三:推理成本下降與模型能力提升帶來了應用端共振。思考三:推理成本下降與模型能力提升帶來了應用端共振。2025 年將是 AI 應
8、2025 年將是 AI 應用爆發的一年。雖為 AI“后發者”,但廠商若擁有自身業務生態,也能利用 AI 提升自身業務場景體驗,如互聯網廠商在原先生態上加入 AI 賦能。用爆發的一年。雖為 AI“后發者”,但廠商若擁有自身業務生態,也能利用 AI 提升自身業務場景體驗,如互聯網廠商在原先生態上加入 AI 賦能。思考四:推理模型賦能端側思考四:推理模型賦能端側 AIAI。DeepSeek-R1 證明了大型模型的推理模式可以DeepSeek-R1 證明了大型模型的推理模式可以被提煉到小型模型中,提升模型效果。被提煉到小型模型中,提升模型效果。投資建議:投資建議:得益于 DeepSeek 引發的鯰魚效
9、應,預計 2025 年大模型能力將有明顯提升。隨著大模型能力提升新范式的到來,互聯網廠商在AI 領域的競爭由“技術之爭”開始轉為“生態之爭”“應用之爭”。隨著“模型平權”與生態端的“AI 賦能”到來,得益于 DeepSeek 引發的鯰魚效應,預計 2025 年大模型能力將有明顯提升。隨著大模型能力提升新范式的到來,互聯網廠商在AI 領域的競爭由“技術之爭”開始轉為“生態之爭”“應用之爭”。隨著“模型平權”與生態端的“AI 賦能”到來,港港股互聯網將迎來重估值股互聯網將迎來重估值,看好具有生態優勢的互聯網平臺如騰訊(00700.HK)、阿里巴,看好具有生態優勢的互聯網平臺如騰訊(00700.HK
10、)、阿里巴巴-W(0 9 9 8 8.H K)、小 米 集 團-W(0 1 8 1 0.H K)、M e t a(M E T A.O),看 好A g e n t生 態 廠商 S e r v i c e N o w(N O W.N)、S a l e s f o r c e(CRM),端側網絡安全廠商 Cloudflare(N E T.N),同 時 建 議 關 注 受 益 于 推 理 需 求 提 高 的 數 據 中 心、云 廠 商,如 亞 馬 遜(A M Z N.O)、甲 骨文(O R C L.N)、世 紀 互 聯(V N E T.O)等。巴-W(0 9 9 8 8.H K)、小 米 集 團-W(
11、0 1 8 1 0.H K)、M e t a(M E T A.O),看 好A g e n t生 態 廠商 S e r v i c e N o w(N O W.N)、S a l e s f o r c e(CRM),端側網絡安全廠商 Cloudflare(N E T.N),同 時 建 議 關 注 受 益 于 推 理 需 求 提 高 的 數 據 中 心、云 廠 商,如 亞 馬 遜(A M Z N.O)、甲 骨文(O R C L.N)、世 紀 互 聯(V N E T.O)等。風 險 提 示:大 模 型 能 力 提 升 遇 到 瓶 頸;AI 應用生態不及預期;地緣政治及出口管制風險。風 險 提 示:大
12、 模 型 能 力 提 升 遇 到 瓶 頸;AI 應用生態不及預期;地緣政治及出口管制風險。海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 2/23 Industry Rating Recommendation(Maintain)Report Date February 15,2025 Related Report Smartphones entering the 2.0 Era-2024.11.22 Mid-2024 Investment Strategies for Chinese Tech Companies:Core Assets Repaired Again-2024.07
13、.12 Analyst:Jiajun Hong AnalystSAC:S0190519080002 SxxxxxxxxxxxSFC:BPL829 S xAnalyst:Jiayuan Weng AnalystSFC:S0190523060002 SxxxxxxxxxxxJiayuan Weng is not license holder registered at the Securities and Futures Commission(SFC),and are not allowed to engage in regulated activities in Hong Kong.S x As
14、sistant Analyst x Industry Name Changes in the Internet Triggered by DeepSeek Investment Highlights:Before DeepSeek:Pre-training was the main path for enhancing model capabilities.Model training typically consists of two main stages:pre-training and post-training.Previously,the resource consumption
15、in the pre-training phase far exceeded that of post-training.Model enhancement during pre-training primarily depended on two key factors:high-level computing power and large amounts of high-quality data.The significance of DeepSeek lies in pointing out a correct path for reinforcement learning.In Se
16、ptember 2024,OpenAI launched ChatGPT o1,which discovered that reinforcement learning in post-training on a sufficiently strong model enables reasoning and significant model improvements.In January 2025,DeepSeek open-sourced the reinforcement learning approach along with the reasoning model R1,thus t
17、ruly promoting technology equality.A cost-effective model training path for enhancing model capabilities is coming.Currently,fine-tuning costs are very low in the industry.With the popularization of this reinforcement learning method,more investment will likely flow into this phase.Reflections on De
18、epSeeks Arrival:Shortened gap in Large Model Development will lead to a new surge in model capabilities.With the new model paradigm,pre-training is no longer the sole solution for All in AI.As for latecomers in AI,increasing investment in reinforcement learning will become a more cost-effective choi
19、ce.The competition for Chatbot will be more intense.The advent of reasoning models has elevated AI large models capabilities,going beyond the emotional interactions of non-reasoning models.Their ability to handle complex tasks will make them true“efficiency tools”,showcasing the personal AI assistan
20、ts.The massive application of reasoning model is brought by decreased reasoning costs and enhanced model capabilities.2025 will see an explosive growth for AI applications.Even as a latecomer in AI,companies with established business ecosystems can leverage AI to improve user experiences within thei
21、r own business contexts,as seen with Internet companies integrating AI into their existing ecosystems.Reasoning models empower Edge AI.DeepSeek-R1 proves that the reasoning pattern of large models can be distilled into smaller models,improving their performance.Investment suggestion:As the new parad
22、igm of model enhancement arrives,competition among Internet companies will shift from a technological rivalry to an ecosystem and application competition.With the arrival of model equality and AI empowerment at the ecosystem level,we recommend focusing on Internet platforms with ecosystem advantages
23、,such as Tencent(00700.HK),Alibaba-W(09988.HK),Xiaomi Group-W(01810.HK),Meta(META.O);agent ecosystem companies like ServiceNow(NOW.N)and Salesforce(CRM);as well as edge cybersecurity firms like Cloudflare(NET.N).Meanwhile,data centers and cloud providers benefiting from increased reasoning demands,s
24、uch as Amazon(AMZN.O),Oracle(ORCL.N),and CenturyLink(VNET.O),should be watched.Potential risks:Bottlenecks in Enhancing Large Model Capabilities;AI Application Ecosystem Underperformance;Geopolitical and Export Control Risks lUnZrQtRpMsOnQbR8Q8OoMoOnPqNjMrRoMfQmNqPbRmMxOuOmNqNxNsOwO 海外行業深度報告|資訊科技業 請
25、閱讀最后評級說明和重要聲明 3/23 目錄目錄 一、DeepSeek 之前:2024H2 大模型上新動力放緩.4 二、DeepSeek 的意義:指明了模型能力提升的第二條路.6 三、DeepSeek 到來的一些思考.12 思考一:大模型差距大幅度縮短,模型能力將迎來一輪新爆發.12 思考二:“入口之爭”將是頭部互聯網廠商的重中之重.13 思考三:推理成本下降與模型能力提升帶來的應用端共振.15 思考四:推理模型賦能端側 AI.17 四、投資建議.19 五、風險提示.19 圖目錄圖目錄 圖 1、DeepSeek-V3 技術報告披露預訓練與后訓練成本.4 圖 2、頭部模型訓練所用算力估算.5 圖
26、3、GPT-4o 與 o1 improvement 標尺對比圖.6 圖 4、o1 AIME 準確率趨勢圖.6 圖 5、DeepSeek-R1 推理模型示例:擁有思維鏈進行深度思考.7 圖 6、R1-Zero 訓練期間每個響應的平均時長.9 圖 7、R1-Zero 中間版本一個有趣的“頓悟時刻”.9 圖 8、各開源基準模型比較.10 圖 9、Kimi 長 CoT 結果.11 圖 10、Kimi 短 CoT 結果.11 圖 11、ChatGPT 流量情況(日活).13 圖 12、o1 與 o3-mini 價格對比.16 圖 13、推理模型蒸餾小模型后效果.17 圖 14、米家 App 月活用戶.1
27、8 表目錄表目錄 表 1、Chatbot Arena 大模型排行榜(截至 2025.2.3).7 表 2、ChatGPT 2024 年以來主要產品更新.13 表 3、頭部模型 API 調用價格(單位:USD$/Million Tokens).16 表 4、推理模型與非推理模型的差異.17 海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 4/23 一、DeepSeek 之前:2024H2 大模型上新動力放緩 2024H2 大模型觀察大模型觀察 1:海外大模型進展緩慢。:海外大模型進展緩慢。我們看到海外頭部大模型公司推出領先大模型的節奏放緩。OpenAI 方面,據 AI 研究員 Gwe
28、rn Branwen 發文表示,OpenAI 可能選擇將其 o1-pro 模型保密,利用其計算資源來訓練 o3 這類更高級的模型。與此同時,SemiAnalysis 表示 Anthropic 完成了對 Claude 3.5 Opus 的訓練。Claude 3.5 Opus 表現出色,但 Anthropic 并沒有將其公開發布,而是利用 Claude 3.5 Opus 生成合成數據,結合用戶數據進行獎勵建模,從而大大改進了 Claude 3.5 Sonnet。模型能力提升放緩原因淺析:模型能力提升放緩原因淺析:模型訓練的兩個階段:預訓練模型訓練的兩個階段:預訓練 vs.后訓練。后訓練。模型訓練通
29、常分為兩個主要階段:預訓練和后訓練。在預訓練階段,會在大量未標注(無監督)數據上訓練模型,讓模型學會通用的語言知識、語法結構、常識等。后訓練即是在預訓練模型的基礎上,利用少量高質量的有標簽數據針對具體任務進行優化,使模型在特定應用(如問答、翻譯、文本分類等)上表現更好。行業中,預訓練階段消耗的資源遠遠超過后訓練階段。例如 DeepSeek-V3 的預訓練花費約532.8 萬美元,而后訓練階段僅花費 1 萬美元。圖圖1、DeepSeek-V3 技術報告披露預訓練與后訓練成本技術報告披露預訓練與后訓練成本 數據來源:Arxiv,興業證券經濟與金融研究院整理 大模型在預訓練階段能力提升的核心在于訓練
30、算力與數據的提升。大模型在預訓練階段能力提升的核心在于訓練算力與數據的提升。模型預訓練階段的能力提升主要依賴于兩個關鍵因素的增強:一是強大的訓練算力,二是海量且高質量的數據。如 OpenAI 2020 年論文(Scaling Laws for Neural Language Models所發現的,當模型參數量、訓練數據量和計算資源按照一定比例增加時,模型的性能會以冪律(power-law)的方式不斷改善。2024H2 大模型能力提升放緩的部分原因在于,目前模型所用的算力尚未“質大模型能力提升放緩的部分原因在于,目前模型所用的算力尚未“質變”。變”。自 GPT-4 發布以來,數據中心建設進度緩慢
31、,訓練模型所需的算力并 海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 5/23 無顯著提升,導致各大廠商的預訓練進度放緩。根據 SemiAnalysis 報告,GPT-4 的訓練算力約為 2.15e25 的 FLOPS,而谷歌 Gemini,Llama,Claude等最新模型所用算力的提升有限。OpenAI前首席科學家Bob McGrew指出,盡管外界認為自 GPT-4 發布后大型語言模型的進展似乎停滯,但內部視角截然不同。開發如 GPT 系列的大型語言模型依賴大量算力,而這又取決于新數據中心的建設,這一過程通常耗時數年。從 GPT-4 到 GPT-5,預計需要 100倍的算力提
32、升,這是一個漸進的過程。在 GPT-5 正式發布之前,市場可能會先迎來算力提升 10 倍的過渡版本。圖圖2、頭部模型訓練所用算力估算頭部模型訓練所用算力估算 數據來源:SemiAnalysis,興業證券經濟與金融研究院整理 算力提升的瓶頸在于集群,金錢與時間均為限制條件。算力提升的瓶頸在于集群,金錢與時間均為限制條件。數據中心集群對組網架構,數據中心的選址、冷卻速度和電力供應等提出更高的要求,因此大模型預訓練的成本被大幅抬高。根據 SemiAnalysis 首席分析師帕特爾估算,一個 10 萬卡超算中心的物料成本(不包含土地、建筑外殼)高達 40 億美元。建設一個超算中心,從芯片發貨到組網,耗
33、時近 1 年。2024H2 大模型觀察大模型觀察 2:由于大模型預訓練階段的投入高企,我們看到部分跟隨:由于大模型預訓練階段的投入高企,我們看到部分跟隨者開始退出大模型訓練。者開始退出大模型訓練。2025 年 1 月,零一萬物表示將不再追求訓練超級大模型,但會繼續訓練參數適中的更快、更便宜的模型,并基于后者打造商業化應用:已和阿里云成立“產業大模型聯合實驗室”。零一萬物大部分訓練和 AI infra 團隊加入該實驗室,成為阿里員工。而 Character AI 被谷歌收購后選擇放棄通用模型競爭,專注個性化對話場景。海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 6/23 二、Dee
34、pSeek 的意義:指明了模型能力提升的第二條路 OpenAI 推出推出 o1 模型,發現除了預訓練外,模型能力也能在后訓練端提升。模型,發現除了預訓練外,模型能力也能在后訓練端提升。2024年 9 月,OpenAI 推出 ChatGPT-o1,并提出了在后訓練中最重要的發現:“在足夠強大的模型上應用強化學習進行訓練,能夠使該模型學會推理,并實現性能提升?!睆娀瘜W習(Reinforcement Learning)是一種通過獎勵與懲罰調節行為策略的機器學習方法,旨在優化智能體在環境中的互動行動。具體而言,強化學習是在機器學習中,讓智能體(agent)在與環境不斷交互的過程中,通過試錯(trial
35、 and error)的方式學習出一套最佳決策策略,從而在每個時刻選擇能夠最大化未來累積獎勵的動作。o1 的閉源使得行業復現有較高難度的閉源使得行業復現有較高難度。我們看到,OpenAI 對于 o1 的技術細節披露很少,并且隱藏了思維鏈。我們認為這也是為什么 Sam Altman 最近說:“我認為我們在這件事情上站在了歷史的錯誤一邊,OpenAI 需要想出一種不同的開源策略?!眻D圖3、GPT-4o 與與 o1 improvement 標尺對比圖標尺對比圖 圖圖4、o1 AIME 準確率趨勢圖準確率趨勢圖 數據來源:OpenAI 官網 Learning to reason with LLMs,興
36、業證券經濟與金融研究院整理 數據來源:OpenAI 官網 Learning to reason with LLMs,興業證券經濟與金融研究院整理 2025 年年 1 月月 DeepSeek-R1 發布以來,能力迅速獲得認可。發布以來,能力迅速獲得認可。DeepSeek-R1 目前在 Chatbot Arena 排行榜上已排名第三,成為國內首個模型登頂全球前三的大模型。更為重要的是,更為重要的是,DeepSeek 將“強化學習”的方式與推理模型將“強化學習”的方式與推理模型 R1 進行開源,進行開源,真正意義上實現了“技術平權”。真正意義上實現了“技術平權”。DeepSeek 開源了 DeepS
37、eek-R1-Zero、DeepSeek-R1 以及基于 Qwen 和Llama 從 DeepSeek-R1 中提煉出的六個密集模型(1.5B、7B、8B、14B、32B、70B)。海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 7/23 其中 R1-Zero 是通過大規模強化學習訓練出來的模型,在沒有監督微調(SFT)作為初始步驟的情況下,展示了非凡的推理能力。通過強化學習,DeepSeek-R1-Zero 自然而然地出現了許多強大而有趣的推理行為。而 R1 在強化學習之前則結合了多階段訓練和冷啟動數據,在推理任務上的性能與 OpenAI-o1-1217 不相上下。表表1、Cha
38、tbot Arena 大模型排行榜(截至大模型排行榜(截至 2025.2.3)Ranking Model Arena Score Organization 1 Gemini-2.0-Flash-Thinking-Exp-01-21 1382 Google 1 Gemini-Exp-1206 1373 Google 2 Gemini-Exp-1121 1365 Google 3 ChatGPT-4o-latest(2024-11-20)1365 OpenAI 3 Gemini-2.0-Flash-Thinking-Exp-1219 1363 Google 3 DeepSeek-R1 1358 D
39、eepSeek 5 Gemini-2.0-Flash-Exp 1356 Google 6 o1-2024-12-17 1351 OpenAI 7 Gemini-Exp-1114 1347 Google 10 o1-preview 1335 OpenAI 11 DeepSeek-V3 1317 DeepSeek 11 Step-2-16K-Exp 1304 StepFun(階躍星辰)12 o1-mini 1305 OpenAI 12 Gemini-1.5-Pro-002 1302 Google 12 Gemini-1.5-Pro-Exp-0827 1300 Google 16 Grok-2-08
40、-13 1288 xAI 16 Yi-Lightning 1287 01 AI(零一萬物)數據來源:Hugging Face,興業證券經濟與金融研究院整理 圖圖5、DeepSeek-R1 推理模型示例:擁有思維鏈進行深度思考推理模型示例:擁有思維鏈進行深度思考 數據來源:DeepSeek,興業證券經濟與金融研究院整理 海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 8/23 DeepSeek-R1 與與 R1-Zero 技術亮點淺析:技術亮點淺析:DeepSeek-R1-Zero 完全拋開監督微調(完全拋開監督微調(SFT)。)。監督微調是指在預訓練模型的基礎上,利用標注好的特定任
41、務數據集進行進一步訓練,以提升模型在特定任務上的性能。具體步驟如下:(1)準備任務特定數據集:選擇并標注與特定任務相關的數據;(2)微調模型:使用標注好的數據對模型進行微調,調整模型的權重以匹配特定任務的數據分布。而 R1-Zero 放棄了監督微調,訓練模型時候不再教模型具體該怎么做(SFT),而是告訴模型什么是好與不好,然后讓模型自己摸索哪種行為更好。對于人類無法教授的復雜情況,R1-Zero 能夠自行探索最優行為方案。值得注意的是,盡管 DeepSeek-R1-Zero 展現出強大的推理能力,并能自主開發出意想不到的強大推理行為,但它也面臨著一些問題:如 R1-Zero 在可讀性和語言混雜
42、等問題上舉步維艱。因此因此 DeepSeek 對其進對其進行小幅度監督微調,發布了行小幅度監督微調,發布了 R1(目前市面上的通用模型)。(目前市面上的通用模型)。利用利用 GRPO 評價方式。評價方式。GRPO 方法(Group Relative Policy Optimization)是 DeepSeek 在強化學習上的創新,用于在訓練模型時優化其決策策略。該方法省去了設計復雜的評價標準,也讓訓練過程更高效、更穩定。GRPO 的核心思想是:不需要額外的價值模型。傳統方法(如 PPO)會同時訓練一個價值網絡(critic),用于評估當前動作的好壞,幫助減少訓練中的波動。而 GRPO則省去了這
43、個步驟,不用另外訓練一個和策略模型同樣大的價值網絡,達到節省計算資源的效果。利用“組內比較”來評估表現。在 GRPO 中,對于同一個問題(或輸入),模型會生成多個答案(動作)。GRPO 不會直接計算這些答案的絕對得分,而是通過組內的相對比較來估計每個動作的優劣。也就是說,如果某個答案比這一組的平均水平好,就認為它具有“優勢”(advantage);反之,則認為它較差。采用穩定更新策略。GRPO 在更新模型時,會使用類似重要性采樣的方法來計算新舊策略輸出概率的比值,并結合上面計算出的相對優勢來更新模型參數。同時,它還會通過剪切(clip)和 KL 正則化來控制策略更新的幅度,避免模型變化過大帶來
44、的不穩定。海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 9/23 圖圖6、R1-Zero 訓練期間每個響應的平均時長訓練期間每個響應的平均時長 圖圖7、R1-Zero 中間版本一個有趣的“頓悟時刻”中間版本一個有趣的“頓悟時刻”數據來源:Arxiv,興業證券經濟與金融研究院整理 數據來源:Arxiv,興業證券經濟與金融研究院整理 后訓練階段的“強化學習”后訓練階段的“強化學習”一條更具性價比的模型能力提升路徑。一條更具性價比的模型能力提升路徑。雖 DeepSeek未披露其 R1 強化學習階段的成本,但根據論文AI capabilities can be significantly
45、 improved without expensive retraining的論述,后訓練階段的開發成本相對較低:微調成本通常小于原始訓練成本的 1%,且能顯著增強模型能力。從 DeepSeek-V3 的訓練成本結構可見,目前業界在訓練模型時,后訓練階段的投入仍然很低。隨著強化學習方式的普及,業界將更加注重后訓練階段的投入。經過數千次強化學習的訓練,DeepSeek-R1-Zero 在推理基準測試中展現了卓越的性能提升。具體而言,其在 AIME 2024 中的 pass1 得分從 15.6%提高到 71.0%,而在多數投票的情況下,得分進一步提高到 86.7%,這可以與 OpenAI-o1-0
46、912 的性能相媲美。此外,DeepSeek-R1 的性能預計在短期內可以實現進一步優化。這讓 DeepSeek 能自信地表示:(“(“DeepSeek-R1 的的工程性能將在下一個版本中得到改善,因為目前相關的強化學習訓練數據量工程性能將在下一個版本中得到改善,因為目前相關的強化學習訓練數據量仍然非常有限?!比匀环浅S邢??!焙M庑袠I深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 10/23 圖圖8、各開源基準模型比較各開源基準模型比較 數據來源:Arxiv,興業證券經濟與金融研究院整理 不止不止 DeepSeek,Kimi 也證明了強化學習之路的可行性。也證明了強化學習之路的可行性。Ki
47、mi 于 1 月 22 日發布Kimi k1.5 和相應的技術報告Kimi k1.5:Scaling Reinforcement Learning with LLMs。報告中提到,“雖然使用下一個標記預測進行語言模型預訓練對于擴展計算是有效的,但受限于可用的訓練數據量。擴展強化學習為人工智能的持續改進擴展強化學習為人工智能的持續改進打開了一條新的軸線,大型語言模型有望通過學習探索獎勵來擴展其訓練數據。打開了一條新的軸線,大型語言模型有望通過學習探索獎勵來擴展其訓練數據。該模型在多個基準和模式上都達到了最先進的推理性能,例如在 AIME 上達到77.5,在 MATH 500 上達到 96.2,在
48、 Codeforces 上達到 94%,在 MathVista 上達到 74.9,與與 OpenAI 的的 o1 相媲美相媲美?!焙M庑袠I深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 11/23 圖圖9、Kimi 長長 CoT 結果結果 數據來源:Arxiv,KIMI K1.5:SCALING REINFORCEMENT LEARNING WITH LLMS,興業證券經濟與金融研究院整理 圖圖10、Kimi 短短 CoT 結果結果 數據來源:Arxiv,KIMI k1.5:SCALING REINFORCEMENT LEARNING WITH LLMS,興業證券經濟與金融研究院整理 除了
49、除了 DeepSeek-R1 外,外,DeepSeek-V3 同樣具有亮點,通過工程、算法上的優化同樣具有亮點,通過工程、算法上的優化極大地降低了模型的訓練和推理成本。極大地降低了模型的訓練和推理成本。DeepSeek-V3 采用了 14.8 萬億 tokens 的高質量數據,其完整訓練只需要 278.8萬 H800 GPU 小時和 2048個 H800集群。通過兩邊倒推卡的訓練方式,在集群訓練中空泡率減少(即機器等待數據的時間)的同時,模型訓練的 MFU(算力利用率)得以提升。架構上:DeepSeek-V3 采用了 MoE 架構,并為 MoE 開創了負載平衡的無損失策略;研究了多 token
50、s 預測目標 MTP,并證明其有利于模型性能,也可以用于推理加速的推測解碼。預訓練:DeepSeek-V3 首次在超大規模模型上驗證了 FP8 訓練的可行性和有效性;協同設計算法、框架和硬件,克服了跨節點 Mo 訓練中的通信瓶頸,顯著增強了訓練效率并降低訓練成本。海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 12/23 DeepSeek-V3 引入了一種創新方法,能夠將 CoT 模型中的推理能力提煉到標準的 LLMs 中。三、DeepSeek 到來的一些思考 思考一:大模型差距大幅度縮短,模型能力將迎來一輪新爆發 DeepSeek-R1 的的重要性在于其開源性縮短了重要性在于其開
51、源性縮短了國內外大模型國內外大模型的的差距。差距。自 2025 年以來,國內大模型的發展迅速跟進。除了 DeepSeek 以外,階躍星辰 Step-2-16K-Exp 的表現也不凡,在 Chatbot Arena 排行榜中位列第 11。預計今年預計今年將有更多將有更多性性能顯著能顯著提升的大模型提升的大模型發布發布。得益于 DeepSeek 引發的鯰魚效應,我們預計 2025年大模型的更新頻率及能力提升幅度將較 2024 年實現顯著飛躍。在新興的技術范式下,預訓練不再是互聯網企業“在新興的技術范式下,預訓練不再是互聯網企業“All in AI”的唯一的唯一解決方案解決方案。對于 AI 的后發者
52、,提高對強化學習的資金投入成了性價比更高的策略。我們看好騰訊、阿里巴巴、小米、字節跳動等互聯網公司通過這一策略進一步提升其模型能力?!皬娀瘜W習”的新范式并不代表預訓練的結束?!皬娀瘜W習”的新范式并不代表預訓練的結束。由于后訓練的能力仍很大程度取決于基座模型,即預訓練,我們預計頭部大廠,如 OpenAI、谷歌、Meta、xAI 等頭部科技公司將會兼顧“預訓練”與(“強化學習”。如馬斯克在 2025 年 1 月表示,其用 10 萬張 H100 訓練的 Grok 3 模型,已經結束了預訓練階段,發布在即。Sam Altman 近期表示近期表示 OpenAI 將持續推動開發將持續推動開發小型、小型、高
53、性能高性能且且極速極速的推理模型,的推理模型,同時也會繼續推進同時也會繼續推進 GPT-6/7 的研發。的研發。此外,他提到除了 o1 和 o3 模型外,OpenAI還有一個尚未公開的內部推理模型。據他透露,該模型目前的編程能力已躋身全球頂尖程序員的前 50 名,并有望在年底達到全球第一的水平。Atman 還表示,OpenAI 內部已經達到了 GPT-4.5。Meta 和和 Anthropic 也將推出更新的模型也將推出更新的模型。Meta 在 2024Q4 業績會上表示,使用超過 10 萬 H100 訓練的 Llama4 或將于本季度發布。Anthropic 首席執行官表示近期將發布強大新模
54、型,在推理上走不同的道路。海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 13/23 思考二:“入口之爭”將是頭部互聯網廠商的重中之重 OpenAI 雖雖在大模型上進展緩慢,但在大模型上進展緩慢,但在在產品與商業化上的競爭卻很亮眼產品與商業化上的競爭卻很亮眼。OpenAI 2024H2 更多注重打磨產品,日活相較 2024H1 提升近一倍,最新一周的日活約1.2 億,目標在 2025 年底達到 10 億日活。截至 2024 年,OpenAI 年化收入約 70 億美元,其中 ChatGPT 貢獻約 40 億美元,僅 ChatGPT Pro 套餐(每月 200 美元)每月至少產生 25
55、00 萬美元的收入,或每年至少產生 3 億美元的收入。圖圖11、ChatGPT 流量情況流量情況(日活)(日活)數據來源:Sensor Tower,Similarweb,興業證券經濟與金融研究院整理 表表2、ChatGPT 2024 年以來主要產品更新年以來主要產品更新ChatGPT 流量的攀升得益于流量的攀升得益于 App 的持續打磨的持續打磨 更新更新 描述描述 發布日期發布日期 設立 GPT 商店 用戶可以發現和使用他人創建的自定義 GPT 的平臺。2024/1/10 推出 ChatGPT 團隊 使團隊能夠通過共享訪問和管理功能協作并一起使用 ChatGPT。2024/1/10 推出內存
56、控件 用戶可以控制 ChatGPT 的記憶,明確告訴它記住或忘記某些數據。2024/2/13 發布 GPT-4o 是當時最新的旗艦模型,提供 GPT-4 級別的智能水平以及更快的運行速度,并在文本、語音和視覺方面有所改進。2025/5/13 推出高級數據分析 用戶可以:直接從 Google Drive、Microsoft OneDrive Personal 和 Microsoft OneDrive(包括 Sharepoint)上傳最新文件版本;在新的可擴展視圖中與表格和圖表進行交互;自定義并下載可用于演示的圖表和文檔。2024/5/16 發布 GPT-4o mini 功能強大,性價比高的小模型
57、。在文本智能和多模態推理方面的學術基準測試中超越了 GPT-3.5 Turbo 和其他小型模型。2024/7/18 DALLE 3 適用于免費用戶 免費用戶每天最多可以創建兩張圖片。2024/8/8 高級語音模式應用于網頁端 語音聊天功能從移動端和桌面端擴展至網頁端。2024/11/19 更新交互頁面設計 應用界面重新設計,具有新的浮動模式、改進的側邊欄和增強的移動端體驗。2024/11/22 020406080100120140百萬人次百萬人次網頁DAU(百萬人次)移動端DAU(百萬人次)海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 14/23 推出畫布 在 GPT-4o 中為
58、所有用戶提供該功能,以突出用戶的子任務背景和需求。2024/12/10 推出圣誕老人效果 用戶可以使用高級語音功能和圣誕老人聊天。2024/12/12 推出視頻和屏幕共享 涵蓋實時視頻、屏幕共享和圖片上傳功能,但有每日使用量限制。2024/12/12 推出項目管理 用戶可以將文件和聊天進行分組以完善對多個聊天的管理;用戶在每個項目中可以使用畫布、高級數據分析、DALLE 和搜索功能。2024/12/13 推出任務預約 用戶可以要求 ChatGPT 在未來某個時間執行某個任務。2025/1/14 聯動聊天和畫布 支持用戶將已有的聊天導入到畫布以進行編輯和協作。2025/1/15 增強自定義的個性
59、化程度 自定義指令的范圍更廣,使用更便捷輕松。2025/1/17 推出畫布分享 用戶可以和其他用戶共享畫布內容。2025/2/6 數據來源:ChatGPT,興業證券經濟與金融研究院整理 Chatbot 的入口之爭將愈發激烈。的入口之爭將愈發激烈。早期的非推理模型作用更多是情感聊天(最具代表性的例子是 Character.AI)。然而,隨著推理模型的崛起(如 DeepSeek-R1、ChatGPT-o3 mini),Chatbot 類產品的能力邁上了一個大臺階。其處理復雜任務的能力將使其成為真正意義上的“效率工具”,并初步展現出個人私人 AI 助理的雛形。這一趨勢預示著 Chatbot 產品的使
60、用頻率和用戶規模將大幅提升,從而成產品的使用頻率和用戶規模將大幅提升,從而成為互聯網的下一個重要入口為互聯網的下一個重要入口。OpenAI 已證明了 Chatbot 的商業價值,單 ChatGPT 的年化收入已達 40億美元。各家頭部互聯網大廠也開始重視這一入口:Meta:馬克扎克伯格認為“今年將是高度智能化和個性化的人工智能助手服務超過 10 億人的一年”,并期待“Meta AI 成為領先的人工智能助手”,同時表示“月活增長到 10 億后,才會關注商業化,今年更有意義的事情是將人工智能產品規?;?。Google:首席執行官皮查伊表示,公司在模型研發方面取得初步成功,但強調仍需不斷推進,以保持
61、在人工智能創新領域的領先地位。開拓 Gemini 的消費市場將成為首要任務,目標是達到 5 億用戶。他指出,雖然人工智能領域的進展正變得越來越具有挑戰性,但對于 Google 來說,有效利用這項技術來滿足用戶的實際需求仍然是至關重要的。OpenAI:目標是在 2025 年底前將 ChatGPT 的日活躍用戶數提升至 10 億。海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 15/23 Meta AI 月活已達月活已達 7 億,是海外僅次于億,是海外僅次于 OpenAI 的的 C 端端 AI 產品。產品。產品計劃:Meta 計劃未來更新用戶歷史查詢細節的記憶功能,并根據Faceboo
62、k、Instagram 上的互動,提供個性化和相關程度更高的響應。使用場景:Meta AI 在不同應用中有不同使用場景。在 WhatsApp 中,Meta AI 主要被用于信息搜集、教育查詢以及尋求情感支持。盡管在一些群組消息中,用戶也會使用 Meta AI,但大多數的 AI 互動存在于一對一的對話中。Facebook 則是用戶使用 Meta AI 的第二大驅動因素。用戶在深度探索信息流時,傾向于和 Meta AI 咨詢有關推薦內容的問題,并在信息整合方面尋求幫助。騰訊騰訊在“在“入口入口”的下一步布局值得重點”的下一步布局值得重點關注關注。在 DeepSeek 的技術支持下,騰訊的模型能力有
63、望實現快速躍升。微信作為超級入口,未來若接入騰訊自研模型,或可助力騰訊元寶在競爭中實現降維打擊。同時,得益于其強大的小程序生態,微信在 AI 應用層面的潛力可能超越 Meta。如在智能推薦方面,精準理解用戶需求后,可以推薦合適的小程序直接跳轉至相應界面,從而為用戶提供高效的服務體驗。思考三:推理成本下降與模型能力提升帶來的應用端共振 高昂的價格是推理模型早期難以大規模普及的主要障礙之一。高昂的價格是推理模型早期難以大規模普及的主要障礙之一。以 ChatGPT-o1 為例,除了其發布初期采用閉源的策略外,高昂的定價也限制了其市場滲透率。在 2024 年 9 月發布時,GPT-o1-preview
64、 的 API 定價為每百萬輸入 token 15 美元,每百萬輸出 token 60 美元,遠高于 GPT-4o 的定價(輸入 5 美元/百萬 token,輸出 15 美元/百萬 token)。而 12 月完整版 GPT-o1 發布后,OpenAI 也推出了ChatGPT Pro 訂閱服務,C 端用戶每月支付 200 美元即可無限制訪問 o1 模型。便宜才是硬道理。便宜才是硬道理。得益于 DeepSeek 在基礎模型 V3 與推理模型 R1 上的算法創新與優化,在 1 月推出時候,DeepSeek-R1 API 服務定價為每百萬輸入 tokens 1元(緩存命中)/4 元(緩存未命中),每百萬
65、輸出 tokens 16 元,輸出 API 價格僅為 GPT-o1 的 3.3%。海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 16/23 價格的鯰魚效應。價格的鯰魚效應。由于 DeepSeek 的鯰魚效應,OpenAI 在 2 月 1 日推出新的推理模型 GPT-o3 mini,價格相較 GPT-o1 同樣有明顯下降。輸出由 GPT-o1 的 60美元/百萬 token 下降到 GPT-o3 mini 的 4.4 美元/百萬 token。而谷歌于 2 月 3 日也推出了一系列極具性價比的模型 Gemini 2.0 Flash 系列。圖圖12、o1 與與 o3-mini 價格對比
66、價格對比 數據來源:OpenAI,興業證券經濟與金融研究院整理 表表3、頭部模型頭部模型 API 調用價格調用價格(單位:(單位:USD$/Million Tokens)公司公司 模型模型 最大文本最大文本長度長度 最大輸出最大輸出長度長度 輸入(無輸入(無需緩存)需緩存)輸入(使輸入(使用緩存)用緩存)輸入(需輸入(需要緩存)要緩存)輸出輸出 文本緩存文本緩存存儲存儲 DeepSeek DeepSeek-V3 64K 8K-0.07 0.27 1.1-DeepSeek-R1 64K 8K-0.14 0.55 2.19-ChatGPT GPT-4o 128K 4k-1.25 2.5 10-GP
67、T-o3 mini 200K 100k-0.55 1.1 4.4-Claude Claude 3.5 Sonnet 200K 8K 3 0.3 3.75 15-Claude 3.5 Haiku 200K 8K 0.8 0.08 1 4-Google Gemini 2.0 Flash 1M 8K 0.1(文本、圖片、視頻)0.7(音頻)0.025(文本、圖片、視頻)0.175(音頻)-0.4 1/小時 Gemini 2.0 Flash-Lite 1M 8K 0.075 0.01875-0.3 1/小時 Gemini 1.5 Pro 2M 8K 128K Tokens:2.5 128K Token
68、s:0.625-128K Tokens:10 4.5/小時 數據來源:DeepSeek、OpenAI、Anthropic、Google Gemini,興業證券經濟與金融研究院整理 模型能力同樣是影響模型能力同樣是影響AI應用市場滲透率的重要因素。應用市場滲透率的重要因素。除價格因素之外,DeepSeek更是在春節時實現了一輪推理模型的破圈,讓很多個人與企業用戶認識到相較此前的非推理模型,推理模型的 AI 能力具有長足的進步。海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 17/23 表表4、推理模型與非推理模型的差異推理模型與非推理模型的差異 特性特性 推理模型推理模型 非推理模型
69、非推理模型 回答生成方式 生成答案的同時展示中間推理步驟(例如鏈式思考)。直接生成最終答案,內部推理過程不透明或僅隱藏,不顯示中間步驟。應用場景 更適用于復雜任務,如高級數學證明、編程挑戰、謎題解答等需要多步邏輯推導的問題。更適用于簡單事實問答、翻譯、摘要等對速度和成本要求較高的任務??山忉屝耘c用戶信任 展示推理過程,答案的邏輯鏈條更清晰,便于用戶理解和驗證,提升了可解釋性和信任度。生成過程不透明,用戶難以追蹤模型內部的決策過程,在某些關鍵任務中不易維持用戶信任度。性能與響應時間 在處理復雜問題時邏輯更準確嚴謹,但多步推理和擴展計算會導致響應時間延長和計算成本增加。對于簡單問題響應迅速,但在復
70、雜問題上可能因缺少詳細推理步驟而出現錯誤或邏輯不連貫的問題。數據來源:Hubwiz、CSDN 論壇、天翼云開發者社區,興業證券經濟與金融研究院整理 價格與能力共振。價格與能力共振。隨著新范式的到來,在 AI 應用端,一方面 AI 部署價格的大幅度下降,另一方面,AI 能力顯著提升。我們看到,這一趨勢為 AI 應用的場景打開更廣闊的市場空間。預計 2025 年將迎來 AI 應用的爆發,尤其看好具備成熟業務生態的后發者,如互聯網廠商通過 AI 賦能升級現有業務,實現AI+生態的深度融合。思考四:推理模型賦能端側 AI 端側端側 AI 也具備推理能力。也具備推理能力。以 DeepSeek-R1 為代
71、表的創新實踐表明,通過模型蒸餾技術,大型語言模型的推理范式可被有效遷移至小型模型中。這一技術路徑不僅顯著提升了小型模型的推理性能,更重要的是開辟了模型持續學習的新維度:小模型能夠從用戶端吸收新知識和數據,從而在資源受限的端側設備上實現近似大模型的推理能力。這一突破為端側 AI 的規?;瘧玫於酥匾夹g基礎。圖圖13、推理模型蒸餾小模型后效果推理模型蒸餾小模型后效果 數據來源:Arxiv,興業證券經濟與金融研究院整理 海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 18/23 智能終端爭先接入智能終端爭先接入 DeepSeek 模型。模型。語音助手先行:華為小藝助手、榮耀 YOYO
72、助理和聯想小天宣布接入 DeepSeek-R1:用戶可以通過語音指令直接調用大模型,獲取更準確的信息以及更精準的服務。同時系統層將開始接入:OPPO 宣布2 月底,ColorOS 將全面接入 DeepSeek。Flyme AIOS 團隊確認將為魅族 21 系列、Lucky 08 上線 DeepSeek,后續將大模型搭載到 StarV AR 眼鏡等 AI 生態產品。模型能力補上短板,終端入口價值或將提高。模型能力補上短板,終端入口價值或將提高。DeepSeek 帶來的“技術平權”彌補了手機廠商在模型能力上的缺陷。同時,我們認為手機系統或成為 AI 助理調用第三方應用的橋梁,這將大幅度提高手機系統
73、的生態價值。感知數據是感知數據是 AI 手機的重要勝負手。手機的重要勝負手。所謂感知數據,即是通過對現實世界的物理世界或抽象信息的識別和檢測所生成的數據,如我們生活中常見的溫濕度傳感器、攝像頭、定位數據、文本數據等等。有感知數據做支撐,大模型在執行理解、推薦等任務時,才更有能力理解用戶的真實意圖。這也是 AI 手機能更“懂”用戶的決定性因素。小米“人車家生態”帶來感知數據優勢。小米“人車家生態”帶來感知數據優勢。截至 2024 年 9 月,小米人車家生態全球月活用戶數已達 6.86 億(yoy+10.1%),IoT 設備(不包括手機、平板、電腦)全球連接量達 8.6 億(yoy+23%)。根據
74、公司披露,截至 2024 年 9 月,米家 App月活達到 1 億。根據 Sensor Tower 數據,米家 App 2024 年 12 月月活同比增長43%,環比增長 1%,仍保持快速增長。IoT 設備亮眼的市場表現是大多數手機廠商所缺乏的,也是小米 AI 手機的長期護城河。圖圖14、米家米家 App 月活用戶月活用戶 數據來源:Sensor Tower,興業證券經濟與金融研究院整理 注:Sensor Tower 跟蹤數據,國內區域僅有 IOS 端數據,僅作趨勢參考,絕對值以公司披露口徑為準 -5.00 10.00 15.00 20.00 25.00Oct-15Feb-16Jun-16Oc
75、t-16Feb-17Jun-17Oct-17Feb-18Jun-18Oct-18Feb-19Jun-19Oct-19Feb-20Jun-20Oct-20Feb-21Jun-21Oct-21Feb-22Jun-22Oct-22Feb-23Jun-23Oct-23Feb-24Jun-24Oct-24MAUMAU(百萬)(百萬)米家App MAU 海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 19/23 手機系統的手機系統的 AI 化進程化進程將將成為成為未來未來智能智能手機手機迭代升級的核心迭代升級的核心變量。變量。自 2024 年 1 月三星發布首款 AI 手機 Galaxy S2
76、4 后,經過近一年的技術演進和市場驗證,行業對手機 AI 化的實現路徑已形成更清晰的認知。從初期單一場景的 AI 功能,到目前跨應用、跨場景的智能協同,手機系統 AI 化已成為手機廠商的戰略共識。2024年 10 月以來,各手機廠商相繼舉辦開發者大會,AI 功能均被列為系統更新的核心議題。我們相信,隨著廠商持續推進 AI 功能的優化和用戶教育,AI 將在手機的日常使用中扮演更重要的角色?;诋斍?AI 手機的技術發展態勢,預計今年或將出現新一輪的換機潮。在此背景下,我們看好具備強大的模型研發能力、擁有海量用戶感知數據的手機廠商。四、投資建議 得益于 DeepSeek 引發的鯰魚效應,預計 20
77、25 年大模型能力將有明顯提升。隨著大模型能力提升新范式的到來,互聯網廠商在 AI 領域的競爭由“技術之爭”開始轉為“生態之爭”“應用之爭”。隨著“模型平權”與生態端的“AI 賦能”到來,港股互聯網將迎來重估值,看好具有生態優勢的互聯網平臺如騰訊(00700.HK)、阿里巴巴-W(09988.HK)、小米集團-W(01810.HK)、Meta(META.O),看好Agent 生態廠商 ServiceNow(NOW.N)、Salesforce(CRM),端側網絡安全廠商 Cloudflare(NET.N),同時建議關注受益于推理需求提高的數據中心、云廠商,如亞馬遜(AMZN.O)、甲骨文(ORC
78、L.N)、世紀互聯(VNET.O)等。五、風險提示 大模型能力提升遇到瓶頸:大模型能力提升遇到瓶頸:當前人工智能大模型在性能提升方面可能面臨技術瓶頸,包括但不限于算法創新放緩、算力需求與成本矛盾加劇、數據質量與規模限制等問題。這些因素可能導致模型性能提升速度不及預期,進而影響相關產品的競爭力和市場表現。AI 應用生態不及預期:應用生態不及預期:人工智能技術的商業化應用可能面臨市場需求不足、用戶接受度低、應用場景受限等問題。行業標準缺失、技術成熟度不足、商業模式不清晰等因素可能導致 AI 應用生態發展緩慢。此外,跨行業融合難度大、傳統行業數字化轉型進程緩慢等也可能制約 AI 技術的規?;瘧?。地
79、緣政治及出口管制風險:地緣政治及出口管制風險:全球地緣政治局勢變化可能對人工智能產業鏈造成沖擊,包括關鍵技術和設備的進出口限制、數據跨境流動管制、國際技術標準競爭等。特定國家或地區可能出臺針對 AI 技術的出口管制措施,影響相關企業的技術 海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 20/23 研發和產品供應。同時,國際政治環境的不確定性也可能導致市場波動,影響投資者信心和行業長期發展。海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 21/23 分析師聲明分析師聲明 本人具有中國證券業協會授予的證券投資咨詢執業資格并登記為證券分析師,以勤勉的職業態度,獨立、客觀地出
80、具本報告。本報告清晰準確地反映了本人的研究觀點。本人不曾因,不因,也將不會因本報告中的具體推薦意見或觀點而直接或間接收到任何形式的補償。本人具有中國證券業協會授予的證券投資咨詢執業資格并登記為證券分析師,以勤勉的職業態度,獨立、客觀地出具本報告。本報告清晰準確地反映了本人的研究觀點。本人不曾因,不因,也將不會因本報告中的具體推薦意見或觀點而直接或間接收到任何形式的補償。投資評級說明投資評級說明 投資建議的評級標準投資建議的評級標準 類別類別 評級評級 說明說明 報告中投資建議所涉及的評級分為股票評級和行業評級(另有說明的除外)。評級標準為報告發布日后的12 個月內公司股價(或行業指數)相對同期
81、相關證券市場代表性指數的漲跌幅。其中:滬深兩市以滬深300 指數為基準;北交所市場以北證50 指數為基準;新三板市場以三板成指為基準;香港市場以恒生指數為基準;美國市場以標普500 或納斯達克綜合指數為基準。股票評級 買入 相對同期相關證券市場代表性指數漲幅大于 15%報告中投資建議所涉及的評級分為股票評級和行業評級(另有說明的除外)。評級標準為報告發布日后的12 個月內公司股價(或行業指數)相對同期相關證券市場代表性指數的漲跌幅。其中:滬深兩市以滬深300 指數為基準;北交所市場以北證50 指數為基準;新三板市場以三板成指為基準;香港市場以恒生指數為基準;美國市場以標普500 或納斯達克綜合
82、指數為基準。股票評級 買入 相對同期相關證券市場代表性指數漲幅大于 15%增持 相對同期相關證券市場代表性指數漲幅在 5%15%之間 增持 相對同期相關證券市場代表性指數漲幅在 5%15%之間 中性 相對同期相關證券市場代表性指數漲幅在-5%5%之間 中性 相對同期相關證券市場代表性指數漲幅在-5%5%之間 減持 相對同期相關證券市場代表性指數漲幅小于-5%減持 相對同期相關證券市場代表性指數漲幅小于-5%無評級 由于我們無法獲取必要的資料,或者公司面臨無法預見結果的重大不確定性事件,或者其他原因,致使我們無法給出明確的投資評級 無評級 由于我們無法獲取必要的資料,或者公司面臨無法預見結果的重
83、大不確定性事件,或者其他原因,致使我們無法給出明確的投資評級 行業評級 推薦 相對表現優于同期相關證券市場代表性指數 行業評級 推薦 相對表現優于同期相關證券市場代表性指數 中性 相對表現與同期相關證券市場代表性指數持平 中性 相對表現與同期相關證券市場代表性指數持平 回避 相對表現弱于同期相關證券市場代表性指數 回避 相對表現弱于同期相關證券市場代表性指數 信息披露信息披露 本公司在知曉的范圍內履行信息披露義務??蛻艨傻卿洠▋饶唤灰追揽貦趦炔樵冹o默期安排和關聯公司持股情況。有關財務權益及商務關系的披露有關財務權益及商務關系的披露$BusinessPublishStart$興證國際證券有限公司
84、及/或其有關聯公司在過去十二個月內與 JinJiang Road&Bridge Construction Development Co Ltd、成都經開資產管理有限公司、寶應縣開發投資有限公司、中泰證券、中泰金融國際有限公司、中泰國際財務英屬維爾京群島有限公司、杭州上城區城市建設投資集團有限公司、湖州市城市投資發展集團有限公司、重慶大足實業發展集團有限公司、江西省金融資產管理股份有限公司、珠海華發集團有限公司、華發投控2022 年第一期有限公司、海鹽縣國有資產經營有限公司、海鹽海濱有限公司、平安國際融資租賃有限公司、湖北農谷實業集團有限責任公司、湖州經開投資發展集團有限公司、環太湖國際投資有限
85、公司、泰安市城市發展投資有限公司、Taishan City Investment Co.,Ltd.、益陽市赫山區發展集團有限公司、佛山市高明建設投資集團有限公司、重慶巴洲文化旅游產業集團有限公司、上海中南金石企業管理有限公司、廈門國貿控股集團有限公司、國貿控股(香港)投資有限公司、中國國新控股有限責任公司、國晶資本(BVI)有限公司、中原資產管理有限公司、中原大禹國際(BVI)有限公司、南京溧水經濟技術開發集團有限公司、溧源國際有限公司、成都中法生態園投資發展有限公司、桐廬縣國有資產投資經營有限公司、政金金融國際(BVI)有限公司、濟南市中財金投資集團有限公司、江蘇省溧陽高新區控股集團有限公司
86、、江蘇中關村控股集團(國際)有限公司、連云港港口集團、山海(香港)國際投資有限公司、漳州圓山發展有限公司、鎮江交通產業集團有限公司、Higher Key Management Limited、廣州產業投資基金管理有限公司、淮安市交通控股集團有限公司、恒源國際發展有限公司、建發國際集團、四海國際投資有限公司、商丘市發展投資集團有限公司、青島市即墨區城市開發投資有限公司、交運燃氣有限公司、中南高科產業集團有限公司、中國景大教育集團控股有限公司、福建省藍深環保技術股份有限公司、重慶市萬盛工業園區開發建設有限公司、湖北光谷東國有資本投資運營集團有限公司、湖北新銅都城市投資發展集團有限公司、廈門國際投資
87、有限公司、無錫市太湖新城資產經營管理有限公司、江蘇句容投資集團有限公司、漳州市九龍江集團有限公司、Yi Bright International Limited、臨沂城市建設投資集團有限公司、杭州錢塘新區建設投資集團有限公司、孝感市高創投資有限公司、深圳市天圖投資管理股份有限公司、濟南舜通國際有限公司、濟南軌道交通集團有限公司、郴州市福天建設發展有限公司、揚州江淮建設發展有限公司、平潭綜合實驗區城市發展集團有限公司、陜西榆神能源開發建設集團有限公司、福建漳州城投集團有限公司、澳門國際銀行股份有限公司、升輝清潔集團控股有限公司、BPHL Capital Management LTD、北京建設(控
88、股)有限公司、北京控股集團有限公司、香港一聯科技有限公司、鎮江國有投資控股集團有限公司、瀘州航空發展投資集團有限公司、濟南城市建設集團有限公司、Jinan Urban Construction International Investment Co.,Limited、龍川海外投資有限公司、泰興市潤嘉控股有限公司、寧鄉市水務建設投資有限公司、華通國際投資控股有限公司、青島華通國有資本投資運營集團有限公司、四川簡州空港農業投資發展集團有限公司、浙江省新昌縣投資發展集團有限公司、金龍山實業(英屬維爾京群島)有限公司、濟南章丘控股集團有限公司、Shenghai Investment Co.,Limit
89、ed、青島軍民融合發展集團有限公司、華信藥業(香港)有限公司、泰州華信藥業投資有限公司、瀘州白酒產業發展投資集團有限公司、天風證券、三明市城市建設發展集團有限公司、Zhejiang Anji Construction Development Hong Kong Co Ltd、浙江安吉國控建設發展集團有限公司、陜西金融資產管理股份有限公司、湘潭振湘國有資產經營投資有限公司、曲阜興達投資發展有限公司、沂晟國際有限公司、臨沂市城市建設投資集團有限公司、長沙藍月谷智造產業投資有限公司、科學城(廣州)投資集團有限公司、海墾國際資本(香港)有限公司、海南省農墾投資控股集團有限公司、阜寧縣城發控股集團有限公
90、司、菏澤財金投資集團有限公司、鶴山市公營資產經營有限公司、四川納興實業集團有限公司、水發集團有限公司、淮北市公用事業資產運營有限公司、茂名港集團有限公司、江蘇荃信生物醫藥股份有限公司、浙江錢塘江投資開發有限公司、眾創(香港)科技有限公司、海通恒信、HAITONG UT BRILLIANT LIMITED、Vertex Capital Investment Limited、五礦地產有限公司、南平武夷集團有限公司、南平武夷發展集團有限公司、洛陽國苑投資控股集團有限公司、南昌金開集團有限公司、JinJiang Road&Bridge Construction Development Co Ltd、福
91、建省晉江市建設投資控股集團有限公司、江蘇海晟控股集團有限公司、RONGHE INTERNATIONAL INDUSTRY CO.,LTD.、青島西海岸新區融合控股集團有限公司、淄博市城市資產運營集團有限公司、威海城市投資集團有限公司、平度市城市開發集團有限公司、舟山普陀城投開發建設有限公司、海納城投國際控股有限公司、上海浦東發展銀行股份有限公司香港分行、新希望集團有限公司、三明市城市建設投資集團、南安市發展投資集團有限公司、宜都市國有資產投資運營控股集團有限公司、淮南建設發展控股(集團)有限公司、濟南高新控股集團有限公司、濟高國際(開曼)投資發展有限公司、莆田市國有資產投資集團有限責任公司、洛
92、陽國晟投資控股集團有限公司、濰坊市城區西部投資發展集團有限公司、高郵市水務產業投資集團有限公司、上饒創新發展產業投資集團有限公司、泰州東方中國醫藥城控股集團有限公司、安吉七彩靈峰鄉村旅游投資有限公司、烏魯木齊經濟技術開發區建發國有資本投資運營(集團)有限公司、福建省晉江城市建設投資開發集團有限責任公司、上饒投資控股集團有限公司、上饒投資控股國際有限公司、海寧市城市發展投資集團有限公司、鹽城東方投資開發集團有限公司、東方資本有限公司、集友銀行有限公司、濟南歷城控股集團有限公司、歷城國際發展有限公司、光大銀行、海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 22/23 漳州市交通發展集
93、團有限公司、中國國際金融股份有限公司、天風國際證券集團有限公司、TFI Overseas Investment Limited、工商銀行、株洲高科集團有限公司、濱州市財金投資集團有限公司、濱州財金國際有限公司、泰興市港口集團有限公司、南陽交通控股集團有限公司、江蘇疊石橋家紡產業集團有限公司、十堰城市運營集團有限公司、宜賓市新興產業投資集團有限公司、湖州吳興城市投資發展集團有限公司、WUXING CITY INVESTMENT HK COMPANY LIMITED、Haitian(BVI)International Investment Development Limited、青島國信(發展)集
94、團有限責任公司、MINGHU INTERNATIONAL(BVI)INVESTMENT DEVELOPMENT CO.,LIMITED、濟南歷下控股集團有限公司、Zhongyuan Zhicheng Co.,Ltd.、中原豫資投資控股集團有限公司、福建省晉江建控投資控股集團有限公司、JINJIANG ROAD AND BRIDGE CONSTRUCTION&DEVELOPMENT CO.,LTD、武漢有機控股有限公司、Jinjiang Road and Bridge Construction&Development Co.,Ltd.、重慶新雙圈城市建設開發有限公司、九江銀行、青島膠州灣發展集團
95、有限公司、無錫市交通產業集團有限公司、海翼(香港)有限公司、保定市國控集團有限責任公司、泉州城建集團有限公司、Coastal Emerald Limited、山東高速集團、贛州建控投資控股集團有限公司、湖南省汨羅江控股集團有限公司、湖南省融資擔保集團有限公司、萬晟國際(維爾京)有限公司、中原國際發展(BVI)有限公司、河南投資集團有限公司、China Cinda 2020 I Management Ltd、中國信達(香港)控股有限公司、資陽發展投資集團有限公司、重慶興農融資擔保集團有限公司、荊州市城市發展控股集團有限公司、成都空港城市發展集團有限公司、南洋商業銀行有限公司、許昌市投資集團有限公
96、司、江蘇雙湖投資控股集團有限公司、四川西南發展控股集團有限公司、China Great Wall International Holdings III Ltd、中國長城資產(國際)控股有限公司、湖州南潯旅游投資發展集團有限公司、南京銀行、武漢地鐵集團有限公司、湖北省融資擔保集團有限責任公司、淮北市建設投資有限責任公司、安徽西湖投資控股集團有限公司、淄博高新國有資本投資有限公司、河南省鄭州新區建設投資有限公司、湖北澴川國有資本投資運營集團有限公司、江蘇鐘吾城鄉投資發展集團有限公司、諸暨市國有資產經營有限公司、興業銀行股份有限公司香港分行、Soar Wise Limited、Soar Wind L
97、td、中航國際融資租賃有限公司、邳州市產業投資控股集團有限公司、巴中發展控股集團有限公司、江蘇潤鑫城市投資集團有限公司、山東泉匯產業發展有限公司、天府信用增進股份有限公司、農業銀行、鹽城高新區投資集團有限公司、眾淼控股(青島)股份有限公司、濰坊市城市建設發展投資集團有限公司、全椒全瑞投資控股集團有限公司、安徽省興泰融資擔保集團有限公司、東興啟航有限公司、東興證券、黃石市國有資產經營有限公司、浙江湖州南潯經濟建設開發有限公司、湖州南潯新開建設集團有限公司、浦江縣國有資本投資集團有限公司、萊州財金國際有限公司、萊州市財金投資有限公司、民生銀行、新沂市交通文旅集團有限公司、泰安高新建設集團有限公司、
98、香港國際(青島)有限公司、青島城市建設投資(集團)有限責任公司、貴溪市發展投資集團有限公司、湖南瑞鑫產業運營管理有限公司、常德財鑫融資擔保有限公司、舟山海城建設投資集團有限公司、贛州城市投資控股集團有限責任公司、江蘇中揚清潔能源發展有限公司、黃石產投控股集團有限公司、赤壁城市發展集團有限公司、重慶三峽融資擔保集團股份有限公司、QUAN CHENG FINANCIAL HOLDINGS(BVI)LIMITED、濟南金投控股集團有限公司、無錫恒廷實業有限公司、江蘇銀行、靖江港口集團有限公司、沛縣產業投資發展集團有限公司、Taishan Finance International Business
99、Co.,Limited、泰安市泰山財金投資集團有限公司、婁底市城市發展控股集團有限公司、湖州市南潯區交通投資集團有限公司、懷遠縣新型城鎮化建設有限公司、徽商銀行、JUNFENG INTERNATIONAL CO.,LTD、煙臺國豐投資控股集團有限公司、長沙金洲新城投資控股集團有限公司、湖州新型城市投資發展集團有限公司、湖州吳興國有資本投資發展有限公司、榮利營造控股有限公司、Haichuan International Investment Co Ltd、江蘇方洋控股有限公司、都江堰智慧城市運營建設發展集團有限公司、洛陽文化旅游投資公司有限公司、漳州臺商投資區資產運營集團有限公司、鄭州城建集團投
100、資有限公司、佛山市南海聯達投資(控股)有限公司、成都武侯產業發展投資管理集團有限公司、浙江長興金融控股集團有限公司、寧國市寧陽控股集團有限公司、鄒城市城資控股集團有限公司、溫州市鹿城區國有控股集團有限公司、山東明水國開發展集團有限公司、Mixin International Trading Co.,Limited、宜昌高新投資開發有限公司、中原大禹國際(BVI)有限公司、武漢金融控股(集團)有限公司、威海市環通產業投資集團有限公司、知識城(廣州)投資集團有限公司、成都交通投資集團有限公司、福清市國有資產營運投資集團有限公司、濱州市濱城區經濟開發投資有限公司、浙江杭海新城控股集團有限公司、YAN
101、GSHAN OVERSEAS DEVELOPMENT CO.,LTD、湖州莫干山高新集團有限公司、湖州莫干山國有資本控股集團有限公司、鄭州地鐵集團有限公司、漳州高鑫發展有限公司、宜春市袁州區國投集團有限公司、鄭州市金水控股集團有限公司、肇慶市國聯投資控股有限公司、撫州市數字經濟投資集團有限公司、建德市國有資產投資控股集團有限公司、建投國際(香港)有限公司、重慶豐都文化旅游集團有限公司、Huafa 2024 I Company Limited、廣德市國有資產投資經營有限公司、浙江德盛(BVI)有限公司、杭州富陽交通發展投資集團有限公司、Zibo High-Tech International I
102、nvestment Co.,Limited、成都市羊安新城開發建設有限公司、Lintou Overseas Co.,Limited、臨沂投資發展集團有限公司、三水國際發展有限公司、江蘇姜堰經開集團有限公司、青島平度控股集團有限公司、河南省鐵路建設投資集團有限公司、曹妃甸國控投資集團有限公司、唐山國控集團有限公司、青島市即墨區城市旅游開發投資有限公司、淮北市建投控股集團有限公司、衢州市衢通發展集團有限公司、無錫市廣益建設發展集團有限公司、嵊州市城市建設投資發展集團有限公司、黃石市新城產業投資集團有限公司、麗水經濟技術開發區實業發展集團有限公司、印象大紅袍股份有限公司、兗礦集團(開曼群島)有限公司
103、、山東能源集團有限公司、淮安市投資控股集團有限公司、南陽城投控股有限公司、科學城(廣州)融資租賃有限公司、科學城(廣州)投資集團有限公司、稠州國際投資有限公司、義烏市國有資本運營有限公司、江門高新技術工業園有限公司、林州市城投控股有限公司、安徽海螺材料科技股份有限公司、安徽海螺水泥股份有限公司、腦動極光醫療科技有限公司、江蘇皋開投資發展集團有限公司、天長市農業發展有限公司、四川省金玉融資擔保有限公司、徽商銀行股份有限公司有投資銀行業務關系。$BusinessPublishEnd$使用本研究報告的風險提示以及法律聲明使用本研究報告的風險提示以及法律聲明 興業證券股份有限公司經中國證券監督管理委員
104、會批準,已具備證券投資咨詢業務資格。,本公司不會因接收人收到本報告而視其為客戶。本報告中的信息、意見等均僅供客戶參考,不構成所述證券買賣的出價或征價邀請或要約,投資者自主作出投資決策并自行承擔投資風險,任何形式的分享證券投資收益或者分擔證券投資損失的書面或口頭承諾均為無效,任何有關本報告的摘要或節選都不代表本報告正式完整的觀點,一切須以本公司向客戶發布的本報告完整版本為準。該等信息、意見并未考慮到獲取本報告人員的具體投資目的、財務狀況以及特定需求,在任何時候均不構成對任何人的個人推薦??蛻魬攲Ρ緢蟾嬷械男畔⒑鸵庖娺M行獨立評估,并應同時考量各自的投資目的、財務狀況和特定需求,必要時就法律、商業
105、、財務、稅收等方面咨詢專家的意見。對依據或者使用本報告所造成的一切后果,本公司及/或其關聯人員均不承擔任何法律責任。本報告所載資料的來源被認為是可靠的,但本公司不保證其準確性或完整性,也不保證所包含的信息和建議不會發生任何變更。本公司并不對使用本報告所包含的材料產生的任何直接或間接損失或與此相關的其他任何損失承擔任何責任。本報告所載的資料、意見及推測僅反映本公司于發布本報告當日的判斷,本報告所指的證券或投資標的的價格、價值及投資收入可升可跌,過往表現不應作為日后的表現依據;在不同時期,本公司可發出與本報告所載資料、意見及推測不一致的報告;本公司不保證本報告所含信息保持在最新狀態。同時,本公司對
106、本報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。海外行業深度報告|資訊科技業 請閱讀最后評級說明和重要聲明 23/23 除非另行說明,本報告中所引用的關于業績的數據代表過往表現。過往的業績表現亦不應作為日后回報的預示。我們不承諾也不保證,任何所預示的回報會得以實現。分析中所做的回報預測可能是基于相應的假設。任何假設的變化可能會顯著地影響所預測的回報。本公司的銷售人員、交易人員以及其他專業人士可能會依據不同假設和標準、采用不同的分析方法而口頭或書面發表與本報告意見及建議不一致的市場評論和/或交易觀點。本公司沒有將此意見及建議向報告所有接收者進行更新的義務。本公司
107、的資產管理部門、自營部門以及其他投資業務部門可能獨立做出與本報告中的意見或建議不一致的投資決策。本報告并非針對或意圖發送予或為任何就發送、發布、可得到或使用此報告而使興業證券股份有限公司及其關聯子公司等違反當地的法律或法規或可致使興業證券股份有限公司受制于相關法律或法規的任何地區、國家或其他管轄區域的公民或居民,包括但不限于美國及美國公民(1934 年美國證券交易所第 15a-6 條例定義為本主要美國機構投資者除外)。本報告由受香港證監會監察的興證國際證券有限公司(香港證監會中央編號:AYE823)于香港提供。香港的投資者若有任何關于本報告的問題請直接聯系興證國際證券有限公司的銷售交易代表。本
108、報告作者所持香港證監會牌照的牌照編號已披露在報告首頁的作者姓名旁。本報告的版權歸本公司所有。本公司對本報告保留一切權利。除非另有書面顯示,否則本報告中的所有材料的版權均屬本公司。未經本公司事先書面授權,本報告的任何部分均不得以任何方式制作任何形式的拷貝、復印件或復制品,或再次分發給任何其他人,或以任何侵犯本公司版權的其他方式使用。未經授權的轉載,本公司不承擔任何轉載責任。特別聲明特別聲明 在法律許可的情況下,興業證券股份有限公司可能會持有本報告中提及公司所發行的證券頭寸并進行交易,也可能為這些公司提供或爭取提供投資銀行業務服務。因此,投資者應當考慮到興業證券股份有限公司及/或其相關人員可能存在影響本報告觀點客觀性的潛在利益沖突。投資者請勿將本報告視為投資或其他決定的唯一信賴依據。興業證券研究興業證券研究 上上 海海 北北 京京 地址:上海浦東新區長柳路 36 號興業證券大廈 15 層 地址:北京市朝陽區建國門大街甲 6 號世界財富大廈 32 層 01-08 單元 郵編:200135 郵編:100020 郵箱: 郵箱: 深深 圳圳 香香 港(興證國際)港(興證國際)地址:深圳市福田區皇崗路 5001 號深業上城 T2 座 52 樓 地址:香港德輔道中 199 號無限極廣場 32 樓全層 郵編:518035 郵編:518035 郵箱: 郵箱:.hk