《計算機行業國內頂尖大模型巡禮:MiniMax-240423(19頁).pdf》由會員分享,可在線閱讀,更多相關《計算機行業國內頂尖大模型巡禮:MiniMax-240423(19頁).pdf(19頁珍藏版)》請在三個皮匠報告上搜索。
1、 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 證券研究報告|行業深度 2024 年 04 月 23 日 計算機計算機 國內頂尖大模型巡禮:國內頂尖大模型巡禮:MiniMax 全棧自研大模型,打造全球領先全棧自研大模型,打造全球領先 AGI 生態。生態。1)MiniMax 成立于 2021 年 12 月,是一家通用人工智能科技公司,致力于與用戶共創智能。MiniMax 自主研發了不同模態的通用大模型,包括萬億參數的 MoE 文本大模型、語音大模型以及視覺大模型?;诓煌B通用大模型,公司已推出多款 AI 原生應用。公司創始人為商湯前副總裁閆俊杰,核心團隊成員技術背景強大。截至 2024
2、年初,公司估值已超過 25 億美金,新一輪為阿里巴巴領投,驗證其技術地位。2)2024 年 1 月,MiniMax 全量發布大語言模型 abab6,為國內首個數千億參數級別 MoE 大語言模型。同年 4 月,MiniMax 推出萬億參數 MoE 大語言模型 abab6.5。根據公司官方微信公眾號,在各類核心能力測試中,abab6.5 已與 GPT4、Claude 3 Opus、Gemini 1.5 Pro 等全球頂尖大語言模型接近。3)產品端,MiniMax 在 B 端 C 端廣泛布局。2C 而言,基于不同模態的通用大模型,MiniMax 推出生產力工具海螺 AI、沉浸式 AI 內容社區星野等
3、原生應用;2B 而言,MiniMax 開放平臺為企業和開發者提供安全、靈活、可靠的 API服務,助力快速搭建 AI 應用。技術前瞻技術前瞻全面轉向全面轉向 MoE,已超越,已超越 GPT3.5、追趕、追趕 GPT4。1)自 2022 年底 ChatGPT推出以來,大模型已成為全球科技必爭之地。目前,業內大模型主要包括兩種流派,Dense 與 MoE。在傳統的 Dense 模型中,所有的參數都會對所有的輸入數據進行處理。而在 MoE 模型中,用戶可以僅針對整個系統的某些特定部分執行動態激活計算。2)相比 Dense 架構,MoE 在相同計算資源下,訓練速度更快,模型上限更高,是世界頂尖模型的主流
4、選擇。在訓練階段,MoE 能夠在遠少于 Dense 模型所需的計算資源下進行有效的預訓練。這意味著在相同的計算預算條件下,用戶可以顯著擴大模型或數據集的規模。在微調階段,MoE 模型可能從指令式微調中獲益更多,高于 Dense 模型。在推理階段,盡管對內存需求較高,MoE 模型的推理速度遠快于具有相同數量參數的 Dense 模型。3)目前,MoE 已成為業內共識,GPT4、Gemini、Mixtral 等全球一流模型均已采用 MoE 架構。而 MiniMax 為了進一步提升模型在復雜任務下的效果,從 2023 年 6 月開始全面轉向 MoE 模型,并于 2024 年 4 月全量發布為國內首個萬
5、億參數級別 MoE 大語言模型 abab 6.5,體現了其深刻的技術前瞻性與戰略執行能力。萬卡算力集群為基,平臺與產品已為全球客戶廣泛認可。萬卡算力集群為基,平臺與產品已為全球客戶廣泛認可。1)在算力儲備方面,根據公開信息,截至 2023 年,公司已擁有數千卡以上的常態化訓練和萬卡級推理算力資源池,支撐單日過億次調用。2)在 B 端生態方面,自 2023 年 4 月,MiniMax 發布開放平臺以來,MiniMax 陸續服務了近 20,000 家企業客戶和開發者,其中包括金山辦公、小紅書、騰訊、小米和閱文在內的多家頭部互聯網公司。截止至 2024 年 1月 16 日,即大語言模型 abab6
6、發布前,MiniMax 開放平臺平均單日的 token 處理量達到了數百億。3)在 C 端產品方面,用戶可以在星野根據自定義的外表、性格、語音,創立獨特 AI 形象并收集卡牌,星野全球數據表現亮眼,月活已突破千萬級別,商業化潛力大;另外,海螺 AI 作為公司國內推出的個人 AI 助理,用戶可提出問題,獲得詳盡的解決方案,且可語音通話并和 AI 外教練習口語。著眼著眼 AGI,與用戶共創智能。,與用戶共創智能。MiniMax 的理念是“Intelligence with Everyone”,即與用戶共創智能。公司創始人閆俊杰在采訪中提到“AGI 不是大殺器,是普通人每天會用的一個產品、一個服務”
7、;公司副總裁和開放平臺負責人魏偉也在采訪里提到,“目前距離實現真正的 AGI 仍然有很長的路要走。我們的目標是在算法上持續保持領先,在業務上始終為用戶創造實際的價值?!蔽覀冋J為,憑借扎實的大模型基座、廣泛的應用生態、敏銳的技術前瞻性、果斷的投入決心、優秀的人才團隊,以 MiniMax 等為代表的國產大模型已逐步躋身全球一流科技梯隊,AGI 正在加速到來。風險提示風險提示:AI 技術迭代不及預期;經濟下行超預期;行業競爭加劇。增持增持(維持維持)行業行業走勢走勢 作者作者 分析師分析師 劉高暢劉高暢 執業證書編號:S0680518090001 郵箱: 分析師分析師 陳芷婧陳芷婧 執業證書編號:S
8、0680523080001 郵箱: 相關研究相關研究 1、計算機:Meta 發布 Llama3,開源生態再迎重大更新2024-04-20 2、計算機:Tesla Robotaxi 即將面世,自動駕駛真元年已經到來2024-04-14 3、計算機:AI 現象級產品曙光出現2024-04-13 -48%-32%-16%0%16%2023-042023-082023-12計算機滬深300 2024 年 04 月 23 日 P.2 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 內容目錄內容目錄 一、全棧自研大模型,打造全球領先 AGI 生態.3 二、技術前瞻全面轉向 MoE,超越 GPT3.5、追
9、趕 GPT4.7 三、萬卡算力集群為基,平臺及產品已獲全球客戶廣泛認可.12 四、風險提示.18 圖表目錄圖表目錄 圖表 1:MiniMax 技術理念.3 圖表 2:公司現有大模型部分布局.4 圖表 3:MiniMax 開放平臺文本大模型接口計費標準.4 圖表 4:MiniMax 開放平臺語音大模型接口計費標準.5 圖表 5:星野產品界面.5 圖表 6:海螺 AI 產品界面.6 圖表 7:MiniMax 歷史融資.6 圖表 8:GPT 用戶數高速增長.7 圖表 9:MoE 模型架構.8 圖表 10:MoE 模型較 Dense 模型從指令微調中受益更多.8 圖表 11:GPT-4 性能對比.9
10、圖表 12:Mixtral 8x7b 性能對比.9 圖表 13:Gemini 1.5 百萬字符的上下文窗口遠超同類模型.10 圖表 14:abab6.5 測試結果.11 圖表 15:黃仁勛于英偉達 GTC 大會上表示 GPT 或采用 1.8 萬億參數的 MoE 結構.11 圖表 16:MiniMax 開放平臺部分合作伙伴.12 圖表 17:WPS 文字一鍵起草工作周報.13 圖表 18:WPS 文字秒速提煉分析文檔重點.13 圖表 19:WPS 演示一鍵更換配色方案美化 PPT.13 圖表 20:WPS 演示自動生成演講備注和演講稿.13 圖表 21:WPS PDF 生成可追溯文檔概要.13
11、圖表 22:WPS PDF 支持外文翻譯與提煉.13 圖表 23:WPS 表格調整表格陳列格式.14 圖表 24:WPS 表格根據用戶要求自動應用公式.14 圖表 25:MiniMax 藥師 AI 助手框架.14 圖表 26:MiniMax 醫生 AI 助手框架.14 圖表 27:MiniMax 與高濟健康簽訂合作.15 圖表 28:Talkie 豐富的角色創建功能和對話體驗.15 圖表 29:Talkie 卡牌推薦.16 圖表 30:Talkie(星野海外版)App Store 排名趨勢.16 圖表 31:海螺 AI 閱讀并分析 MiniMax 公眾號文章.17 圖表 32:海螺 AI 語音
12、交流界面.17 圖表 33:海螺 AI 提供一系列 AI 聲音選擇.17 圖表 34:海螺 AI 提供的文字版語音交流記錄.18 PWlYiYcUeXqUcVnXgYaXpN6McM6MmOnNmOqMkPnNtPeRtRnR6MoPmMvPrQsOMYnMsR 2024 年 04 月 23 日 P.3 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 一、全棧自研大模型,打造全球領先一、全棧自研大模型,打造全球領先 AGI 生態生態 成立于成立于 2021 年底,核心理念秉持“與用戶共創智能”。年底,核心理念秉持“與用戶共創智能”。1)MiniMax 成立于 2021 年 12月,是國內領先
13、的擁有文本、語音、視覺三模態融合的語言大模型、并打通產品全鏈路的創業公司。通過搭建超大規模實驗平臺與推理平臺,跑通技術與產品的迭代閉環,實現模型能力與用戶交互量的極速增長。2)公司自成立以來便一直專注于推動通用人工智能技術突破,秉承“與用戶共建智能(Intelligence with Everyone)”的核心理念,不斷深化與用戶的互動和智能技術的融合:2022 年 10 月,推出第一款面向 C 端的的虛擬 AI 社交應用 Glow?!芭c智能體實時交流、沉浸互動并建立情感羈絆”,Glow 上線 4 個月用戶近 500 萬,也是當前產品星野的前身。2023 年 3 月,發布面向 B 端用戶的大語
14、言模型技術平臺“MiniMax 開放平臺”,支持文本和語音模型的服務調用。2023年6月,發布面向海外C端市場的虛擬扮演社交軟件Talkie:Soulful Character AI。用戶可以創建屬于自己的 AI 聊天機器人形象,定制性格、語音。2023 年 9 月,該軟件的中文版星野登錄 AppStore、安卓等平臺。2023 年 8 月底,MiniMax abab 大模型全面開放服務。1)適用于大多數文本處理相關的場景,如邏輯推理、文本續寫、文案生成、文本擴寫、文本改寫、內容摘要、代碼生成、知識檢索等。2)提供一部分聲音大模型能力,可應用于配音和音頻交互等場景中。2023 年 9 月,面向
15、 C 端的海螺 AI 智能伙伴軟件正式發布。2023 年 11 月,MiniMax 發布語音大模型 abab-speech-01。截止 2024 年 1 月底,共有超過 400 家企業用戶接入 MiniMax 的語音大模型。2024 年年 1 月,月,MiniMax 全量發布大語言模型全量發布大語言模型 abab6,為國內首個,為國內首個 MoE 大語言模大語言模型。型。在 MoE 結構下,abab6 擁有大參數帶來的處理復雜任務的能力,同時模型在單位時間內能夠訓練足夠多的數據,計算效率也可以得到大幅提升。改進了 abab5.5在處理更復雜、對模型輸出有更精細要求場景中出現的問題。2024 年
16、 4 月,MiniMax 發布國內首個萬億參數的 MoE 大模型 abab6.5。abab6.5 系列包含兩個模型:abab6.5 和 abab6.5s。abab6.5 包含萬億參數,支持 200k tokens的上下文長度;abab6.5s 跟 abab6.5 使用了同樣的訓練技術和數據,但是更高效,支持 200k tokens 的上下文長度,可以 1 秒內處理近 3 萬字的文本。圖表 1:MiniMax 技術理念 資料來源:MiniMax 官網,國盛證券研究所 2024 年 04 月 23 日 P.4 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 2:公司現有大模型部分布局 資料
17、來源:MiniMax 官網,國盛證券研究所 B 端端 C 端廣泛布局,開放平臺為企業提供端廣泛布局,開放平臺為企業提供 API 服務,星野、海螺為服務,星野、海螺為 C 端代表應用。端代表應用?;诓煌B的通用大模型,MiniMax 推出生產力工具海螺 AI、沉浸式 AI 內容社區星野等原生應用。MiniMax 開放平臺為企業和開發者提供安全、靈活、可靠的 API 服務,助力快速搭建 AI 應用。1、MiniMax 開放平臺:開放平臺:提供基于大語言模型的豐富 API 能力,以滿足不同企業客戶及專業開發者的需求。計價方式簡單靈活,按量計費,滿足不同業務規模。在文本大模型方面在文本大模型方面,
18、MiniMax 提供 Chat Completion Pro、Chat Completion V2、ChatCompletion、Embeddings(向量化)以及 Retrieval(知識庫)等服務。收收費標準主要基于費標準主要基于 token 數計費,不同服務和使用量對應不同的單價。數計費,不同服務和使用量對應不同的單價。例如,ChatCompletion Pro的計費項包括0.1元/千tokens、0.015元/千tokens和0.005元/千 tokens 三個檔次,而 Embeddings 服務則以 0.0005 元/千 tokens 的價格計費。此外,Finetune(微調)服務則
19、根據訓練和推理的 token 數以及 epoch 數來計算費用。圖表 3:MiniMax 開放平臺文本大模型接口計費標準 計費項計費項 單價單價 ChatCompletion Pro:提供了更強大的問答和文本生成能力,包括多人對話、對話示例,支持集合搜索引擎、調用自定義函數、限制返回格式,適合于復雜的對話交互和深度內容創作設計的場景。abab6 0.1 元/千 tokens abab5.5 0.015 元/千 tokens abab5.5s 0.005 元/千 tokens ChatCompletion:基于自然語言交互的文本生成能力接口,適用于人設對話以及生產力等典型文本生成文本場景。aba
20、b5.5 0.015 元/千 tokens abab5.5s 0.005 元/千 tokens Embeddings(向量化):通過向量化技術將文本轉化為高維向量表示,捕捉詞語和句子之間的語義關系,完成語義相似度計算、文本分類和信息檢索等任務,從而實現如長記憶檢索、知識庫檢索等能力。embo-01 0.0005 元/千 tokens Retrieval(知識庫):支持訪問模型外部的專業知識,高效檢索文檔信息,增強大模型專業領域能力,準確回答專業問題。embedding token 0.001 元/千 tokens 存儲(向量數據)1.5 元/GB/天 Finetune(微調):除了提供定制模型
21、微調服務,微調接口支持用戶構造定制數據集對預訓練模型進行多樣化微調,使大模型更適合特定場景。abab5.5(訓練)0.06 元/千 tokens abab5.5s(訓練)0.06 元/千 tokens abab5.5(推理)0.05 元/千 tokens abab5.5s(推理)0.015 元/千 tokens 資料來源:MiniMax 官網,國盛證券研究所(注:abab6.5 暫未公布更新)2024 年 04 月 23 日 P.5 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 在語音大模型方面在語音大模型方面,MiniMax 提供了包括 T2A、T2A pro、T2A large、T2A
22、 stream以及 voice_clone(快速復刻)等多種語音合成服務。這些服務能夠根據文本內容智能生成具有不同特征的語音輸出,適用于多種場景。計費標準主要基于字符計費標準主要基于字符數(數(1 個漢字算個漢字算 2 個字符個字符,英文字母和其他復合算,英文字母和其他復合算 1 個字符)個字符),其中 T2A、T2A pro和 T2A stream 接口均以 5 元/萬字符的價格計費,而 T2A large 則以 2 元/萬字符的價格計費。voice_clone 服務目前僅對邀請制客戶開放,具體費用未在文檔中明確列出。而有聲內容創作接口則專注于小說和敘述性文本,提供角色識別和角色音頻生成服務
23、,分別以 0.6 元/千 tokens 和 5 元/萬字符的價格計費。圖表 4:MiniMax 開放平臺語音大模型接口計費標準 計費項 接口說明 單價 T2A 支持音量、語調、語速調整和混音功能 5 元/萬字符 T2A pro 在 T2A 接口的基礎上,支持單次合成最高 5000 字符輸入,支持比特率、采樣率相關參數調整特性,支持音頻時長、音頻大小等返回參數,支持字幕返回。5 元/萬字符 T2A large 在 T2A 接口的基礎上,支持單次合成最高 1000 萬字符輸入,支持非法字符檢測等功能,適用于整本書籍語音合成的超長文本場景。2 元/萬字符 T2A stream 支持基于自然語言交互生
24、成回復的能力,適用于語音通話、語音聊天等需求流式的相關場景。5 元/萬字符 voice_clone(快速復刻)基于大語言模型的音色克隆更加精準快速,無需數小時時長的超高質量原音頻、無需傳統TTS的超長工期,可以在極短時間內完成音色復刻,并通過大語言模型加持,使復刻后的音色與原音色進行高質量還原,從而滿足客戶需求。本接口暫時只提供邀請制客戶使用。資料來源:MiniMax 官網,國盛證券研究所 2、Talkie 星野:星野:MiniMax 旗下沉浸式 AI 內容社區,定制化智能體聊天伙伴。用戶可以與虛擬人進行聊天互動,而與智能體的持續對話會讓智能體更加精準預測用戶需求。在操作上,星野提供了豐富的自
25、定義功能,用戶可以創建自己的智能體,選擇不同的音色和人物形象,以及自定義對話風格。圖表 5:星野產品界面 資料來源:星野官網,國盛證券研究所 3、海螺、海螺 AI:MiniMax 面向 C 端的 AI 生產力工具,致力于成為每一個人的 AI 伙伴。用戶可以提出問題獲得詳盡的解決方案,上傳文件整理成摘要筆記,粘貼網址抽取文章核心要點,甚至模擬語音通話和 AI 外教練習口語。2024 年 04 月 23 日 P.6 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 6:海螺 AI 產品界面 資料來源:海螺 AI 官網,國盛證券研究所 創始人為商湯前副總裁閆俊杰,核心團隊技術背景強大。創始人為
26、商湯前副總裁閆俊杰,核心團隊技術背景強大。1)在核心團隊方面,MiniMax稀宇科技創始人為前商湯科技副總裁、商湯科技研究院副院長、通用智能技術負責人閆俊杰。2)在 MiniMax 的團隊構成中,亦約三分之一的成員持有世界頂尖實驗室的博士學位,這些成員的專業涵蓋了自然語言處理、計算機圖形學等多個重要領域的專業人才。在由杰出專家組成的核心團隊的引領下,MiniMax 稀宇科技已成為國內少數幾家掌握文本、語音和視覺三模態融合技術的公司之一,擁有通用大模型引擎的能力,并實現了產品全鏈路的成熟運作。閆俊杰,MiniMax 聯合創始人,前商湯科技副總裁、通用智能技術負責人,也曾擔任商湯研究院副院長:20
27、15 年博士畢業于中科院自動化所,此前在商湯科技負責搭建深度學習的工具鏈和底層算法,以及通用智能的技術發展。此外,他還搭建了商湯的人臉識別和智慧城市相關的技術體系。在深度學習和計算機視覺領域,閆俊杰發表頂級會議和期刊論文 100 余篇,Google Scholar 引用近 30,000 次,h-index 達75。估值超估值超 25 億美金,新一輪為阿里巴巴領投,驗證技術地位。億美金,新一輪為阿里巴巴領投,驗證技術地位。從融資能力來看,根據彭博社于 2024 年 3 月 5 日報道,MiniMax 已從阿里巴巴和其他投資者處獲得資金,估值超過 25 億美元。圖表 7:MiniMax 歷史融資
28、公布日期公布日期 投資方投資方 交易金額交易金額 融資輪次融資輪次 2021/12/31 云啟資本 未披露 天使輪 2022/7/25 明勢資本、米哈游、高瓴創投、IDG 資本 未披露 Pre-A 輪 2023/5/31 騰訊投資 超 2.5 億美元 A 輪 2024/3/3 阿里巴巴 未披露 B 輪 資料來源:證券之星,天眼查,國盛證券研究所(根據公開消息整理,與實際情況可能存在差異)2024 年 04 月 23 日 P.7 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 二、技術前瞻二、技術前瞻全面轉向全面轉向 MoE,超越,超越 GPT3.5、追趕、追趕 GPT4 GPT 引爆引爆 A
29、IGC 熱潮,全球頂尖技術企業蜂擁而至。熱潮,全球頂尖技術企業蜂擁而至。1)2022 年 11 月,OpenAI 首次推出 ChatGPT 的 demo 版本,并在發布的五天之內吸引了過百萬用戶。截止 2024 年 3 月底,已更新至 GPT-4 的大模型擁有超 1.8 億用戶,而 OpenAI 的官網每月流量約 16 億次訪問。2)緊跟著 GPT 的突破,全球科技大廠高強度投入大模型構建,行業頂尖模型包括但不限于谷歌 Gemini(2024 年 2 月發布 Gemini 1.5 版)、Anthropic 的 Claude(2024年 3 月更新至 Claude 3)等。在此同時,以 Meta
30、 的 Llama(2024 年 4 月更新至 Llama 3)和 Minstral 的 Mixtral 8x7B 為代表的開源模型也在快速迭代。圖表 8:GPT 用戶數高速增長 資料來源:Exploding Topics,國盛證券研究所 目前業內大模型主要包括兩種流派,目前業內大模型主要包括兩種流派,Dense 與與 MoE。1)在傳統的 Dense 模型中,所有的參數都會對所有的輸入數據進行處理。2)在 MoE 模型中,用戶可以僅針對整個系統的某些特定部分執行計算。這意味著并非所有參數都會在處理每個輸入時被激活或使用,而是只有部分參數,會根據輸入的特定特征或需求,被調用和運行。3)例如,一個
31、專注于計算機視覺方面的 MoE 模型可能擁有一系列專門識別不同類型的物體的“專家”,如人、建筑物、汽車等。而門控網絡則將判斷對輸入圖像的每個區域使用哪個專家。簡單來說,MoE 模型的核心在于將多個“專家”神經網絡模型合并為一個更大的模型,模型的核心在于將多個“專家”神經網絡模型合并為一個更大的模型,以此來提高模型的準確性和性能。以此來提高模型的準確性和性能。從架構來看,MoE 模型包含以下幾個關鍵部分:“專家”神經網絡:1)“專家”是解決特定類型問題,或處理某種特定模式的輸入的個體化專門模型。2)通過表征學習,每個“專家”只會看到數據的一個子集。例如,在文本分類中,一個“專家”可能專門于檢測負
32、面信息,而另一個則專注于識別正面情緒。3)通過專家并行計算,“專家”被放置在不同的節點上,每個節點處理不同批次的訓練樣本,從而實現總體訓練時間的縮短。門控網絡:1)門控網絡負責基于可學習的注意力分數,動態地將每個輸入分配到相關的專家網絡。2)它通過處理輸入特征和全局上下文,輸出一個關于專家的軟概率分布,來決定了哪些部分的整體模型被激活。2024 年 04 月 23 日 P.8 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 路由器:1)路由器根據輸入和門控網絡給出的概率分布,選擇一個或多個專家網絡進行處理。2)常用的選擇方法包括 top-k,noisy top-k,以及更復雜的層次混合結構,
33、用以降低計算負擔。3)在某些 MoE 中,路由器會查詢多個專家并基于歸一化得分合并它們的輸出。圖表 9:MoE 模型架構 資料來源:Hugging Face,國盛證券研究所 相比相比 Dense 架構,架構,MoE 在相同計算資源下,訓練速度更快,模型上限更高,是有限算在相同計算資源下,訓練速度更快,模型上限更高,是有限算力下的更優選擇。力下的更優選擇。1)在訓練階段,MoE 能夠在遠少于 Dense 模型所需的計算資源下進行有效的預訓練。這意味著在相同的計算預算條件下,用戶可以顯著擴大模型或數據集的規模。2)在微調階段,MoE 模型可能從指令式微調中獲益更多,高于 Dense 模型。3)在推
34、理階段,盡管對內存需求較高,MoE 模型的推理速度快于具有相同數量參數的 Dense模型。圖表 10:MoE 模型較 Dense 模型從指令微調中受益更多 資料來源:Hugging Face,國盛證券研究所 全球主流大模型均已采用,全球主流大模型均已采用,MoE 已成為業內共識。已成為業內共識。GPT-4:2023 年 6 月,美國計算機專家 George Hotz 推斷 GPT-4 采用的是 8 個“專家”的 MoE 架構,并擁有大約 1.2 萬億個參數(8x2200 億個)。2024 年 3月,黃仁勛在英偉達 GTC 大會上表示 GPT 確實采用 MoE 結構,可能擁有 1.8 萬億參數。
35、2024 年 04 月 23 日 P.9 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 11:GPT-4 性能對比 資料來源:OpenAI 官網,國盛證券研究所 Mixtral:2023 年 12 月,Mistral 發布同樣基于 8 個“專家”的 MoE 架構的大語言模型 Mixtral 8x7b。經過測試,Mixtral Instruct(指令版)的性能優于 MT-Bench上的所有其他開放模型,且是第一個與 GPT-3.5 性能相當的開源模型。圖表 12:Mixtral 8x7b 性能對比 資料來源:Mistral AI 官網,國盛證券研究所 Gemini 1.5:2024 年
36、 2 月,谷歌發布 Gemini 1.5,同樣基于 MoE 架構。在技術文檔中,技術人員稱 MoE 架構“極大地提高了模型的效率”,“使 Gemini 1.5能夠更快地學習復雜任務并保持質量,同時更高效地訓練和服務?!?024 年 04 月 23 日 P.10 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 13:Gemini 1.5 百萬字符的上下文窗口遠超同類模型 資料來源:谷歌官網,國盛證券研究所 技術前瞻、押注創新,技術前瞻、押注創新,MiniMax 從從 2023 年年 6 月起全面轉向月起全面轉向 MoE。2023 年 abab5.5發布以來,在寫作、聊天、問答等場景中表現
37、優異,達到了 GPT-3.5 的水平。然而,abab5.5在處理更復雜的、對模型輸出有精細要求的場景時,存在一定概率違反用戶要求的輸出格式,或是在推理過程中發生錯誤,和最先進的模型 GPT-4 相比仍存在一定差距。為了進一步提升模型在復雜任務下的效果,MiniMax 從 2023 年 6 月開始研發 MoE 模型,并于 2024 年 1 月全量發布為國內首個 MoE 大語言模型 abab6,4 月發布國內首個萬億參數 MoE 大模型 abab6.5。參數量躍升新量級,參數量躍升新量級,MoE 架構顯著優化計算效率。架構顯著優化計算效率。1)根據公司官方微信公眾號,abab6.5為萬億參數量級。
38、在傳統的稠密模型中,更大的模型意味著模型可以更好的從訓練語料中學到更精細的規律,完成更復雜的任務,卻也會降低模型的推理速度以及更慢的訓練時間。2)然而在 MoE 架構下,模型參數被劃分為多組“專家”,每次推理時只有一部分專家參與計算,運算效率也因此得到了保證?;?MoE 結構的 abab6.5 一方面具備了大參數帶來的處理復雜任務的能力,另一方面計算效率也得到了提升,使得模型在單位時間內能夠訓練足夠多的數據。測評能力超越測評能力超越 GPT3.5,全面接近,全面接近 GPT4,在復雜場景下表現優秀。,在復雜場景下表現優秀。1)根據公司官方微信公眾號,其對 abab6.5、abab6.5s、G
39、PT-3.5、GPT-4、Gemini1.5ProClaude3Opus、Claude3Sonnet 和 Claude3Haiku 等模型進行了自動評測,測試結果如下。2)可以看出,在英文/中文綜合、知識、基礎算數、數學解題、邏輯推理、編程、指令遵從等方面,abab6.5均大致與 GPT4 處于同一水平,并對 GPT3.5 實現初步超越。3)另外,在長文本能力上,公司在 200ktoken 內進行了業界常用的“大海撈針”測試,即在很長的文本中放入一個和該文本無關的句子(針),然后通過自然語言提問模型,看模型是否準確將這個針回答出來。在 891 次測試中,abab6.5 均能正確回答。2024
40、年 04 月 23 日 P.11 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 14:abab6.5 測試結果 資料來源:MiniMax 官方微信公眾號,國盛證券研究所 GPT-4 超萬億參數量,超萬億參數量,abab 持續持續實現追趕。實現追趕。1)Transformer 類模型明確表明,增加參數數量可以提高性能。根據黃仁勛在 GTC 大會發言,自 Transformer 架構出世以來,研發人員平均每六個月就能將模型參數量擴張一倍。2)2024 年英偉達 GTC 大會上,黃仁勛表示 GPT-4 采用的或是 MoE 架構,且擁有 1.8 萬億參數,是當前市面上參數量最大的模型。3)隨
41、著 abab 更新迭代,其在參數量上有望進一步追趕全球頂尖模型。圖表 15:黃仁勛于英偉達 GTC 大會上表示 GPT 或采用 1.8 萬億參數的 MoE 結構 資料來源:YouTube,英偉達,國盛證券研究所 2024 年 04 月 23 日 P.12 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 三、萬卡算力集群三、萬卡算力集群為基,平臺及產品已獲全球客戶廣泛認可為基,平臺及產品已獲全球客戶廣泛認可 1、算力儲備國內領先,萬卡集群保證訓推質量、算力儲備國內領先,萬卡集群保證訓推質量 AIGC 浪潮已至,進一步推動對芯片和算力的需求。當下,算力供應短缺的問題已經成浪潮已至,進一步推動對芯
42、片和算力的需求。當下,算力供應短缺的問題已經成為了大模型訓練企業的普遍關注點。為了大模型訓練企業的普遍關注點。經過我們測算,推理側僅考慮文字問答場景,需要數萬張 H100,多模態提升空間廣闊。訓練側 GPT3.5 對應數千張 H100;多模態需求再提升數倍至十倍 GPT4 或對應數萬張 A100,GPT5 或對應數萬張 H100。截至截至 2023 年,公司已擁有數千卡常態化訓練年,公司已擁有數千卡常態化訓練+萬卡推理算力資源池,后續或仍不斷擴萬卡推理算力資源池,后續或仍不斷擴大。大。1)根據科創板日報于 2023 年 12 月 28 日報道,在數字中國大模型論壇上,AI 大模型企業 Mini
43、Max 副總裁魏偉介紹,目前公司已擁有數千卡以上的常態化訓練和萬卡級算力資源池。2)MiniMax 與火山引擎合作建立了超大規模實驗平臺,實現千卡級常態化訓練;超大規模推理平臺有萬卡級別的跨云高效計算系統,支撐單日過億次調用。2、國內頂尖大模型開放平臺,服務客戶數超、國內頂尖大模型開放平臺,服務客戶數超 2 萬家萬家 開放平臺接入千行百業,客戶數超開放平臺接入千行百業,客戶數超 2 萬、每日萬、每日 token 量已達百億。量已達百億。自 2023 年 4 月,MiniMax 發布開放平臺以來,MiniMax 陸續服務了 20,000 家企業及個人開發者,其中包括金山辦公、小紅書、騰訊、小米和
44、閱文在內的多家頭部互聯網公司。截止至 2024 年 1月 16 日,即大語言模型 abab6 發布前,MiniMax 開放平臺平均單日的 token 處理量達到了數百億。圖表 16:MiniMax 開放平臺部分合作伙伴 資料來源:MiniMax 官網,國盛證券研究所 MiniMax 開放平臺的典型客戶案例包括但不限于辦公、社交、醫療等多行業。開放平臺的典型客戶案例包括但不限于辦公、社交、醫療等多行業。在辦公領域中,金山辦公旗下的在辦公領域中,金山辦公旗下的 WPS AI 正式接入了正式接入了 MiniMax 開放平臺、開放平臺、具備大語言具備大語言模型能力的模型能力的 AI 應用,為用戶提供智
45、能文檔寫作、閱讀理解和問答、智能人機交互的能應用,為用戶提供智能文檔寫作、閱讀理解和問答、智能人機交互的能力。力。作為 WPS 辦公套件的重要組成部分,WPS AI 已經實現了與 WPS 等金山辦公產品的無縫銜接,可以給用戶在辦公、寫作、文檔處理等方面帶來更高效、更智能的體驗。WPS 文字:1)完成活動策劃、周報月報、公文各類文章起草;2)一鍵生成公文、請假條、論文等多種格式文檔,無需再手動調節和使用模板;3)對話詢問文檔細節,梳理會議紀要。2024 年 04 月 23 日 P.13 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 17:WPS 文字一鍵起草工作周報 圖表 18:WPS
46、 文字秒速提煉分析文檔重點 資料來源:WPS AI 官網,國盛證券研究所 資料來源:WPS AI 官網,國盛證券研究所 WPS 演示:1)根據主題和頁數,自動生成大綱和完整 PPT,并支持生成單頁、擴寫改寫等能力;2)一鍵切換模版、配色、字體;3)自動生成演講備注,快速完成講稿。圖表 19:WPS 演示一鍵更換配色方案美化 PPT 圖表 20:WPS 演示自動生成演講備注和演講稿 資料來源:WPS AI 官網,國盛證券研究所 資料來源:WPS AI 官網,國盛證券研究所 WPS PDF:1)快速生成文檔概要,且可追溯至原文;2)同步翻譯外文文檔,支持直接用中文提問英文論文或報告。圖表 21:W
47、PS PDF 生成可追溯文檔概要 圖表 22:WPS PDF 支持外文翻譯與提煉 資料來源:WPS AI 官網,國盛證券研究所 資料來源:WPS AI 官網,國盛證券研究所 2024 年 04 月 23 日 P.14 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 WPS 表格:1)根據用戶描述想要的效果,自動調用表格指令完成操作,比如生成條件格式、篩選排序、應用公式等等;2)分類統計數據并展示。圖表 23:WPS 表格調整表格陳列格式 圖表 24:WPS 表格根據用戶要求自動應用公式 資料來源:WPS AI 官網,國盛證券研究所 資料來源:WPS AI 官網,國盛證券研究所 在醫療領域中,
48、在醫療領域中,MiniMax 開放平臺與開放平臺與高濟健康合作,高濟健康合作,優化醫療咨詢服務,提升效率與優化醫療咨詢服務,提升效率與專業性。專業性。面對龐大的患者數量、極高的專業性要求與人工成本,MiniMax 為醫療咨詢行業提供了解決方案,通過協助藥師定期回訪并回答患者的專業問題,極大提高了服務效率和專業水平。憑借大模型強大的邏輯能力和豐富的知識儲備,MiniMax 能夠在強思維模式下精確回答醫療領域的專業問題,并支持長記憶檢索和知識庫問答,為醫療咨詢領域提供定制化的行業解決方案。圖表 25:MiniMax 藥師 AI 助手框架 圖表 26:MiniMax 醫生 AI 助手框架 資料來源:
49、MiniMax 公眾號,國盛證券研究所 資料來源:MiniMax 公眾號,國盛證券研究所 外接外接 MiniMax 大語言模型大語言模型,“高濟神農高濟神農 1.0”顯著提高腫瘤咨詢準確率。顯著提高腫瘤咨詢準確率?!案邼褶r 1.0”是高濟健康與 MiniMax 共同打造的智能患者管理系統?;?MiniMax-abab 大語言模型,它構建了包含數億條醫學專家指南和共識的腫瘤知識庫。通過知識增強技術外接到大模型中,以高濟累積的超 80 萬腫瘤患者真實服務場景為基礎,經過 200 余家藥房藥師的反復調試優化,對于腫瘤用藥及不良反應問題的回答準確率高達 97.6%。2024 年 04 月 23 日
50、 P.15 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 27:MiniMax 與高濟健康簽訂合作 資料來源:MiniMax 公眾號,國盛證券研究所 未來,未來,MiniMax 還將提供標準化工具鏈,支持客戶自動化構建醫療智能助手。還將提供標準化工具鏈,支持客戶自動化構建醫療智能助手。我們認為,MiniMax 的這一趨勢預計將會延續到其他行業,如辦公、社交等,通過提供標準化的工具鏈,支持各行各業自動化構建智能助手,推動千行百業的數字化、智能化轉型。3、C 端標桿應用數據亮眼,商業化潛力廣闊端標桿應用數據亮眼,商業化潛力廣闊 1)Talkie 星野:加厚版“星野:加厚版“Charact
51、er.ai”,用戶數據表現亮眼”,用戶數據表現亮眼 從明星到動漫人物,用戶可以根據自定義的外表、性格、語音,創立獨特從明星到動漫人物,用戶可以根據自定義的外表、性格、語音,創立獨特 AI 形象。形象。從“Talkie”的商店頁面介紹上看,這款產品主打的第一大特色是 UGC。用戶可以創建屬于自己的 AI 聊天機器人形象,定制性格、語音。1)在角色外形方面,創作機器人形象需要用戶上傳樣本圖片,Talkie 一共設計了兩種創作模式:普通和高保真。普通模式只需要上傳一張形象圖,高保真模式則需要上傳 20-40 張人像照片,生成一個“Avatar”。用戶還可以增加對機器人的形象描述,增強準確性。之后 T
52、alkie 會直接用 AI 生成聊天機器人的 2D 備選圖片,用戶需要從中挑選一張,確定機器人的最終“長相”。2)在角色聲音方面,Talkie 會直接給出多個音色樣本,用戶可以根據自己的喜好添加并調整各個樣本的配比。3)在角色性格方面,Talkie 本身會提供包含各種性格的“風格廣場”,里面展示了各種性格模板和文本回復范例,用戶可以自由選擇和組合。圖表 28:Talkie 豐富的角色創建功能和對話體驗 資料來源:Talkie 官網,國盛證券研究所 2024 年 04 月 23 日 P.16 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 引入“卡牌”概念,聊天引入“卡牌”概念,聊天應用與游戲
53、的進一步融合。應用與游戲的進一步融合。1)用戶如果能夠和 AI 機器人交流并解鎖某個特定話題,Talkie 就會給用戶一個抽出 CG 卡牌的機會。用戶可以在幾張候選卡面中抽取一個自己最喜歡的設計,且所有的備選卡面也都是 AI 自動生成。2)用戶每天只能免費抽卡一次,之后再想抽卡就需要花費游戲內貨幣“鉆石”。抽到的卡牌本身也能出售,用戶自己定價之后可以掛在每個 AI 機器人各自的 CG 卡牌商店上,經過審核就能公開上架,如果其他用戶想要購買,同樣是用鉆石。用戶還可以在商店上給卡牌點贊。圖表 29:Talkie 卡牌推薦 資料來源:Talkie 官網,國盛證券研究所 宣發鼓勵宣發鼓勵 UGC 創作
54、,下載數據亮眼、月活已過千萬。創作,下載數據亮眼、月活已過千萬。1)2023 年 9 月,Talkie 發起了兩個有獎活動,分別鼓勵用戶在社媒上宣傳 Talkie 和創作更多 AI 聊天機器人。如果用戶在社交媒體上的分享帖點擊量過千,那么每 1000 次點擊就能換來 5 美元的 Amazon 電商禮品卡。2)從下載量來看,海外版 Talkie 在 2023 年 6 月 16 日正式上線,8 月 27 日開始美國 Google Play 下載榜排名迅速躥升,截至 9 月 7 日,已經在美國 Google Play 非游下載總榜躋身 Top 5,下載總榜位居第六位。之后雖然排名有小幅回落,但截止到
55、 2024年 4 月 22 日,依然位居美國 App Store 免費娛樂榜第 30 位。3)從用戶反饋來看,Talkie自發布以來共收獲 7.6 萬個評分,均分 4.5。4)根據 MiniMax 官方微信公眾號,截至 2024年 4 月,星野的月活已經突破千萬級了。圖表 30:Talkie(星野海外版)App Store 排名趨勢 資料來源:點點數據,國盛證券研究所 2)海螺)海螺 AI:個人:個人 AI 助理,綜合能力位于前列助理,綜合能力位于前列 海螺 AI 是面向 C 端的 AI 個人智能助理。用戶可以提出問題,獲得詳盡的解決方案;上 2024 年 04 月 23 日 P.17 請仔細
56、閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 傳文件整理成摘要筆記;粘貼網址,抽取文章核心要點;甚至語音通話,和 AI 外教練習口語。例如,當我們將 MiniMax 公眾號的鏈接發給海螺 AI 時,它能快速的根據要求閱讀這篇公眾號文章,并列出文章的作者信息、信息要點、作者態度。圖表 31:海螺 AI 閱讀并分析 MiniMax 公眾號文章 資料來源:MiniMax 公眾號,國盛證券研究所 配備朗讀功能,配備朗讀功能,對齊對齊全球頂尖大模型。全球頂尖大模型。值得注意的是,在海螺 AI 提供文字回答的同時,還提供了語音朗讀答案的功能。在此之前,2024 年 3 月 5 日,ChatGPT 剛剛推出朗
57、讀功能 Read Aloud,實現對正在閱讀的文本的語言的自動檢測,并且用戶可以將聊天機器人設置為在響應提示時始終以口頭方式響應。英文語音交流流暢自然,主動引導用戶深入交流。英文語音交流流暢自然,主動引導用戶深入交流。經測試,海螺 AI 的英文口語交流能力較高,日常對話發音準確且流暢自然。當用戶打開語音對話界面,AI 會主動提問“你好,我是你們的 AI 英語老師,你們今天想練習說什么話題呢?(Hello,Im your AI English teacher,what topic would you like to practice speaking about today?)”。在接下來的交流
58、中,海螺 AI 不斷主動提出問題,引導和用戶的下一步對話。圖表 32:海螺 AI 語音交流界面 圖表 33:海螺 AI 提供一系列 AI 聲音選擇 資料來源:海螺 AI 官網,國盛證券研究所 資料來源:海螺 AI 官網,國盛證券研究所 2024 年 04 月 23 日 P.18 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 在用戶“掛斷電話”,結束與 AI 的語音通話后,系統還會自動提供文字版的語音對話記錄,供用戶進一步學習。圖表 34:海螺 AI 提供的文字版語音交流記錄 資料來源:海螺 AI 官網,國盛證券研究所 著眼著眼 AGI,與用戶共創智能。,與用戶共創智能。MiniMax 的理
59、念是 Intelligence with Everyone,與用戶共創智能。公司創始人閆俊杰在采訪中提到“AGI 不是大殺器,是普通人每天會用的一個產品、一個服務”;公司副總裁和開放平臺負責人魏偉也在采訪里提到,“目前距離實現真正的 AGI 仍然有很長的路要走。我們的目標是在算法上持續保持領先,在業務上始終為用戶創造實際的價值?!蔽覀冋J為,憑借扎實的大模型基座、廣泛的商業化應用、敏銳的技術前瞻性、果斷的投入決心、優秀的人才團隊,以 Minimax 等為代表的國產大模型已逐步躋身全球一流科技梯隊,AGI 正在加速到來。四、風險提示四、風險提示 AI 技術迭代不及預期:技術迭代不及預期:若 AI
60、技術迭代不及預期,則對產業鏈相關公司會造成一定不利影響。經濟下行超預期:經濟下行超預期:若宏觀經濟景氣度下行,固定資產投資額放緩,影響企業再投資意愿,從而影響消費者消費意愿和產業鏈生產意愿,對整個行業將會造成不利影響。行業競爭加?。盒袠I競爭加?。喝粝嚓P企業加快技術迭代和應用布局,整體行業競爭程度加劇,將會對目前行業內企業的增長產生威脅。2024 年 04 月 23 日 P.19 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 免責聲明免責聲明 國盛證券有限責任公司(以下簡稱“本公司”)具有中國證監會許可的證券投資咨詢業務資格。本報告僅供本公司的客戶使用。本公司不會因接收人收到本報告而視其為客
61、戶。在任何情況下,本公司不對任何人因使用本報告中的任何內容所引致的任何損失負任何責任。本報告的信息均來源于本公司認為可信的公開資料,但本公司及其研究人員對該等信息的準確性及完整性不作任何保證。本報告中的資料、意見及預測僅反映本公司于發布本報告當日的判斷,可能會隨時調整。在不同時期,本公司可發出與本報告所載資料、意見及推測不一致的報告。本公司不保證本報告所含信息及資料保持在最新狀態,對本報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。本公司力求報告內容客觀、公正,但本報告所載的資料、工具、意見、信息及推測只提供給客戶作參考之用,不構成任何投資、法律、會計或稅務的最
62、終操作建議,本公司不就報告中的內容對最終操作建議做出任何擔保。本報告中所指的投資及服務可能不適合個別客戶,不構成客戶私人咨詢建議。投資者應當充分考慮自身特定狀況,并完整理解和使用本報告內容,不應視本報告為做出投資決策的唯一因素。投資者應注意,在法律許可的情況下,本公司及其本公司的關聯機構可能會持有本報告中涉及的公司所發行的證券并進行交易,也可能為這些公司正在提供或爭取提供投資銀行、財務顧問和金融產品等各種金融服務。本報告版權歸“國盛證券有限責任公司”所有。未經事先本公司書面授權,任何機構或個人不得對本報告進行任何形式的發布、復制。任何機構或個人如引用、刊發本報告,需注明出處為“國盛證券研究所”
63、,且不得對本報告進行有悖原意的刪節或修改。分析師聲明分析師聲明 本報告署名分析師在此聲明:我們具有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任能力,本報告所表述的任何觀點均精準地反映了我們對標的證券和發行人的個人看法,結論不受任何第三方的授意或影響。我們所得報酬的任何部分無論是在過去、現在及將來均不會與本報告中的具體投資建議或觀點有直接或間接聯系。投資評級說明投資評級說明 投資建議的評級標準投資建議的評級標準 評級評級 說明說明 評級標準為報告發布日后的 6 個月內公司股價(或行業指數)相對同期基準指數的相對市場表現。其中 A 股市場以滬深 300 指數為基準;新三板市場以三板成指
64、(針對協議轉讓標的)或三板做市指數(針對做市轉讓標的)為基準;香港市場以摩根士丹利中國指數為基準,美股市場以標普 500 指數或納斯達克綜合指數為基準。股票評級 買入 相對同期基準指數漲幅在 15%以上 增持 相對同期基準指數漲幅在 5%15%之間 持有 相對同期基準指數漲幅在-5%+5%之間 減持 相對同期基準指數跌幅在 5%以上 行業評級 增持 相對同期基準指數漲幅在 10%以上 中性 相對同期基準指數漲幅在-10%+10%之間 減持 相對同期基準指數跌幅在 10%以上 國盛證券研究所國盛證券研究所 北京北京 上海上海 地址:北京市東城區永定門西濱河路 8 號院 7 樓中海地產廣場東塔 7 層 郵編:100077 郵箱: 地址:上海市浦東新區南洋涇路 555 號陸家嘴金融街區 22棟 郵編:200120 電話:021-38124100 郵箱: 南昌南昌 深圳深圳 地址:南昌市紅谷灘新區鳳凰中大道 1115 號北京銀行大廈 郵編:330038 傳真:0791-86281485 郵箱: 地址:深圳市福田區福華三路 100 號鼎和大廈 24 樓 郵編:518033 郵箱: