
國內模型百花齊放,互聯網大廠、初創公司、科技企業均有代表性模型產品。國內模型技術辨識度不高,據 SuperCLUE 測評結果榜單,頭部的國內模型在得分上相差并不顯著。在國內主流的模型中,互聯網廠商和科技企業在大模型上起步較早,如百度在 GPT-4 發布的后一天即 23 年 3 月 15 日發布文心一言,23 年 3 月 29 日 360 智腦 1.0 發布,23 年 4 月通義千問上線,23 年 5 月 6 日訊飛星火 1.0 發布。進入 24 年,初創公司的大模型產品得到 了更廣泛 的關注,例如 24 年 3 月月之暗面更新 Kimi智能 助手 200 萬字的上下文支持能力,直接引發了百度、360 等廠商對長上下文的適配。同月階躍星辰 STEP 模型發布,其 STEP 2 宣稱為萬億參數 MoE 模型,直接對標 GPT-4 的參數(一般認為是 1.8 T 參數的 MoE),在大多數國內模型以千億參數為主的環境下,將參數量率先提升到萬億級別。4 月,MiniMax也發布了萬億參數 MoE 架構的 abab 6.5。