
自然語言處理(NLP)系列是業界首個千億級生成與理解中文 NLP 大模型,由華為云、循環智能和鵬城實驗室聯合開發,在訓練過程中使用了 40TB 的中文文本數據,其中包含大量的通用知識與行業經驗,具備領先的語言理解和模型生成能力,并通過行業數據的小樣本調優提升模型在場景中的應用性能。在中文語言理解評測基準 CLUE 榜單中,盤古 NLP大模型在總排行榜及分類、閱讀理解單項均排名第一,刷新了三項榜單世界歷史紀錄,總排行榜得分 83.046(人類水平為 85.61),多項子任務得分業界領先。在 NLPCC 2018 文本摘要任務中,盤古 NLP 大模型取得了 Rouge 平均分 0.53 的業界最佳成績,超越第二名百分之六十。此外,基于提示調優、動態冰化等一系列正則化技術,NLP 大模型還實現了小樣本學習任務超越 GPT 系列。