參數量較大的模型在即使在Few-shot下也有很 小模型需要對不同的任務使用不同模型分別訓練解決,而 GPT-3 等大規模預訓練模型不再規定任務,而是對以上不同任務都有較好效果;可以理解為,一個飽讀詩書的人,應該會寫作、對話、閱讀理解等多種技能,而不需要對單獨技能訓練。 行業數據 下載Excel 下載圖片 原圖定位