豆包大模型12月相比5月的提升,以及同GPT-4o的對比 后發而先至,大模型能力比肩 GPT-4o。相比 5 月版本,豆包最強模型 Doubao-pro 能力大幅提升。面向 MMLU_pro 評測集,模型綜合能力提升 32%,和 GPT-4o 持平,使用價格僅為 GPT-4o 的八分之一。分項目看,Doubao-pro 指令遵循能力提升 9%,代碼能力提升 58%,GPQA 專業知識方面能力提升 54%,數學能力提升 43%,推理能力提升 13%,全面對齊 GPT-4o 水平。 行業數據 下載Excel 下載圖片 原圖定位