升級版Claude3.5Sonnet推理能力全面提升 根據基準測試結果,升級版的 Claude 3.5 Sonnet 各方面能力顯著提升,在研究生水平推理能力 GPQA、一般推理能力 MMLU、編程能力等方面表現優于 GPT-4o和 Gemini 1.5,并彌補了在數學能力方面較 GPT-4o 的不足。 行業數據 下載Excel 下載圖片 原圖定位