DeepSeek-V3代碼場景測評表現比肩GPT-4o及Claude-3.5-Sonnet 在算法類代碼場景(Codeforces),DeepSeek-V3 測評表現領先于市面上已有的全部非 o1 類模型,并在工程類代碼場景( SWE-Bench Verified )逼近 Claude-3.5-Sonnet-1022。 行業數據 下載Excel 下載圖片 原圖定位