12月1日晚,DeepSeek又上新了兩款新模型,DeepSeek-V3.2和DeepSeek-V3.2-Speciale,在推理能力上全球領先。

兩款模型有著不同的定位。DeepSeek-V3.2的目標是平衡推理能力與輸出長度,適合日常使用,例如問答場景和通用智能體任務場景。9月底DeepSeek發布了實驗版V3.2-Exp,此次是正式版更新。在公開推理測試中,V3.2達到了GPT-5的水平,僅略低于谷歌的Gemini3 Pro。
DeepSeek-V3.2-Speciale則是此次的重頭戲,其目標是“將開源模型的推理能力推向極致,探索模型能力的邊界”。據介紹,Speciale是V3.2的長思考增強版,同時結合了DeepSeek-Math-V2的定理證明能力,該模型具備出色的指令跟隨、嚴謹的數學證明與邏輯驗證能力。
據DeepSeek公布的數據,Speciale在多個推理基準測試中超越谷歌最先進的Gemini3 Pro。具體來看,在美國數學邀請賽、哈佛MIT數學競賽、國際奧林匹克數學競賽等測試中,V3.2-Speciale都超過了Gemini3 Pro,但在編程、理工科博士生測試中略遜于谷歌。
