根據 Beating intelligence,新浪微博團隊近期開源了 VibeThinker-3B,這是一款具有 30 億參數的推理模型,能在數學與程式碼任務上達到前沿等級的表現,其部分指標接近或超過 DeepSeek V3.2、GLM-5 以及 Gemini 3 Pro。
該模型基於 Qwen2.5-Coder-3B,使用頻譜到訊號的訓練管線,並具備 64K 推理空間。透過推理過程中的自我蒸餾以及逐步層級驗證,VibeThinker-3B 將 AIME26 數學測試成績從 94.3 提升至 97.1。