据称 Beating intelligence,新浪微博团队最近开源了 VibeThinker-3B,这是一个具有 30 亿参数的推理模型,在数学和代码任务上实现了前沿级表现,其部分指标接近或超过 DeepSeek V3.2、GLM-5 和 Gemini 3 Pro。
该模型基于 Qwen2.5-Coder-3B,采用谱到信号的训练流水线,并使用 64K 推理空间。在推理过程中通过自蒸馏以及逐步级别的验证,VibeThinker-3B 将 AIME26 数学测试分数从 94.3 提升至 97.1。