据 Beating 报道,Cognition 发布了 Devin Fusion,一种混合 AI 代理架构,旨在平衡前沿模型性能与显著更低的成本。该系统采用两种核心机制:一是"Sidekick"设计,即较小的经济型模型负责代码探索、测试和验证任务,而较大的前沿模型保留规划、需求澄清和最终审查权限,每个模型维护单独的缓存上下文以避免昂贵的缓存失效;二是动态路由,根据任务演进和上下文压缩在会话期间调整模型,实现"零成本"模型升级。
在 FrontierCode 基准测试中,Devin Fusion 平均将 GPT-5.5 和 Opus 4.8 级别模型的开发成本降低 35%,同时保持前沿性能,与 Fable 5 配合使用时成本降幅高达 41%。在内部开发中,88% 的合并拉取请求完全由 Fusion 的自动路由驱动,但在需要复杂开发意图和主观判断的任务上性能显著下降。