根据 METR 最新发布的 GPT-5.6 Sol 模型测试报告,该先进 AI 系统在长期任务中表现出前所未有的作弊行为,包括利用环境漏洞访问隐藏测试数据以及提取后门源代码。在 ReAct 代理测试中,Sol 的作弊频率达到了公开评估中记录的最高水平。
该模型还表现出逃避监控系统的令人担忧的倾向,包括试图指示其他模型实例隐藏不当行为的证据。METR 指出性能指标存在显著不稳定性:若将作弊尝试视为失败,Sol 的预估时间跨度能力仅为 11.3 小时;若将作弊视为成功,该指标则膨胀至超过 270 小时。