前两课分别处理了链路分工与输入结构。第三课进入“想法是否具有历史一致性“这一环节。许多失败并非源于方向完全错误，而是源于回测在未经审计的情况下被当作结论：数据包含已退市资产、信号使用了未来信息、费用被省略、参数在短样本上被反复调试。AI 可以加速代码编写与指标解释，但不能承接“策略是否成立“的最终判断。验证的更合理目标是：在明确前提下，策略尚未被统计与成本假设证伪；而非用流畅叙述证明必然盈利。

二、AI 在回测中的合理分工

适合由 AI 协助的部分包括：生成回测框架代码、说明夏普比率、最大回撤、胜率等指标含义、列举可能的前视偏差点、将结果表格整理为文字摘要。必须由人工独立完成或复核的部分包括：标的宇宙是否包含幸存者、上币前是否存在价格、手续费与滑点及资金费率是否计入、样本外或走样本检验是否执行、是否将纸面与实盘差异纳入评估。代码能够运行，仅表示工程步骤完成，不表示策略通过验证。

三、数据清洗：加密回测最易失效的环节

回测若只使用当前仍存在的币种，结果往往系统性偏乐观。代币上市前的区间不应纳入可交易假设。不同交易所的价格、成交量与资金费率存在差异，回测应固定交易所或写明合成规则。分叉、合约迁移与代币更名会导致价格序列断裂，需人工映射或剔除。稳定币脱锚阶段用单一稳定币计价，可能扭曲收益与风险指标，重大脱锚窗口应单独标注或说明处理方式。要求 AI 在文档中列出数据源、时间范围与 universe 定义，并对照原始数据逐项勾选，比单纯追求回测曲线更为重要。

四、前视偏差：信号与成交的时间对齐

常见前视包括：用全样本统计量做标准化却在全样本上回测；当日收盘产生信号却在当日开盘成交；使用事后才被标记为“聪明钱“的地址；用修订后的宏观数据冒充历史发布值。纪律上应明确：信号在 t 生成，成交至少在 t+1 或按策略类型更晚；宏观数据若无法获得当时版本，相关结论应降级。可要求 AI 在代码注释中标注每个特征的数据可用时点，人工抽查关键特征是否早于成交一日以上。

五、成本与摩擦：未含费用的回测默认无效

加密策略至少应纳入交易手续费、滑点、永续资金费率（若持仓跨结算点）、借贷利率（若使用杠杆）及必要时提币与跨链成本。可设基础费用情景与悲观情景（例如费用加倍）做压力测试。若悲观情景下期望收益明显恶化或转为负值，说明策略对成本高度敏感，不宜仅凭样本内曲线判断。AI 常默认零费用或单一基点，人工须将费用表写入回测假设并写入报告。

六、过拟合与样本外：参数越多，叙事越需谨慎

征象包括：大量指标组合后只展示最优一组、仅在短牛市样本上调参、规则极度具体却缺乏机制解释。

对抗方式包括：保留不参与调参的样本外区间；采用滚动窗口的走样本检验；在可解释前提下尽量简化规则。

可要求报告同时给出样本内与样本外关键指标；若样本外显著弱于样本内，应标注过拟合风险，并暂停实盘放大。AI 不宜在无人监督的情况下反复优化参数直至曲线满意，那相当于自动化过拟合。

七、从回测到实盘：分级晋级而非一步到位

建议采用三级阶梯。第一级：回测通过，且文档化 universe、费用与样本外结果。第二级：纸面或模拟运行，记录信号与成交价差异，观察滑点现实。第三级：小仓位实盘，设限额与止损，持续对比纸面与实盘。每一级是否晋级由人决定，不由模型建议重仓。AI 可为每一级生成检查表，但不能替代晋级判断。

八、回测报告的最低字段

即使不依赖复杂系统，报告也应包含：策略一句话描述；数据区间与标的范围；费用假设表；样本内与样本外的收益、最大回撤、交易次数；最大连续亏损；尚未解决的问题列表；结论为继续验证、暂停或放弃。避免使用“谨慎乐观“等无法指导行为的表述。复盘与回测共用同一纪律：可执行、可核对、可重复。

九、本课总结

本课围绕“想法有没有经过检验“展开。AI 适合帮忙写回测代码、解释指标、提醒前视偏差和费用遗漏；不适合代替人确认数据是否含幸存者偏差、信号与成交是否对齐、样本外是否还能看、悲观成本下是否仍有余地。代码跑通、样本内曲线好看，都只说明工程步骤走完了，不说明可以放大实盘。更稳妥的路径是回测文档化之后纸面跟踪，再小仓试错，每一级是否往上走由人决定。下一课看宏观和链上重大事件：那时信息最多、也最容易把摘要当成结论，需要单独划清 AI 能协助准备什么、不能代替核实什么。

免责声明

* 投资有风险，入市须谨慎。本课程不作为投资理财建议。

* 本课程由入驻 Gate Learn 的作者创作，观点仅代表作者本人，绝不代表 Gate Learn 赞同其观点或证实其描述。