Lección 3

Validación de estrategia: backtesting, estadística y división del trabajo de IA

Este capítulo explica las funciones auxiliares que la IA puede realizar y los pasos de auditoría manual que deben conservarse conforme las estrategias pasan de las ideas a los números. Se centra en la limpieza de datos, el sesgo de anticipación, las suposiciones de costos y las pruebas fuera de muestra.

1. Punto de partida: el objetivo de la validación no es «demostrar rentabilidad»

Las dos lecciones anteriores abordaron la división del trabajo en el flujo y la estructura de entrada. Esta tercera lección se centra en si una idea demuestra coherencia histórica. Muchos fracasos no nacen de rumbos fundamentalmente erróneos, sino de tratar los backtests como conclusiones sin una auditoría rigurosa: los datos incluyen activos dados de baja, las señales incorporan información futura, se omiten los costes y los parámetros se ajustan una y otra vez sobre muestras reducidas. La IA puede acelerar la escritura de código y la interpretación de indicadores, pero no puede decidir si una estrategia es válida. El objetivo razonable de la validación es: bajo supuestos claros, la estrategia no ha sido refutada ni estadística ni económicamente, no demostrar una rentabilidad inevitable mediante una narrativa atractiva.

2. División razonable del trabajo para la IA en backtesting

La IA es adecuada para asistir en:

  • Generar el código del framework de backtesting

  • Explicar el significado del ratio Sharpe, la reducción máxima y la tasa de aciertos

  • Enumerar posibles puntos de sesgo de anticipación

  • Convertir tablas de resultados en resúmenes de texto

Las tareas que deben completar o revisar los humanos de forma independiente incluyen:

  • Verificar si el universo contiene sesgo de supervivencia

  • Confirmar si existían precios antes del listado

  • Asegurar que se incluyen comisiones, deslizamiento y tasas de financiación

  • Comprobar si se ejecutan pruebas fuera de muestra o walk-forward

  • Evaluar si se consideran las discrepancias entre papel y directo

Que el código se ejecute solo indica que los pasos de ingeniería están completos; no significa que la estrategia haya superado la validación.

3. Limpieza de datos: el paso más frágil en el backtesting de criptoactivos

Si un backtest solo emplea tokens que siguen activos hoy en día, los resultados tienden a ser sistemáticamente optimistas. Los períodos previos al listado de un token no deben tratarse como negociables. Los precios, volúmenes y tasas de financiación varían según el exchange; los backtests deben fijar el exchange o definir reglas de síntesis. Los forks, las migraciones de contratos y los cambios de nombre provocan discontinuidades en las series de precios que requieren mapeo manual o exclusión. Usar una única stablecoin para valorar durante fases de depeg puede distorsionar la rentabilidad y las métricas de riesgo; las ventanas de depeg significativas deben marcarse o explicarse por separado. Se debe exigir a la IA que documente las fuentes de datos, los rangos temporales y las definiciones del universo, y que coteje cada elemento con los datos brutos; esto es más importante que limitarse a trazar curvas de backtest.

4. Sesgo de anticipación: alineación temporal entre señales y ejecución

Los sesgos de anticipación más habituales son:

  • Emplear estadísticas de toda la muestra para normalizar, pero realizar el backtest sobre la muestra completa

  • Generar señales al cierre del día y ejecutarlas a la apertura del día siguiente

  • Utilizar direcciones etiquetadas como «smart money» solo después de que se hayan hecho efectivas

  • Emplear datos macro revisados como si fueran valores publicados en su momento

La disciplina exige especificar: las señales generadas en t deben ejecutarse en t+1 o más tarde según el tipo de estrategia; si los datos macro no pueden obtenerse tal como se publicaron originalmente, las conclusiones derivadas deben atenuarse. Se puede pedir a la IA que anote en comentarios del código la disponibilidad temporal de cada característica; los humanos deben verificar las características clave para garantizar que preceden a la ejecución en al menos un día.

5. Costes y fricción: los backtests sin comisiones son inválidos por defecto

Las estrategias de cripto deben incluir como mínimo comisiones de trading, deslizamiento, tasas de financiación perpetuas (si las posiciones cruzan puntos de liquidación), costes de préstamo (si se usa apalancamiento) y gastos de retiro o entre cadenas si procede. Se pueden aplicar escenarios de comisiones base y pesimistas (por ejemplo, duplicar las comisiones) para someter a estrés la estrategia. Si la rentabilidad esperada empeora drásticamente o se vuelve negativa bajo supuestos pesimistas, la estrategia es muy sensible a los costes y no debe juzgarse únicamente por las curvas dentro de la muestra. La IA suele asumir por defecto comisiones cero o un único punto básico; los humanos deben incorporar tablas de comisiones en los supuestos del backtest y en los informes.

6. Sobreajuste y fuera de muestra: más parámetros exigen mayor cautela narrativa

Los síntomas incluyen:

  • Mostrar solo la mejor combinación después de probar muchos conjuntos de indicadores

  • Ajustar parámetros únicamente en muestras cortas de mercado alcista

  • Reglas muy específicas sin explicación del mecanismo subyacente

Las contramedidas incluyen:

  • Reservar intervalos fuera de muestra que no se utilicen para el ajuste de parámetros

  • Aplicar pruebas walk-forward con ventana móvil

  • Simplificar al máximo las reglas dentro de premisas explicables

Los informes deben presentar métricas clave tanto dentro como fuera de la muestra; si el rendimiento fuera de muestra es significativamente inferior al de dentro de la muestra, debe señalarse el riesgo de sobreajuste y pausarse el escalado en vivo. La IA no debe optimizar parámetros repetidamente sin supervisión hasta que la curva tenga buen aspecto: eso equivale a sobreajuste automatizado.

7. Del backtest al trading en vivo: avance gradual, no lanzamiento de una sola vez

Se recomienda una progresión de tres niveles. Nivel uno: el backtest supera la validación con universo documentado, comisiones y resultados fuera de muestra. Nivel dos: trading en papel o simulado que registra las diferencias de precio entre señal y ejecución y observa el deslizamiento real. Nivel tres: trading en vivo de tamaño reducido con límites y stop-loss, comparando de forma continua los resultados en papel y en directo. El avance en cada nivel lo deciden humanos, no modelos que recomienden posiciones elevadas. La IA puede generar listas de verificación para cada nivel, pero no puede sustituir las decisiones de avance.

8. Campos mínimos en un informe de backtest

Incluso sin sistemas complejos, un informe debe incluir:

  • Descripción de la estrategia en una frase

  • Intervalo de datos y universo de activos

  • Tabla de supuestos sobre comisiones

  • Rentabilidad dentro y fuera de muestra, reducción máxima y número de operaciones

  • Pérdida máxima consecutiva

  • Lista de problemas pendientes

  • Conclusión sobre si continuar la validación, pausar o abandonar

Evite afirmaciones como «cautelosamente optimista» que no orientan la acción. Los backtests y las revisiones comparten la misma disciplina: ejecutable, auditable, repetible.

9. Resumen de la lección

Esta lección se centra en si las ideas han sido puestas a prueba. La IA es adecuada para ayudar a escribir código de backtest, explicar indicadores, señalar sesgos de anticipación y comisiones omitidas; no lo es para reemplazar la confirmación humana del sesgo de supervivencia en los datos, la alineación señal‑ejecución, el rendimiento fuera de muestra o el margen bajo costes pesimistas. Que el código se ejecute y las curvas dentro de la muestra tengan buen aspecto solo indica que los pasos de ingeniería están hechos, no que el escalado en vivo esté justificado. Un camino más seguro consiste en documentar los backtests, hacer seguimiento en papel y después pasar a una prueba a pequeña escala con prueba y error; cada avance lo deciden los humanos. La próxima lección cubrirá eventos macro y on‑chain principales: períodos con la mayor cantidad de información, pero también los más propensos a resúmenes engañosos para las conclusiones, lo que exige límites claros sobre lo que la IA puede ayudar a preparar y lo que no puede sustituir en la verificación.

Descargo de responsabilidad
* La inversión en criptomonedas implica riesgos significativos. Proceda con precaución. El curso no pretende ser un asesoramiento de inversión.
* El curso ha sido creado por el autor que se ha unido a Gate Learn. Cualquier opinión compartida por el autor no representa a Gate Learn.