De acordo com Beating, o pesquisador de pós-treinamento da OpenAI Paul Garnier demonstrou que o Codex 5.5 consegue gerar código de controle interpretável, superando bases de aprendizado por reforço profundo em aplicações de mecânica dos fluidos. Em vez de treinar redes neurais, Garnier usou o modelo para refinar iterativamente scripts em Python analisando simulações de física, alcançando desempenho superior em mais da metade dos cenários testados.
As regras de controle geradas por IA eram fisicamente interpretáveis, como “atrasar a injeção do jato quando a curvatura local exceder o limite”. Diferentemente das caixas-pretas de redes neurais, a abordagem baseada em código se mostrou robusta diante de mudanças de distribuição; quando a duração do teste foi estendida em quatro vezes, modelos tradicionais de DRL colapsaram, enquanto o código com informações da física permaneceu estável. A implementação da estratégia de controle completa consumiu 21,25 milhões de tokens, somando menos de US$ 14.