Codex supera a DRL no controle de fluidos com código escrito à mão, custo total de US$ 14

De acordo com Beating, o pesquisador de pós-treinamento da OpenAI Paul Garnier demonstrou que o Codex 5.5 consegue gerar código de controle interpretável, superando bases de aprendizado por reforço profundo em aplicações de mecânica dos fluidos. Em vez de treinar redes neurais, Garnier usou o modelo para refinar iterativamente scripts em Python analisando simulações de física, alcançando desempenho superior em mais da metade dos cenários testados.

As regras de controle geradas por IA eram fisicamente interpretáveis, como “atrasar a injeção do jato quando a curvatura local exceder o limite”. Diferentemente das caixas-pretas de redes neurais, a abordagem baseada em código se mostrou robusta diante de mudanças de distribuição; quando a duração do teste foi estendida em quatro vezes, modelos tradicionais de DRL colapsaram, enquanto o código com informações da física permaneceu estável. A implementação da estratégia de controle completa consumiu 21,25 milhões de tokens, somando menos de US$ 14.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários