Codex Mengungguli DRL dalam Kontrol Cairan dengan Kode Tulisan Tangan, Biaya Total $14

Menurut Beating, peneliti pasca-pelatihan OpenAI Paul Garnier menunjukkan bahwa Codex 5,5 dapat menghasilkan kode kontrol yang dapat diinterpretasikan dengan mengungguli baseline deep reinforcement learning pada aplikasi mekanika fluida. Alih-alih melatih jaringan saraf, Garnier menggunakan model untuk menyempurnakan skrip Python secara iteratif dengan menganalisis simulasi fisika, sehingga mencapai performa yang lebih baik pada lebih dari setengah skenario yang diuji.

Aturan kontrol yang dihasilkan AI dapat diinterpretasikan secara fisik, seperti "tunda penyuntikan jet ketika kelengkungan lokal melebihi ambang batas." Berbeda dari black box jaringan saraf, pendekatan berbasis kode terbukti tangguh saat terjadi pergeseran distribusi; ketika durasi pengujian diperpanjang empat kali, model DRL tradisional runtuh sementara kode yang diinformasikan fisika tetap stabil. Menerapkan strategi kontrol penuh menghabiskan 21,25 juta token, dengan total di bawah $14.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar