Theo Beating, nhà nghiên cứu hậu huấn luyện của OpenAI, Paul Garnier, đã chứng minh rằng Codex 5.5 có thể tạo ra mã điều khiển mang tính diễn giải, vượt trội hơn các baseline học tăng cường sâu trong các ứng dụng cơ học chất lỏng. Thay vì huấn luyện mạng nơ-ron, Garnier dùng mô hình để tinh chỉnh lặp đi lặp lại các đoạn script Python bằng cách phân tích các mô phỏng vật lý, đạt hiệu suất cao hơn trong hơn một nửa số kịch bản được thử nghiệm.
Các quy tắc điều khiển do AI tạo ra có tính diễn giải theo vật lý, chẳng hạn như “trì hoãn việc phun jet khi độ cong cục bộ vượt ngưỡng”. Khác với các hộp đen của mạng nơ-ron, cách tiếp cận dựa trên mã cho thấy độ bền vững tốt trước những thay đổi phân phối; khi thời lượng thử nghiệm được kéo dài gấp bốn lần, các mô hình DRL truyền thống sụp đổ, trong khi mã được cung cấp thông tin từ vật lý vẫn ổn định. Việc triển khai toàn bộ chiến lược điều khiển tiêu tốn 21,25 triệu token, tương đương dưới $14.