Tin tức Cổng, ngày 29 tháng 4 — Các nhà nghiên cứu của OpenAI, Sébastien Bubeck và Ernest Ryu, cho biết các hệ thống AI có thể thực hiện phần lớn công việc nghiên cứu của con người trong vòng hai năm, coi toán học là thước đo rõ ràng cho tiến bộ của AI. Khác với các bài kiểm tra hiệu suất mơ hồ, các bài toán mang lại khả năng xác minh chính xác: câu trả lời hoặc đúng hoặc sai, không để chỗ cho sự mơ hồ.
Bubeck cho biết suy nghĩ thật sự của AI cần có khả năng vượt qua các chuỗi suy luận dài. Chỉ một sai sót trong một lập luận nhiều bước sẽ làm sụp đổ toàn bộ chứng minh, khiến việc phát hiện và sửa lỗi ngay trong quá trình trở thành mục tiêu tối thượng đối với các mô hình tiên tiến. Các phòng thí nghiệm nội bộ của OpenAI đã tạo ra hơn mười định lý hoàn toàn mới có thể công bố trên các tạp chí hàng đầu về tổ hợp, cho thấy rằng AI hiện tạo ra các công trình thực sự nguyên bản, đột phá, thay vì chỉ tái tổ hợp các bài báo hiện có.
Tuy nhiên, các đột phá khoa học bền vững đòi hỏi sự tập trung ổn định trong nhiều tuần thử nghiệm. Các hệ thống hiện tại vẫn cần giám sát chặt chẽ của con người để dẫn dắt và xác minh từng lần đổi hướng. Bubeck dùng "thời gian AGI" để đo xem một mô hình có thể độc lập bắt chước suy nghĩ của con người trong bao lâu; hiện tại, các hệ thống hoạt động trong khoảng từ vài ngày đến một tuần, và mục tiêu của ngành là vài tuần hoặc vài tháng để có thể làm việc tự chủ trong các lĩnh vực như sinh học.
Trí nhớ dài hạn là then chốt cho tương lai này. Các cửa sổ chat tiêu chuẩn giới hạn độ sâu—các chứng minh toán học phức tạp thường vượt quá 50 trang—trong khi các kho mã cho thấy việc duy trì các phiên làm việc kéo dài giúp giải quyết vấn đề sâu hơn. Khi AI đạt được tính độc lập và trí nhớ, chuyên môn của con người trở nên có giá trị hơn, không phải ít hơn. Người lao động cần giữ lại kiến thức nền tảng sâu để thách thức và xác minh các câu trả lời của máy, và các tổ chức sẽ cần các bộ lọc tự động và hệ thống danh tiếng mới để duy trì niềm tin giữa một dòng nghiên cứu do AI hỗ trợ tràn ngập.