Tin tức Cổng, ngày 29 tháng 4 — Các nhà nghiên cứu của OpenAI, Sébastien Bubeck và Ernest Ryu, cho biết các hệ thống AI có thể thực hiện phần lớn công việc nghiên cứu của con người trong vòng hai năm, coi toán học là thước đo rõ ràng cho tiến bộ của AI. Khác với các bài kiểm tra hiệu suất mơ hồ, các bài toán mang lại khả năng xác minh chính xác: câu trả lời hoặc đúng hoặc sai, không để chỗ cho sự mơ hồ.

Bubeck cho biết suy nghĩ thật sự của AI cần có khả năng vượt qua các chuỗi suy luận dài. Chỉ một sai sót trong một lập luận nhiều bước sẽ làm sụp đổ toàn bộ chứng minh, khiến việc phát hiện và sửa lỗi ngay trong quá trình trở thành mục tiêu tối thượng đối với các mô hình tiên tiến. Các phòng thí nghiệm nội bộ của OpenAI đã tạo ra hơn mười định lý hoàn toàn mới có thể công bố trên các tạp chí hàng đầu về tổ hợp, cho thấy rằng AI hiện tạo ra các công trình thực sự nguyên bản, đột phá, thay vì chỉ tái tổ hợp các bài báo hiện có.

Tuy nhiên, các đột phá khoa học bền vững đòi hỏi sự tập trung ổn định trong nhiều tuần thử nghiệm. Các hệ thống hiện tại vẫn cần giám sát chặt chẽ của con người để dẫn dắt và xác minh từng lần đổi hướng. Bubeck dùng "thời gian AGI" để đo xem một mô hình có thể độc lập bắt chước suy nghĩ của con người trong bao lâu; hiện tại, các hệ thống hoạt động trong khoảng từ vài ngày đến một tuần, và mục tiêu của ngành là vài tuần hoặc vài tháng để có thể làm việc tự chủ trong các lĩnh vực như sinh học.

Trí nhớ dài hạn là then chốt cho tương lai này. Các cửa sổ chat tiêu chuẩn giới hạn độ sâu—các chứng minh toán học phức tạp thường vượt quá 50 trang—trong khi các kho mã cho thấy việc duy trì các phiên làm việc kéo dài giúp giải quyết vấn đề sâu hơn. Khi AI đạt được tính độc lập và trí nhớ, chuyên môn của con người trở nên có giá trị hơn, không phải ít hơn. Người lao động cần giữ lại kiến thức nền tảng sâu để thách thức và xác minh các câu trả lời của máy, và các tổ chức sẽ cần các bộ lọc tự động và hệ thống danh tiếng mới để duy trì niềm tin giữa một dòng nghiên cứu do AI hỗ trợ tràn ngập.

Xem nguồn

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.

Tin tức liên quan

04-29 03:35

Báo cáo a16z Crypto: Tác nhân AI đạt tỷ lệ thành công lên tới 70% trong việc khai thác các lỗ hổng thao túng giá DeFi với kiến thức có cấu trúc

04-28 18:52

Anthropic Đạt Định Giá $1 Nghìn Tỷ, Vượt Qua OpenAI Trên Các Thị Trường Thứ Cấp

04-28 08:31

Adobe Ra Mắt Firefly AI Assistant với Quy Trình Đa Ứng Dụng, Tích Hợp Claude

04-27 09:11

OpenAI's Greg Brockman: AI Shifting from Chat to Autonomous Task Execution

04-27 05:17

GPT-5.5 Trở Lại Tuyến Đầu Trong Lập Trình, Nhưng OpenAI Đổi Benchmark Sau Khi Thua Opus 4.7

Phân tích chuyên sâu