OpenAI và Broadcom công bố Jalapeño, chip AI tùy chỉnh đầu tiên cho suy luận mô hình ngôn ngữ lớn (LLM Inference)

OpenAI và Broadcom hôm nay đã công bố Jalapeño, Bộ xử lý thông minh đầu tiên của OpenAI được thiết kế cho suy luận mô hình ngôn ngữ lớn. Con chip đã được trao cho CEO OpenAI Sam Altman và Chủ tịch Greg Brockman bởi Chủ tịch kiêm CEO Broadcom Hock Tan và Chủ tịch Charlie Kawwas. Bộ tăng tốc này đại diện cho chip AI đầu tiên trong nền tảng tính toán đa thế hệ mà các công ty đang cùng xây dựng để làm cho AI tiên tiến nhanh hơn, đáng tin cậy hơn và dễ tiếp cận hơn. OpenAI đã thiết kế chip từ đầu dựa trên hiểu biết về nền tảng LLM, với Broadcom và Celestica giúp công nghiệp hóa nền tảng thông qua triển khai chip, tích hợp hệ thống bo mạch và rack, kết nối hiệu suất cao và hệ thống sản xuất có thể mở rộng.

OpenAI và Broadcom Trao Chip Jalapeño cho Ban Lãnh đạo Công ty

Việc bàn giao chip đánh dấu một bước quan trọng trong chiến lược của OpenAI nhằm xây dựng toàn bộ hệ thống phía sau các mô hình và sản phẩm của mình. Jalapeño được phát triển thông qua sự hợp tác giữa OpenAI, Broadcom và Celestica, với mỗi đối tác đóng góp chuyên môn riêng cho nền tảng.

OpenAI thiết kế kiến trúc chip dựa trên lộ trình các mô hình, kernel, hệ thống phục vụ và nhu cầu sản phẩm. Broadcom đóng góp triển khai chip và công nghệ mạng, bao gồm silicon Tomahawk, để đưa nền tảng vào sản xuất quy mô lớn. Celestica cung cấp chuyên môn về tích hợp hệ thống bo mạch, rack và hệ thống sản xuất có thể mở rộng.

Kiến trúc Jalapeño Tối ưu hóa cho Khối lượng Công việc Suy luận LLM

Jalapeño được thiết kế linh hoạt để hoạt động với tất cả LLM, dựa trên hiểu biết của OpenAI về nhu cầu suy luận của các mô hình AI hiện tại và tương lai trong toàn ngành. Các mẫu kỹ thuật đã chạy khối lượng công việc ML trong phòng thí nghiệm ở tần số và công suất mục tiêu sản xuất, bao gồm GPT-5.3-Codex-Spark.

Thử nghiệm ban đầu cho thấy Jalapeño sẽ mang lại hiệu suất trên mỗi watt tốt hơn đáng kể so với công nghệ tiên tiến hiện tại. Kiến trúc giảm chuyển động dữ liệu và cân bằng tài nguyên tính toán, bộ nhớ và mạng để đạt được mức sử dụng thực tế gần hơn nhiều với hiệu suất đỉnh lý thuyết. Một báo cáo kỹ thuật chi tiết sẽ được trình bày trong những tháng tới.

"Jalapeño được thiết kế từ đầu cho suy luận LLM bằng cách sử dụng những hiểu biết chi tiết từ sự hợp tác chặt chẽ của chúng tôi với các nhà nghiên cứu OpenAI," Richard Ho, người đứng đầu chương trình phần cứng của OpenAI, cho biết. "Chúng tôi đã tối ưu hóa kiến trúc xung quanh các kernel, chuyển động bộ nhớ, mạng và các mẫu phục vụ quan trọng nhất đối với các mô hình AI tiên tiến. Dựa trên thử nghiệm ban đầu, Jalapeño sẽ thực thi hiệu quả các khối lượng công việc quan trọng nhất của chúng tôi gần với giới hạn lý thuyết của phần cứng."

Con chip là thiết kế từ trang giấy trắng cho suy luận LLM hiện đại, không phải bộ tăng tốc đa năng được điều chỉnh từ các khối lượng công việc AI trước đó. Nó được định hình bởi các hệ thống mà OpenAI vận hành hàng ngày trên ChatGPT, Codex, API và các sản phẩm tác nhân trong tương lai. Mục tiêu là kết hợp sức mạnh và thông lượng của các bộ tăng tốc AI hàng đầu hiện nay với độ trễ gần hơn với các hệ thống suy luận chuyên dụng nhanh nhất.

Phát triển Hoàn thành trong 9 Tháng Sử dụng Thiết kế Hỗ trợ AI

Jalapeño được đồng phát triển từ thiết kế ban đầu đến tape-out sản xuất chỉ trong 9 tháng. Các công ty tin rằng đây là chu kỳ phát triển ASIC nhanh nhất từng đạt được trong chất bán dẫn tiên tiến hiệu suất cao.

Tiến độ nhanh này phản ánh sự đồng phát triển phần mềm-phần cứng sâu rộng với các đội kỹ thuật của OpenAI, chuyên môn triển khai silicon của Broadcom và việc sử dụng các mô hình OpenAI để tăng tốc các phần của quá trình thiết kế và tối ưu hóa. Các mô hình tương tự được phục vụ cho người dùng đang giúp cải thiện cơ sở hạ tầng dùng để chạy các mô hình trong tương lai.

Nền tảng Tính toán Đa thế hệ Được Lên kế hoạch với Broadcom và Celestica

Jalapeño là bước đầu tiên trong nền tảng tính toán đa thế hệ kết hợp các bộ tăng tốc do OpenAI thiết kế với triển khai silicon, mạng và công nghệ kết nối của Broadcom, cùng chuyên môn về bo mạch, rack và hệ thống của Celestica.

"Thế giới đang chuyển sang nền kinh tế dựa trên sức mạnh tính toán," Greg Brockman, Chủ tịch kiêm Đồng sáng lập của OpenAI, cho biết. "Jalapeño là một phần trong chiến lược cơ sở hạ tầng toàn diện dài hạn của chúng tôi nhằm làm cho tính toán trở nên dồi dào hơn, dẫn đến AI nhanh hơn, đáng tin cậy hơn, giá cả phải chăng hơn cho người dân và doanh nghiệp, và có thể được sử dụng để giải quyết nhiều vấn đề quan trọng hơn. Bằng cách tự thiết kế nhiều hơn trong hệ thống, chúng tôi có thể phục vụ nhiều trí thông minh hơn với hiệu quả cao hơn và tiếp tục thúc đẩy AI tiên tiến hướng tới khả năng tiếp cận rộng rãi hơn."

Triển khai Dự kiến vào Cuối năm 2026

Nền tảng tính toán đa thế hệ được thiết kế để triển khai ban đầu vào cuối năm 2026 và mở rộng trong những năm tiếp theo. OpenAI hoạt động trên toàn bộ hệ thống, bao gồm kiến trúc chip, kernel, hệ thống bộ nhớ, mạng, lập lịch, hệ thống triển khai và trải nghiệm sản phẩm, với mỗi lớp được tối ưu hóa nhằm làm cho các mô hình của họ nhanh hơn, đáng tin cậy hơn và giá cả phải chăng hơn cho người dùng.

FAQ

Jalapeño là gì và khi nào nó được công bố?

Jalapeño là Bộ xử lý thông minh đầu tiên của OpenAI, một bộ tăng tốc AI được thiết kế đặc biệt cho suy luận mô hình ngôn ngữ lớn. OpenAI và Broadcom đã công bố con chip hôm nay.

Mất bao lâu để phát triển Jalapeño?

Jalapeño được đồng phát triển từ thiết kế ban đầu đến tape-out sản xuất trong 9 tháng. Các công ty tin rằng đây là chu kỳ phát triển ASIC nhanh nhất từng đạt được trong chất bán dẫn tiên tiến hiệu suất cao.

Khi nào Jalapeño sẽ được triển khai?

Nền tảng tính toán đa thế hệ có Jalapeño được thiết kế để triển khai ban đầu vào cuối năm 2026, với kế hoạch mở rộng trong những năm tiếp theo.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận