Theo thông báo của OpenAI ngày 6/5, công ty đã hợp tác với AMD, Broadcom, Intel, Microsoft và NVIDIA để ra mắt Multipath Reliable Connection (MRC) — một giao thức mạng mở nhằm kết nối GPU cho các cụm huấn luyện AI quy mô lớn. Giao thức chia một lần truyền dữ liệu thành nhiều tuyến đường khác nhau trong hàng trăm đường dẫn để giảm tắc nghẽn ở lõi và cho phép vượt qua lỗi liên kết cũng như lỗi switch ở mức mili giây.
OpenAI đã triển khai MRC trên siêu máy tính Stargate của mình (được xây dựng với OCI) và siêu máy tính Fairwater của Microsoft, cho phép kết nối hơn 100.000 GPU chỉ với hai lớp switch trong khi giảm mức tiêu thụ điện năng và yêu cầu phần cứng. Đặc tả MRC đã được công bố cho ngành thông qua Open Compute Project.