OpenAI запускает протокол MRC Network с AMD, Intel, NVIDIA; поддерживает 100 000+ GPU

Согласно объявлению OpenAI от 6 мая, компания сотрудничала с AMD, Broadcom, Intel, Microsoft и NVIDIA, чтобы запустить Multipath Reliable Connection (MRC) — открытый сетевой протокол для соединения GPU в кластерах крупномасштабного ИИ-обучения. Протокол разбивает отдельные передачи данных на сотни маршрутов, чтобы снизить перегрузку магистралей, и обеспечивает обход с задержками на уровне микросекунд при сбоях каналов и коммутаторов.

OpenAI уже развернула MRC в своем суперкомпьютере Stargate (собранном на OCI) и в суперкомпьютере Microsoft Fairwater, что позволяет подключать более 100 000 GPU всего с двумя уровнями коммутаторов при одновременном снижении энергопотребления и требований к аппаратному обеспечению. Спецификация MRC была опубликована для отрасли через Open Compute Project.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев