У нещодавньому блозі Nvidia йдеться, що GPU Blackwell коштують майже вдвічі дорожче за годину порівняно з поколінням Hopper, але забезпечують у 35 разів нижчі витрати на інференс на токен. Як тестову модель використали DeepSeek-R1: оренда Blackwell (GB300 NVL72) становить $2,65 за GPU на годину проти $1,41 для Hopper, однак пропускна здатність одного GPU зростає з 90 до 6 000 токенів за секунду. Такий приріст пропускної здатності у 65 разів знижує витрати на мільйон токенів з $4,20 до $0,12.

Показник $0,12 передбачає повну оптимізацію програмного забезпечення, включно з інференсом у низькій точності FP4 та багатотокенним прогнозуванням (MTP). Якщо MTP не ввімкнено, витрати на мільйон токенів досягають приблизно $2,35, а з увімкненим MTP падають до $0,11, демонструючи, що лише ця функція дає ефект оптимізації у 21 раз.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

04-30 04:01

OpenAI відстежує «ґоблінську» проблему до винагородного сигналу нердьової особистості та спостерігає сплеск згадок «ґобліна» на 175% у GPT-5,1

04-30 02:31

Gorilla Technology розширює $2.8B угоду з інфраструктури ШІ з Індії з Yotta, додаючи 20,736 B300 GPU

04-30 01:31

Виручка Cambricon Подвоюється в I кварталі до $421M , Завдяки Поштовху Китаю до AI-чипів

04-29 13:41

Alibaba Cloud знизила ціну неявного кешу DeepSeek-V4-Pro до 1 юаня за мільйон токенів 29 квітня

04-28 23:21

NVIDIA представляє Nemotron 3 Nano Omni — мультимодальну модель з відкритим кодом для корпоративних ШІ-агентів

Поглиблений аналіз