Согласно последнему анализу блога Nvidia, стоимость GPU Blackwell почти вдвое выше за час по сравнению с поколением Hopper, но при этом они обеспечивают в 35 раз более низкие затраты на инференс в пересчёте на токен. В качестве тестовой модели используется DeepSeek-R1: Blackwell (GB300 NVL72) сдается в аренду по $2,65 за GPU в час против $1,41 для Hopper, однако пропускная способность одного GPU растет с 90 до 6 000 токенов в секунду. Этот 65-кратный прирост пропускной способности снижает затраты на миллион токенов с $4,20 до $0,12.

Показатель $0,12 предполагает полную оптимизацию ПО, включая инференс с низкой точностью FP4 и предсказание нескольких токенов (MTP). Если MTP не включена, затраты на миллион токенов достигают примерно $2,35, но при активной MTP они падают до $0,11, демонстрируя 21-кратное влияние оптимизации только от этой функции.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

04-30 04:01

OpenAI Traces Goblin Problem to Nerdy Personality Reward Signal, Goblin упоминает всплеск на 175% в GPT-5.1

04-30 02:31

Gorilla Technology расширяет сделку по инфраструктуре ИИ на $2.8B с индийской Yotta, добавляя 20,736 GPU B300

04-30 01:31

Выручка Cambricon удваивается в $421M в I квартале, благодаря рывку Китая в сфере ИИ-чипов

04-29 13:41

Alibaba Cloud Снижает Цену Неявного Кэша DeepSeek-V4-Pro до 1 Юаня за Миллион Токенов 29 Апреля

04-28 23:21

NVIDIA запускает Nemotron 3 Nano Omni — мультимодальную открытую модель для корпоративных ИИ-агентов

Детальный анализ

Alphabet 財報超預期，GOOG 上漲6% 創新高

ChainNewsAbmedia04-29 21:47

Вице-президент по глубокому обучению в Nvidia считает, что расходы на ИИ-вычисления превышают затраты на зарплаты персонала

ChainNewsAbmedia04-29 21:44

Аналитики по полупроводникам настроены оптимистично по поводу рынка ИИ: «как минимум еще на три года» — передовая упаковка является главной «узкой» частью отрасли

ChainNewsAbmedia04-29 08:04

комментарий

0/400

Нет комментариев