Чи $NBIS зараз має найшвидший в світі висновок на $NVDA апаратному забезпеченні?


Nebius придбав Eigen AI за $643M грошей і акцій, безпосередньо впровюючи висновок Eigen та оптимізацію після тренування у Nebius Token Factory
У ключовій промові NVIDIA GTC 2026 Eigen AI зайняв перше місце за швидкістю виведення для Kimi K2.5 Reasoning, тоді як Nebius Fast був майже з ним у рівних умовах
Nebius Fast також посідає перше місце за швидкістю висновку на $NVDA апаратному забезпеченні для відкритої моделі ChatGPT, gpt-oss-120B
Більше того, Eigen посів перше місце серед постачальників на базі GPU для 25 відкритих моделей на Artificial Analysis, виключаючи постачальників ASIC, за замовчуванням з налаштуваннями 10K вхідних даних. Це також найшвидший постачальник для Qwen3 Coder 480B, з показником 255.8 т/с, випереджаючи Google Vertex з 169.2 т/с і Amazon з 121.3 т/с
Це означає, що Eigen приблизно на 51% швидший за Google Vertex і більш ніж у 2 рази швидший за Amazon за цим показником
━━━━━━━━━━━━━━━━━━━━
Хоча вартість придбання здається високою, якщо Eigen справді зможе покращити $NBIS висновкову продуктивність, навіть трохи, це матиме накопичувальний довгостроковий ефект на доходи та конкурентоспроможність, що, ймовірно, окупить себе більше ніж повністю
━━━━━━━━━━━━━━━━━━━━
Nebius володіє GPU-хмарою, тоді як Eigen покращує ефективність використання цих GPU для генерації токенів. На тому ж обладнанні NVIDIA продуктивність залежить не лише від капітальних витрат. Це стосується використання GPU, оптимізації моделей, пакетування, затримки, управління пам’яттю та користувацьких ядер
Стек Eigen зосереджений на таких сферах, як кільковання, оптимізація KV-кешу, розрідженість, спекулятивне декодування, користувацькі ядра CUDA і Triton, безперервне пакетування та оптимізація під час виконання
Якщо Nebius зможе отримати більше пропускної здатності висновку з того ж обладнання NVIDIA, це покращить дохідність, собівартість за токен і валову маржу без необхідності пропорційного збільшення капітальних витрат
$NBIS йде до того, щоб стати компанією з багатомільярдним щорічним доходом, що означає, що навіть кілька відсоткових пунктів покращення висновку можуть принести сотні мільйонів у заощадженнях
━━━━━━━━━━━━━━━━━━━━
Відкриті моделі швидко розвиваються. Kimi, Qwen, DeepSeek, GLM, Llama, Nemotron, MiniMax та інші моделі потребують постійної оптимізації, щоб залишатися конкурентоспроможними
Інтегруючи Eigen, Nebius також може швидше випускати оптимізовані версії та робити Token Factory більш привабливим для розробників і корпоративних клієнтів
EIGEN-0,33%
Переглянути оригінал
post-image
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 1
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Saidur48
· 05-02 05:28
2026 ГОДИНОЮ ГОДИНОЮ 👊
Переглянути оригіналвідповісти на0
  • Закріпити