DeepSeek додає режим Vision, оскільки китайські чипи відповідають підтримці запуску

DeepSeek, компанія з галанчжоу в галузі штучного інтелекту, додала можливості розпізнавання зображень і відео до свого основного чатбота через нову функцію «режим розпізнавання зображень», зрівнявшись із іншими провідними чатботами зі ШІ. Запуск збігся зі значущою віхою в ланцюгу постачання китайських чипів: чотири вітчизняні напівпровідникові компанії — Huawei Ascend, Cambricon, Hygon Information і Moore Threads — підтвердили підтримку у той самий день для нового флагманського модельного релізу DeepSeek, DeepSeek-V4, засвідчивши зсув від попередніх місячних періодів адаптації, що були типовими поза екосистемою Nvidia.

Бачення DeepSeek та розширення моделей

DeepSeek непомітно запустила режим розпізнавання зображень разом із двома іншими режимами, які з’явилися раніше цього місяця: «expert» і «flash». За словами Чен Сяоканґа, керівника мультимодальної команди DeepSeek, інструмент уперше протестували на невеликій групі користувачів як на вебсайті, так і в мобільному застосунку. Чен Делі, старший дослідник компанії, відсвяткував запуск дописом із посиланням на логотип компанії: «Маленький кит тепер може бачити».

Функція для зображень і відео надійшла через кілька днів після того, як DeepSeek випустила попередній перегляд DeepSeek-V4 і зробила ваги моделі доступними для публічного завантаження та використання. V4 має структуру з двох окремих моделей: DeepSeek-V4-Pro, що містить 1,6 трлн параметрів і призначена для складних міркувань та багатокрокових автоматизованих робочих процесів, і DeepSeek-V4-Flash, оптимізовану для обробки великих обсягів запитів із нижчою вартістю. Обидві моделі підтримують контекстне вікно в один мільйон токенів і використовують гібридний дизайн уваги, який компанія стверджує, що зменшує потреби в обчислювальній потужності та пам’яті під час інференсу.

Китайські виробники чипів досягли підтримки запуску в той самий день

Те, що привернуло увагу індустрії, — це було не лише сама модель, а й скоординована апаратна підтримка, продемонстрована в день релізу V4. Huawei Ascend підтвердила сумісність із її чипами A2, A3 та 950, причому Ascend 950 використовує злиті обчислювальні процеси та паралельні потоки обробки, щоб прискорити інференс як для V4-Pro, так і для V4-Flash. Cambricon завершила адаптацію, використавши відкритий фреймворк vLLM для інференсу, і опублікувала свій код на GitHub. Hygon Information виконала глибоку оптимізацію моделей на своїй платформі DCU, щоб забезпечити плавний перехід від релізу моделі до розгортання. Moore Threads співпрацювала з Пекінською академією штучного інтелекту, щоб запустити V4 на своїй карті MTT S5000, використовуючи програмний стек FlagOS.

Ця підтримка в той самий день на кількох наборах чипів є відхиленням від історичних патернів. Раніше апаратне забезпечення поза екосистемою Nvidia зазвичай потребувало місяців, щоб почати підтримувати важливі нові моделі. Спостерігачі ринку зазначають, що досягнення сумісності з чотирма різними вітчизняними чипсетами в день запуску свідчить про справжній зсув у зрілості китайської напівпровідникової та AI-інфраструктури.

Стратегічні наслідки: вартість і незалежність від ланцюгів постачання

Значущість загалом запуску DeepSeek виходить за межі окремих технічних досягнень. Дозволяючи V4 нативно працювати одночасно на кількох китайських чипах, DeepSeek знижує ризик залежності від експортних обмежень, які історично блокували китайські компанії від доступу до найпросунутіших американських процесорів. Ефективність за витратами залишається центральною в стратегії DeepSeek — компанія робила акцент на тому, щоб утримувати витрати на роботу моделей низькими, даючи бізнесам можливість будувати автоматизовані системи без непосильних обчислювальних витрат.

Спостерігачі ринку характеризують цей реліз як віддзеркалення того, що дозріває цілий ланцюг постачання, а не як окремий технічний прорив. Координація між DeepSeek, виробниками чипів і програмними фреймворками демонструє інтегрований розвиток екосистеми. Така траєкторія вказує, що конкурентний ландшафт у галузі AI зміщується: з акценту на досконалість окремих моделей до здатності підтримувати повні, економічні та незалежні системи в довгостроковій перспективі.

FAQ

Які нові можливості DeepSeek додав до свого чатбота? DeepSeek додав «режим розпізнавання зображень», який дозволяє його чатботу розуміти фото та відео, а не лише текст. Цю функцію вперше протестували на невеликій групі користувачів як на вебсайті, так і в мобільному застосунку, тож можливості DeepSeek стали узгоджені з іншими провідними чатботами зі ШІ, які пропонують подібні здібності.

Які китайські компанії з чипів підтримали DeepSeek-V4 у день запуску? Чотири китайські компанії з чипів підтвердили підтримку DeepSeek-V4 у день запуску: Huawei Ascend (with A2, A3, and 950 chips), Cambricon, Hygon Information і Moore Threads. Така сумісність у день запуску на кількох чипсетах раніше була рідкістю поза екосистемою Nvidia, зазвичай вимагаючи місяців робіт з адаптації.

Які існують дві версії DeepSeek-V4 і чим вони відрізняються? DeepSeek-V4-Pro має 1,6 трлн параметрів і призначена для складних міркувань та багатокрокових автоматизованих робочих процесів, тоді як DeepSeek-V4-Flash оптимізована для обробки великих обсягів запитів із нижчою вартістю. Обидві підтримують контекстне вікно в один мільйон токенів і використовують гібридний дизайн уваги, щоб зменшити потреби в обчислювальній потужності та пам’яті.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
TransparentDomeCityvip
· 05-02 09:50
Вітчизняні великі моделі розвиваються досить швидко, але екосистема ще відстає
Переглянути оригіналвідповісти на0
BlueGlassJellyvip
· 05-01 16:16
Завод у Ханчжоу піднімається, мультимодальність стала стандартом
Переглянути оригіналвідповісти на0
AprDaydreamvip
· 04-30 01:15
DeepSeek ця хвиля оновлень, класно, нарешті не потрібно заздрити GPT-4V
Переглянути оригіналвідповісти на0
RugProofRitavip
· 04-29 21:26
Щойно спробував розпізнавання зображень, розуміння китайської дійсно краще, ніж у деякої компанії.
Переглянути оригіналвідповісти на0
ybaservip
· 04-29 20:02
Тримайтеся міцно HODL💎 Тримайтеся міцно HODL💎
Переглянути оригіналвідповісти на0
GateUser-0b71fc11vip
· 04-29 19:28
Від чистого тексту до мультимодальності — за півроку пройшли шлях, на який іншим потрібно два роки
Переглянути оригіналвідповісти на0
MirrorBallGazingAtTheSkyvip
· 04-29 19:27
Не хвалися лише словами, чи вирішили проблему галюцинацій RAG?
Переглянути оригіналвідповісти на0
GateUser-ced0257avip
· 04-29 19:22
Розпізнавання відео? Прошу оцінити стабільність у складних сценаріях
Переглянути оригіналвідповісти на0
GateUser-8f9ccfecvip
· 04-29 19:20
Це час публікації вийшов ідеальним, якраз підхоплює тренд на чіпи
Переглянути оригіналвідповісти на0
GateUser-cb789e81vip
· 04-29 19:15
Зниження витрат — це справжнє мистецтво, чекати ціну API
Переглянути оригіналвідповісти на0
Дізнатися більше