DeepSeek 30 квітня представив метод Visual Primitives для покращення мультимодальних міркувань

2026-04-30 11:04:21

Згідно з технічним звітом DeepSeek, 30 квітня компанія представила Visual Primitives — метод, який вбудовує базові візуальні елементи, зокрема точки та рамки, у ланцюги міркувань, щоб подолати проблему Reference Gap у мультимодальних задачах. Метод зменшує споживання токенів зображень завдяки стисненню KV cache.

У тестах з лічби та просторових міркувань підхід відповідає за продуктивністю GPT-5.4, Claude-Sonnet-4.6 та Gemini-3-Flash на вибраних вимірах. DeepSeek заявила, що відкриє вихідний код частин бенчмарків і наборів даних, а ваги моделей буде випущено після інтеграції.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

04-30 11:01

NVIDIA випустила ваги флагманської моделі Cosmos-Reason2-32B і розширила контекстне вікно до 256K токенів

04-30 02:41

Apple планує AI-режим Siri для камери iPhone в iOS 27, попередній перегляд на WWDC у червні

04-29 13:41

Alibaba Cloud знизила ціну неявного кешу DeepSeek-V4-Pro до 1 юаня за мільйон токенів 29 квітня

04-29 10:37

DeepSeek запускає функцію розпізнавання зображень у режимі бета-тестування

04-29 09:09

Дослідник мультимодального напрямку DeepSeek натякає на нову візійну модель 29 квітня

Поглиблений аналіз