За Beating, Google Gemini 3.1 Flash-Lite перейшов з режиму попереднього доступу до загальної доступності (GA) 8 травня, ставши найдешевшою та найшвидшою моделлю в лінійці Gemini 3. Вартість введення встановлено на рівні $0,25 за мільйон токенів, а виведення — $1,50 за мільйон токенів: витрати на введення на 75% нижчі, ніж у Claude 4.5 Haiku ($1,00), а на виведення — на 70% нижчі ($5,00). Модель має контекстне вікно на 1 мільйон токенів і досягає пропускної здатності 363 токени за секунду — на 45% швидше, ніж попередник Gemini 2.5 Flash.

Бенчмарки продуктивності показують GPQA Diamond (розуміння на рівні випускних курсів природничих наук) на рівні 86,9%, що перевищує 73,0% у Claude 4.5 Haiku та 82,3% у GPT-5 mini. MMMU-Pro (мультимодальне міркування) досягає 76,8%. Серед ранніх користувачів — платформа для клієнтського сервісу Gladly, яка повідомляє про зниження витрат на 60% і показник успішності 99,6% на продакшн-навантаженнях, а також JetBrains, що інтегрувала Flash-Lite у інструменти IDE для допомоги розробникам.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

05-08 00:08

OpenAI запускає модель GPT-5.5-Cyber і фреймворк Trusted Access для кіберзахисників

05-07 08:11

Snap завершує угоду з Perplexity AI, скасовує виплату $400 мільйонів

05-07 04:21

Google та Naver запускають push-рекламу в інструментах пошуку на базі ШІ; дохід Naver у I кварталі зростає на 16,3% до 2,22 млрд доларів

05-07 02:04

Зростання користувачів Gemini і Claude прискорюється в квітні, тоді як зростання ChatGPT сповільнюється до 30% YoY

05-06 07:57

SenseNova U1 зменшує витрати на генерацію зображень до однієї десятої зображень ChatGPT Images 2.0, SenseTime публікує першу прибуткову половину у 2025 році

Поглиблений аналіз