Офіційний запуск Google Gemini 3.1 Flash-Lite: ціна введення на 75% нижча, ніж у Claude 4.5 Haiku, а результат GPQA — 86,9%

За Beating, Google Gemini 3.1 Flash-Lite перейшов з режиму попереднього доступу до загальної доступності (GA) 8 травня, ставши найдешевшою та найшвидшою моделлю в лінійці Gemini 3. Вартість введення встановлено на рівні $0,25 за мільйон токенів, а виведення — $1,50 за мільйон токенів: витрати на введення на 75% нижчі, ніж у Claude 4.5 Haiku ($1,00), а на виведення — на 70% нижчі ($5,00). Модель має контекстне вікно на 1 мільйон токенів і досягає пропускної здатності 363 токени за секунду — на 45% швидше, ніж попередник Gemini 2.5 Flash.

Бенчмарки продуктивності показують GPQA Diamond (розуміння на рівні випускних курсів природничих наук) на рівні 86,9%, що перевищує 73,0% у Claude 4.5 Haiku та 82,3% у GPT-5 mini. MMMU-Pro (мультимодальне міркування) досягає 76,8%. Серед ранніх користувачів — платформа для клієнтського сервісу Gladly, яка повідомляє про зниження витрат на 60% і показник успішності 99,6% на продакшн-навантаженнях, а також JetBrains, що інтегрувала Flash-Lite у інструменти IDE для допомоги розробникам.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів