Google Gemini 3.1 Flash-Lite Официально Запускается: Стоимость Ввода На 75% Дешевле, Чем Claude 4.5 Haiku, Результат GPQA — 86,9%

По данным Beating, Google Gemini 3.1 Flash-Lite перешёл из режима предпросмотра в общую доступность (GA) 8 мая, став самым дешёвым и быстрым в серии Gemini 3. Стоимость ввода установлена на уровне $0,25 за миллион токенов, а вывода — $1,50 за миллион токенов: ввод на 75% дешевле, чем у Claude 4.5 Haiku ($1,00), а вывод — на 70% дешевле ($5,00). Модель поддерживает контекстное окно в 1 миллион токенов и достигает пропускной способности 363 токена в секунду — на 45% быстрее, чем её предшественник Gemini 2.5 Flash.

Бенчмарки производительности показывают GPQA Diamond (рассуждения на уровне аспирантуры по науке) на уровне 86,9%, что выше Claude 4.5 Haiku (73,0%) и GPT-5 mini (82,3%). MMMU-Pro (мультимодальное рассуждение) достигает 76,8%. Среди ранних пользователей — платформа для клиентской поддержки Gladly, которая сообщает о снижении затрат на 60% и 99,6% успешности на рабочих нагрузках в продакшене, а также JetBrains, интегрировавшая Flash-Lite в инструменты IDE для помощи пользователям.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев