Anthropic наконец выпустила безопасную версию модели Mythos Fable-5.


Об этом уже много говорили в сети, я не буду повторяться.
Более интересно — это реальные тесты задач, выполненные сторонним инструментом программирования Augment Code.
Этот набор тестов прошёл всего 489 программных задач, и результаты довольно интересные:
Fable-5 явно лидирует по общей производительности и точности.
Общий балл +0.224, точность +0.191, действительно сейчас это самая сильная категория.
Но ещё один важный момент: GPT-5.5 всё ещё уверенно превосходит Opus-4.8.
Общий балл GPT-5.5 — +0.164, Opus-4.8 — +0.128;
Точность GPT-5.5 — +0.141, Opus-4.8 — +0.092.
Это также объясняет моё последнее ощущение: после выхода Opus-4.8 я не почувствовал, что он явно сильнее GPT-5.5,
по крайней мере в реальных программных задачах это ощущение не иллюзия.
Более реалистичная проблема — это стоимость.
Fable-5, хоть и мощная, но потребление токенов и стоимость тоже высоки: примерно 14.6 тысяч токенов на задачу, стоимость $3.09 за задачу;
в то время как GPT-5.5 — 7.5 тысяч токенов, $1.52.
Мощь действительно есть, но и цена тоже очень высокая.
Поэтому в итоге всё сводится к одной фразе: ждём GPT-5.6 как можно скорее.
Если Fable-5 можно использовать только 10 дней по подписке, а потом придётся платить по стандартной API-цене,
то скорее всего это не станет инструментом повседневной работы для обычных пользователей, а останется “роскошной моделью” для немногих и немногих сценариев.
Использование ИИ-моделей, возможно, действительно начнёт делиться по классам.
Посмотреть Оригинал
post-image
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закреплено