OpenAI выпускает три голосовые модели в Realtime API; GPT-Realtime-2 предлагает контекстное окно на 128K

Beating: OpenAI выпустила три голосовые модели в своей Realtime API: GPT-Realtime-2 для голосового общения с рассуждениями, GPT-Realtime-Translate для перевода в реальном времени и GPT-Realtime-Whisper для потоковой транскрибации. GPT-Realtime-2 — первая голосовая модель OpenAI с возможностями рассуждений на уровне GPT-5: она расширяет контекстное окно с 32K до 128K токенов и поддерживает до 1-2 часов плотного разговора.

GPT-Realtime-2 улучшила на 15,2% результат в бенчмарке Big Bench Audio и на 13,8% — в Audio MultiChallenge по сравнению с GPT-Realtime-1.5. GPT-Realtime-Translate поддерживает 70+ входных языков и перевод на 13 выходных языков. Цены: GPT-Realtime-2 — $32 за 32k входных токенов и $64 за 128k выходных токенов; Translate — $0,034 за минуту; Whisper — $0,017 за минуту.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев