Али Qianwen выпустила мультимодальную модель Qwen3.5-Omni, поддерживающую распознавание 113 видов речи

Новости Gate News, 30 марта, Alibaba Qianwen объявила о запуске универсальной мультимодальной модели Qwen3.5-Omni. Эта серия включает Instruct-версии трех размеров: Plus, Flash и Light; поддерживает контекст длиной 256k. Модель поддерживает ввод аудио более 10 часов и ввод аудио/видео более 400 секунд в формате 720P (1FPS). Модель проходит нативное мультимодальное предобучение на огромных массивах текстовых, визуальных данных и аудио/видео данных объемом более 100 млн часов, демонстрируя выдающиеся способности к мультимодальному восприятию и генерации. По сравнению с предыдущей Qwen3-Omni, Qwen3.5-Omni значительно усилила мультиязычные возможности: она может поддерживать распознавание речи на 113 языках и диалектах, а также генерацию речи на 36 языках и диалектах.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев