A Alibaba Qianwen lançou o modelo de linguagem multimodal completo Qwen3.5-Omni, com suporte para 113 tipos de reconhecimento de voz

Gate Notícias, 30 de março, a Ali Qianwen anunciou o lançamento do modelo de linguagem geral multimodal Qwen3.5-Omni. Esta série inclui versões Instruct em três tamanhos: Plus, Flash e Light, com suporte a contexto longo de 256k; o modelo suporta mais de 10 horas de entrada de áudio e mais de 400 segundos de entrada de vídeo e áudio em 720P (1FPS). O modelo é treinado nativamente em pré-treino multimodal em grandes volumes de dados de texto, visão e mais de 100 milhões de horas de dados de vídeo e áudio, demonstrando capacidades excecionais de perceção e geração multimodais. Em comparação com o antecessor Qwen3-Omni, o Qwen3.5-Omni melhora significativamente as capacidades multilingues, conseguindo suportar reconhecimento de voz em 113 línguas e dialetos e geração de voz em 36 línguas e dialetos.
Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário