A Alibaba Qianwen lançou o modelo de linguagem multimodal completo Qwen3.5-Omni, com suporte para 113 tipos de reconhecimento de voz

Gate Notícias, 30 de março, a Ali Qianwen anunciou o lançamento do modelo de linguagem geral multimodal Qwen3.5-Omni. Esta série inclui versões Instruct em três tamanhos: Plus, Flash e Light, com suporte a contexto longo de 256k; o modelo suporta mais de 10 horas de entrada de áudio e mais de 400 segundos de entrada de vídeo e áudio em 720P (1FPS). O modelo é treinado nativamente em pré-treino multimodal em grandes volumes de dados de texto, visão e mais de 100 milhões de horas de dados de vídeo e áudio, demonstrando capacidades excecionais de perceção e geração multimodais. Em comparação com o antecessor Qwen3-Omni, o Qwen3.5-Omni melhora significativamente as capacidades multilingues, conseguindo suportar reconhecimento de voz em 113 línguas e dialetos e geração de voz em 36 línguas e dialetos.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários