A API Fusion da OpenRouter corresponde ao desempenho do Claude Fable 5 a metade do custo

A OpenRouter lançou a Fusion a 12 de junho, uma API do lado do servidor que distribui prompts por múltiplos modelos de IA em simultâneo e sintetiza as suas respostas numa resposta única. A empresa desenvolveu o sistema para oferecer um desempenho comparável ao Claude Fable 5 a cerca de metade do custo, segundo testes de referência no conjunto de dados DRACO da Perplexity. O lançamento ocorreu pouco depois de a Anthropic ter suspendido o acesso ao Fable 5 e ao Mythos 5 na sequência de uma diretiva de controlo de exportações dos EUA que citava uma descoberta de jailbreak contestada, criando uma lacuna no mercado para alternativas de IA de alto desempenho acessíveis a utilizadores internacionais.

OpenRouter Fusion Usa Arquitetura em Painel Multi-Modelo

A Fusion funciona ao enviar um único prompt para vários modelos de IA em paralelo, com cada modelo a receber acesso a ferramentas de pesquisa na web e bash. Um modelo juiz extrai pontos de consenso, contradições e zonas cegas a partir de todas as respostas. O Claude Opus 4.8 funciona como sintetizador predefinido, gerando a resposta final com base na análise do juiz. Os utilizadores podem aceder à Fusion alterando a sua string de modelo para "openrouter/fusion" para uma configuração de painel predefinida, adicionando uma ferramenta de fusion para chamadas seletivas, ou criando painéis personalizados através da interface da sala de chat da Fusion sem necessidade de codificação.

Painel de IA Orçamental Obtém 64,7% no Benchmark DRACO

A OpenRouter testou a Fusion no DRACO, um benchmark da Perplexity construído a partir de pedidos reais de deep research de utilizadores. Um painel que combina o Fable 5 e o GPT-5.5 da OpenAI, sintetizado pelo Opus, atingiu a pontuação mais alta, de 69%. O Fable 5 em modo único obteve 65,3%, embora sete das suas 100 tarefas não tenham sido executadas devido a bloqueios do filtro de conteúdo. A configuração orçamental — Gemini 3 Flash combinado com Kimi K2.6 e DeepSeek V4 Pro, sintetizado pelo Opus — obteve 64,7%, ultrapassando o GPT-5.5 em modo único (60%) e o Opus 4.8 em modo único (58,8%) a cerca de metade do custo do Fable 5. Um painel que emparelha o Opus 4.8 com uma instância separada do próprio obteve 65,5%, representando uma melhoria de 6,7 pontos face ao Opus em modo único; a OpenRouter atribuiu cerca de três quartos deste ganho ao passo de síntese e o restante à diversidade de modelos. A empresa identificou um risco de contaminação em que os modelos acedem ao quadro de avaliação do DRACO através de resultados de pesquisa na web, o que a OpenRouter resolveu ao excluir os domínios de alojamento do benchmark das ferramentas de pesquisa. Todas as pontuações publicadas refletem esta configuração corrigida.

Lançamento da Fusion Segue-se à Suspensão do Fable 5

A Anthropic suspendeu na semana passada o Fable 5 e o Mythos 5 para todos os nacionais estrangeiros em todo o mundo após uma diretiva de controlo de exportações dos EUA que citava uma descoberta de jailbreak contestada. A OpenRouter anunciou a Fusion no dia seguinte, afirmando que a API entrega "inteligência ao nível do Fable a metade do preço". A Fusion funciona inteiramente com modelos encaminhados através da infraestrutura da OpenRouter e não resolve as restrições subjacentes ao controlo de exportações.

OpenRouter Identifica Limitações da Fusion para Tarefas de Codificação

A OpenRouter afirmou que a Fusion não serve como substituto completo do Fable 5. O benchmark DRACO exclui trabalho de longo horizonte, em que o Fable 5 supostamente mantém uma vantagem. Para aplicações de codificação, a Fusion funciona como uma ferramenta que os modelos de programação chamam de forma seletiva, em vez de uma substituição total. A OpenRouter posicionou a Fusion para deep research, planeamento complexo e tarefas em que o cruzamento de perspetivas de múltiplos modelos agrega valor. O investigador de IA Andrew Trask classificou o lançamento como "um assunto muito maior do que parece", argumentando que os laboratórios de fronteira deixarão de controlar exclusivamente a fronteira. Os críticos apontaram resultados fracos na codificação, chamadas de ferramentas inadequadas e falta de transparência devido à indisponibilidade do Fable 5 para comparação direta.

FAQ

O que é que a OpenRouter lançou a 12 de junho?
A OpenRouter lançou a Fusion, uma API do lado do servidor que envia prompts para múltiplos modelos de IA em paralelo, usa um modelo juiz para analisar as respostas e emprega um sintetizador para produzir uma resposta unificada.

Como é que o painel de IA orçamental se saiu no benchmark DRACO?
O painel orçamental que combina Gemini 3 Flash, Kimi K2.6 e DeepSeek V4 Pro obteve 64,7% no DRACO, ficando a menos de um ponto percentual da pontuação do Fable 5 em modo único (65,3%) a cerca de metade do custo.

Porque é que a Anthropic suspendeu o Fable 5 e o Mythos 5?
A Anthropic suspendeu o Fable 5 e o Mythos 5 na semana passada na sequência de uma diretiva de controlo de exportações dos EUA que citava uma descoberta de jailbreak contestada, afetando todos os nacionais estrangeiros em todo o mundo.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário