Mistral Lança Leanstral 1.5 para Provas Formais, Reduz Custo para ~US$ 4 por Problema

De acordo com a OneMillion_AI, a Mistral AI lançou recentemente o Leanstral 1.5, um modelo de prova formal para Lean 4 com 119 bilhões de parâmetros totais e 65 bilhões de parâmetros ativos. O modelo é lançado sob licença Apache-2.0 com acesso gratuito à API. No PutnamBench, o Leanstral 1.5 alcança um custo médio de aproximadamente US$ 4 por problema para resolver, significativamente menor do que sistemas anteriores que custavam dezenas a centenas de dólares por problema.

O modelo resolve 587 dos 672 problemas do PutnamBench e atinge 87% no benchmark de álgebra abstrata FATE-H e 34% no FATE-X, estabelecendo novos recordes de desempenho em sua categoria. Além de provas matemáticas, o Leanstral 1.5 também foi aplicado à verificação de código, descobrindo 11 bugs reais em 57 repositórios Rust de código aberto, sendo 5 anteriormente não relatados.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários