Modelos pequenos geram JSON diretamente, a extração de documentos no lado do cliente finalmente não precisa mais de escrever um pequeno texto antes de analisar, com 450M consegue rodar bem, muito conveniente

Ver original
CoinNetwork
Liquid AI modelo multimodal de pequeno porte de código aberto: extrair imagens diretamente no lado do dispositivo como dados estruturados JSON
Liquid AI lança duas modelos multimodais de pequeno porte de código aberto, lfm2.5-vl-1.6b-extract e lfm2.5-vl-450m-extract, otimizados para extração de dados estruturados de imagens, podendo converter imagens diretamente em JSON no dispositivo com base na lista de campos, eliminando a etapa de geração de texto completo e posterior análise. Oferecendo versões de 1,6b e 450m, seguem a licença aberta lf open license v1.0. Os testes oficiais mostram desempenho excelente em digitalização de documentos, compreensão de cabines de veículos e inspeção industrial; nos testes de referência, o de 1,6b é comparável a modelos gerais de 4b, enquanto o de 450m equivale a um modelo de 2b. Já estão disponíveis para download de pesos no Hugging Face.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado