NVIDIA disponibiliza como código aberto a Arquitetura TwoTower, alcança aceleração de 2,42x na geração de texto

De acordo com a Beating, a NVIDIA disponibilizou como código aberto o Nemotron-Labs-TwoTower, uma arquitetura discreta de difusão de texto projetada para acelerar a geração de texto em modelos de linguagem de grande escala. O design de torre dupla separa um modelo autorregressivo congelado, que preserva a capacidade de raciocínio, de uma torre de denoising treinável, que gera texto em paralelo. Utilizando apenas 1/12 dos dados de pré-treinamento de referência em um modelo Mamba-Transformer mixture-of-experts de 30 bilhões de parâmetros, o TwoTower manteve 98,7% da qualidade de referência, ao mesmo tempo que aumentou a velocidade de geração em 2,42 vezes, sem sobrecarga adicional de memória.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários