Tinygrad relata que o GLM 5.2 atinge 120 tokens por segundo numa configuração dupla Blackwell por 150.000 dólares

De acordo com a BlockBeats, a 21 de junho, a Tinygrad afirmou que a GLM 5.2 atinge uma velocidade de inferência de 120 tokens por segundo numa configuração tinybox com uma arquitetura Blackwell de dupla rede. A configuração de 150.000 dólares está disponível quer como duas unidades standard tinybox quer como uma tinybox Pro. A Tinygrad posiciona a oferta como uma alternativa de implementação privada a serviços de inferência baseados na nuvem, com o slogan "compre uma vez, nunca mais pague taxas de nuvem". A GLM ainda não confirmou oficialmente as alegações de desempenho.
Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário