Tinygrad informa que GLM 5.2 logra 120 tokens por segundo en una configuración dual de Blackwell por $150,000

De acuerdo con BlockBeats, el 21 de junio, Tinygrad informó que GLM 5.2 alcanza 120 tokens por segundo de velocidad de inferencia en una configuración tinybox con una arquitectura Blackwell de doble red. La configuración de $150.000 está disponible en dos unidades estándar tinybox o en una tinybox Pro. Tinygrad presenta la oferta como una alternativa de despliegue privado a los servicios de inferencia basados en la nube, con el eslogan "compra una vez, nunca pagues comisiones de la nube". GLM no ha confirmado oficialmente las afirmaciones de rendimiento.
Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios