Tencent Hunyuan presenta el algoritmo de atención dispersa Stem, reduce la latencia del primer token 3,7 veces en contexto de 128K

Según Guru Club, el 5 de junio Tencent Hunyuan dio a conocer el algoritmo de atención dispersa Stem, aceptado por la principal conferencia de aprendizaje automático ICML-26. El algoritmo logra una precisión casi sin pérdida con un presupuesto del 25% mediante Token Position Decay (TPD) y Output-Aware Metric (OAM), reduciendo la latencia del primer token en 3,7x a una longitud de contexto de 128K cuando se combina con operadores HPC.
Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios