Huawei Ascend 910C completa el postentrenamiento de parámetros completos para DeepSeek-V4-Pro con 1,6 billones de parámetros

Según el gobierno de Shenzhen, el 5 de junio un equipo de investigación, incluido Huawei Technologies, completó el postentrenamiento de parámetros completos para DeepSeek-V4-Pro usando los chips Ascend 910C de la empresa. El proyecto ejecutó el modelo más grande de DeepSeek hasta la fecha, con 1,6 billones de parámetros, en un clúster impulsado por más de 1.000 chips Huawei. El equipo estuvo compuesto por Huawei, Shenzhen Loop Area Institute, el campus de Shenzhen de la Harbin Institute of Technology y el Shenzhen Research Institute of Big Data. Esto marca un paso en los esfuerzos de China por avanzar de la inferencia de IA al entrenamiento de modelos utilizando hardware nacional bajo las restricciones de exportación de EE. UU.
Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios