D’après Citrini Research, le 16 juin, AMD et Apple font progresser simultanément des alternatives aux DRAM basées sur la mémoire flash dans leurs produits d’IA. AMD a acquis MEXT pour optimiser les performances de stockage flash proches de celles des DRAM, réduisant ainsi les coûts de mémoire des centres de données ; Apple a déployé la technologie « LLM in a flash » pour obtenir une optimisation similaire au niveau du périphérique.
La dernière recherche de Citrini indique que les besoins en KV cache lors de l’inférence IA et la consommation de HBM, soit 25% de la capacité de production des DRAM, créent d’importantes pressions sur les coûts mémoire. Les coûts du stockage flash ne représentent que 1/55 de ceux des DRAM, et grâce à l’optimisation des contrôleurs, à l’empilement NAND et à l’ajustement du mode de cellule, il propose des alternatives viables en capacité et en bande passante pour l’IA de bord.