De acordo com a Citrini Research, em 16 de junho, AMD e Apple estão, simultaneamente, avançando alternativas baseadas em memória flash ao DRAM em produtos de IA. A AMD adquiriu a MEXT para otimizar o desempenho do armazenamento flash próximo aos níveis do DRAM, reduzindo os custos de memória de data centers; a Apple implementou a tecnologia “LLM in a flash” para obter uma otimização semelhante na borda do dispositivo.
A mais recente pesquisa da Citrini indica que as demandas de KV cache na inferência de IA e o uso de HBM, que consomem 25% da capacidade de produção de DRAM, geram pressões significativas de custo com memória. O custo do armazenamento flash é apenas 1/55 do DRAM e, por meio de otimizações de controlador, empilhamento NAND e ajustes no modo de célula, ele oferece alternativas viáveis de capacidade e largura de banda para a IA na borda.