OpenAI e Broadcom revelam chip de IA Jalapeno para inferência de LLM a 25 de junho

Segundo a OpenAI, a empresa e a Broadcom revelaram o Jalapeno no dia 25 de junho, um acelerador de IA personalizado concebido especificamente para inferência de grandes modelos de linguagem. Desenvolvido em parceria com a Broadcom e a Celestica, o Jalapeno representa o primeiro componente de uma plataforma de computação multigeracional planeada, destinada a melhorar a velocidade, eficiência e acessibilidade de sistemas avançados de IA. O chip foi construído a partir de investigação interna sobre os requisitos de inferência de LLM e incorpora otimização de kernel, gestão de memória, redes e sistemas de serviço. As primeiras amostras de engenharia já estão a executar cargas de trabalho de aprendizagem automática em ambientes laboratoriais, incluindo as associadas a modelos avançados como o GPT-5.3-Codex-Spark, operando nas frequências e níveis de energia alvo. A arquitetura enfatiza a redução do movimento de dados e a distribuição equilibrada de recursos entre computação, memória e redes, concebida para funcionar em diferentes grandes modelos de linguagem.
Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário