Google Meluncurkan Chip AI Terpisah untuk Pelatihan dan Inferensi, Meningkatkan Kinerja 2,8x

Pesan Berita Gate, 23 April — Google mengumumkan pada 22 April bahwa pihaknya akan merilis chip TPU generasi kedelapan yang terpisah untuk pelatihan dan inferensi pada akhir tahun ini, menggantikan desain gabungannya sebelumnya. Langkah ini menargetkan beban kerja AI agent dan memberi pelanggan Google Cloud alternatif selain perangkat keras Nvidia.

Chip pelatihan memberikan kinerja 2,8 kali lebih tinggi dibanding TPU Ironwood generasi ketujuh milik Google dengan harga yang sama, sementara chip inferensi 80% lebih cepat dan dilengkapi SRAM 384 MB, tiga kali lipat jumlah yang ada di Ironwood. Pemisahan kapabilitas pelatihan dan inferensi mencerminkan pergeseran cara perusahaan mengoptimalkan untuk kebutuhan komputasi yang berbeda.

Inisiatif ini didukung oleh kemitraan jangka panjang dengan Broadcom dan Anthropic. Anthropic berencana menggunakan sekitar 3,5 gigawatt komputasi TPU melalui Broadcom mulai tahun 2027, dengan Broadcom menangani manufaktur chip dan komponen jaringan hingga 2031. Anthropic, perusahaan rintisan AI di balik Claude, baru-baru ini melihat pendapatan tahunan yang dinormalisasi melebihi $30 billion. Sementara itu, Apple, Microsoft, Meta, dan Amazon juga memperluas upaya chip AI khusus untuk mengurangi ketergantungan pada Nvidia, yang tetap menjadi pemimpin pasar.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar