Persaingan di pasar chip AI memasuki babak baru yang seru. Google, lewat induk usahanya Alphabet Inc., sedang menyusun strategi ambisius untuk merebut dominasi Nvidia — bukan di pelatihan model, melainkan di inference: proses menjalankan model AI yang sudah dilatih untuk merespons pertanyaan pengguna. Dan kali ini, Google tidak main-main.
Inti strateginya terletak pada pendekatan empat mitra desain. Google tidak mengandalkan satu pabrikan semikonduktor saja. Broadcom ditunjuk mengerjakan chip "Sunfish" (TPU v8 untuk training), MediaTek menangani varian "Zebrafish" (TPU v8 untuk inference yang lebih hemat biaya), Marvell sedang dalam pembicaraan untuk memproduksi Memory Processing Unit, dan Intel menyediakan lapisan infrastruktur jaringan dan komputasi umum. Semua chip difabrikasi oleh TSMC.
Jeff Dean, Chief Scientist Google, menjelaskan logika di balik pergeseran ini: "Seiring meningkatnya permintaan untuk memproses kueri AI dengan cepat, kini masuk akal untuk menspesialisasikan chip — sebagian lebih cocok untuk training, sebagian lagi untuk inference." Pernyataan ini mencerminkan perubahan fundamental dalam cara industri memandang kebutuhan hardware AI.
Angka-angkanya sendiri mengesankan. Proyeksi pengiriman TPU Google mencapai 4,3 juta unit pada 2026, dan melonjak menjadi lebih dari 35 juta unit pada 2028. Ironwood (TPU v7) yang saat ini sudah dikapalkan menawarkan performa puncak 10 kali lipat dari TPU v5p, dengan 192 GB memori HBM3E per chip dan bandwidth 7,2 terabyte per detik. Satu superpod Ironwood bisa memuat hingga 9.216 chip cair-didinkin dengan daya komputasi 42,5 FP8 exaflops.
Yang menarik, klien-klien besar sudah antre. Anthropic menandatangani kontrak untuk mengakses hingga satu juta TPU dan 3,5 gigawatt daya komputasi pada 2027. Meta Platforms ikut meneken kesepakatan bernilai miliaran dollar untuk menggunakan TPU via Google Cloud, khususnya untuk keperluan inference. Citadel Securities memanfaatkan TPU untuk melatih model lebih cepat dibanding alur kerja berbasis GPU sebelumnya. Bahkan G42 dari Abu Dhabi sedang dalam pembicaraan untuk mengadopsi infrastruktur TPU Google.
Namun ada sisi unik dari strategi Google: mereka mulai mengizinkan perusahaan tertentu — seperti Anthropic — menjalankan TPU di data center mereka sendiri, bukan cuma di fasilitas Google. Ini langkah berani yang menunjukkan Google siap melepaskan kendali eksklusif demi memperluas adopsi. Google juga kini mengizinkan pelanggan TPU menggunakan alat pihak ketiga seperti PyTorch dan software penjadwalan eksternal, menjauh dari kebijakan "Google-only" yang dulu sempat dikeluhkan banyak pihak.
Chirag Dekate, analis Gartner, merangkum situasi ini dengan tajam: "Medan pertempuran bergeser ke arah inference. Di medan itu, Google punya keunggulan infrastruktur." Perkiraan TrendForce mendukung klaim ini — penjualan chip custom diproyeksikan naik 45% pada 2026, jauh melampaui pertumbuhan GPU sebesar 16%.
Tapi Nvidia tidak tinggal diam. Jensen Huang, CEO Nvidia, berargumen bahwa GPU punya fleksibilitas yang lebih luas dibanding chip khusus. Nvidia juga mulai menanamkan diri di ekosistem custom — termasuk investasi $2 miliar di Marvell — untuk memastikan teknologi mereka tetap ada di rak data center meski GPU digantikan. Selain itu, ekosistem CUDA yang sudah teruji bertahun-tahun tetap menjadi "parit pertahanan" Nvidia di sisi training.
Tantangan terbesar Google mungkin bukan teknologi, melainkan waktu pengembangan. Chip butuh sekitar tiga tahun untuk dikembangkan, sementara model AI berevolusi setiap bulan. Amin Vahdat, pimpinan infrastruktur AI Google, mengakui bahwa menjaga TPU eksklusif di Google akan membatasi populasi dan keragaman pengguna, yang pada akhirnya membuat teknologi tersebut "semakin kurang baik." Membuka ekosistem jadi jalan satu-satunya.
Bagi industri AI secara luas, langkah Google ini punya implikasi besar. Jika inference — yang biayanya terus membengkak seiring bertambahnya kueri pengguna — bisa ditangani chip custom yang lebih murah dan cepat, maka biaya menjalankan AI bisa turun drastis. Dan itu berarti lebih banyak perusahaan, startup, dan bahkan individu bisa memanfaatkan AI tanpa harus bergantung pada harga sewa GPU Nvidia yang selangit.
Sudut Pandang Kami:
Perang chip AI antara Google dan Nvidia bukan sekadar persaingan teknis — ini soal siapa yang mengendalikan biaya paling besar dalam bisnis AI: inference. Semakin murah inference, semakin demokratis aksesnya. Untuk startup di Indonesia, diversifikasi chip ini kabar baik karena akan menekan biaya cloud AI.
