Nvidia yapay zeka yarışında rakipsiz mi?

Silikon14
6 min readSep 1, 2024

--

NVIDIA HGX 2 SXM3 kartı — servethehome.com

Nvidia tasarımı GPU’lar, yapay zeka modellerini eğiten ve çalıştıran tonlarca süperbilgisayara güç veriyor. Bu sayede Nvidia, dünyanın en değerli firmalarından biri oldu. Peki Nvidia’nın rakibi var mı?

Yazar: Tan Siret AKINCI

Grafikten yapay zekaya uzanan yol

Nvidia 1993'de 3 kişi tarafından kurulduğunda hedef, dönemin artan video işleme gereksinimlerine deva olacak bir yonga tasarlamaktı. Seri işleme prensibine dayanarak verileri tek kanalda işleyen CPU’nun aksine paralel işleme, yani basitçe görevleri başka kanallara yayarak işleyen bir yan işlemci mimarisi geliştirdiler. Bu mimariye GPU (Graphic Processing Unit yani Görüntü İşleme Birimi) deniyor.¹

GPU, isminden anlaşılacağı üzere bilgisayarların görüntü işleme kapasitesini arttırmak için bizzat Nvidia tarafından icat edildi. 90'lardan günümüze kalitesi artan video oyunlarının gerçekçi grafiklerini, filmlerdeki efektleri ve sanal gerçeklik simülasyonlarını mümkün kıldı. Nvidia, icat ettiği bu teknolojinin pazarında dominant bir marka olmayı sürdürüyor.¹

CUDA destekli çekirdeklere sahip Nvidia GPU’su — Nvidia

GPU’lar özlerinde bilgisayarın tüm işlem kapasitesini arttırabilecek potansiyele sahipti, ancak Nvidia yongalarında bulunan çekirdeklerin görüntü hariç işlemleri çalıştırabilmeleri için çoğu yazılımcının bilmediği Assembly makine diliyle programlanmaları gerekiyordu. Bu sebeple firma, 2007'de GPU’larındaki paralel işlem özelliğinin doğrudan kolayca programlanabilmesi için CUDA (Compute Unified Device Architecture yani kabaca Birleşik Cihaz İşlam Mimarisi) isimli bir API (Application Programming Interface yani Uygulama Programlama Arayüzü) geliştirdi.²

CUDA, GPU çekirdeklerinin C/C++ ve Python gibi çoğu yazılımcının bildiği popüler orta/üst seviye diller ile programlanabilmesine olanak tanıyarak ileriki yıllarda görüntüden öte alanlarda da işlem kapasitesinin arttırılmasında kullanılabilmesinin önünü açtı. 2012 yılında geliştirilen, nesne tanıma alanında önceki tüm yapay zeka sinir ağı modellerinden çok daha iyi performans gösteren AlexNet’in CUDA aracılığıyla Nvidia GPU’larıyla çalıştırılması üzerine Nvidia, yapay zeka alanındaki potansiyelini sektöre kanıtlamış oldu.²

GPU’lar ve yapay zeka devrimi

Günümüzde yapay zeka denince çoğumuzun aklına ChatGPT, Gemini, Copilot, IBM Watsonx gibi aracı yazılımlar geliyor. Bu yazılımlar, GPT (Generative Pre-trained Transformer yani Önceden eğitilmiş Üretken Dönüştürücü) ve benzeri LLM (Large Language Model yani Geniş Dil Modeli) yapay zeka modellerine dayanıyor. Bu teknolojilerin detayları ve arkalarında yatan matematik bu makalenin amacının dışında kalıyor. Eğer sinir ağları ve derin öğrenme konularında bilgi sahibi olmak istiyorsanız 3Brown1Blue’nun Derin Öğrenme video serisini şiddetle tavsiye ederim.

LLM, çok güçlü ancak çok büyük bir model tipi. Genelde bu modellerin küçükleri 7–8 milyar, büyükleri 300–1000 milyar parametreye sahip oluyor. Bu kadar büyük olunca haliyle çok fazla işlem gücü gerekiyor. Bu işlem gereksiniminin sağlanmasında ve işlemlerin hızlandırılmasında Nvidia’nın GPU’ları büyük rol oynuyor.³

Jensen Huang, OpenAI’a DGX-1 süperbilgisayarı hediye ediyor — OpenAI

Son dönem herkesin dilinde olan OpenAI, 9 yıl önce Sam Altman ve Elon Musk ortaklığında kurulmuştu. Firma, yapay zeka modellerini CUDA aracılığıyla Nvidia GPU’larının paralel işlem kapasitesinden yararlanacak şekilde geliştiriyordu. Nvidia CEO’su Jensen Huang, OpenAI’ın potansiyelini görüp 2016'da yapay zeka işlemlerini hızlandırma amaçlı geliştirilen DGX-1 süperbilgisayarını firmaya imzalı bir şekilde hediye etti.⁴

Huang haksız çıkmadı. 2020 yılında OpenAI, devrim niteliğindeki GPT-3 modelini çıkardı. 1 yıl sonra DALL-E, 2 yıl sonra da ChatGPT uygulamalarını çıkararak üretken yapay zekanın geldiği son noktayı herkesin görmesine vesile oldu ve şu an yaşamakta olduğumuz yapay zeka devriminin öncülüğünü yaptı. OpenAI’ın modellerinin eğitildiği ve uygulamalarının çalıştırıldığı, şu an Microsoft’un sahip olduğu süperbilgisayarlarda tonlarca Nvidia GPU’su kullanılıyor.⁴

Nvidia ürünlerini kullanan tek yapay zeka firması OpenAI değil. Tesla, Google ve Meta (eski adıyla Facebook) gibi dev firmaların hemen hemen hepsi yapay zeka modellerini eğittikleri süperbilgisayarlarda Nvidia GPU’larını kullanıyor. Bu gelişmeler, Nvidia’yı dünyanın en değerli firmalarından biri haline getirdi.⁵

Nvidia CEO’su Jensen Huang sağ elinde Blackwell GPU’yu, sol elinde Grace Hopper süperyongasını tutuyor

Nvidia yalnızca GPU yapmıyor. Geçtiğimiz yıl firma Grace Hopper isimli bir yapay zeka süperyongası (superchip) çıkardı. Grace Hopper, Nvidia’nın Grace isimli CPU’su ve Hopper H100 isimli GPU’larından oluşan bir tek kartlı bilgisayar. Nvidia CEO’su Huang, Grace’in piyasadaki öbür süperbilgisayar yongalarından 10 kat daha hızlı yapay zeka işlem kapasitesine sahip olduğunu iddia etti. Grace Hopper şu an hala çoğu firmanın gözdesi.⁶

Nvidia’nın son inovatif ürünü, geçtiğimiz mart ayında düzenlenen Nvidia konferansında tanıtılan 208 milyar transistöre sahip, yapay zeka süperbilgisayarlarında kullanılması hedeflenen Blackwell GPU. Blackwell’in içinde birbiriyle saniyede 10 terabayt veri alışverişi yapabilen 2 yonga bulunuyor. Bu açıdan Blackwell, tek yonga içinde tekniken 2 GPU barındırmasıyla bir ilk. Huang, Nvidia’nın daha önceki GPU’su H100'den 25 kat daha verimli olan Blackwell’in gelmiş geçmiş en güçlü yapay zeka yongası olduğunu ve trilyonlarca parametre içeren modelleri çalıştırabileceğini iddia ediyor.⁶

Yapay zeka yonga rekabeti kızışıyor

Dev teknoloji firmaları, Nvidia GPU’larına bağlı kalmamak için kendi ASIC (Application Specific Integrated Circuit yani Uygulamaya Özgün Entegre Devre) yapay zeka yongalarını geliştiriyor.

Google, daha Transformer modellerinin icat edilmediği 2015'den beri TPU (Tensor Processing Unit yani Tensör İşlem Ünitesi) ismini verdiği, Google’ın kendi TensorFlow yazılımı ile çalışan ASIC yongaları geliştiriyor. TPU aynı GPU gibi paralel işlem özelliğiyle bilgisayarın üstündeki yükü azaltıyor ancak GPU’dan farklı olarak özellikle yapay zeka için tasarlanmış olması sayesinde çok daha az enerji harcıyor. Başlangıçta firma içi kullanım için geliştirilen TPU’lar, 2018'de bulut aracılığıyla üçüncü kişilerin kullanımına sokuldu ve küçük versiyonları satışa çıkarıldı. Google’ın son çıkardığı TPU v5p, Nvidia’nın piyasadaki en güçlü GPU’su H100 ile yarışabilecek güçteyken A100'den 4 kat daha güçlü.⁷

Meta, Amazon ve Tesla da firma içi kullanım için yakın tarihte benzer ASIC yapay zeka yongalar tasarlamaya başladı. Yapay zeka yonga gelişimi yalnızca ASIC’ler ile sınırlı değil. Apple ve AMD, varolan CPU tasarımlarına NPU (Neural Processing Unit yani Sinirsel İşlem Ünitesi) isimli, yapay zeka işlemlerini hızlandıran bir bölüm ekliyor. AMD ayrıca Nvidia H100'den 1.7 kat daha güçlü yapay zeka uyumlu MI300X GPU’su ile ateşe ateş ile karşılık veriyor.⁸

Groq LPU’su ile bir Nvidia GPU numunesinin karşılaştırması — groq.com

Nvidia’nın hegemonyasıyla sadece devler rekabet etmiyor. TPU’nun mucitlerinden olan Jonathan Ross’un başını çektiği, ekiden Google çalışanı olan bir grup mühendis 2016'da Groq (Grok ile alakası yok. Grok, Musk’ın X’de kullanıma sunduğu yapay zeka modeli) isimli bir firma kurdu. Groq, LPU (Language Processing Unit yani Dil İşleme Ünitesi) ismini verdiği, paralel işlem kapasitesinin yanında hafıza, matrix ve vektör işlem kapasitelerini bir arada barındıran basit bir mimari geliştirdi. LPU tasarlandığı dönem sektörün ve yatırımcıların ilgisini çekmemiş olsa da 2022'de LLM’lerin patlamasıyla yayınladıkları bir demo sayesinde popülerlik kazandı.⁹

Bu mimari, piyasadaki Nvidia GPU’larına kıyasla çok daha basit tasarıma sahip olması ve düşük enerjiye ihtiyaç duyması yanında 18 kat daha hızlı işlem yapma potansiyeline ve 100 kat daha hızlı hafızaya sahip. LPU’lar ayrıca GPU’lara ve öbür yongalara kıyasla birbirlerine çok daha kolayca bağlanıp paralel işlem ile daha yüksek performans sağlayabiliyor. Groq’un Nvidia’ya karşı başka bir avantajı üretim için da Tayvan’daki TSMC yerine ABD’deki Global Foundries’i kullanacak olması.⁹

Heterodoks teknolojilerin de yapay zekanın işlem gereksinimlerine çözümleri var. Daha önceki makalemde bahsettiğim Mythic gibi analog yapay zeka yongaları, geleneksel dijital yongaların ikili sisteme bağlı olma sebebiyle yaşadığı birçok sorunu sürekli işlem yapabilme kabiliyetiyle gideriyor. Ancak bu yongaların hala deneysel seviyede olmaları ve dijital bilgisayarlar için tasarlanmış mevcut popüler modellerde tam performans sergileyememeleri, Nvidia’ya en azından yakın tarihte rakip olmalarını zorlaştırıyor.

Nvidia rakipsiz mi? Tabii ki hayır. Bu rakipler Nvidia’yı yapay zeka yarışında yenebilir mi? Belki, ancak Nvidia yalnızca bir yapay zeka donanım firması değil. GPU’ların birçok farklı amaç için programlanabiliyor olması, yalnızca üretken yapay zekayı hızlandırmak için üretilen yongalardan ayrışmasını ve daimi olmasını sağlıyor.

Kaynakça

1 —Nvidia. “NVIDIA History”. nvidia.com

2 — Lucas de Lima Nogueira. “Why Deep Learning Models Run Faster on GPUs: A Brief Introduction to CUDA Programming”. towardsdatascience.com

3 — Tim Bajarin. “Why NVIDIA Matters For The Future Of AI”. forbes.com

4 — Jacob Roach. “Microsoft explains how thousands of Nvidia GPUs built ChatGPT”. digitaltrends.com

5 — Krystal Hur. “Nvidia surpasses Microsoft to become the largest public company in the world”. editor.cnn.com

6 — Sean Hollister. “Nvidia reveals Blackwell B200 GPU, the ‘world’s most powerful chip’ for AI”. theverge.com

7 — Keumars Afifi-Sabet. “Google is rapidly turning into a formidable opponent to BFF Nvidia — the TPU v5p AI chip powering its hypercomputer is faster and has more memory and bandwidth than ever before, beating even the mighty H100”. techradar.com

8 — Emilia David. “AMD releases new chips to power faster AI training”. theverge.com

9 — Karl Freund. “Can Groq Really Take On Nvidia?”. forbes.com

--

--