CUDA çekirdeği, NVIDIA GPU içindeki grafik ve paralel hesaplama için temel işleri yapan küçük matematik birimlerinden biridir. Her çekirdek, Akışlı Çoklu İşlemci (SM) adı verilen daha büyük bir blok içinde bulunur ve modern GeForce "Blackwell" GPU'larda her SM 128 CUDA çekirdeği içerir. Bu nedenle RTX 5090'da toplam 21.760 CUDA çekirdeği gibi sayılar görürsünüz. Çipte, her biri bu çekirdeklerle dolu birçok SM bulunur.
CUDA (NVIDIA'nın paralel hesaplama platformu) hikayenin yazılım tarafını oluşturur: uygulamaların ve çerçevelerin büyük ölçekli paralel iş işleme, yapay zeka ve simülasyon işlemlerini bu çekirdeklere verimli bir şekilde göndermesini sağlar.
GPU'yu toplu işler için tasarlanmış bir fabrika gibi düşünün. CUDA çekirdekleri, farklı veriler üzerinde aynı komutu yürüten 32 iş parçacığı içeren warp gruplarında işleri yürütür (NVIDIA'nın SIMT olarak adlandırdığı bir model). GPU'lar bu şekilde binlerce işlemi aynı anda gerçekleştirir. Her SM, bellek gecikmesini gizlemek ve çekirdekleri meşgul tutmak için birçok warp'ı çalışır durumda tutan zamanlayıcılara sahiptir.
Yararlı bir zihinsel resim:
Bunlar belirli görevleri devre dışı bırakarak CUDA çekirdeklerinin gölgelendirme/hesaplamaya odaklanabilmesini sağlar.
Görsel Kaynak: NVIDIA
Genellikle, ancak tek başına değil. Mimari çok önemlidir. Örneğin, NVIDIA'nın Ampere nesli, Turing'e kıyasla SM başına FP32 verimini iki katına çıkardı, bu nedenle nesiller arasında "çekirdek başına" güç değişti. Ada ayrıca önbellekleri (özellikle L2) büyük ölçüde genişletti, bu da çekirdek sayısını değiştirmeden birçok iş yükünü artırdı. Kısacası: farklı nesillerdeki CUDA çekirdek sayılarını karşılaştırmak, elma ile elmayı karşılaştırmak gibi değildir.
Diğer önemli etkenler:
Kullanışlı bir kural:
Ölçek konusunda hızlı bir akıl sağlığı kontrolü yapmak istiyorsanız, RTX 5090 21.760 CUDA çekirdeği listeler ve NVIDIA'nın birçok SM'de SM başına çekirdekleri nasıl hesapladığını gösterir. Ancak yine de, performans artışları sadece sayıdan değil, toplam tasarımdan kaynaklanır.
Görsel Kaynak: NVIDIA
Özel bir kabloya ihtiyacınız yoktur, ancak doğru yazılım yığınına ihtiyacınız vardır. CUDA, NVIDIA'nın platformudur; uygulamalar bunu sürücüler, araç setleri ve kitaplıklar aracılığıyla kullanır. NVIDIA sürücüleri ve (gerektiğinde) CUDA Araç Seti yüklendiğinde, birçok popüler uygulama ve çerçeve CUDA hızlandırmasını kullanmak üzere zaten oluşturulmuştur, desteklenen uygulamalar sadece... onu kullanır.
CUDA, tüm ürün serilerinde (oyun ve içerik oluşturma için GeForce/RTX, profesyonel RTX ve veri merkezi GPU'ları) CUDA özellikli NVIDIA GPU'larda çalışır. Programlama kılavuzunda, modelin birçok GPU nesli ve SKU'da ölçeklenebilir olduğu belirtilmektedir. NVIDIA, CUDA özellikli GPU'ların ve bunların hesaplama yeteneklerinin bir listesini tutmaktadır.
CUDA çekirdeği "gölgelendirici çekirdeği" ile aynı mıdır?
Günlük GPU konuşmalarında, evet, NVIDIA GPU'larda "CUDA çekirdekleri", her SM içinde gölgelendirme ve genel hesaplama için kullanılan programlanabilir FP32/INT32 ALU'ları ifade eder.
CUDA çekirdek sayıları nesiller arasında neden bu kadar farklı?
Çünkü mimariler gelişir. Ampere, FP32 veri yollarını değiştirdi (saat başına daha fazla iş) ve Ada, performansın çekirdek sayısı ile doğrusal olarak ölçeklenmemesi için önbellekleri elden geçirdi.
Warp nedir?
SM üzerinde eşzamanlı olarak çalışan 32 iş parçacığı grubu. Uygulamalar binlerce iş parçacığı başlatır; GPU, donanımı meşgul tutmak için bunları warp olarak planlar.
CUDA çekirdekleri yapay zekaya yardımcı olur mu?
Evet, ancak modern yapay zekanın en büyük hızlandırıcıları Tensor Çekirdekleridir. CUDA çekirdekleri hala bu boru hatlarında birçok çevre işini yürütmektedir.