BLOG

CUDA Çekirdeği Nedir ve Nasıl Çalışır?

Son güncelleme:

  Bu sayfa DeepL tarafından otomatik olarak çevrilmiştir. Switch to English

CUDA çekirdeği, NVIDIA GPU içindeki grafik ve paralel hesaplama için temel işleri yapan küçük matematik birimlerinden biridir. Her çekirdek, Akışlı Çoklu İşlemci (SM) adı verilen daha büyük bir blok içinde bulunur ve modern GeForce "Blackwell" GPU'larda her SM 128 CUDA çekirdeği içerir. Bu nedenle RTX 5090'da toplam 21.760 CUDA çekirdeği gibi sayılar görürsünüz. Çipte, her biri bu çekirdeklerle dolu birçok SM bulunur.

CUDA (NVIDIA'nın paralel hesaplama platformu) hikayenin yazılım tarafını oluşturur: uygulamaların ve çerçevelerin büyük ölçekli paralel iş işleme, yapay zeka ve simülasyon işlemlerini bu çekirdeklere verimli bir şekilde göndermesini sağlar.

NVIDIA-Tesla-Module

CUDA Çekirdekleri Nasıl Çalışır?

GPU'yu toplu işler için tasarlanmış bir fabrika gibi düşünün. CUDA çekirdekleri, farklı veriler üzerinde aynı komutu yürüten 32 iş parçacığı içeren warp gruplarında işleri yürütür (NVIDIA'nın SIMT olarak adlandırdığı bir model). GPU'lar bu şekilde binlerce işlemi aynı anda gerçekleştirir. Her SM, bellek gecikmesini gizlemek ve çekirdekleri meşgul tutmak için birçok warp'ı çalışır durumda tutan zamanlayıcılara sahiptir.

Yararlı bir zihinsel resim:

  • CUDA çekirdeği = tek bir işçi (toplama, çarpma gibi aritmetik işlemleri yapar).
  • SM = kendi zamanlayıcıları, önbellekleri, özel işlev birimleri, Tensor Core(lar) vb. ile donatılmış bir işlem alanı.
  • GPU = birçok SM'nin paralel olarak çalıştığı tüm fabrika.

CUDA Çekirdekleri ve CPU Çekirdekleri (ve Diğer GPU Çekirdekleri)

  • CPU çekirdekleri değil: CUDA çekirdeği, büyük, gecikme süresi ayarlanmış genel amaçlı bir CPU çekirdeği değil, verim için optimize edilmiş daha basit bir aritmetik şerittir. GPU'lar, bu küçük şeritlerin birçoğunun birlikte çalışmasıyla ölçeklenir. (CUDA'nın programlama kılavuzu, bu verim odaklı tasarımı açıklamaktadır.)
  • Özel GPU çekirdeklerinden farklı olarak:
    • Tensor Çekirdekleri, AI/ML ve DLSS gibi özellikleri güçlendiren matris matematik motorlarıdır.
    • RT Çekirdekleri ışın izlemeyi hızlandırır (BVH geçişi, ışın/üçgen testleri).

Bunlar belirli görevleri devre dışı bırakarak CUDA çekirdeklerinin gölgelendirme/hesaplamaya odaklanabilmesini sağlar.

nvidia-workstation-rtx-pro-5000-og-1200x630

Görsel Kaynak: NVIDIA

Daha fazla CUDA çekirdeği her zaman daha yüksek performans anlamına mı gelir?

Genellikle, ancak tek başına değil. Mimari çok önemlidir. Örneğin, NVIDIA'nın Ampere nesli, Turing'e kıyasla SM başına FP32 verimini iki katına çıkardı, bu nedenle nesiller arasında "çekirdek başına" güç değişti. Ada ayrıca önbellekleri (özellikle L2) büyük ölçüde genişletti, bu da çekirdek sayısını değiştirmeden birçok iş yükünü artırdı. Kısacası: farklı nesillerdeki CUDA çekirdek sayılarını karşılaştırmak, elma ile elmayı karşılaştırmak gibi değildir.

Diğer önemli etkenler:

  • Saat hızları ve güç başlığı (çekirdeklerin çalışma hızı).
  • Bellek bant genişliği ve önbellek boyutları (çekirdekleri besler).
  • Tensor/RT Çekirdeklerinin Kullanımı (AI ve ışın izleme, CUDA çekirdeklerinin yükünü hafifletir).
  • Sürücüler ve yazılımlar (bir uygulamanın CUDA aracılığıyla GPU'yu ne kadar iyi kullandığı).

CUDA Çekirdekleri Pratikte Ne İşe Yarar?

  • Oyun/grafik: Arka planda gölgelendirme programları (köşe, piksel, hesaplama) çalıştırırlar. RT Çekirdekleri ağır ışın izleme adımlarını gerçekleştirir; CUDA çekirdekleri ise bunların etrafında birçok gölgelendirme ve hesaplama işlemi yapmaya devam eder.
  • İçerik oluşturma ve simülasyon: Fizik çözücüler, gürültü gidericiler, render çekirdekleri, video efektleri ve daha fazlası, CUDA'nın paralel modelinden yararlanmak için yazılmıştır.
  • AI/ML: Tensor işlemleri Tensor Çekirdeklerine gider, ancak birçok ön işleme, son işleme ve matris dışı işler hala CUDA çekirdeklerinde çalışır.

Kaç CUDA Çekirdeğine İhtiyacım Var?

Kullanışlı bir kural:

  • Yüksek FPS 1080p–1440p oyun: Sadece çekirdek sayısına değil, GPU'nun tamamına (mimari, saat hızları, bellek, RT/Tensor özellikleri) bakın. Benchmarklar, ham sayılardan daha önemlidir.
  • 4K veya ağır ışın izleme: Daha fazla SM/CUDA çekirdeği ve güçlü RT/Tensor bloklarının yanı sıra bant genişliği ve önbellekten faydalanabilirsiniz.
  • AI/hesaplama: Çekirdek sayısı yardımcı olur, ancak Tensor Core kapasitesi, VRAM boyutu ve bellek bant genişliği genellikle verimi belirler.

Ölçek konusunda hızlı bir akıl sağlığı kontrolü yapmak istiyorsanız, RTX 5090 21.760 CUDA çekirdeği listeler ve NVIDIA'nın birçok SM'de SM başına çekirdekleri nasıl hesapladığını gösterir. Ancak yine de, performans artışları sadece sayıdan değil, toplam tasarımdan kaynaklanır.

NVIDIA-Blackwell-Ultra-GB300

Görsel Kaynak: NVIDIA

Özel bir yazılım veya kablo gerekir mi? (CUDA'nın "4K için HDMI" özelliği)

Özel bir kabloya ihtiyacınız yoktur, ancak doğru yazılım yığınına ihtiyacınız vardır. CUDA, NVIDIA'nın platformudur; uygulamalar bunu sürücüler, araç setleri ve kitaplıklar aracılığıyla kullanır. NVIDIA sürücüleri ve (gerektiğinde) CUDA Araç Seti yüklendiğinde, birçok popüler uygulama ve çerçeve CUDA hızlandırmasını kullanmak üzere zaten oluşturulmuştur, desteklenen uygulamalar sadece... onu kullanır.

Hangi GPU'lar CUDA'yı destekler?

CUDA, tüm ürün serilerinde (oyun ve içerik oluşturma için GeForce/RTX, profesyonel RTX ve veri merkezi GPU'ları) CUDA özellikli NVIDIA GPU'larda çalışır. Programlama kılavuzunda, modelin birçok GPU nesli ve SKU'da ölçeklenebilir olduğu belirtilmektedir. NVIDIA, CUDA özellikli GPU'ların ve bunların hesaplama yeteneklerinin bir listesini tutmaktadır.

CUDA çekirdeği "gölgelendirici çekirdeği" ile aynı mıdır?


Günlük GPU konuşmalarında, evet, NVIDIA GPU'larda "CUDA çekirdekleri", her SM içinde gölgelendirme ve genel hesaplama için kullanılan programlanabilir FP32/INT32 ALU'ları ifade eder.



CUDA çekirdek sayıları nesiller arasında neden bu kadar farklı?


Çünkü mimariler gelişir. Ampere, FP32 veri yollarını değiştirdi (saat başına daha fazla iş) ve Ada, performansın çekirdek sayısı ile doğrusal olarak ölçeklenmemesi için önbellekleri elden geçirdi.



Warp nedir?


SM üzerinde eşzamanlı olarak çalışan 32 iş parçacığı grubu. Uygulamalar binlerce iş parçacığı başlatır; GPU, donanımı meşgul tutmak için bunları warp olarak planlar.



CUDA çekirdekleri yapay zekaya yardımcı olur mu?


Evet, ancak modern yapay zekanın en büyük hızlandırıcıları Tensor Çekirdekleridir. CUDA çekirdekleri hala bu boru hatlarında birçok çevre işini yürütmektedir.