Hesaplama Kapasitesi

2 minute read

Bir GİB’in hesaplama kapasitesi “major version number(birincil versiyon numarası)” ve “minor version number(ikincil versiyon numarası)” ile ifade edilmektedir. Birincil versiyon numaraları aynı olan ürünler aynı fiziksel çekirdek mimarisindedirler. Birincil versiyon numarası 1 olan aygıtlar Tesla mimarisine, 2 olan aygıtlar Fermi mimarisine ve 3 olan aygıtlar Kepler mimarisine sahiptirler. İkincil versiyon numarası ise mimari yenilendikçe değişir.

CUDA mimarisine donanımsal olarak bakıldığında her bir thread’in “Streaming Processor(Akış İşlemcisi)” üzerinde çalıştığı görülmektedir (Şekil 4-16 ). Sekiz adet akış işlemcisinin bir araya gelerek oluşturduğu yapıya “Streaming Multiprocessor(Çoklu-işlemci)” adı verilmektedir.

</a>

SM’ler ise ekran kartı donanımını oluşturmaktadır . Örneğin, nVIDIA GT200 grafik kartı 30 adet SM’ye sahiptir.Bunlardan 2 tanesi Şekil 4-17’de görülmektedir. Her bir SM, 8 block’a kadar görevlendirilebilir şekilde dizayn edilmiştir. GT200 işlemcide 30 SM ile 240 block’a kadar eş zamanlı görevlendirme olabilir. Çoğu grid 240 block’tan fazlasını içermektedir. GT200’de her bir SM 1024 thread’e kadar görevlendirilebilecek şekilde yapılandırılmıştır.Bu yapıya 4 block-256 thread veya 8 block-128 thread grupları örnek olarak verilebilir. Ancak 16 block-64 thread olmaz çünkü , her bir SM sadece 8 blocka kadar yerleştirilebilir.

</a>

CUDA’da uygulamalar GİB’in karakteristiğine göre geliştirilmelidir. Bunun için birincil ve ikincil versiyon numaraları ile birlikte teknik özellikleri verilen Tablo 4-1’den yararlanılabilir.

</a>

Fermi Mimarisi

Fermi mimarisi tabanlı ilk GİB 3 milyar transistöre ve 512 adet CUDA çekirdeğine sahipti. Bu 512 adet CUDA çekirdeğinin her biri 16 adet SM(çoklu- işlemci)’den meydana gelmiştir ve her bir SM’de 32 adet fiziksel çekirdek(core) bulunmaktadır. Şekil 4-18’de Fermi mimarisinin genel yapısı ve Şekil 4-19’da her bir Fermi SM’sinin yapısı görülmektedir.

</a>
</a>

Kepler Mimarisi

Fermi mimarisine ek olarak bir çok yeni özelliği barındırmaktadır. Bunlar: Gelişmiş SM’ler(SMX) Dinamik Paralellik Hyper-Q Teknolojisi

</a>
</a>

Fermi ile Kepler Mimarilerinin Teknik Karşılaştırması

</a>

Warp Yapısı

CUDA mimarisinde bir grid tanımlandığında thread’lerden “Warp Scheduler(Warp Zamanlayıcı)” tarafından 32’li gruplar oluşturulur ve bu gruplar işlenecekleri yer olan SP’ye gönderilmektedir. SP’ye gelen thread’ler işlenmek üzere çekirdeklere dağılırlar. Warp üzerindeki her bir thread farklı verinin aynı komutunu yürütmektedir.

Özetle:

Grid’ler–> GİB ile eşleşir.

Block’lar–> MultiProcessor(MP) ler ile eşleşir.

Thread’ler–> Stream Processor(SP)ler ile eşleşir.

Warp’lar–>Eşzamanlı yürütülen 32’lik thread blocklarıdır.

Tags:

Updated:

Leave a Comment