Nvidia Blackwell B200, selefine 4 kat performans farkı attı: Pekala sahiden o denli mi?
Nvidia’nın yayınladığı bilgilere nazaran, Blackwell tabanlı B200 GPU, bir sunucu doğrulama testinde tek bir GPU ile saniyede 10.755 token, çevrimdışı bir referans testinde ise saniyede 11.264 token süreç kapasitesine sahip. Mevcut MLPerf Llama 2 70B kıyaslama sonuçlarına baktığımızda, dört adet Hopper H100 tabanlı bir makinenin benzeri sonuçlar elde ettiği görülüyor. Bu da Nvidia’nın, tek bir Blackwell işlemcisinin tek bir Hopper H100 GPU’ya kıyasla yaklaşık 3.7-4 kat daha hızlı olduğunu ortaya koyuyor.
4 katlık sürat farkı biraz aldatıcı
İkinci olarak ise Nvidia’nın aslında elma ile armudu kıyaslaması. Firma, tek bir B200 ile dört adet H100’ü kıyaslıyor, bu biraz aldatıcı. Çünkü ekseriyetle GPU başına performansı ölçmek için GPU’lar tekil olarak kıyaslanır zira, ölçekleme birçok vakit kusursuz değildir. Bu, CrossFire yahut SLI yapıldığında iki ekran kartının performansının tek ekran kartına kıyasla 2X olmaması üzere.
MLPerf 4.1’de tekil halde H100 GPU sonucu bulunmamakta lakin H200 için bulunuyor. Tek bir H200, saniyede 4.488 token süreç kapasitesine ulaşabiliyor, bu da B200’ün 2.5 kat daha süratli olduğu manasına geliyor. Bellek kapasitesi ve bant genişliği de kıymetli. Test edilen B200 GPU, 180 GB HBM3E belleği taşırken, H100 SXM 80 GB HBM (bazı konfigürasyonlarda 96 GB’a kadar) ve H200 96 GB HBM3 ile 144 GB’a kadar HBM3E sunmakta. Münasebetiyle “4 kata kadar” tabiri, sayı formatı, GPU sayısı ve bellek kapasitesi üzere potansiyel farklılıklardan kaynaklanıyor.