Nvidia, Blackwell AI çiplerinde aşırı ısınma sorunuyla karşı karşıya

Posted by

Nvidia’nın Blackwell İşlemcilerindeki Aşırı Isınma Sorunları Devam Ediyor

Dünyanın önde gelen yapay zeka ve yüksek performanslı yonga üreticisi Nvidia, yeni nesil Blackwell işlemcilerinde yaşanan aşırı ısınma sorunları nedeniyle zor bir süreçten geçiyor. The Information tarafından yayımlanan bir rapora göre, bu sorunlar yalnızca tasarım değişikliklerine ve üretim gecikmelerine yol açmakla kalmıyor, aynı zamanda Google, Meta ve Microsoft gibi büyük müşterilerin endişelerini artırıyor.

Aşırı ısınma ve performans kaybıyla karşı karşıya

Blackwell GPU’ları, özellikle 72 işlemcili yüksek kapasiteli sunucu raflarında ciddi ısınma sorunlarıyla karşılaşıyor. Bu sunucuların tek bir rafında 120 kW’a kadar enerji tüketimi olması bekleniyor. Isınma problemi, hem işlemci performansını sınırlıyor hem de bileşenlerde hasar riski yaratıyor. Nvidia’nın bu sorunların çözümü için sunucu raflarının tasarımını defalarca gözden geçirmek zorunda kaldığı belirtiliyor.

Nvidia’nın, aşırı ısınmayı önlemek amacıyla tedarikçilerine birçok tasarım değişikliği talimatı verdiği bildirildi. Soğutma sistemlerinin geliştirilmesi için mühendislik revizyonları yapılırken, bu süreç aynı zamanda sevkiyat tarihlerinin de ertelenmesine yol açtı. Nvidia, bu tür değişikliklerin teknoloji dünyasında büyük ölçekli lansmanlarda normal olduğunu belirtse de, müşteriler üretim ve dağıtım takvimlerinde yaşanan aksamalardan endişeli.

Blackwell işlemcilerindeki sorunlar yalnızca aşırı ısınmayla sınırlı değil. Daha önce Nvidia, Blackwell GPU’larının üretiminde karşılaşılan verimlilik problemleri nedeniyle üretimi ertelemek zorunda kalmıştı. Bu işlemcilerde kullanılan TSMC’nin CoWoS-L paketleme teknolojisi, iki yonga arasındaki bağlantıyı sağlamak için son derece hassas bir mühendislik gerektiriyor. Ancak, termal genleşme farklılıklarından kaynaklanan yapısal sorunlar, sistem arızalarına neden olmuştu. Nvidia, bu problemleri çözmek için işlemci tasarımında çeşitli düzenlemeler yaparak sorunu çözdüğünü açıklamıştı.

Yapay zeka çalışmaları etkilenebilir

Nvidia’nın geciken sevkiyatları Google, Meta ve Microsoft gibi büyük teknoloji şirketlerinin planlarını etkileyebilir. Bu şirketler, büyük dil modelleri gibi gelişmiş yapay zeka sistemlerini eğitmek için Nvidia’nın GPU’larını kullanıyor. Blackwell işlemcilerinin gecikmesi, bu sistemlerin geliştirme ve uygulama süreçlerini de aksatabilir.

Gecikmeler ve aşırı ısınma sorunlarına yanıt olarak bir Nvidia sözcüsü Reuters’e bulut sağlayıcılarla yapılan ortak çalışmaları hatırlattı ve tasarım değişikliklerini normal geliştirme sürecinin bir parçası olarak tanımladı. Sonuç itibarıyla, Blackwell GPU’ların son revizyonu ancak Ekim ayı sonunda seri üretime girebildi; bu da Nvidia’nın bu işlemcileri Ocak ayı sonundan itibaren sevk edebileceği anlamına geliyor. Orijinal planlar ise 2024’ün ikinci çeyreğini hedefliyordu.

Leave a Reply

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir