Проблемы перегрева GPU Blackwell от Nvidia ставят под угрозу поставки

· 0 минут чтения

article picture

Как стало известно, новое поколение графических процессоров Nvidia Blackwell столкнулось с серьезными проблемами перегрева при установке в серверные стойки высокой плотности. Эта ситуация вынуждает компанию пересматривать конструкцию систем охлаждения и задерживает поставки крупным клиентам.

По информации инсайдеров, GPU Blackwell начинают перегреваться в серверах, содержащих 72 процессора. Такие системы потребляют до 120 кВт энергии на стойку, что создает серьезные трудности с отводом тепла.

Проблема затрагивает крупнейших клиентов Nvidia - Google, Meta и Microsoft, которые используют эти GPU для обучения языковых моделей. Компании обеспокоены тем, что задержки могут нарушить их планы по развертыванию новых процессоров в дата-центрах.

Nvidia уже поручила поставщикам внести несколько изменений в конструкцию серверных стоек для решения проблем с перегревом. Компания тесно сотрудничает с партнерами над улучшением системы охлаждения серверов.

Ранее Nvidia уже сталкивалась с задержками при производстве Blackwell из-за дефекта в конструкции процессора. GPU B100 и B200 используют технологию упаковки TSMC CoWoS-L для соединения чиплетов, и несоответствие характеристик теплового расширения компонентов приводило к деформации и сбоям системы.

Представитель Nvidia отметил, что компания продолжает работу над техническими проблемами в тесном взаимодействии с облачными провайдерами. Массовое производство финальной версии GPU Blackwell началось только в конце октября, а первые поставки ожидаются не ранее конца января.