По данным Financial Times, тестирование новейших графических процессоров NVIDIA Blackwell требует в 3-4 раза больше времени по сравнению с предыдущим поколением Hopper. Об этом сообщил глава компании Advantest Даг Лефевер.
Увеличение времени тестирования связано с существенным усложнением архитектуры новых GPU. Blackwell B100/B200 состоит из двух вычислительных чиплетов, содержащих 104 миллиарда транзисторов, и восьми чиплетов памяти HBM3E. Для сравнения, GPU Hopper H100 имел один чиплет на 80 миллиардов транзисторов и шесть стеков памяти HBM3.
С ростом количества транзисторов сложность тестирования растет практически экспоненциально. Процедуры проверки должны охватывать высокоскоростные соединения, различные режимы работы и тепловые условия, которые особенно критичны для B200.
Дополнительное время требуется на тестирование технологии упаковки TSMC CoWoS-L, используемой в Blackwell. Необходимо проверять как отдельные компоненты, так и надежность их соединений. Каждый GPU проходит множество циклов тестирования по мере добавления чиплетов на подложку.
Длительное время тестирования Blackwell отражает общую тенденцию роста сложности современных GPU для искусственного интеллекта и высокопроизводительных вычислений. Тщательная проверка необходима для гарантии надежной работы в различных условиях центров обработки данных.