Intel заявила, что её серверный ускоритель вычислений Ponte Vecchio до 2,5 раза быстрее NVIDIA A100

В рамках конференции HotChips 34 компания Intel поделились новыми деталями о готовящихся к выпуску серверных ускорителях вычислений Ponte Vecchio, у которых на одной подложке объединены 63 отдельных элемента (47 функциональных включая GPU). В частности, эксперты компании рассказали о максимальной пропускной способности и производительности ускорителя Ponte Vecchio в вычислениях с одинарной и двойной точностью.

 Источник изображений: Intel

Источник изображений: Intel

 

В составе Ponte Vecchio используются кристаллы, выполненные по трём разным техпроцессам: Intel 7 (10 нм Enhanced SuperFin), TSMC N7 (7 нм) и TSMC N5 (5 нм). Они объединены между собой с помощью новой упаковкой Foveros и шиной EMIB. В составе одного Ponte Vecchio присутствуют 128 графических ядер Xe, 128 ускорителей трассировки лучей, 64 Мбайт кеш-памяти L1 и 408 Мбайт кеш-памяти L2. Данные ускорители также получили до 128 Гбайт высокоскоростной памяти HBM2e и поддерживают интерфейс PCIe 5.0.

 Подсистема памяти и пропускная способность (ниже) Ponte Vecchio

Подсистема памяти и пропускная способность (ниже) Ponte Vecchio

 
 Ponte Vecchio в задачах DPC++ в сравнении с NVIDIA A100

Ponte Vecchio при выполнении кода DPC++ в сравнении с NVIDIA A100

 

По словам Intel, в задачах, созданных на языке Data Parallel C++ (DPC++), ускорители Ponte Vecchio обеспечивают в 1,4–2,5 раза более высокую производительность по сравнению с серверными ускорителями вычислений NVIDIA A100. Intel также предоставила данные о производительности своего решения в ExaSMR OpenMC (современный код Монте-Карло для исследований и разработок), где Ponte Vecchio обеспечивает вдвое более высокую производительность. А в NekRS (для решения уравнений Навье–Стокса) решение Intel показывает производительность в 1,3–1,7 раза выше конкурента.

 Ponte Vecchio в задачах ExaSMR и miniBUDE

Ponte Vecchio в задачах ExaSMR и miniBUDE

 

 

Ожидалось, что Intel Ponte Vecchio вместе с серверными процессорами Intel Sapphire Rapids Xeon дебютируют в составе первого американского эксафлопсного суперкомпьютера Aurora. Однако из-за задержки разработки это звание перехватил суперкомпьютер Frontier, оснащённый третьим поколением процессоров AMD EPYC и графическими ускорителями AMD Instinct MI250X, выдающими пиковую производительность в 1,1 Эфлопс.

 Источник изображения: VideoCardz

Источник изображения: VideoCardz

 

Когда состоится релиз Ponte Vecchio — пока неизвестно. Однако на его замену Intel уже готовит ускоритель Rialto Bridge.

Источник:

Фото процессоров Intel Core 14-го поколения, HEDT-чипов Sapphire Rapids и GPU ускорителей Ponte Vecchio

В мае Intel отчиталась об окончании стадии проектирования процессоров Core 14-го поколения под кодовым именем Meteor Lake. Их ключевой особенностью станет применение мультичиповой компоновки. Релиз этого семейства ожидается в 2023 году, а тем временем с завода Fab 42 в Аризоне вышли первые образцы мобильных Meteor Lake. Их фотографиями поделился ресурс CNET.

На фото хорошо видно, что на одной положке соседствуют 4 отдельных кремниевых кристалла. Один содержит x86-ядра (скорее всего крупнейший кристалл), второй – графическое ядро с 96-192 исполнительными блоками, третий – SoC с интерфейсами ввода-вывода. Назначение оставшегося кристалла остаётся неизвестным. Чип выполнен по техпроцессу Intel 4, ранее известному как 7-нм EUV.

Помимо этого, появились фото серверных процессоров Sapphire Rapids. Они тоже выполнены по мультичиповой топологии, где 4 отдельных чипа с x86-ядрами и 4 чипа многослойной памяти HBM2e общей ёмкостью 64 ГБ. Появятся вариации и без дополнительное памяти.

Наконец, есть изображения графических процессоров для ускорителей вычислений Ponte Vecchio, насчитывающих суммарно 47 отдельных кристаллов на одной подложке и свыше 100 млрд транзисторов.

Источник:

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Переводчик »