Tachyum готова всего за €500 млн построить монструозный ИИ-суперкомпьютер производительностью 1 Зфлопс

Tachyum продолжает рассказывать о том, как хороши её грядущие процессоры Prodigy. Вчера компания анонсировала две референсные системы, которые, по словам разработчиков, будут значительно быстрее и энергоэффективнее всех ныне существующих суперкомпьютерных платформ, даже самых производительных. Более того, платформа Tachyum якобы уже сейчас может масштабироваться до зеттафлопсного уровня.

 Изображения: Tachyum

Изображения: Tachyum

 

Первая система Prodigy Rack с воздушным охлаждением включает 24 2U-узла, каждый их которых содержит четыре процессора Prodigy среднего уровня — суммарно 96 CPU на стойку. В сравнении с кластером из четырёх NVIDIA DGX H100, включающем 32 ускорителя H100 (SXM), решение Tachyum обещает быть до 6,5 раз производительнее в HPC-приложениях, а в ИИ-нагрузках — до 12,5 раз быстрее (без уточнения точности вычислений). При этом по производительности и совокупной стоимости владения (TCO) оно до 16 раз лучше по сравнению с решением NVIDIA.

Вторая референсная система Prodigy Rack, на этот раз с жидкостным охлаждением, включает 36 1U-узлов. Узлы тоже четырёхпроцессорные, но уже с флагманскими 128-ядерными CPU Prodigy, работающими на частоте 5,7 ГГц. У этой системы разница в производительности с решением NVIDIA составляет до 13,5 и 27 раз для HPC- и ИИ-нагрузок соответственно, а по показателю TCO — до 10 раз. Впрочем, на бумаге сравнивать между собой два всё ещё не вышедших продукта можно сколько угодно.

Тем не менее, Tachyum предлагает Словакии построить за €70 млн новый суперкомпьютер, который в ИИ-задачах будет иметь производительность 128 Эфлопс, а в HPC — 500 Пфлопс (FP64). Эта гипотетическая система получит более 1,6 Пбайт RAM и 100-Пбайт хранилище (10 стоек), а её энергопотребление составит 9 МВт. В случае платформы с воздушным охлаждением на вычислительную часть потребуется 197 стоек, а с СЖО можно уложиться и 48 стоек.

Суперкомпьютер Tachyum должен быть всемеро быстрее суперкомпьютера NVIDIA Eos и в 25 раз производительнее машины Fugaku, нынешнего лидера TOP500. В данном случае речь идёт об ИИ-нагрузках, хотя к методике подсчёта Tachyum есть вопросы, поскольку для Eos, например, заявлено 9 Пфлопс для FP16-расчётов, а результат Fugaku в HPL-AI на вычислениях смешанной точности составляет 2 Эфлопс.

 FPGA-эмулятор Tachyum Prodigy

FPGA-эмулятор Tachyum Prodigy

 

Если и такого суперкомпьютера окажется недостаточно, то Tachyum готова за €500 млн построить настоящего монстра с FP64-производительностью на уровне 4 Эфлопс, а ИИ — сразу 1 Зфлопс (зеттафлопс). Именно до такого уровня, по словам компании, могут масштабироваться её Prodigy-системы первого поколения. Потреблять такая машина должна менее 70 МВт. Но, честно говоря, пока что всё это звучит слишком хорошо, чтобы быть правдой.

 

Источник:   Tachyum

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Переводчик »