Обзор видеокарты NVIDIA GeForce RTX 3090

В следующем месяце, когда AMD выпустит ускорители Radeon 6000, противостояние между двумя производителям дискретных GPU развернется с новой силой, но уже сейчас очевидно, что NVIDIA сделала очень сильный первый ход. Конечно, поклонникам зеленой марки следовало охладить завышенные ожидания по поводу возможностей GeForce RTX 3080 — первой видеокарты нового семейства, представленной на суд публики. В реальных играх RTX 3080 оказался не настолько силен, как на презентациях чипмейкера, и тем не менее архитектура Ampere повлияла на производительность видеокарт NVIDIA сильнее, чем прорывной для своего времени Maxwell, а в бенчмарках при разрешении 4К или с трассировкой лучей приближается к эталонным достижениям Pascal. А главное, NVIDIA откорректировала ценовую модель RTX 20-й серии, которая не встретила горячего одобрения среди покупателей и, по сути, вынуждала делать апгрейд не ради производительности, не так уж сильно изменившейся по сравнению со старшими моделями GeForce 10 в пересчете на доллар стоимости, а исключительно ради новых функций рендеринга, связанных с аппаратной трассировкой лучей. И что по-настоящему обидно, игры с графическими эффектами на основе рейтрейсинга все еще можно пересчитать по пальцам.

Возможно, грядущие продукты AMD еще заставят нас увидеть Ampere в новом свете, но пока единственным поводом для недовольства новыми видеокартами является их ограниченная доступность и, как следствие, завышенные цены. Но если вдруг именно производительность GeForce RTX 3080 кажется недостаточной, а деньги — второстепенный вопрос, NVIDIA приберегла напоследок более убедительное предложение. Давайте выясним, на какого покупателя рассчитан беспрецедентно мощный (в плане и вычислительного потенциала, и энергопотребления) графический ускоритель, когда всю работу над ошибками прошлого поколения уже сделал, причем на твердую пятерку, RTX 3080.

 

Технические характеристики GeForce RTX 3080

Мы посвятили отдельную статью подробному разбору графических процессоров Ampere, которые лежат в основе новых ускорителей NVIDIA, но для тех читателей, которые пропустили на данный момент самое значительное событие в IT-индустрии 2020 года и только сейчас познакомятся с 30-й серией GeForce, приведем краткое резюме основных характеристик графического процессора GA102 и двух старших моделей в линейке RTX 30.

Кристалл GA102 содержит рекордное для чипов потребительской направленности количество транзисторов (28 млрд) и по этому параметру является самым крупным ASIC, который производится в наши дни на коммерческой основе, после истинного флагмана архитектуры Ampere — GA100 (54 млрд). Однако GA100 зарезервирован ускорителями для дата-центров и совершенно не предназначен для игр. Прямой предшественник новинки, чип TU102 семейства Turing, который применяется в GeForce RTX 2080 Ti и TITAN RTX, содержит в полтора раза меньше транзисторов по сравнению с GA102. Тем не менее чипы Ampere отличаются меньшей площадью в пересчете на количество элементов по сравнению с Turing и повышенной энергоэффективностью благодаря миграции производства с 12-нанометрового конвейера TSMC на самсунговский техпроцесс 8 нм.

Структура полностью функционального кристалла GA102 представлена семью блоками GPC (Graphics Processing Cluster, крупнейшими масштабируемыми компонентами массива) вместо шести в составе TU102. Каждый из них по-прежнему содержит 12 потоковых мультипроцессоров (Streaming Multiprocessor), но одно из ключевых архитектурных отличий Ampere от Turing заключается в том, что массив 32-битных CUDA-ядер, обрабатывающих вещественные числа, внутри SM был удвоен. В результате формула главных исполнительных блоков GA102 включает 10 752 FP32-совместимых CUDA-ядра и 336 блоков наложения текстур.

Однако GeForce RTX 3080 комплектуется существенно урезанной разновидностью GA102, в которой осталось только шесть действующих модулей GPC. Кроме того, два из них не полностью укомплектованы SM’ами. В итоге GeForce RTX 3980 располагает 8 704 шейдерными ALU для операций FP32 и 272 блоками наложения текстур. Но даже в таком виде GA102 располагает колоссальным потенциалом сырой вычислительной мощности по сравнению с топ-моделями 20-й серии. NVIDIA вернулась к практике, принятой в годы Kepler и Maxwell, когда ускорители с модельным номером на -80 или -80 Ti по рекомендованной розничной цене $649–699 были основаны на кремнии первого эшелона — в отличие от семейства Turing — и обеспечивали выгодное соотношение быстродействия в играх и цены.

Для тех, кому требуется максимальная производительность для рабочих задач или попросту хочется иметь самое лучшее железо, NVIDIA создала серию TITAN, но в этот раз появление такой видеокарты осталось под вопросом. Дело в том, что флагманский продукт основной линейки GeForce — RTX 3090 — по всем характеристикам близок к пределу возможностей чипа GA102. В кристалле деактивированы только 2 потоковых мультипроцессора, которые в общей сложности содержат 256 CUDA-ядер FP32, или 2 % от всего массива вещественночисленных ALU. Сделано это скорее с целью обеспечить резерв для возможных дефектов фотолитографии, нежели для сегментации модельного ряда с расчетом на будущие продукты. GeForce RTX 3090 и так превосходит TITAN RTX в 2,2 раза по расчетной пропускной способности операций FP32, а если сравнивать с GeForce RTX 2080 Ti, то уже в 2,5 раза.

А вот от следующей по старшинству модели 30-й серии новый флагман отделяет лишь 20 % теоретического быстродействия. Конечно, мы-то уже знаем, какие числа набрал RTX 3090 в игровых бенчмарках, но читатели, знакомые с обзором RTX 3080, тоже вряд ли рассчитывают увидеть на графиках еще 20 % FPS. Недаром NVIDIA избегает прямых сравнений между GeForce RTX 3080 и RTX 3090 в презентациях, посвященных 30-й серии. Есть только диаграмма с данными трех игр (Control, Minecraft с трассировкой лучей и Borderlands 3), в которых RTX 3090 хвастается на 50 % большей FPS по сравнению с TITAN RTX, но их тоже следует оценивать скептически, ведь ни в одном из перечисленных проектов нет встроенного бенчмарка, а условия тестирования могли сильно повлиять на результат.

В качестве нагрузки, адекватной возможностям GeForce RTX 3090, NVIDIA видит игры на экране с разрешением 8К. Учитывая, что за семь лет видеокарты так и не справились с 4К (после каждого рывка производительности выходят проекты, вновь опускающие частоту смены кадров ниже 60 FPS на максималках), нелегко поверить, что RTX 3090 сразу покорится режим 8К. В конце концов, количество пикселов на таком мониторе или телевизоре не вдвое, а вчетверо больше по сравнению с 4К, поэтому NVIDIA ориентируется на сравнительно легкие игры (такие как Apex Legends, Forza Horizon 4 и World of Tanks), которые являются посильной задачей для RTX 3090 в 8К при высоких настойках графики. Для более требовательных проектов, в том числе с трассировкой лучей, ввели особый режим работы DLSS, который подразумевает масштабирование кадра, отрендеренного в разрешении 2560 × 1440, до полного размера в 7580 × 4320 пикселов, а количество пикселов при таком соотношении между внутренним и выходным разрешением отличается 8,8 раза. Конечно, современные реализации DLSS версии 2.0 работают намного лучше ранних попыток и синтезируют настолько качественное изображение в 4К, что только при внимательном рассмотрении фрагментов кадра можно обнаружить ошибки нейросети, но еще более агрессивные алгоритмы, необходимые для 8К, безусловно, являются для DLSS новым вызовом. Когда у нас появится возможность проверить GeForce RTX 3090 в связке с настоящим 8К-экраном, мы обязательно выясним, соответствуют ли притязания NVIDIA действительности, но сегодня ограничимся стандартным набором тестов при разрешении от 1080p до 2160p.

В любом случае RTX 3090 предназначен не только и не столько для игр, сколько для рабочих приложений. В таких задачах, как 3D-моделирование, кодирование видео и, разумеется, машинное обучение, вполне можно рассчитывать на  близкий к проектным величинамрост быстродействия между TITAN RTX и GeForce RTX 3090 (особенно в свете архитектурных новшеств Ampere) или даже между RTX 3080 и RTX 3090. Но основным преимуществом RTX 3090 перед RTX 3080 являются 24 Гбайт оперативной памяти. Кроме того, для того, чтобы получить такой объем и обеспечить быстрый доступ к данным почти нетронутому кристаллу GA102, в нем активировали все контроллеры GDDR6X, а совокупная ПСП оценивается в 936 Гбайт/с. Более скоростным интерфейсом VRAM среди игровых и просьюмерских ускорителей может похвастаться только Radeon VII (1 Тбайт/с), оборудованный памятью HBM2.

Наконец, GeForce RTX 3090 оказался единственной видеокартой 30-го семейства, которая поддерживает интерфейс NVLink для прямой коммуникации между двумя GPU. Общая пропускная способность канала осталась практически такой же, как в потребительских ускорителях архитектуры Turing (112,5 Гбайт/ с против 100 Гбайт/с в обе стороны), но это уже другая версия интерфейса, который теперь состоит из четырех линий скоростью 28,13 Гбайт/с вместо двух прежних на 50 Гбайт/с и требует использовать мостики нового образца. Функцию NVLink в RTX 3090 тоже оставили не для игр, а для приложений GP-GPU, которые в состоянии ей воспользоваться, но размер кластера в любом случае ограничен двумя графическими процессорами. Поддержка технологии SLI никуда не делась, но со следующего года NVIDIA не будет выпускать профили для новых игр. Работу с несколькими GPU отдали на откуп разработчикам, которым придется реализовывать функцию mGPU самостоятельно в рамках эксплицитного режима Direct3D 12.

ПроизводительNVIDIA
МодельGeForce RTX 2080GeForce RTX 2080 SUPERGeForce RTX 2080 TiTITAN RTXGeForce RTX 3080GeForce RTX 3090
Графический процессор
НазваниеTU104TU104TU102TU102GA102GA102
МикроархитектураTuringTuringTuringTuringAmpereAmpere
Техпроцесс12 нм FFN12 нм FFN12 нм FFN12 нм FFN8 нм (8N)8 нм (8N)
Число транзисторов, млн13 60013 60018 60018 60028 30028 300
Тактовая частота, МГц: Base Clock / Boost Clock1 515/1 710 (Founders Edition: 1 515/1 800)1 650/1 8151 350/1 545 (Founders Edition: 1 350/1 635)1 350/1 770НД /1 710НД /1 695
Шейдерные ALU2 9443 0724 3524 6088 70410 496
Блоки наложения текстур (TMU)184192272288272328
Блоки операций растеризации (ROP)6464889696112
Тензорные ядра368384544576272328
RT-ядра464868726882
Оперативная память
Разрядность шины, бит256256352384320384
Тип микросхемGDDR6 SGRAMGDDR6 SGRAMGDDR6 SGRAMGDDR6 SGRAMGDDR6X SGRAMGDDR6X SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)1 750 (14 000)1 937,5 (15 500)1 750 (14 000)1 750 (14 000)1 188 (19 000)1 219 (19 500)
Объем, Мбайт8 1928 19211 26424 57610 24024 576
Шина ввода/выводаPCI Express 3.0 x16PCI Express 3.0 x16PCI Express 3.0 x16PCI Express 3.0 x16PCI Express 4.0 x16PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)10 069/10 598 (Founders Edition)11 15113 448/14 231 (Founders Edition)16 31229 76835 581
Производительность FP64/FP321/321/321/321/321/321/32
Производительность FP16/FP322/12/12/12/11/11/1
Пропускная способность оперативной памяти, Гбайт/с448496616672760936
Вывод изображения
Интерфейсы вывода изображенияDisplayPort 1.4a, HDMI 2.0bDL DVI-D, DisplayPort 1.4a, HDMI 2.0bDisplayPort 1.4a, HDMI 2.0bDisplayPort 1.4a, HDMI 2.0bDisplayPort 1.4a, HDMI 2.1DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт215/225 (Founders Edition)250250/260 (Founders Edition)280320350
Розничная цена (США, без налога), $699 (рекоменд.)/ 799 (Founders Edition) — в момент выхода699 (рекоменд. в момент выхода)999 (рекоменд.)/ 1 199 (Founders Edition) — в момент выхода2 499699 (рекоменд. в момент выхода)1499 (рекоменд. в момент выхода)
Розничная цена (Россия), руб.63 990 (Founders Edition в момент выхода)56 990 (рекоменд. в момент выхода)95 990 (Founders Edition в момент выхода)221 990 (в момент выхода)63 490 (nvidia.ru)136 990 (nvidia.ru)

Последняя характеристика GeForce RTX 3090, которой осталось уделить внимание, прежде чем мы рассмотрим тестовый образец видеокарты, — это энергопотребление. Согласно оценкам чипмейкера, производительность чипов Ampere на ватт мощности в благоприятных случаях увеличилась на 90 % по сравнению с Turing. Однако в нашем собственном исследовании GeForce RTX 3080 всего лишь на 8 % превосходит по энергоэффективности GeForce RTX 2080 Ti и на 21 % — RTX 2080 SUPER, если речь идет об игровой нагрузке. Флагманская модель обязана превзойти эти результаты благодаря тому, что в ней используется почти целиком активированная версия GA102. И все же RTX 3090 — чрезвычайно прожорливая видеокарта, рассчитанная на энергопотребление вплоть до 350 Вт против 320 Вт у RTX 3080.

Наконец, стоит в очередной раз прокомментировать рекомендованные цены ускорителей 30-й серии. Чемпионскому ускорителю назначили беспрецедентно высокую по меркам потребительских видеокарт (по крайней мере, одночиповых) цену в $1 499. Тем не менее и эта новинка представляет собой более выгодное предложение по сравнению с ее прямым аналогом из прошлого поколения, TITAN RTX, который стоил уже $2 499. Не исключено, что чипмейкер вернется к прежним ценам, если выпустит настоящий TITAN на основе GA102, но появление такой видеокарты под вопросом из-за того, что NVIDIA пока не может предложить профессионалам, которым адресованы «Титаны», ощутимых преимуществ перед теми характеристиками, которыми обладает GeForce RTX 3090. Сам графический процессор здесь работает почти на пике своего потенциального быстродействия, а увеличить объем оперативной памяти до 48 Гбайт будет возможно лишь тогда, когда Micron откроет производство 16-гигабитных чипов GDDR6X. По слухам, такие видеокарты обязательно появятся, только с обычной памятью GDDR6 и в рамках серии Quadro, которой важнее именно объем, нежели повышенная пропускная способность GDDR6X.

В то время как ускорители TITAN производятся по заказу NVIDIA исключительно в референсном дизайне, партнерам чипмейкера дали добро на разработку собственных версий GeForce RTX 3090 наравне с младшими моделями 30-го семейства. Одно из таких устройств, Palit GeForce RTX 3090 GamingPro OC, представит действующий флагман игровых и просьюмерских решений NVIDIA в тестах производительности. Как и GeForce RTX 3080 того же производителя, эта видеокарта заранее разогнана, но о том, что заводской оверклокинг даст RTX 3090 несправедливое преимущество по сравнению с видеокартами прошлых поколений, беспокоиться не стоит. Оба устройства Palit — и RTX 3080, и RTX 3090 — разогнаны всего лишь на 30 МГц по расчетной тактовой частоте в типичной нагрузке (Boost Clock) и, что более важно для производительности современных ускорителей, работают в пределах штатного резерва мощности 320 и 350 Вт соответственно.

 

Palit GeForce RTX 3090 GamingPro OC: конструкция, комплект поставки

По конструкции кулера и ряду основных характеристик версия GeForce RTX 3090, представленная Palit под маркой GamingPro, является копией RTX 3080, которую мы рассмотрели на прошлой неделе. В отличие от NVIDIA, которая предусмотрела в устройствах Founders Edition различные системы охлаждения — одну для RTX 3080 и другую, помощнее, для RTX 3090, большинство независимых производителей изготавливают видеокарты по одному и тому же шаблону.

Неспроста Palit водрузила на чип GA102 такую мощную систему охлаждения. Видеокарта занимает три корпусных слота расширения, а для того, чтобы под тяжестью радиатора не провисал свободный край печатной платы, нужно воспользоваться акриловой подпоркой, которая входит в комплект поставки RTX 3080 и RTX 3090 серии GamingPro OC.

 

Не будем утомлять читателей чрезмерно подробным описанием дизайна и системы охлаждения видеокарты, когда почти такое же устройство мы изучили на прошлой неделе, но вкратце перечислим его ключевые особенности. Palit известна российским покупателям доступными ценами, зачастую именно ее видеокарты занимают нижние строчки прайс-листов той или иной модели, но вместе с тем мы уже не раз убеждались в том, что эта компания умеет экономить на второстепенных функциях устройств, не пренебрегая качеством наиболее важных компонентов, и совершенствует свою продукцию с каждым поколением графических процессоров.

Ускорители на чипах GA102 требуют особой ответственности, ведь на этот раз NVIDIA не постеснялась увеличить потребляемую мощность вплоть до 350 Вт, а миграция на новый тип памяти GDDR6X влечет за собой отдельные сложности. Не удивительно, что Palit совершила очередной шаг вперед в конструкции системы охлаждения, достоинства которой не исчерпываются большим радиатором, который обдувают три вентилятора диаметром 95 мм.

Микросхемы GDDR6X нужно распаивать как можно ближе к подложке графического процессора в связи с повышенными требованиями интерфейса к соотношению «сигнал — шум». Как следствие, можно собирать видеокарты на укороченных печатных платах, а освободившуюся площадь использовать для сквозного продува радиатора — так сделано и в Founders Edition, и в Palit GamingPro.

 

В остальном перед нами вполне типичный, разве что очень крупный даже по стандартам предыдущего поколения, двухсекционный радиатор, пронизанный несколькими U-образными теплотрубками. В отличие от Founders Edition, здесь не используется такой дорогостоящий элемент, как испарительная камера, а тепло с графического процессора снимает никелированная медная подошва. Микросхемы памяти и силовые каскады регулятора напряжения накрыты массивной алюминиевой рамой, сопряженной с основным радиатором, а дроссели VRM — прямо с оребрением последнего через термопрокладки.

В связи с тем, что чипы оперативной памяти в GeForce RTX 3090 распаяны с обеих сторон печатной платы, крышка на обратной стороне установлена не только для красоты и защиты компонентов, но и для охлаждения VRAM.

Новый кулер видеокарт Palit со сквозным продувом радиатора хорошо зарекомендовал себя в тестах GeForce RTX 3080: он одновременно обеспечивает и умеренную температуру GPU, и низкий уровень шума. Тем не менее RTX 3090 в пике энергопотребления достигает уже не 320, а 350 Вт. Посмотрим, какие результаты нас ждут в этот раз. Во всяком случае, предупреждаем потенциальных владельцев GeForce RTX 3080 и особенно RTX 3090 о том, что корпус компьютера, в котором поселится такая видеокарта, должен иметь исключительно качественную вентиляцию. Воздух, насквозь проходящий через радиатор GPU, попадает в зону центрального процессора, а средств для того, чтобы извлекать тепло наружу, у Palit GamingPro нет: все радиаторные ребра проходят параллельно крепежной планке видеокарты, а прорези в ней, таким образом, являются чисто декоративными.

 

Palit GeForce RTX 3090 GamingPro OC: печатная плата

Судя по разводке печатных плат GeForce RTX 3080, фотографии которых появились в интернете после релиза 30-й серии, многие производители, включая Palit, взяли за основу PCB референсный дизайн (не путать с картами Founders Edition, выделяющимся из основой массы еще сильнее, чем в 20-й серии), который NVIDIA распространила среди партнеров, чтобы поскорее наладить выпуск ускорителей нового поколения.

Палитовский вариант GeForce RTX 3090 представляет собой то же самое, только с поправкой на увеличенное число микросхем оперативной памяти, которые распаяны с двух сторон текстолита и работают в clamshell-режиме. Кстати, чипов GDDR6X с номинальной пропускной способностью 19,5 Гбит/с Micron не производит. Все разновидности RTX 3090 комплектуются памятью, рассчитанной на 21 Гбит/с, но ее действительную пропускную способность уменьшили до 19,5 в интересах стабильности, а это неплохой задел для разгона.

Помимо 24 Гбайт оперативной памяти, печатная плата Palit GeForce RTX 3090 GamingPro OC отличается от PCB следующей по старшинству модели того же производителя усиленными регуляторами напряжения. Разводка PCB позволяет организовать 16-фазное питание графического процессора при помощи двух восьмифазных контроллеров On Semiconductor NCP81610, каждый из которых обслуживает свою порцию кристалла GA102.  Памяти GDDR6X выделено вплоть до четырех фаз, но компоненты одной фазы питания GPU и одной VRAM — то, на чем Palit нашла возможность сэкономить. В фазах питания графического процессора применяются силовые каскады AOZ5311NQI от Alpha & Omega с номинальным током 50 А.

 

Тестовый стенд, методика тестирования

Тестовый стенд
CPUIntel Core i9-9900K (4,9 ГГц, 4,8 ГГц в AVX, фиксированная частота)
Материнская платаASUS MAXIMUS XI APEX
Оперативная памятьG.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 × 8 Гбайт (3200 МГц, CL14)
ПЗУIntel SSD 760p, 1024 Гбайт
Блок питанияCorsair AX1200i, 1200 Вт
Система охлаждения CPUCorsair Hydro Series H115i
КорпусCoolerMaster Test Bench V1.0
МониторNEC EA244UHD
Операционная системаWindows 10 Pro x64
ПО для GPU AMD
Все видеокартыAMD Radeon Software Adrenalin 2020 Edition 20.8.3
ПО для GPU NVIDIA
Все видеокартыNVIDIA GeForce Game Ready Driver 456.38/356.38
Игры
Игра (в порядке даты выхода)APIМетод тестированияНастройки графикиПолноэкранное сглаживание
Strange BrigadeVulkanВстроенный бенчмаркМакс. качество графикиAA Ultra
Shadow of the Tomb RaiderDirectX 12Встроенный бенчмаркМакс. качество графики. DXR выкл., DLSS выкл.TAA
Assassin’s Creed OdysseyDirectX 11Встроенный бенчмаркМакс. качество графикиAA High (TAA)
Battlefield VDirectX 12Миссия Liberte + OCATМакс. качество графики. DXR выкл., DLSS выкл.TAA High
Metro ExodusDirectX 12Встроенный бенчмаркМакс. качество графики. DXR выкл., DLSS выкл. Shading Rate 100%TAA
Total War: THREE KINGDOMSDirectX 12Встроенный бенчмарк (Battle Benchmark)Макс. качество графикиTAA
ControlDirectX 12OCATМакс. качество графикиTAA
Borderlands 3DirectX 12Встроенный бенчмаркМакс. качество графикиTAA
Red Dead Redemption 2VulkanВстроенный бенчмаркМакс. качество графикиTAA High
DOOM EternalVulkanНачало миссии Mars Core + OCATМакс. качество графикиTAA
Игры (с трассировкой лучей)
Игра (в порядке даты выхода)APIМетод тестирования Полноэкранное сглаживание
Battlefield VDirectX 12Миссия Liberté + OCATМакс. качество графики. DXR Raytrace Reflection Quality: UltraTAA/DLSS
Shadow of the Tomb RaiderDirectX 12Встроенный бенчмаркМакс. качество графики. Ray Traced Shadows Quality: UltraTAA/DLSS
Metro ExodusDirectX 12Встроенный бенчмаркМакс. качество графики. Shading Rate 100%. Ray Trace: UltraTAA/DLSS
Quake II RTXVulkanTimedemo, запись demo1.dm2Макс. качество графикиTAA
ControlDirectX 12OCATRay Tracing Preset: HighTAA/DLSS 2.0
Minecraft with RTX BetaDirectX 12Бенчмарк в мире Portal Pioneers + OCATМакс. дальность рендеринга геометрии и частицНет/DLSS 2.0

В большинстве тестовых игр показатели средней и минимальной кадровых частот выводятся из массива времени рендеринга индивидуальных кадров, который записывает встроенный бенчмарк (или утилита OCAT, если его нет).

Средняя частота смены кадров на диаграммах является величиной, обратной среднему времени кадра. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду теста. Из этого массива чисел выбирается значение, соответствующее 1-му процентилю распределения. Red Dead Redemption 2 является исключением: ее встроенный бенчмарк регистрирует 1-й процентиль времени рендеринга кадра, из которого выводится соответствующая кадровая частота.

Вычисления общего назначения, кодирование/декодирование видео
ПриложениеНастройкиAPI
AMDNVIDIAAMDNVIDIA
Adobe Premiere Pro CC 2020PugetBench for Premiere Pro 0.88GPU Effects: воспроизведение (ProRes 422, 4K@59,94 FPS)OpenCLCUDA
GPU Effects: экспорт в H.264 40 Мбит/с и ProRes 422HQ (4K@59,94 FPS)
Blender 2.9Демо Class Room с сайта Blender FoundationРендерер Cycles. Feature Set: Supported. Размер тайла: 256 × 256OpenCLCUDA/OptX
Демо Nissan GTR от AMDРендерер AMD Radeon ProRenderOpenCL
DXVA Checker 4.1.2, Decode BenchmarkH.264 (Microsoft H264 Video Decoder)1920 × 1080 (High Profile, L4.1); 3840 × 2160 (High Profile, L5.1)D3D11VA
H.265 (Microsoft HEVC Video Extensions)1920 × 1080 (Main Profile, L4.0); 3840 × 2160 (Main Profile, L5.0); 7680 × 4320 (Main Profile, L6.0)
VP9 (Microsoft VP9 Video Extensions)1920 × 1080; 3840 × 2160; 7680 × 4320
AV1 (Microsoft AV1 Video Extension)
FFmpeg 4.2.1, кодирование H.2641920 × 1080-c:v h264_amf -quality speed -coder cabac -level 4.1 -refs 1 -b:v 3M-c:v h264_nvenc -preset fast -coder cabac -level 4.1 -refs 1 -b:v 3MAMFNVENC
3840 × 2160-c:v h264_amf -quality speed -coder cabac -level 5.1 -refs 1 -b:v 7.5M-c:v h264_nvenc -preset fast -coder cabac -level 5.1 -refs 1 -b:v 7.5M
FFmpeg 4.2.1, кодирование H.2651920 × 1080-c:v hevc_amf -quality speed -level 4 -b:v 3M-c:v hevc_nvenc -preset fast -level 4 -b:v 3M
3840 × 2160-c:v hevc_amf -quality speed -level 5 -b:v 7.5M-c:v hevc_nvenc -preset fast -level 5 -b:v 7.5M
7680 × 4320Н/Д-c:v hevc_nvenc -preset fast -level 6 -refs 1 -b:v 20M
REDCINE-X PROДекодирование файлов RED R3D с разрешением 4К, 6К и 8КOpenCLCUDA

Мощность видеокарт регистрируется отдельно от CPU и прочих компонентов ПК с помощью устройства NVIDIA PCAT. В качестве тестовой нагрузки для тестов мощности и уровня шума используется игра Crysis 3 при разрешении 3840 × 2160 без полноэкранного сглаживания и с максимальными параметрами качества графики, а также стресс-тест FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x). Замеры всех параметров выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются.

 

Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

Прим. В скобках после названий видеокарт указаны базовая и boost-частота согласно спецификациям каждого устройства. Видеокарты нереференсного дизайна приведены в соответствие с референсными параметрами (или приближены к последним) при условии, что это можно сделать без ручной правки кривой тактовых частот. В противном случае (ускорители серии NVIDIA GeForce 16, а также GeForce RTX 2070/2080/2080 Ti Founders Edition) используются настройки производителя.

 

Тактовые частоты, энергопотребление, температура, уровень шума и разгон

Обе новые видеокарты на чипах NVIDIA — и GeForce RTX 3080, и RTX 3090 — в наших тестах представлены устройствами Palit, их обслуживает одинаковая система охлаждения, обе слегка (буквально для галочки) разогнаны на 30 МГц по частоте Boost Clock, но работают в границах референсного TDP: 320 и 350 Вт соответственно. Это идеальные условия для сравнения реальных тактовых частот под нагрузкой и тепловыделения RTX 3080 и RTX 3090, ведь большинство партнеров NVIDIA сделали выбор в пользу унифицированного дизайна старшей и младшей модели вместо того, чтобы дополнительно усиливать систему охлаждения RTX 3090, как сделано в устройствах Founders Edition.

Как показала практика, по перечисленным параметрам RTX 3090 не так уж сильно отличается от RTX 3080. Да, потребляемая мощность флагмана выше на 24–28 Вт, однако тактовым частотам GPU она почти не вредит: разброс стабильной тактовой частоты в играх между двумя разновидностями GA102 составляет около 38 МГц, а 1950 МГц — универсальный предел авторазгона при штатных настройках. А вот кулер, возможно, и стоило заменить чем-то посерьезнее. Нельзя сказать, что Palit GeForce RTX 3090 GamingPro OC перегревается или работает слишком громко, но все-таки по уровню шума видеокарта недалеко ушла от турбинной версии GeForce GTX 1080 Ti, а это, как вы понимаете, не очень лестное сравнение. RTX 3080 того же производителя работает намного тише.

Рабочие параметры под нагрузкой (Crysis 3)
ВидеокартаНастройкиТактовая частота GPU, МГцНапряжение питания GPU, ВЧастота вращения вентиляторов, об/мин (% от макс.)Частота вращения вентиляторов 2, об/мин (% от макс.)
Средн.Макс.Средн.Макс.Средн.Средн.
Palit GeForce RTX 3090 GamingPro OC (1395/1725 МГц, 19,5 Гбит/с, 24 Гбайт) 18161950Н/ДН/Д2039 (53%)2038 (53%)
Palit GeForce RTX 3090 GamingPro OC (+50 МГц, 21,8 Гбит/с, 24 Гбайт)+4% мощности18651995Н/ДН/Д2104 (55%)2104 (55%)
Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт) 18541950Н/ДН/Д1823 (46%)1823 (46%)
Palit GeForce RTX 3080 GamingPro OC (+50 МГц, 21,2 Гбит/с, 10 Гбайт)+9% мощности19402010Н/ДН/Д1894 (48%)1894 (48%)
NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11000 Мбит/с, 11 Гбайт) 173518100,961,012377 (50%)Н/Д
NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт) 190719201,031,041969 (53%)1969 (53%)
NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт) 172318600,911,032082 (56%)2082 (56%)
NVIDIA TITAN RTX (1350/1770 МГц, 14 Гбит/с, 24 Гбайт) 173518300,910,992099 (57%)2099 (57%)
AMD Radeon VII (1800 МГц, 2000 Мбит/с, 16 Гбайт) 17561786Н/ДН/Д2617 (Н/Д)Н/Д
AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт)Термопаста ARCTIC MX-2 вместо графитовой прокладки179518191,071,182102 (43%)Н/Д

Прим. Измерение всех параметров выполняется после прогрева GPU и стабилизации тактовых частот.

В плане оверклокинга мы рассчитывали на GeForce RTX 3090 еще меньше, чем на RTX 3080, но оказалось, что флагманская модель разгоняется чуть лучше. Нам вновь не удалось повысить целевой параметр тактовой частоты GPU более чем на 50 МГц, но благодаря тому, что резерв мощности устройства можно сдвинуть не на 4, а уже на 9 %, фактическая прибавка стабильной тактовой частоты под нагрузкой достигла 85 МГц против 49 МГц у RTX 3080. Кроме того, оперативная память GDDR6X на этот раз не была такой привередливой. GeForce RTX 3090 укомплектован чипами, которым положено работать на скорости 21 Гбит/с, поэтому сильный разгон со штатных для RTX 3090 19,5 до 21,8 Гбит/с не вызывает ни потери стабильности, ни просадок быстродействия. Подумать только, теперь совокупная ПСП видеокарты составляет 1046 Гбайт/с — даже больше, чем у Radeon VII с чипами HBM2.

И все-таки оверклокинг GeForce RTX 3090 представляет скорее академический, нежели практический интерес. По крайней мере, если речь идет об ускорителе Palit GamingPro OC. К тому же ценой дополнительной ПСП и 85 МГц тактовой частоты ядра стал рост энергопотребления еще на 14–21 Вт — вплоть до пугающих 358–356 Вт. К счастью, GPU по-прежнему избегает перегрева, а ощутить разницу в уровне шума системы охлаждения можно только под стрессовой нагрузкой.

 

Игровые тесты (1920 × 1080)

Как мы уже выяснили в обзоре GeForce RTX 3080, от таких мощных видеокарт немного пользы в разрешении 1080p. Если только не нагружать GPU трассировкой лучей (этот вопрос мы раскроем отдельно), но пока такие игры можно пересчитать по пальцам, покупка GeForce RTX 3090 для игры на мониторе Full HD выглядит нелепо. Конечно, новый флагман даже в невыгодных для себя условиях продемонстрировал серьезный межпоколенческий рост производительности: он опередил GeForce RTX 2080 Ti и TITAN RTX на 30 и 24 % усредненной кадровой частоты, обеспечивает на 81 % больше FPS по сравнению с любимым в народе GeForce GTX 1080 Ti и на 76 % больше по сравнению с просьюмерским ускорителем Radeon VII.

И все-таки это не те числа, на которые имеет право рассчитывать покупатель самой дорогостоящей модели новой волны, тем более что разница между RTX 3080 и RTX 3090 колеблется вокруг 9 % кадров в секунду. Если рассматривать GeForce RTX 3090 как игровой, а не профессиональный ускоритель (что само по себе не вполне справедливо), нужно ориентироваться на игры с рейтресингом или при более высоком разрешении экрана. Блок тестовых результатов в 1080p является иллюстрацией этого правила, а не укором RTX 3090, и все-таки обидно, что в наше время, когда существуют мониторы с частотой обновления вплоть до 360 Гц, связка GPU и центрального процессора оказалась бутылочным горлышком системы, сдерживающим скорость реакции в графическом режиме, который больше всего располагает к высокому фреймрейту.

 

Игровые тесты (2560 × 1440)

Раньше, когда в играх преобладали ресурсоемкие методы полноэкранного сглаживания MSAA и SSAA, бенчмарки при разрешении 1440p вызывали нагрузку на GPU, эквивалентную тестам на 4К-экране, но без сглаживания. Теперь, когда почти все новые игры полагаются на быстрые временные алгоритмы сглаживания, во многих случаях фреймрейт в 1080p и 1440p на мощных видеокартах различается незначительно. Преимущество GeForce RTX 3090 перед топовыми «зелеными» моделями предыдущего поколения возросло до 36 % средней частоты смены кадров, если взять за точку отсчета GeForce RTX 2080 Ti, и 29 % в случае TITAN RTX, но серьезной прибавки FPS по сравнению с GeForce RTX 3080 флагман не принес, если не считать таковой 10 % среднего фреймрейта.

Зато при смене разрешения с 1080p на 1440p нарастает дистанция между RTX 3090 и более слабыми ускорителями. Теперь GeForce RTX 3090 практически вдвое превосходит по быстродействию GeForce GTX 1080 Ti и Radeon RX 5700 XT, а GeForce GTX 1080 без приставки Ti — уже в 2,5 раза. Тем не менее бенчмарки в режиме 1440p — это все еще не совсем подходящая среда для испытаний устройства, которое обещает вытянуть современные игры на 8К-экране. Нам еще предстоит выяснить, соответствует ли GeForce RTX 3090 таким громким заявлениям, как только мы получим в свое распоряжение монитор или телевизор с подходящими параметрами.

Тем более даже 4К еще ни в коем случае нельзя считать пройденным этапом. В нашей базе тестовых результатов еще нет ни одной видеокарты, которая гарантирует твердые 60 FPS во всех современных играх при максимальных настройках детализации при разрешении 2160p. Быть может, не хватало именно GeForce RTX 3090, чтобы исправить эту недоработку?

 

Игровые тесты (3840 × 2160)

В тестах при разрешении 4К разрыв между GeForce RTX 3080 и RTX 3090 приобретает наибольшие значения. Конечно, есть такие упрямые игры, как Assassin’s Creed Odyssey, которые по-прежнему не могут извлечь из почти нетронутого кристалла GA102 на плате RTX 3090 более чем 2 % дополнительных FPS. Впрочем, ACO — единственная игра в подборке бенчмарков, которая держится за устаревший API Direct3D 11. В технически современных тайтлах разница между GeForce RTX 3080 и RTX 3090 составляет 9–14 % (12% в среднем) частоты смены кадров. На большее уже вряд ли можно рассчитывать при игровой нагрузке, и только в избранных профессиональных приложениях, возможно, мы все-таки увидим числа, близкие к 20 %, которыми оценивается пропускная способность RTX 3090 в операциях FP32 по сравнению с RTX 3080.

Тем не менее именно 9–14 % FPS недоставало GeForce RTX 3080, чтобы пробить планку 60 FPS в таких чрезвычайно требовательных играх, как Control, Metro Exodus и Red Dead Redemption 2. 60 FPS все еще не даются современному железу в Total War: THREE KINGDOMS, однако в данном случае у нас больше вопросов к оптимизации графического движка, который используется в стратегиях данной серии.

В 4К поистине впечатляющих масштабов достигло преимущество RTX 3090 перед экс-топовыми моделями NVIDIA. Новый флагман мог бы заменить сразу три GeForce GTX 1080 при условии, если бы они эффективно работали в режиме тройного SLI, а GeForce GTX 1080 Ti он превосходит вдвое, и еще 16 % FPS сверх того. То же относится к самым мощным предложениям AMD в преддверии релиза Radeon 6000-й серии: GeForce RTX 3090 на 123 % FPS опередил Radeon RX 5700 XT и выдал дойную норму быстродействия по сравнению с Radeon VII, который, как известно, именно при разрешении 4К работает наиболее эффективно.

GeForce RTX 3090 выглядит очень солидно даже на фоне самых мощных ускорителей семейства GeForce RTX 20: он на 44 % быстрее GeForce RTX 2080 Ti и дает на 36 % больше FPS по сравнению с TITAN RTX.

 

Игровые тесты в разгоне

Как мы и предполагали, при скромном разгоне GPU на 85 МГц стабильной тактовой частоты под игровой нагрузкой практически значимого роста быстродействия в играх быть не может. Не факт, что более значительную роль в экспериментах с GeForce RTX 3090 не играет оперативная память GDDR6X, набранная чипами со штатной пропускной способностью 21 Гбит/с на контакт, которую очень легко восстановить, отталкиваясь от заниженных 19,5 Гбит/с, и даже превысить. В общей сложности Palit GeForce RTX 3080 GamingPro OC лучше поддается разгону, чем RTX 3080 под той же маркой, но даже в режиме 4К, наиболее чувствительном к производительности графической карты, средняя прибавка кадровой частоты сводится к 4 % FPS.

 

Игровые тесты с трассировкой лучей

Трассировка лучей, особенно при разрешениях 1440p и 4К, помогла GeForce RTX 3080 дальше всего оторваться старших «Тьюрингов» по кадровой частоте в играх. Если взять за точку отсчета именно топовые видеокарты на чипе TU102, GeForce RTX 2080 Ti и TITAN RTX, преимущество новой архитектуры никуда не делось и предсказуемым образом возросло. GeForce RTX 3090 обеспечивает рост фреймрейта на величину от 33 до 45 % по сравнению с уровнем GeForce RTX 2080 Ti и от 29 до 40 % по сравнению с TITAN RTX.

RTX 3090 даже не нуждается в DLSS для того, чтобы поднять средний фреймрейт выше 60 FPS на экране c разрешением 1440p в таких играх, как Metro Exodus, а полностью трассированный Minecraft и Quake II RTX в 1440p на нем просто летают. Пожалуй, если бы игр с поддержкой трассировки лучей было больше, чем в данный момент, можно было бы сказать, что GeForce RTX 3080 и RTX 3090 — вполне рациональная покупка не только для обладателей мониторов 1440p и 4K, но и для основной массы геймеров, сидящих за экранами Full HD.

В режиме 2160p нашлась только одна игра, в которой GeForce RTX 3090 выдает больше 60 FPS без масштабирования кадров силами DLSS, — Battlefield V, а в Shadow of the Tomb Raider ему не хватило 6 кадров в секунду до критической отметки. В других проектах с рейтрейсингом обе новые видеокарты вырвались за предел 30 FPS, что само по себе является важным достижением, но по большому счету игры с трассировкой лучей в 4К и без DLSS еще не являются в полной мере рабочим сценарием даже для GPU такого класса, как GA102. В свою очередь, с DLSS новый флагман по-прежнему значительно, но уже не так сильно превосходит по быстродействию своих предшественников: он на 36 % быстрее GeForce RTX 2080 Ti и на 30 % FPS опередил TITAN RTX.

В таких условиях идет борьба за разницу в единицы FPS, не ослабевающая даже на верхушке самого 30-го семейства. В игровой трассировке лучей GeForce RTX 3090, может быть, лишь на 11 % лучше RTX 3080 (и это самый благоприятный исход), но другой видеокарты, которая сделает, к примеру, Control безоговорочно играбельным в 4К на максималках (пусть и с DLSS, которая в этой игре работает весьма качественно), пока просто не существует.

 

Вычисления общего назначения

Хотя GeForce RTX 3090 формально отделен от прочих моделей 30-й серии только высокой ценой, по объему оперативной памяти и, если честно, по скромной прибавке FPS в играх можно понять, что это устройство предназначено скорее для работы в профессиональных приложениях, нежели для развлечения. Пока не появились устройства Quadro на базе GA102, которым, по слухам, достанется 48 Гбайт оперативной памяти, видеокарты с более широкими возможностями для рабочих станций просто не существует.

Первой сферой применения GeForce RTX 3090, в которой дополнительные 20 % вычислительной мощности FP32 могут иметь решающее значение даже без учета вдвое большего объема VRAM по сравнению с GeForce RTX 3080, является видеомонтаж и кодирование видео высокого разрешения. Живое воспроизведение роликов, отягощенных сложными эффектами, в Adobe Premiere Pro по-прежнему невозможно в полном разрешении 4К с кадровой частотой 60 FPS, но RTX 3090 уже вплотную приблизился к отметке 50, в то время как GeForce RTX 2080 Ti и TITAN RTX ограничены 41–42 FPS. Но основное преимущество почти целиком функционального чипа GA102 состоит в ускорении кодирования. В то время как GeForce RTX 3080 в этой задаче оказался ничем не лучше TITAN RTX, RTX 3090 удалось нарастить скорость рендеринга в ProRes на 19 %. Другая, и довольно неожиданная, находка состоит в том, что активация выделенного кодировщика NVENC для экспорта в H.264 не принесла никаких преимуществ всем участвующим в сравнении картам NVIDIA, за исключением RTX 3090. Похоже, в остальных случаях быстродействие просто упирается в шейдерный массив GPU, а дополнительные CUDA-ядра RTX 3090 устраняют бутылочное горлышко и позволяют выполнить задачу на 19% быстрее, чем без помощи NVENC. Заметим, что речь идет о тестах с тяжелыми эффектами, рассчитанными на максимальную загрузку GPU. В других условиях кодирование на NVENC может ускорить рендеринг еще сильнее — конечно, при условии, что пользователь готов пойти на компромисс в качестве изображения, так как программный метод здесь по-прежнему вне конкуренции.

GeForce RTX 3090 произвел еще более сильное впечатление в задачах оффлайновой трассировки лучей. Бенчмарк тайлового рендерера Cycles оценил производительность RTX 3090 на 25 % выше, чем RTX 3080, а по сравнению с TITAN RTX скорость прорисовки увеличилась более чем вдвое — независимо от того, используется ли целиком программный рейтрейсинг под API CUDA или аппаратные RT-ядра под OptX.

В бенчмарке на движке ProRender новый флагман выступил не настолько ярко, но ощутимый рост быстродействия по-прежнему имеет место: GeForce RTX 3090 на 15% опередил RTX 3080 и на 40 % — TITAN RTX.

Прим. Для тестов новых видеокарт мы перешли на актуальную релизную версию Blender — 2.9 — и обнаружили, что Radeon RX 5700 XT снова потерял возможность работать с движком Cycles.

Наконец, библиотеки REDCINEX-PRO, предназначенные для аппаратного декодирования и дебайеринга файлов RED R3D с привлечением тензорных ядер чипов NVIDIA, уже не особенно чувствительны к разнице между GeForce RTX 3080 и RTX 3090. Благо любая из двух видеокарт более чем в два раза ускоряет обработку записей в разрешении 4К, а в 6К GeForce RTX 3090 на 25 % быстрее по сравнению с TITAN RTX.

 

Кодирование/декодирование видео

В тестах GeForce RTX 3080, которые были опубликованы на прошлой неделе, мы обошли стороной одну из новых функций кремния Ampere — аппаратное декодирование видеопотока AV1. Дело в том, что бесплатные программные кодировщики нового стандарта AV1, которыми мы пытались воспользоваться, пока не вышли из экспериментального статуса и работают настолько медленно, что на создание тестового файла с разрешением 8К (которое, собственно говоря, и требует высокой компрессии, возможной в рамках AV1) ушло бы столько времени, что материал для бенчмарка не успел бы и к обзору RTX 3090. Такое происходит именно при кодировании в 8К, причем дело не в производительности центрального процессора. К счастью, мы отыскали в Сети запись AV1 примерно с таким же битрейтом, как у тестовых 8К-роликов в HEVC и VP9, и можем смело сравнивать скорость обработки разных форматов силами обновленного модуля NVDEC.

Кодек AV1 предназначен в первую очередь для стриминга видео с высоким разрешением и HDR по сети и призван заменить в этой роли VP9. Однако ценой высокой степени сжатия при одновременно высоком качестве изображения является вычислительная мощность, необходимая для декодирования потока. Видео AV1 в 8К с кадровой частотой 30 FPS загружает восьмиядерный CPU тестового стенда (Intel Core i9-9900K, работающий на постоянной частоте 4,8 ГГц с применением инструкций AVX) на 50 %, когда файл воспроизводится из локального хранилища, и на 60 % через браузер. Конечно, большинству пользователей попросту не на чем смотреть видео в 8К, но, с другой стороны, и такие компьютеры есть далеко не у всех.

Как показали тесты, аппаратный декодер NVDEC в чипах Ampere обрабатывает AV1 даже быстрее прочих методов компрессии и достигает пропускной способности 110 кадров в секунду при разрешении 8К без HDR. Кроме того, новая версия NVDEC еще эффективнее обращается с потоком HEVC и VP9, чем ASIC, встроенный в процессоры Turing. Не сомневаемся, что способность декодировать AV1 приобретут все будущие продукты 30-й серии на основе младших чипов Ampere, которые со временем найдут применение не только в дискретных видеокартах для ПК, но и в мобильных устройствах.

Что касается аппаратного кодировщика H.264 и HEVC, то в GA102 используется та же версия NVENC, что в «Тьюрингах», но жаловаться на ее производительность не приходится — в быстром режиме можно кодировать хоть 8К при 60 FPS в реальном времени.

 

Производительность на ватт и площадь GPU

Теперь, когда мы можем оперировать результатами тестов GeForce RTX 3090, в котором используется графический процессор с минимальными потерями активных вычислительных блоков и полной 384-битной шиной памяти, вернемся к оценке энергоэффективности чипа GA102. Перед нами открылась довольно любопытная картина. Ни один продукт на чипах Turing не дает в сравнении с RTX 3090 таких чисел, как 90-процентная разница в производительности на ватт, о которой говорят презентации NVIDIA. Если отталкиваться от GeForce RTX 2080 SUPER на полностью активном чипе TU104, речь идет о росте энергоэффективности на 27 %. Однако чем меньше внутри чипа вычислительных блоков, оказывающих прямое влияние на быстродействие (потоковых мультипроцессоров и шейдерных ALU), тем больше вклад в потребляемую мощность тех частей GPU, которые не настолько хорошо масштабируются.

Стоит перейти к GeForce RTX 2080 Ti и TITAN RTX, и преимущество GeForce RTX 3090 в энергоэффективности падает до 9 и 5 % соответственно. Кроме того, мы обнаружили, что по удельному игровому быстродействию на число транзисторов RTX 3090 уступает 11 % в пользу TITAN RTX. Теоретически полностью функциональный кристалл GA102 мог бы дать немного иные числа, но в RTX 3090 чип утратил всего лишь 2 % потенциальной вычислительной мощности. Нельзя сослаться и на игры с трассировкой лучей, ведь при разрешении 4К соотношение в производительности между рассматриваемыми устройствами от этого фактора зависит слабо.

ПроизводительNVIDIAAMD
МодельGeForce RTX 3090GeForce RTX 3080GeForce GTX 1080 TiGeForce RTX 2080 SUPERGeForce RTX 2080 Ti FETITAN RTXRadeon VIIRadeon RX 5700 XT
Графический процессорGA102GA102GP102TU104TU102TU102Vega 20 XLNavi 10 XT
МикроархитектураAmpereAmperePascalTuringTuringTuringGCN 5 поколенияRDNA
Техпроцесс, нм8 нм (8N)8 нм (8N)16 нм FFN12 нм FFN12 нм FFN12 нм FFN7 нм FinFET7 нм FinFET
Число транзисторов, млн28 30028 30012 00013 60018 60018 60013 20010 300
Площадь чипа, кв. мм628628471545754754331251
Средняя потребляемая мощность (Crysis 3), Вт337314227248255262280213
Производительность/Вт100%−4%−31%−21%−8%−5%−39%−29%
Производительность/млн транзисторов100%−10%+9%+20%+5%+12%+9%+23%
Производительность/кв. мм100%−10%−38%−33%−42%−39%−4%+12%
         
Производительность/Вт (обратное сравнение)100%+4%+45%+27%+9%+5%+64%+41%
Производительность/млн транзисторов (обратное сравнение)100%+12%−8%−17%−5%−11%−8%−19%
Производительность/кв. мм (обратное сравнение)100%+12%+62%+50%+73%+63%+4%−11%

Прим. Игры при разрешении 3840 × 2160 без трассировки лучей и DLSS.

Почти удвоенная оценка энергоэффективности не выглядит адекватно даже в сравнении GA102 с флагманским GPU, который NVIDIA использовала в потребительских видеокартах серии GeForce 10: RTX 3090 обеспечивает только на 45 % больше FPS на ватт, чем GeForce GTX 1080 Ti, хотя переход чипов с конвейера 16 нм TSMC на самсунговские 8 нм представляет собой один полный шаг производственной нормы. Как ни крути, Ampere (по крайней мере, в его потребительской версии на базе техпроцесса 8N) покорил новые высоты быстродействия в первую очередь за счет простого наращивания вычислительных блоков, которое позволила осуществить передовая фотолитография и новая компоновка логики внутри SM, а не за счет повышенной энергоэффективности. Впрочем, мы все еще далеки от того, чтобы поставить точку в этом вопросе: если фокусироваться именно на быстродействии на ватт, лучше всего взять для сравнения будущий GeForce RTX 3070, который ближе всего стоит к продуктам на базе TU102 по количеству транзисторов GPU и потребляемой мощности.

Кроме того, NVIDIA по-прежнему находится в выгодном положении по сравнению с продуктами конкурента: чип Navi 10 не догнал по энергоэффективности даже Turing, а GeForce RTX 3090 опережает Radeon RX 5700 XT уже на 41 % удельного быстродействия. Следует вновь сделать поправку на разный масштаб сравниваемых процессоров, но AMD явно предстоит выполнить определенную работу над ошибками, чтобы сократить или, в идеале, устранить технологическое отставание своего кремния.

 

Результаты игровых тестов и рекомендованные цены

1920 × 1080
 Полноэкранное сглаживаниеPalit GeForce RTX 3090 GamingPro OCPalit GeForce RTX 3080 GamingPro OCNVIDIA GeForce GTX 1080NVIDIA GeForce GTX 1080 TiNVIDIA GeForce RTX 2080 SUPERNVIDIA GeForce RTX 2080 Ti FENVIDIA TITAN RTXAMD Radeon VIIAMD Radeon RX 5700 XT
Assassin’s Creed OdysseyTAA High81 / 10678 / 10055 / 6267 / 7670 / 8174 / 9075 / 9056 / 6851 / 67
Battlefield VTAA High154 / 175153 / 177107 / 127124 / 140147 / 159142 / 167150 / 171133 / 154125 / 151
Borderlands 3TAA130 / 156124 / 14255 / 6372 / 8383 / 9498 / 111106 / 12080 / 8981 / 89
ControlTAA153 / 168137 / 15259 / 6378 / 8396 / 105118 / 129117 / 13187 / 9578 / 87
DOOM EternalTAA201 / 321189 / 29571 / 12287 / 156141 / 221165 / 253176 / 266102 / 167106 / 171
Metro ExodusTAA63 / 10956 / 9625 / 4532 / 5839 / 6947 / 8051 / 8730 / 5430 / 54
Red Dead Redemption 2TAA High85 / 9477 / 8429 / 3138 / 4149 / 5453 / 6363 / 6740 / 4438 / 42
Shadow of the Tomb RaiderTAA111 / 167111 / 16265 / 8489 / 117107 / 140113 / 150113 / 15584 / 11589 / 114
Strange BrigadeAA Ultra292 / 376264 / 346106 / 137136 / 178176 / 228207 / 269220 / 287123 / 186119 / 168
Total War: THREE KINGDOMSTAA94 / 11286 / 10238 / 4647 / 5760 / 7171 / 8575 / 8944 / 5239 / 47
Макс.  +1%−27%−20%−9%−5%−2%−12%−14%
Средн.  −8%−56%−45%−33%−23%−19%−43%−45%
Мин.  −12%−67%−56%−43%−33%−29%−54%−58%
2560 × 1440
 Полноэкранное сглаживаниеPalit GeForce RTX 3090 GamingPro OCPalit GeForce RTX 3080 GamingPro OCNVIDIA GeForce GTX 1080NVIDIA GeForce GTX 1080 TiNVIDIA GeForce RTX 2080 SUPERNVIDIA GeForce RTX 2080 Ti FENVIDIA TITAN RTXAMD Radeon VIIAMD Radeon RX 5700 XT
Assassin’s Creed OdysseyTAA High73 / 9477 / 9244 / 4956 / 6254 / 6466 / 7766 / 8043 / 5347 / 56
Battlefield VTAA High137 / 168143 / 16080 / 9998 / 115113 / 130126 / 145136 / 149111 / 129100 / 124
Borderlands 3TAA102 / 11792 / 10537 / 4250 / 5758 / 6569 / 7875 / 8457 / 6257 / 62
ControlTAA114 / 11999 / 10336 / 3951 / 5564 / 7185 / 8882 / 9060 / 6451 / 57
DOOM EternalTAA187 / 281168 / 25159 / 9274 / 123116 / 175139 / 202149 / 21490 / 13890 / 135
Metro ExodusTAA55 / 9249 / 8121 / 3627 / 4733 / 5640 / 6644 / 7027 / 4526 / 44
Red Dead Redemption 2TAA High77 / 8168 / 7424 / 2733 / 3543 / 4745 / 5454 / 5835 / 3834 / 36
Shadow of the Tomb RaiderTAA114 / 147110 / 13944 / 5562 / 7877 / 9689 / 11193 / 11861 / 8161 / 76
Strange BrigadeAA Ultra232 / 289210 / 26277 / 94102 / 127135 / 164159 / 196169 / 20899 / 13893 / 121
Total War: THREE KINGDOMSTAA68 / 7960 / 7025 / 2932 / 3840 / 4749 / 5752 / 6130 / 3426 / 31
Макс.  −2%−41%−32%−23%−14%−11%−23%−26%
Средн.  −9%−61%−49%−38%−27%−23%−47%−49%
Мин.  −13%−67%−57%−44%−33%−28%−57%−61%
3840 × 2160
 Полноэкранное сглаживаниеPalit GeForce RTX 3090 GamingPro OCPalit GeForce RTX 3080 GamingPro OCNVIDIA GeForce GTX 1080NVIDIA GeForce GTX 1080 TiNVIDIA GeForce RTX 2080 SUPERNVIDIA GeForce RTX 2080 Ti FENVIDIA TITAN RTXAMD Radeon VIIAMD Radeon RX 5700 XT
Assassin’s Creed OdysseyTAA High56 / 6658 / 6526 / 3036 / 4040 / 4648 / 5452 / 5735 / 4133 / 37
Battlefield VTAA High115 / 130100 / 11444 / 5555 / 6867 / 8077 / 9184 / 9964 / 7655 / 68
Borderlands 3TAA60 / 6853 / 6020 / 2227 / 3132 / 3538 / 4341 / 4629 / 3229 / 34
ControlTAA62 / 6453 / 5517 / 1925 / 2732 / 3643 / 4541 / 4631 / 3325 / 28
DOOM EternalTAA133 / 180118 / 15938 / 5249 / 6973 / 9890 / 11795 / 12562 / 8547 / 62
Metro ExodusTAA41 / 6336 / 5514 / 2320 / 3124 / 3728 / 4431 / 4720 / 3119 / 29
Red Dead Redemption 2TAA High56 / 6051 / 5418 / 1924 / 2531 / 3435 / 4040 / 4226 / 2824 / 26
Shadow of the Tomb RaiderTAA73 / 8766 / 7923 / 2833 / 4142 / 5150 / 6153 / 6434 / 4430 / 39
Strange BrigadeAA Ultra149 / 174134 / 15544 / 5260 / 7183 / 9398 / 113106 / 12270 / 8861 / 72
Total War: THREE KINGDOMSTAA37 / 4233 / 3813 / 1516 / 1921 / 2426 / 3028 / 3215 / 1812 / 15
Макс.  −2%−55%−39%−30%−18%−14%−38%−44%
Средн.  −10%−66%−54%−42%−31%−26%−49%−55%
Мин.  −14%−71%−62%−49%−37%−32%−57%−66%

 

Результаты игровых тестов с трассировкой лучей

1920 × 1080
 Полноэкранное сглаживаниеPalit GeForce RTX 3090 GamingPro OCPalit GeForce RTX 3080 GamingPro OCNVIDIA GeForce RTX 2080 SUPERNVIDIA GeForce RTX 2080 Ti FENVIDIA TITAN RTX
Battlefield VTAA High103 / 12595 / 11767 / 8786 / 10584 / 103
ControlTAA93 / 9885 / 9154 / 5869 / 7269 / 75
Metro ExodusTAA53 / 8447 / 7534 / 5441 / 6443 / 68
Minecraft with RTX BetaНет114 / 127103 / 11561 / 7075 / 8576 / 88
Quake II RTXTAAН/Д / 131Н/Д / 119Н/Д / 72Н/Д / 88Н/Д / 93
Shadow of the Tomb RaiderTAA94 / 12690 / 12162 / 8975 / 10579 / 109
Макс.  −4%−29%−16%−13%
Средн.  −8%−38%−25%−22%
Мин.  −11%−45%−33%−31%
2560 × 1440
 Полноэкранное сглаживаниеPalit GeForce RTX 3090 GamingPro OCPalit GeForce RTX 3080 GamingPro OCNVIDIA GeForce RTX 2080 SUPERNVIDIA GeForce RTX 2080 Ti FENVIDIA TITAN RTX
Battlefield VTAA High81 / 10272 / 9549 / 6663 / 8262 / 82
ControlTAA66 / 7059 / 6436 / 3845 / 4848 / 51
Metro ExodusTAA42 / 6438 / 5726 / 3932 / 4734 / 50
Minecraft with RTX BetaНет73 / 8066 / 7237 / 4245 / 5149 / 55
Quake II RTXTAAН/Д / 77Н/Д / 71Н/Д / 42Н/Д / 51Н/Д / 55
Shadow of the Tomb RaiderTAA71 / 9667 / 9042 / 6051 / 7254 / 76
Макс.  −6%−35%−20%−20%
Средн.  −8%−42%−29%−25%
Мин.  −11%−48%−36%−31%
3840 × 2160
 Полноэкранное сглаживаниеPalit GeForce RTX 3090 GamingPro OCPalit GeForce RTX 3080 GamingPro OCNVIDIA GeForce RTX 2080 SUPERNVIDIA GeForce RTX 2080 Ti FENVIDIA TITAN RTX
Battlefield VTAA High49 / 6743 / 6127 / 3935 / 5037 / 50
ControlTAA34 / 3731 / 3418 / 2023 / 2524 / 26
Metro ExodusTAA28 / 3823 / 3414 / 2119 / 2720 / 28
Minecraft with RTX BetaНет35 / 3830 / 3417 / 1821 / 2423 / 26
Quake II RTXTAAН/Д / 36Н/Д / 33Н/Д / 19Н/Д / 23Н/Д / 24
Shadow of the Tomb RaiderTAA41 / 5438 / 5021 / 3028 / 3930 / 41
Макс.  −7%−42%−25%−24%
Средн.  −9%−46%−31%−28%
Мин.  −11%−53%−37%−33%
3840 × 2160 (DLSS)
 Полноэкранное сглаживание (без DLSS)Palit GeForce RTX 3090 GamingPro OCPalit GeForce RTX 3080 GamingPro OCNVIDIA GeForce RTX 2080 SUPERNVIDIA GeForce RTX 2080 Ti FENVIDIA TITAN RTX
Battlefield VTAA High65 / 8059 / 7241 / 5151 / 6453 / 65
ControlTAA57 / 6053 / 5633 / 3541 / 4343 / 45
Metro ExodusTAA39 / 5434 / 4823 / 3329 / 4131 / 43
Minecraft with RTX BetaНет96 / 10687 / 9549 / 5661 / 6967 / 74
Shadow of the Tomb RaiderTAA60 / 7555 / 6936 / 4744 / 5746 / 60
Макс.  −7%−36%−20%−19%
Средн.  −9%−40%−26%−23%
Мин.  −11%−47%−35%−30%

 

Выводы

Можно сколько угодно возмущаться тем, как дорого стоит GeForce RTX 3090, но боль утихнет, если поместить чемпионское устройство NVIDIA в исторический контекст. В действительности компания просто вернулась к старой сегментации потребительской линейки видеокарт, в которой место флагмана для геймеров занимал ускоритель на базе соответствующим образом урезанного GPU первого эшелона (GK110, GM200, GP102) по цене от 649 до 699 долларов США. В то же время для тех, кому требовалась максимально высокая производительность или специфические преимущества для профессиональных задач (таких как удвоенный массив оперативной памяти), Санта-Клара предлагала очередной «Титан». Только теперь он называется по-другому и формально является частью игровой серии GeForce. Впрочем, не исключено, что NVIDIA планирует выпустить в будущем полноправный TITAN — возможно, с полностью функциональным чипом GA102 и 48 Гбайт памяти GDDR6X на борту (как только Micron наладит производство 16-мегабитных чипов нового типа).

Но если рассматривать GeForce RTX 3090 именно в качестве преемника марки TITAN, о полном возврате к прежней ценовой политике, которую сломало поколение видеокарт на чипах Turing, речи не идет. При рекомендованной цене в $1 499 новинка значительно дешевле TITAN RTX, который NVIDIA отпускала за $2 499. Но корни серии TITAN уходят к устройствам за $999. И все же послабления, которые вслед за младшими моделями из первой троицы «Амперов» — GeForce RTX 2070 и RTX 2080 — распространились на RTX 3090, можно только приветствовать.

Тем более что геймерам, которым посчастливилось купить GeForce RTX 3080 в первую неделю после релиза, вопреки названию обзора совершенно нечему завидовать в RTX 3090. Сверх производительности RTX 3080 вы могли бы получить около 12 % FPS в самом благоприятном случае, при игре на 4К-экране, за доплату в $800. И это при условии, что розничные цены новинок NVIDIA хотя бы через некоторое время подтянутся к рекомендованным. Если RTX 3080 мгновенно оказался дефицитным товаром, то купить RTX 3090, тем более за выгодную сумму, будет еще сложнее.

С другой стороны, попробуйте назвать еще одну видеокарту, которая располагает производительностью на 12 % больше, чем у GeForce RTX 3080. Последнему не хватило именно этих 12 % FPS, чтобы можно было запускать практически любые тайтлы, включая такие чрезвычайно требовательные, как Control, Metro Exodus и Red Dead Redemption 2 (первые два без трассировки лучей), на максималках и в 4К с фреймрейтом 60 FPS или полностью избавиться от необходимости в DLSS при игре в режиме 1440p c рейтрейсингом. Масштабирования кадров при помощи DLSS по-прежнему не избежать, чтобы получить все и сразу: разрешение 4К, максимальные настройки детализации, трассировку лучей и твердые 60 FPS. Но если учесть, что в своих последних итерациях DLSS работает практически безупречно, эта и подобные технологии обосновались в играх надолго, если вообще куда-либо денутся в обозримом будущем.

И все-таки будем честны: GeForce RTX 3090 очень трудно назвать рациональным приобретением исключительно для развлечений. Даже аргумент в виде 24 Гбайт оперативной памяти пока имеет вес только в контексте игры на телевизорах и мониторах с разрешением 8К, которыми владеет исчезающе малый процент геймеров. А гипотетический вариант RTX 3080 с 20 Гбайт VRAM все равно обойдется дешевле. Зато GeForce RTX 3090 сполна отрабатывает свою стоимость в тех ситуациях, когда время равно деньгам, то есть в профессиональных задачах, которым требуется максимум вычислительной мощности и большой объем оперативной памяти графического процессора. В программах для монтажа видео с высоким разрешением и сложными эффектами RTX 3090 может значительно уменьшить время рендеринга даже по сравнению с RTX 3080. Рейтрейсинг в Blender он выполняет на 25 % быстрее RTX 3080 или более чем вдвое быстрее, если сравнивать с предыдущим просьюмерским решением NVIDIA — TITAN RTX. Кроме того, есть ряд задач, которые по большому счету закрыты для ускорителей с меньшим объемом локальной памяти, — например, 3D-моделирование сложных проектов или монтаж видео с наложением эффектов в разрешении 8К. Наконец, GeForce RTX 3090 остается единственной видеокартой NVIDIA, которая формально относится к потребительской серии, но сохранила разъем NVLink, который теперь, в связи с прекращением работ над новыми профилями SLI, утратил игровую ценность, но может быть полезен для специфических приложений GP-GPU.

Напоследок скажем пару слов о видеокарте Palit GamingPro OC, которая представляет GeForce RTX 3090 в нашем обзоре. Palit использовала одну и ту же конструкцию системы охлаждения и похожие печатные платы в своих версиях RTX 3080 и RTX 3090, только усилила VRM в соответствии с повышенным энергопотреблением старшей модели. Как следствие, почти все, что мы уже сказали про Palit GeForce RTX 3080 GamingPro OC, относится к родственному RTX 3090. Видеокарта производит впечатление качественного продукта и обеспечивает чипу GA102 адекватное охлаждение. Тем не менее рост потребляемой мощности не прошел бесследно для уровня шума (350 Вт — это не шутки), а на вентиляцию компьютера покупателю флагманской модели нужно обратить самое пристальное внимание, так как почти весь горячий воздух кулер оставляет внутри корпуса.

Источник:

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Переводчик »