Radeon hd 4870 год выпуска. Видеокарта Radeon HD4870 - новый король в классе top-middle. Производительность в играх и потенциал к разгону

Для Symbian 12.03.2019
Для Symbian
Чтобы понять, чем новый графический чип RV770 качественно отличается от представителей двух предыдущих поколений, достаточно взглянуть на его схематическое представление.

Если сравнить новую схему с той, что была применена в чипе R600/RV670 , то отличия очевидны. Текстурные блоки в новом чипе привязаны к потоковым процессорам, компания AMD серьёзно переработала схему работы встроенной в GPU кэш-памяти L1 и L2, были улучшены блоки ROP и увеличено количество потоковых процессоров до 800 штук.

Система сглаживания претерпела серьёзные изменения, в результате которых значительно повысилась его скорость, а сглаживание 2x/4x MSAA теперь и вовсе стало практически бесплатным! В следующих статьях мы планируем остановиться на этом моменте более подробно, а также сравнить качество сглаживания у видеокарт AMD и NVIDIA. Для справки, приведём таблицу с техническими характеристиками новых видеокарт и сравним их с предыдущим поколением:

ATI Radeon™ HD4870 ATI Radeon™ HD4850 ATI Radeon™ HD3870
Количество транзисторов, млн 965 965 666
Тех. процесс, нм 55 55 55
Количество потоковых процессоров 800 800 320
Количество текстурных модулей 40 40 16
Количество блоков растеризации 16 16 16
Тактовая частота GPU, МГц 750 625 775
Тип и эффективная частота видеопамяти GDDR5, 3600 МГц GDDR3, 2000 МГц GDDR4, 2250 МГц
Вычислительная мощность GPU, ТФлопс 1,2 1,0 0,497
Тип шины PCI Express 2.0, x16 PCI Express 2.0, x16 PCI Express 2.0, x16
Поддержка DirectX 10.1 10.1 10.1
Блок тесселяции да да да
Встроенный видеодекодер ver. 2.0 ver. 2.0 ver. 1.0
Поддержка ATI PowerPlayTM да да да

Изучать Radeon HD4870 мы будем на примере видеокарты, предоставленной нам на тесты компанией HIS.

HIS Radeon HD4870

Упаковка от видеокарты HIS Radeon HD4870 небольшого размера, выполнена в синих тонах. На обеих сторонах коробки размещена ключевая информация о видеокарте. Комплектация видеокарты содержит:
  • переходник DVI > D-sub;
  • переходник DVI > HDMI;
  • переходник S-video > тюльпан;
  • переходник S-video > component out;
  • мостик CrossFire;
  • CD с драйверами;
  • инструкция пользователя, памятка о доступных играх Steam;
  • наклейка на корпус;
  • фирменная отвёртка-фонарик-уровень;
В комплекте с видеокартой отсутствуют переходники для питания видеокарты, зато есть фирменная отвёртка с фонариком и уровнемером. Давайте посмотрим: В комплект с отвёрткой входит две насадки, каждая из которых оснащена двумя головками. Первая насадка служит для работы с плоскими шляпками, вторая - с крестообразными. В корпус отвёртки также вмонтирован уровень. Возле гнезда для установки насадок вмонтирован фонарик, основанный на сверх-ярком светодиоде. Выключатель расположен рядом с уровнемером, причем нет необходимости его удерживать, так как это именно выключатель, а не кнопка. Сама главная обитательница коробки практически не отличается от той, что показала всему миру компания AMD, разве что наклейка на вентиляторе всё же фирменная, HIS. Для подключения питания видеокарты Radeon HD4870 служат два 6-контактных разъёма в хвосте видеокарты, в отличие от младшей Radeon HD4850, у которой всего один разъём. Усиленная система питания потребовалась для стабильной работы видеокарты на повышенных частотах. Так, по сравнению с видеокартой Radeon HD4850, у Radeon HD4870 частота графического процессора выше на 125 МГц и равна 750 МГц, а эффективная частота видеопамяти GDDR5 равна 3600 МГц, что значительно выше 1986 МГц, на которых работает видеопамять у видеокарты Radeon HD4850. Правда, тут стоит оговориться, реальная частота новой памяти GDDR5 равна 900 МГц, просто за один такт у неё передаётся не вдвое, а вчетверо больше информации по сравнению с «обычной» не-DDR памятью. Система охлаждения у видеокарты очень сильно напоминает ту, что применялась в видеокартах Radeon HD2900XT . Медная вставка с двумя тепловыми трубками и алюминиевыми листами служит для охлаждения графического процессора, каркас из крашенного алюминиевого сплава охлаждает чипы памяти и чипы подсистемы питания, а также придаёт жесткость всей конструкции. Для предотвращения перекоса медной вставки и, как следствие этого, повреждения графического чипа, она сделана независимой от металлического каркаса. Из внешних отличий, по сравнению с видеокартой Radeon HD4850 , в Radeon HD4870 изменилась подсистема питания, и появился логотип AMD над слотом PCI-express x16. Хотя новинка и оборудована новейшей видеопамятью GDDR5, её расположение на печатной плате ничем не отличается от расположения видеопамяти GDDR3 на видеокарте Radeon HD4850.

На видеокарте Radeon HD4870 установлен тот же графический чип RV770, что и в Radeon HD4850.

Чипы видеопамяти GDDR5 произведены компанией Qimonda. Номинальная эффективная тактовая частота по паспорту для данной памяти равна 4,0 ГГц, штатная же, на которой данная память функционирует на видеокарте Radeon HD4870, как мы уже говорили, равна 3,6 ГГц.

Под нагрузкой в 3D-режиме графический чип видеокарты Radeon HD4870 работает на частоте 750 МГц, а во время простоя его частота снижается до 500 МГц.

Эффективность системы охлаждения и разгон

Поскольку ни Riva Tuner, ни какая-либо другая программа, осуществляющая разгон видеокарт ATI/AMD, до сих пор не поддерживают новое семейство Radeon HD4000, об измерении температурных и прочих показателей мы расскажем на словах. Во время простоя температура графического процессора колеблется в районе 78 градусов, при этом вентилятор вращается со скоростью 1075 оборотов в минуту, что составляет 22% от его максимально возможной скорости. Под нагрузкой, то есть во время прогона 9-ти тестов Firefly Forest из тестового пакета 3DMark’06 в разрешении 1600х1200 с 4-кратным сглаживанием и 16-кратной анизотропной фильтрацией, графический чип нагрелся до 84 градусов. Скорость вентилятора при этом возросла до 1886 оборотов в минуту, что составляет 30% от максимально возможной скорости. Заметим, что на такой скорости шум от системы охлаждения становился заметен. Что касается разгона, то единственно доступным средством для его осуществления на данный момент является встроенная в панель управления видеокарты утилита ATI Overdrive. Увы, но эта утилита не предоставляет практически никакой свободы действий, позволяя увеличить частоту графического чипа всего на 40 МГц, а памяти на 200 «реальных» МГц. В результате видеокарту Radeon HD4870 удалось разогнать до 790/4400 МГц, что несерьёзно. Однако мы всё же протестировали разогнанную Radeon HD4870 в игре Crysis, и с результатами этого небольшого эксперимента вы сможете ознакомиться в конце данной статьи.

Тестирование

Тестирование мы будем проводить на тестовом стенде следующей конфигурации:

Конкуренты новой видеокарте Radeon HD4870 от компании HIS и драйверы для них будут следующие:

  • GeForce GTX280, драйверы ForceWare 177.34;
  • GeForce GTX260, драйверы ForceWare 177.39;
  • Radeon HD4850, драйверы Catalyst 8.6;
Для нашей новинки, как и для Radeon HD4850, мы использовали драйверы Catalyst 8.6. Наше тестирование мы будем проводить как в «обычных» разрешениях, так и в повышенных. Начнём с тестов 3DMark и «стандартных» разрешений экрана.

Видеокарта ATI Mobility Radeon HD 4870 от AMD - стандартизированный под DirectX 10.1 графический адаптер для ноутбуков класса Hi-End. Технически он основан на HD 4850/4870 GPU для настольных систем, но имеет меньшие тактовые частоты для минимизации энергопотребления. Также как и настольный, этот HD 4870 можно укомплектовать памятью GDDR5.

Производительность ATI Mobility Radeon HD4870 в играх сравнима с настольной HD 4850, что является уже достижением. Большое количество шейдеров и 256-битная шина позволяют запускать любую игру под DirectX 9 на высоких разрешениях и деталях. Требующие DirectX 10 игры, такие как Crysis, могут также запускаться с высокой детализацией.

Mobility HD 4870 основывается на чипе RV770 и предполагает 800-поточный процессор (160 5-мерных шейдерных ядер). Эти ядра выполняют графические вычисления, которыми занимались шейдерные и пиксельные конвейеры на старых GPU. Потоковые процессоры также называются ALU и группируются пяти-направленные модули VLIW. Каждая из пяти инструкций VLIW компонента должна быть независима от остальных и именно поэтому скорость работы зависит от оптимизации драйверов.

Mobility Radeon HD 4870 включает Avivo HD - так называемую видео технологию состоящую из звукового чипа на 7.1 канал через HDMI, или DisplayPort и UVD (Unified Video Decorder) второго поколения. Этот UVD 2 поддерживает полный побитовый декодинг потоков H.264/MPEG-4 AVC и VC-1. В дополнение ко всему поддерживается потоковая обработка дуал-видео, и режима Картинка-в-картинке, что делает UVD полностью совместимым с BD-Live. Упрощенно говоря, технология Avivo HD перехватывает все видео вычисления и задействует GPU для декодинга HD video.

AMD опубликовала некоторые характеристики, по которым энергопотребление HD 4870 находится где-то в области 65 Вт. До сих пор не известно потребляет ли эту цифру исключительно сам чип, либо это потребление всей платы целиком включая память (на которую придется еще порядка 5 вт). В сравнении с настольной ATI Radeon HD 4870 , мобильная 4870 показывает более медленную частоту ядра и, поэтому, должна находиться примерно на том же уровне, на котором сейчас десктопная версия.

Производитель: ATI
Серия: Mobility Radeon HD 4800
Код: M98-XT
Потоки: 800
Тактовая частота: 550/680* МГц
Частота шейдеров: 550* МГц
Частота памяти: 888/700* МГц
Разрядность шины памяти: 256 Бит
Тип памяти: GDDR5
Максимум памяти: 1024 Мб
Общая память: нет
DirectX: DirectX 10.1, Shader 4.1
Транзисторы: 956 млн
Технология: 55 нм
Дополнительно: OpenGL 2.0, PCI-E 2.0 x16, Powerplay, поддержка DisplayPort до 2560x1600, поддержка HDMI до 1920x1080 (вместе с 7.1 AC3 аудио), 1x Dual-Link/Single-Link DVI, поддержка 1x Single-Link DVI (все порты для дисплеев должны поддерживаться производителями ноутбуков)
Размер ноутбука: Большой
Дата выхода: 09.01.2009
Ссылка на производителя: http://ati.amd.com/products/mobilityradeonhd4800/index.html
* Указанные тактовые частоты являются лишь рекомендацией для производителей и могут быть изменены ими.

После недавнего появления в продаже серии Radeon HD 4000 цены на видеокарты упали; теперь за $250 можно приобрести очень даже солидное игровое решение.

Месяц назад мы обозревали свежую Radeon HD 4850, недорогую видеокарту из новой линейки ATI, и бесповоротно влюбились в неё. После этого Nvidia пересмотрела свои цены - теперь за $250 можно приобрести как Radeon HD 4850, так и GeForce 9800 GTX (раньше за неё просили больше $330).

Впрочем, если вы можете себе позволить потратить немного больше, AMD предлагает Radeon HD 4870 - одноядерную видеокарту с ещё большей производительностью примерно за $380. В той же ценовой категории находятся Radeon HD 3870 X2 и GeForce GTX 260; цены на GeForce 9800 GX2 и GeForce GTX 280 значительно выше.

Сегодня мы рассмотрим видеокарту Visiontek Radeon HD 4870 и сравним её со всеми вышеперечисленными топовыми картами. Как она в смысле отношения цены и производительности?

Характеристики Radeon HD 4870 очень даже впечатляют. GPU состоит из 800 потоковых процессоров (160х5), 40 текстурных модулей и 16 блоков растеризации. Сравните эти параметры с параметрами карты прошлого поколения Radeon HD 3870 - который может похвастать лишь 320 потоковыми процессорами (64х5), 16 текстурными модулями и 16 блоками растеризации - и можете представить себе, как изменились цифры вместе с выпуском новой линейки ATI. Пропускная способность памяти Radeon HD 4870 - 115.2 Гб/сек, а Radeon HD 3870 ограничен 57 Гб/сек.

Этот скачок пропускной способности обусловлен использованием новейшей памяти GDDR5, работающей на частоте 900 МГц (1.8 ГГц х 2 = 3.6 Гбит/сек). Ядро работает на частоте 750 МГц (1.2 ТФлоп), на 125 МГц быстрее ядра HD 4850. Кроме различий в характеристиках памяти и частотах HD 4870 и HD 4850 практически идентичны.

Ядро Radeon HD 4870 построено по 55нм-технологии и включает 256-битную шину памяти. Как и серия HD 3000, серия HD 4000 использует слот PCI-Express 2.0, но совместима и со старыми слотами PCI-Express 1.0. В отличие от послдених карт GeForce, линейка Radeon HD 4000 полностью поддерживает DirectX 10.1, что может очень пригодится в дальнейшем. Radeon HD 4870 будет поставляться как с 512, так и с 1024 Мб памяти на борту; наш сегодняшний образец экипирован памятью GDDR5 объёмом 512 Мб.

Видеокарта

Ранний выход на рынок может сыграть с картой от Visiontek шутку - она очень похожа (конечно, для нас, тестеров) на референсную карту от самой AMD. Единственное видимое отличие - лейбл Visiontek на кулере. В любом случае, видеокарта выглядит впечатляюще, особенно выделяется система охлаждения, занимающая два слота.

Как и ядро Radeon HD 3870, ядро нового Radeon HD 4870 произведено по 55нм-технологии. Несмотря на это, ATI не сильно старалась загнать частоты - ядро работает на 750 МГц. Память GDDR5 работает на более впечатляющей частоте - 3.6 ГГц (1.8 ГГц х2) (на этой конкретной модели). Как мы уже упоминали выше, Radeon HD 4870 несёт на себе 800 потоковых процессоров наряду с 40 текстурными модулями и 16 блоками растеризации. Суммируя, можно смело говорить, что это выдающиеся характеристики для видеокарты стоимостью $350-380.

Visiontek поставляет свои Radeon HD 4870 с памятью Qimonda IC на борту (IDGV51-05A1F1C-40X). Эти модули GDDR5 стабильно работают на 4.0ГГц (2.0ГГц x2), так что дальнейший разгон должен быть сравнительно лёгким.

Дизайн Visiontek Radeon HD 4870 подразумевает систему охлаждения на два слота. Большое преимущество такого решения - очень тихий кулер. Но есть и минусы, прямо следующие из плюсов: в режиме простоя карта нагревается до 74 градусов, что не радует, а под нагрузкой температура поднялась почти до 82 градусов.

О габаритах. Radeon HD 4870 всего на полсантиметра длиннее своего собрата Radeon HD 4850; итого - 24 см (9.5 дюймов). Как и другие карты своего сегмента, Radeon HD 4870 нуждается в двух 6-пиновых коннекторах питания.

Карта от Visiontek также поддерживает HDMI и 7.1-канальный звук с помощью идущего в комплекте переходника; на самой карте можно заметить два двусвязных порта DVI и выход S-Video. Также в комплект поставки входит переходник DVI-VGA, компонентный кабель для HDTV и мост для использования Crossfire.

Тесты: Концифгурация тестового стенда и 3Dmark

Конфигурация тестового стенда
- Intel Core 2 Quad Q6600 @ 3.00ГГц (LGA775)
- x2 Kingston HyperX 2Гб PC2-8500
- ASUS P5Q Deluxe (Intel P45)
- OCZ GameXStream (700 Вт)
- Seagate 500GB 7200-об/мин (Serial ATA300)
- ASUS GeForce GTX 280 (1Гб) - 177.41
- Gigabyte GeForce GTX 260 (896Мб) - 177.41
- ASUS GeForce 9800 GX2 (1Гб) - 174.74
- ASUS GeForce 9800 GTX+ (512Мб) - 174.74
- ASUS GeForce 9800 GTX (512Мб) - 174.74
- Visiontek Radeon HD 4870 (512Мб) - 8.7
- ASUS Radeon HD 4850 (512Мб) - 8.7
- VisionTek Radeon HD 3870 X2 (1Гб) - 8.7
Программное обеспечение
- Microsoft Windows Vista Ultimate (64-битная)
- Intel System Driver 8.4.0.1016
- Nvidia Forceware 177.34
- Nvidia Forceware 174.74
- Nvidia Forceware 169.44
- ATI Catalyst 8.7

Основываясь на результатах 3DMark Vantage, можно предположить, что Visiontek Radeon HD 4870 будет немного обгонять GeForce GTX 260 в наших следующих тестах, ну а GeForce GTX 280 будет гораздо быстрее его.

Но мы уверены, что на самом деле именно так чётко дело не пойдёт, так что давайте уже начнём тестирование в реальных игровых приложениях.

Тесты: Company of Heroes

Visiontek Radeon HD 4870 в Company of Heroes не выглядит так уж впечатляюще - он приходит предпоследним из всех протестированных 8-ми карт и обгоняет лишь Radeon HD 4850. С другой стороны, в разрешении 1920х1200 он всего на 1 fps медленнее GeForce 9800 GTX (которая, впрочем, в 1680х1050 отрывается на все 5 fps).

А вот включение настроек 8xAA/16xAF (сглаживание и анизотропная фильтрация) помогает Visiontek Radeon HD 4870 подняться в воздух - тут она оказывается третьей. Как видно из этого и предыдущих тестов, Company Of Heroes очень симпатизирует картам от Nvidia, по крайней мере, в режиме DirectX 10.

Тесты: Crysis

В Crysis Visiontek Radeon HD 4870 снова не особо показывает себя, хотя и догоняет конкурента в лице GeForce GTX 260, оставляя при этом немного позади GeForce 9800 GTX+.

В режиме DirectX 10 Crysis-результаты остаются примерно такими же: Visiontek Radeon HD 4870 идёт вровень с GeForce GTX 260.

Тесты: Devil May Cry 4

В нашем тесте в игре Devil May Cry 4 Visiontek Radeon HD 4870 превосходит GeForce GTX 260. Карта от ATI располагается между GeForce GTX 260 и 280, оставляя Radeon HD 4850 далеко позади.

Включение 8xAA в Devil May Cry 4 почти не влияет на результаты Visiontek Radeon HD 4870 (то же самое можно сказать и о Radeon HD 4850). HD 4870 побеждает более дорогую GeForce GTX 280 в разрешениях 1440х900 и 1680х1050, совсем чуть-чуть уступая в 1920х1200.

Тесты: Enemy Territory: Quake Wars

Если игры Company of Heroes и Crysis отдают предпочтение картам от Nvidia, то Enemy Territory: Quake Wars дружелюбнее относится к ATI-решениям. С выключенными антиальязингом и фильтрацией Visiontek Radeon HD 4870 здесь - быстрее всех с небольшим отрывом. Что ж, посмотрим что будет, если включить эти опции…

Включение 8xAA/16xAF позволяет Visiontek Radeon HD 4870 ещё больше увеличить отрыв от GeForce GTX 280 - карта от ATI становится без сомнений самой быстрой во всех трёх разрешениях экрана. Кстати, в этом тесте Radeon HD 4850 оставляет позади GeForce GTX 260.

Тесты: Supreme Commander

Visiontek Radeon HD 4870 в Supreme Commander ведёт себя хорошо и идёт в ногу с GeForce GTX 280 в разрешениях 1920x1200 и 1680x1050.

С 8xAA Radeon HD 4870 немного отстаёт от GeForce GTX 280 в высоких разрешениях. Впрочем, видеокарта от Visiontek всё ещё быстрее GeForce GTX 260 во всех разрешениях.

Тесты: Unreal Tournament 3

В Unreal Tournament 3 Visiontek Radeon HD 4870 снова показывает себя с лучшей стороны. Хоть обе карты GeForce GTX и лидируют в разрешении 1440х900, в разрешениях повыше карты Radeon в этой не такой уж свежей игре почти догоняют их.

Включение сглаживания и анизотропной фильтрации в Unreal Tournament 3 не помогает Visiontek Radeon HD 4870 лучше противостоять картам GeForce GTX. Хоть показатели и довольно высоки, Unreal Tournament 3 определённо больше симпатизирует картам нового поколения от Nvidia.

Тесты: World in Conflict

Radeon HD 4870 в тесте World in Conflict подбирается к GeForce GTX 260 довольно близко, но обогнать её без включённых сглаживания и анизотропии Radeon"у не по силам.

Включенные опции 4xAA/16xAF позволяют Visiontek Radeon HD 4870 превзойти GeForce GTX 260 в разрешении 1920x1200, хоть в 1440x900 и 1680x1050 дела обстоят по-прежнему.

Энергопотребление и нагрев

Visiontek Radeon HD 4870, не сравнить с ранее протестированным нами HD 4850, очень охоча до электроэнергии и в режиме простоя потребляет 193 Вт (эта цифра - общее энергопотребление системы). Как результат, в этом режиме даже GeForce GTX 280 оказывается предпочтительнее.

Под нагрузкой же Visiontek Radeon HD 4870, наоборот, более скромен и потребляет гораздо меньше, чем GeForce GTX 280, GTX 260, 9800 GX2 и Radeon HD 3870 X2.

Нагревается Visiontek Radeon HD 4870 просто ужасно: даже температура в режиме простоя ниже 74 градусов не опускается. Хотя под нагрузкой большой (80мм) кулер и смог удержать карту в пределах 82 градусов, мы такое положение вещей нормальным назвать никак не можем.

Хотя никаких проблем из-за такого сильного нагрева мы и не испытали, нужно отметить, что более медленная Radeon HD 4850 греется ещё сильнее. Это легко объяснить тем, что её кулер занимает один слот, а HD 4870 использует два.

Мы экспериментировали и выяснили: если на Visiontek Radeon HD 4870 установить кулер Arctic-Cooling S1, температура под нагрузкой упадёт до 49 градусов, а в режиме простоя - и вовсе до гораздо более приемлемых 33. Другими словами, докупить к вашему новому Radeon из серии HD 4000 кулер стороннего производителя - неплохая идея, если вы хотите максимально уменьшить общую температуру в корпусе компьютера.

Итоговые размышления

Visiontek Radeon HD 4870 очень схожа с референсной картой AMD, так что её трудно отличить от других карт на базе Radeon HD 4870, выпущенных до 25 июня. В любом случае, эта видеокарта не разочаровывает и предлагает за свои $350-380 просто превосходную скорость.

По такой же цене вы совершенно точно не найдёте ничего лучше новой карты из серии HD 4000. Хоть Nvidia и подкорректровала свои цены довольно быстро, нужно быть благодарными ATI за то, что она выпустила на рынок такую убедительную линейку. Radeon HD 4850 всё ещё остаётся лучшим выбором для экономных пользователей, ну а если вы можете потратить немного больше - Radeon HD 4870 полностью окупит ваши ожидания и средства.

Как было и в тесте Radeon HD 4850, возникли проблемы с референсной системой охлаждения, используемой в Radeon HD 4870. Хоть он и относительно тихо работает, свежий Radeon нагревался до каких-то экстремальных температур. После установки кулера Arctic-Cooling S1 температура в режиме простоя упала с 74 градусов до 33. Температура под нагрузкой также значительно снизилась - до 52 градусов.

Кстати, мы проинформированы, что некоторые покупатели, использую сторонне ПО вроде RivaTuner, смогли установить фиксированную скорость оборотов референсного кулера. К сожалению, уже на половине своих возможностей этот вентилятор становится слишком громким.

Кроме того, со стандартным кулером и автоматической настройкой его скорости нам совсем не удался разгон. Впрочем, используя Arctic-Cooling S1 и RivaTuner мы запросто подняли частоту ядра и памяти до 835 МГц и 4.2 ГГц (2.1 ГГц х2) соответственно.

Очень надеемся, что Visiontek намерена представить решение с кулером получше, как она уже делала со своим разогнанным Radeon HD 3870 X2. Кроме того, несмотря на графическое оформление коробки с видеокартой в стиле игры Mass Effect, производитель саму игру (и вообще какую-либо игру или игры) в комплекте не поставляет. Ну хоть пожизненная гарантия Visiontek здесь есть.

Итак, если очень горячая видеокарта для вас проблемой не является, Visiontek Radeon HD 4870 будет наилучшей покупкой за свои деньги.

Технические характеристики Radeon HD 4870 X2 представлены в сравнении с вышерассмотренными видеокартами в следующей таблице:

Наименование технических характеристик NVIDIA
GeForce 8800
GTX
ATi Radeon
HD 4870
ATi Radeon
HD 4870 X2
NVIDIA
GeForce GTX
280
Графический(е) процессор(ы) G80 (TSMC) RV770 (TSMC) 2 x RV770 (TSMC) GT200 (TSMC)
Техпроцесс, нм 90 (low-k) 55 (low-k) 55 (low-k) 65 (low-k)
Площадь ядра(ер), кв.мм 484 256 2 x 256 576
Число транзисторов, млн. 681 956 2 x 956 1 400
Частота(ы) графического(их)
процессора(ов), МГц
575
(1350 shader)
750 750 602
(1 296 shader)
Эффективная частота работы
видеопамяти, МГц
1 800 3 600 3 600 2 214
Объем памяти, Мбайт 768 512 / 1024 2 x 1024 1 024
Тип поддерживаемой памяти GDDR3 GDDR5 GDDR5 GDDR3
Разрядность шины обмена с памятью, Бит 384 256 256 512
Интерфейс PCI-Express x16
(v2.0)
PCI-Express x16
(v2.0)
PCI-Express x16
(v2.0)
PCI-Express x16
(v2.0)
Число унифицированных шейдерных
процессоров, шт.
128 800 2 x 800 240
Число текстурных блоков, шт. 32 40 2 x 40 80
Число блоков растеризации (ROPs), шт. 24 16 2 x 16 32
Поддержка версии Pixel Shaders / Vertex
Shaders
4.0 / 4.0 4.1 / 4.1 4.1 / 4.1 4.0 / 4.0
Полоса пропускания видеопамяти,
Гбайт/сек
~86.4 ~115.0 2 x 115.0 ~141.7

закраски, Гпикс./сек
~13.8 ~12.0 2 x 12.0 ~19.3
Теоретическая максимальная скорость
выборки текстур, Гтекс./сек
~38.7 ~30.0 2 x 30.0 ~48.2
Пиковая потребляемая мощность в 3D
режиме работы, Ватт
~177 ~170 ~286
Требования к мощности блока питания,
Ватт
~450 ~500 ~550 ~550
Размеры видеокарты референсного
дизайна, мм (Д х В х Т)
269 x 99 x 38 244 х 99 х 34 269 х 99 х 37 269 х 99 х 40
Выходы 2 х DVI-I (Dual-Link), TV-Out, HDTV-Out, HDCP
Дополнительно поддержка SLI поддержка
CrossFireX
поддержка
CrossFireX
поддержка SLI
(3-Way SLI)
Рекомендованная стоимость, долларов
США
~599* ~299 ~549 ~449

* - установлена осенью 2006 года.

Измерение уровня шума систем референсных систем охлаждения видеокарт проводилось электронным шумомером CENTER-321 по хорошо знакомой постоянным посетителям нашего сайта методике с расстояний в 3 см (от турбины), в 1 и в 3 метра от системного блока. Уровень шума, комфортный по субъективным ощущениям, составляет ~34.5 дБА и отмечен на диаграмме голубой штриховой полосой. Фоновый уровень шума системного блока, измеренный с расстояния в 1 метр, не превышал отметку в 33.5 дБА.

Если анализировать результаты измерения уровня шума референсных систем охлаждения видеокарт в самом актуальном, на мой взгляд, режиме с расстояния в 1 метр, то комфортным можно признать только работу кулера видеокарты Radeon HD 4870 и GeForce GTX 280 в автоматическом режиме работы. С большим натягом можно терпеть шум турбины Radeon HD 4870 на ~2280 об/мин. Во всех остальных случаях никакого удовольствия находиться рядом с системных блоком, в котором установлены столь шумно функционирующие видеокарты, нет.

Измерение энергопотребления видеокарт осуществлялось с помощью многофункциональной панели Zalman ZM-MFC2. Данная панель измеряет потребление системы в целом (без учёта монитора), а не отдельного компонента системного блока (подробная конфигурация указана в следующем разделе). Измерение было проведено в 2D-режиме, при обычной работе в Word или Internet-серфинге, а также в 3D-режиме, нагрузка в котором создавалась с помощью пятикратного бенчмарка Firefly Forest из синтетического графического бенчмарка 3DMark 2006 в разрешении 1920 х 1200 с активированным полноэкранным сглаживанием степени 4х и анизотропной фильтрацией уровня 16х. Столь ресурсоемкий для видеокарт графический режим выбран в целях минимизации влияния на результаты измерений прочих компонентов системного блока (в первую очередь, конечно же, центрального процессора).

Результаты измерения энергопотребления рассмотренных видеокарт представлены вашему вниманию на следующей диаграмме:

Безусловно, разогнанная система с Radeon HD 4870 X2 впечатляет уровнем энергопотребления, примерно на 100 Ватт превышающим оный у системы с установленной GeForce GTX 280 и на 160 ватт у системы с одиночной Radeon HD 4870. Однако, качественного блока питания мощностью в 550 Ватт, для такой конфигурации вполне должно хватить. Не будем забывать, что свою лепту здесь вносит и разогнанный с существенным повышением напряжения до 4.33 ГГц центральный процессор и прочие, далеко не рядовые компоненты системного блока. Кроме того, обращает на себя внимание очень низкий уровень энергопотребления GeForce GTX 280 в 2D-режиме. Налицо грамотно реализованные в графическом процессоре G200 системы энергосбережения, чем пока не может похвастаться Radeon HD 4870 X2.

4. Тестовая конфигурация, инструментарий и методика тестирования, видеокарты для сравнения

Сначала об аппаратной части. Тестирование всех видеокарт было проведено в закрытом корпусе системного блока следующей конфигурации:

  • Материнская плата: Gigabyte GA-X38-DQ6 (Intel X38), LGA 775, BIOS F9f beta;
  • Процессор: Intel Core 2 Duo E8400, 3.0 ГГц, 1.3125 В, L2 6 Мбайт, FSB: 333 МГц x 4, (Wolfdale, C0);
  • Система охлаждения CPU: Thermalright SI-128 SE (Scythe SlipStream 120, ~860 об/мин);
  • Термоинтерфейс: Arctic Silver 5;
  • Оперативная память:
    • 2 x 1024 Мбайт DDR2 Corsair Dominator TWIN2X2048-9136C5D (Spec: 1 142 МГц / 5-5-5-18 / 2.1 В);
    • 2 x 1024 Мбайт DDR2 CSX DIABLO CSXO-XAC-1200-2GB-KIT (Spec: 1 200 МГц / 5-5-5-16 / 2.4 В);
  • Дисковая подсистема: SATA-II 300 Гбайт, Western Digital VelociRaptor, 10 000 об/мин, 16 Мбайт, NCQ;
  • Система охлаждения и звукоизоляции HDD: Scythe Quiet Drive for 3.5" HDD;
  • Привод: SATA-II DVD RAM & DVD±R/RW & CD±RW Samsung SH-S183L;
  • Корпус: ATX ASUS ASCOT 6AR2-B Black&Silver (на вдув и выдув установлены 120-мм корпусные вентиляторы Scythe Slip Stream на ~900 об/мин на силиконовых шпильках, на боковой стенке – такой же вентилятор на ~900 об/мин);
  • Панель управления и мониторинга: Zalman ZM-MFC2;
  • Блок питания: Enermax Galaxy DXX (EGA1000EWL) 1000 Ватт (штатные вентиляторы: 135-мм на вдув, 80-мм на выдув).
  • Монитор: 24" BenQ FP241W (Wide LCD, 1920 x 1200 / 60 Гц).

В целях снижения процессорозависимости тестируемых сегодня видеокарт, двухъядерный процессор был разогнан до 4.33 ГГц при напряжении в 1.55 В:

Оперативная память во время тестов функционировала на частоте , с пониженными с таймингами 5-4-4-12 (Perfomance Level = 9) при напряжении в 2.10 В.

Теперь о программной части. В связи с тем, что в некоторых играх в Windows Vista x64 SP1 видеокарта Radeon HD 4870 X2 , все тесты были проведены в операционной системе Windows Vista Ultimate Edition x86 SP1 (новая "чистая" установка). Дата начала проведения тестов – 26.08.2008, поэтому были использованы следующие доступные на тот момент драйверы:

  • чипсет материнской платы Intel Chipset Drivers – 9.1.0.1002 beta ;
  • библиотеки DirectX 9.0с, дата релиза – август 2008 года ;
  • драйверы видеокарт на графических процессорах ATi – (8.53.0);
  • драйверы видеокарт на графических процессорах NVIDIA – ForceWare 177.92 (29/08/08, Beta);
  • драйвер ускорения физики – PhysX 8.08.18 (26/08/08, WHQL).

Настройки качества графики в драйверах выставлены на "High Quality". Таким образом, все оптимизации, доступные в драйверах ForceWare и Catalyst, были отключены. По многочисленным просьбам, не влияющий на скорость Catalyst A.I. оставлен без изменений в положении "Standart". Включение анизотропной фильтрации и полноэкранного сглаживания выполнялось непосредственно в настройках игр. В случае, если изменение данных настроек в самих играх не реализовано по каким-то причинам, то параметры юстировались в панелях управления драйверов ForceWare и Catalyst. Сглаживание прозрачных поверхностей (текстур) "Adaptive Antialiasing (multi-sampling)" для ATi Catalyst и "Transparency antialiasing (multi-sampling)" для NVIDIA ForceWare активировано.

Производительность видеокарт оценивалась в трёх разрешениях: 1280 x 1024, 1680 х 1050 и 1920/1900 х 1200, в следующем наборе приложений, состоящем из двух синтетических бенчмарков и восьми игр разных жанров:

  • 3DMark 2006 (Direct3D 9/10) – build 1.1.0, default settings и 1920 х 1200 + AF16x + AA4x;
  • 3DMark Vantage (Direct3D 10) – v1.0.1, профили “Perfomance” и "Extreme" (тестировались только основные тесты);
  • S.T.A.L.K.E.R.: Shadow of Chernobyl (Direct3D 9) – версия игры 1.006, включено полное динамическое освещение, анизотропная фильтрация x16 и прочие максимальные настройки качества графики, использовалась демо-запись “ixbt3” (тройной цикл теста);
  • World in Conflict (Direct3D 10) – версия игры 1.0.0.9(b89), профиль качества графики “Very High”, но UI texture quality = Compressed; Water reflection size = 512; DirectX 10 рендеринг активирован;
  • Enemy Territory: Quake Wars (OpenGL 2.0) – версия игры 1.5, максимальные настройки графики, демо “d5” на уровне "Salvage" Finland;
  • Call of Duty 4: Modern Warfare MP (Direct3D 9) – версия игры 1.7.568, настройки графики и текстур выставлены на уровень "Extra", демо "d3" на уровне “Bog”, методика тестирования подробно изложена ;
  • Unreal Tournament 3 (Direct3D 9) – версия игры 1.3, максимальные настройки графики в игре (5-й уровень), Motion Blur и Hardware Physics активированы, тестировалась “Fly By”-сцена на уровне “DM-ShangriLa” (два цикла), использовался бенчмарк HardwareOC UT3 Bench v1.3.0.0;
  • Crysis (Direct3D 10) – версия игры 1.2.1, профиль настроек “High”, двукратный цикл теста видеокарты из бенчмарка HardwareOC Crysis Bench v1.3.0.0;
  • Devil May Cry 4 (Direct3D 10) – версия игры 1.0, максимальные настройки качества графики (" "), за результат принималось среднее значение двойного последовательного прогона второй сцены бенчмарка ().
  • S.T.A.L.K.E.R.: Clear Sky (Direct3D 10) – версия игры 1.004, включено улучшенное полное освещение DX10, анизотропная фильтрация x16 и прочие максимальные настройки качества графики (подробнее – в разделе с результатами тестов), использовалась собственная демо-запись "s1" (тройной цикл теста).

Наконец, перейдём к результатам тестов и их анализу.

HIS RADEON HD 4870 512MB PCI-E

Подключение к аналоговым мониторам с d-Sub (VGA) производится через специальные адаптеры-переходники DVI-to-d-Sub. Также поставляются переходники DVI-to-HDMI (мы помним, что данные ускорители поддерживают полноценную передачу видео и звука на HDMI-приемник), поэтому проблем с такими мониторами также не должно быть.

Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048 × 1536 × 32bit x85Hz Max - по аналоговому интерфейсу
  • 2560 × 1600 @ 60Hz Max - по цифровому интерфейсу (все DVI-гнезда с Dual-Link)

Что касается возможностей видеокарт по проигрыванию MPEG2 (DVD-Video), то еще в 2002 году мы изучали этот вопрос , с тех пор мало что поменялось. В зависимости от фильма загрузка CPU при проигрывании на современных видеокартах не поднимается выше 25%.

По поводу HDTV. Одно из исследований также проведено, и с ним можно ознакомиться .

К сожалению, на настоящий момент утилита RivaTuner (автор А.Николайчук AKA Unwinder) не поддерживает новую серию, и потому мониторинга нет.

Комплектация.

Базовый комплект поставки должен включать в себя: руководство пользователя, диск с драйверами и утилитами, переходник-адаптер DVI-to-VGA, мост CrossFire, DVI-to-HMDI адаптер, адаптер компонентного вывода (TV-out), а также разветвители внешнего питания. Далее мы покажем, что предлагается к карте дополнительно.

Упаковки.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core2 (775 Socket)
    • процессор Intel Core2 Extreme QX9650 (3000 MHz);
    • системная плата Zotac 790i Ultra на чипсете Nvidia nForce 790i Ultra;
    • оперативная память 2 GB DDR3 SDRAM Corsair 2000MHz (CAS (tCL)=5; RAS to CAS delay (tRCD)=5; Row Precharge (tRP)=5; tRAS=15);
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows Vista 32bit SP1; DirectX 10.1;
  • монитор Dell 3007WFP (30").
  • драйверы ATI версии CATALYST 8.6; Nvidia версии 175.16 (9ххх серия) и 177.34 (GTX 2xx).

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка .
  • RightMark3D 2.0 с кратким описанием: ,

Для работы RightMark3D 2.0 требуется установленный пакет MS Visual Studio 2005 runtime, а также последнее обновление DirectX runtime.

Синтетические тесты проводились на следующих видеокартах:

  • RADEON HD 4870 HD4870 )
  • RADEON HD 4850 со стандартными параметрами (далее HD4850 )
  • RADEON HD 3870 X2 со стандартными параметрами (далее HD3870X2 )
  • RADEON HD 3870 со стандартными параметрами (далее HD3870 )
  • Nvidia Geforce GTX 260 со стандартными параметрами (далее GTX260 )
  • Nvidia Geforce 9800 GTX со стандартными параметрами (далее GF9800GTX )

Для сравнения результатов новой видеокарты RADEON HD 4870, были выбраны именно эти модели видеокарт по следующим причинам: с RADEON HD 3870 X2 её будет интересно сравнить, как с двухчиповым решением компании AMD на GPU предыдущей архитектуры, чтобы оценить влияние улучшений архитектуры и разницу в производительности. Сравнительная производительность RADEON HD 4850 интересна для того, чтобы узнать вклад повышенных частот GPU и применения нового типа памяти GDDR5. Geforce 9800 GTX хоть и не является прямым конкурентом, но интересен, как прыдущее поколение чипов Nvidia, да и цена HD 4870 не так далека от его ускоренной версии GTX+. А Geforce GTX 260 выступает уже как прямой конкурент RADEON HD 4870, это сравнение и будет главной битвой.

Direct3D 9: Тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

Ничего нового и интересного, всё соответствует разнице в частотах. Как обычно, видеокарты не достигают теоретических значений. Результаты синтетики не дотягивают до теории, ближе всего к ним подходит HD 3870, основанная на RV670. Но для всех новых видеокарт Nvidia и AMD, в данном тесте теоретический максимум не достигается. RV770 в нашем тесте выбирает около 26-27 текселей за один такт из 32-битных текстур при билинейной фильтрации, не дотягивая до 40 теоретических. У карт Nvidia эффективность даже ещё ниже — 35-37 текселей за такт при теоретических 64.

Что касается сравнения HD 4870 с прямым конкурентом GTX 260, то они весьма близки в этом тесте, а вот до Geforce 9800 GTX обе не дотягивают. Новая карта AMD значительно опережает старую, и обгоняет младшую модель линейки HD 4800 в соответствии с частотами. Интересно, что в тесте с одной текстурой HD 4870 немного отстаёт от HD 3870, это связано с теоретически большей производительностью блоков ROP у последнего при 32-битном фреймбуфере без антиалиасинга. В случае же с большим количеством текстур на пиксель, способности блоков ROP не мешают показывать более высокие результаты карте на основе RV770. Посмотрим на результаты в тесте филлрейта:

Второй синтетический тест измеряет скорость заполнения, и в нём мы видим ту же самую ситуацию, но уже с учетом количества записанных в буфер кадра пикселей. В случаях с 0 и 1 накладываемыми текстурами у RADEON HD 4870 получается всё тот же чуть более низкий результат, чем у HD 3870, что обусловлено рабочей частотой блоков ROP. Но, как и на предыдущей диаграмме, в ситуациях с большим количеством текстур на пиксель, новая видеоплата выходит вперёд.

Direct3D 9: Тесты Geometry Processing Speed

Рассмотрим пару предельных геометрических тестов, и первым у нас будет самый простой вершинный шейдер, показывающий максимальную пропускную способность по треугольникам:

Все современные чипы основаны на унифицированных архитектурах, их универсальные исполнительные блоки в этом тесте заняты только геометрической работой, и решения показывают высокие результаты, явно упирающиеся не в пиковую производительность унифицированных блоков, а в производительность других блоков, например, triangle setup.

Результаты это и показывают — RV670 и RV770 весьма близки при сходных частотах. Результаты решений AMD традиционно более высокие, чем у карт Nvidia. RADEON HD 4870 в этом тесте выигрывает и у обеих карт Nvidia, и у своих собратьев. Так как мы убрали из рассмотрения промежуточные тесты на скорость обработки геометрии с одним источником освещения, то переходим к рассмотрению самой сложной геометрической задачи с тремя источниками света, включающей статические и динамические переходы:

В этом варианте разница между решениями AMD и Nvidia видна лучше, разрыв немного увеличился, видеоплаты производства второй компании «просели». HD 4870 и HD 3870 примерно равны на схожих частотах, они снова ограничены чем-то вроде triangle setup, так как цифры почти не изменились с прошлого теста.

Снова все видеокарты AMD опережают и Geforce 9800 GTX и GTX 260. В реальных приложениях универсальные шейдерные процессоры заняты в основном пиксельными расчетами, к исследованию производительности которых мы и переходим.

Direct3D 9: Тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0.

Хоть тесты слишком просты для современных архитектур и не показывают их истинную силу, их интересно смотреть при смене архитектур. В простых тестах производительность ограничена скоростью текстурных выборок, а в чипе RV770 производительность текстурирования как раз улучшена. Это позволило добиться победы по всем фронтам, HD 4870 опережает обе карты Nvidia во всех рассмотренных задачах и быстрее HD 3870 иногда до двух раз.

В более сложных тестах RADEON HD 4870 также показывает отличные результаты, значительно опережая и предшественника и конкурентов. А вот Geforce GTX 260 из-за меньшей скорости текстурирования не впечатляет, немного выигрывая у 9800 GTX лишь в двух самых сложных тестах. Посмотрим на результаты тестов более сложных пиксельных программ промежуточных версий:

Великолепный результат для RADEON HD 4870! В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water», где используется зависимая выборка из текстур больших уровней вложенности, и карты располагаются по скорости текстурирования, новая модель значительно обгоняет обе карты Nvidia, а разница с HD 3870 просто поразительна.

Второй тест интенсивнее загружает вычислительные блоки, и он лучше подходит для архитектур AMD, обладающих большим количеством потоковых процессоров. В нём новое решение AMD снова показывает лучший результат, быстрее и Geforce GTX 260 и 9800 GTX в 1.5-2 раза! И снова, по сравнению с предыдущим поколением, новая плата ускорилась более чем в два раза. Разница с HD 4850 соответствует разнице в частотах GPU.

Direct3D 9: Тесты пиксельных шейдеров New Pixel Shaders

Эти тесты пиксельных шейдеров DirectX 9 ещё сложнее, они делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это математические тесты, зависящие от частоты шейдерных блоков и скорости текстурирования, тут важен баланс чипа. Производительность видеокарт в тесте «Frozen Glass» ограничена не только математикой, но и скоростью текстурных выборок, поэтому старые RADEON показывают самый слабый результат. А вот новые… Смотрите сами, они заметно быстрее предыдущего. А рассматриваемый сегодня HD 4870 вовсе опережает и Geforce 9800 GTX и GTX 260.

Во втором тесте «Parallax Mapping», новинки от AMD ещё сильнее. Если HD 4850 показывает результат чуть выше GTX 260, то HD 4870 значительно опережает обе модели от Nvidia. Улучшения в TMU значительно усилили результаты линейки HD 4800, в этих тестах они стали новыми лидерами. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям, там результаты могут получиться даже более интересными:

Результаты RADEON HD 4850 и Geforce 9800 GTX весьма близки, но HD 4870 ожидаемо обходит обоих за счёт более высокой частоты чипа. Взаимное положение карт немного изменилось, заметен упор в скорость текстурных блоков. И обе карты на RV770 обгоняют предыдущий одночиповый топ в два и более раза. А вот GTX 260 показал в этом случае весьма слабые результаты, отстав даже от предшественника.

Рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Тесты отличаются тем, что сильно нагружают и ALU и текстурные модули, обе шейдерные программы сложные, длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье
  • Fur — процедурный шейдер, визуализирующий мех

Новая архитектура компании AMD в этих тестах показывает себя с лучшей стороны, в отличие от предыдущих решений, которые проигрывали картам Nvidia. HD 4870 с большим запасом опережает всех соперников, разница с HD 3870 просто огромна. Да и Geforce 9800 GTX с Geforce GTX 260 остаются далеко позади.

Снова мы видим отличные результаты переработанной архитектуры AMD в наших DirectX 9 тестах. Но что получится в DX10, ведь в прошлых исследованиях там дела были явно похуже. Сейчас узнаем, сравнив уже с двухчиповой картой предыдущего поколения, так как с одночиповыми RV670 всё давно понятно…

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

В новую версию RightMark3D 2.0 вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два полностью новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель!) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит не только от количества и скорости блоков TMU, но и от филлрейта и ПСП. Как мы и ожидали, в Direct3D 10 тесты процедурной визуализации меха с большим количеством текстурных выборок ничего особенно не изменилось — всё такое же огромное преимущество решений Nvidia над AMD. Посмотрим, что будет дальше, этот тест карты AMD всегда проваливают.

Хотя HD 4870 и проиграл обеим картам Nvidia, относительно младшей модели линейки он показал преимущество, соответствующее разности частот. Да и двухчиповый RADEON HD 3870 X2 обогнал новое решение HD 4870 только в тяжелом режиме. Очень хороший результат, если не смотреть на цифры Nvidia. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Включение суперсэмплинга теоретически увеличивает нагрузку в четыре раза, в этот раз подавляющее преимущество карт Nvidia также никуда не делось, хотя новые видеокарты AMD уже явно ближе к Geforce 9800 GTX. В остальном, с увеличением сложности шейдера и нагрузки на видеочип, разница между HD 4870 и двухчиповым HD 3870 X2 почти та же, они близки друг к другу.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Этот тест интереснее с практической точки зрения, ведь разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются в некоторых проектах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Повторяется взаимное расположение карт из предыдущего теста. Хотя решения AMD были сильны в Direct3D 9 тестах parallax mapping, в обновленном D3D10 варианте без суперсэмплинга они не могут справиться с нашей задачей на уровне видеокарт Geforce, ещё и включение самозатенения вызывает на продукции AMD слишком большое падение производительности. Рассматриваемый нами сегодня RADEON HD 4870 отстаёт от обеих видеокарт Geforce и очень близок к двухчиповому HD 3870 X2. Посмотрим, что изменит включение суперсэмплинга, в прошлом тесте он вызывал большее падение скорости на картах Nvidia.

При включении суперсэмплинга и самозатенения задача получается более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростью разных видеокарт уже другая, включение суперсэмплинга сказывается как и в предыдущем случае — карты производства AMD улучшают свои показатели относительно решений Nvidia. И новые HD 4800 хотя и продолжают отставать от Geforce, но HD 4870 близок к HD 3870 X2 и почти догнал хотя бы Geforce 9800 GTX. До прямого конкурента GTX 260 ему далеко, конечно же.

Direct3D 10: Тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

При анализе результатов наших синтетических тестов, мы всегда отмечаем, что в вычислительно сложных задачах современные архитектуры AMD показывают себя лучше конкурирующих от Nvidia. Вот и сейчас в Mineral HD 4870 просто разорвал конкурентов. Топовая видеокарта на основе одного чипа RV770 обгоняет карту прошлого поколения на двух RV670, что близко к разнице в количестве и частоте потоковых процессоров. Также новая видеокарта почти в два раза опережает и прямого конкурента Geforce GTX 260, не говоря про Geforce 9800 GTX.

Второй тест шейдерных вычислений носит название Fire, и он ещё более тяжёл для ALU. В нём текстурная выборка только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

В данном тесте скорость рендеринга ограничена исключительно производительностью шейдерных блоков, и тест очень хорошо подходит архитектурам AMD, что хорошо заметно после исправления ошибки в драйверах AMD. Что тут можно сказать… Полный разгром решений Nvidia. Вдумайтесь, RADEON HD 4870 более чем в два раза быстрее Geforce GTX 260 и быстрее двухчипового HD 3870 X2. Потрясающий результат, в вычислениях RV770 явно сильнейший GPU вообще. Кстати, соотношение скоростей между HD 4870 и HD 4850 точно соответствует разнице в частотах.

Direct3D 10: Тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не очень сложная и ограничение скорости мощностью потоковых процессоров в тесте не явное, задача ограничена также и ПСП и филлрейтом.

Ну очень интересно получилось, крайне плотные результаты у двухчиповой HD 3870 X2, новой HD 4870 и конкурента GTX 260. Да и в паре HD 4850 с Geforce 9800 GTX очень тесно. Интересно… Возможно, при переносе части вычислений в геометрический шейдер ситуация будет ещё интереснее, посмотрим:

Но нет, разница между рассмотренными вариантами теста невелика, существенных изменений не произошло. Разве что двухчиповый HD 3870 X2 вышел в явные лидеры по достигнутой частоте кадров. Ему проще, алгоритм многочипового рендеринга AFR прощает многое. Видеокарты Nvidia показывают идентичные результаты при изменении параметра GS load, отвечающем за перенос части вычислений в геометрический шейдер, а результаты некоторых видеоплат AMD немного выросли. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры…

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть в два раза медленней. В этот раз скорость RADEON 4850 и HD 4870 больше, чем у двухчипового решения на GPU предыдущей архитектуры, но все карты производства AMD отстают от всех решений Nvidia, хотя HD 4870 близок к ним.

Похоже, что на результаты новых карт повлияли улучшенные возможности текстурирования. Впрочем, цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

В этот раз «провалился» только Geforce 9800 GTX, все остальные архитектуры выдержали удар. И в RV770, и в GT200 были сделаны некоторые оптимизации, направленные на улучшение исполнения геометрических шейдеров. И RADEON HD 4870 теперь догнал Geforce GTX 260, кроме самого простого режима. Предыдущее поколение чипов AMD значительно хуже показывает себя в этом тесте, даже двухчиповая видеокарта отстаёт.

Что касается сравнения результатов в разных режимах, тут всё как всегда, видеоплаты AMD при переходе от использования «instancing» к геометрическому шейдеру при выводе, улучшают свои показатели, а старые видеокарты Nvidia теряют в производительности. Карта Geforce на основе чипа G92 может конкурировать только за счёт скорости в «Balanced» режиме, которая почти равна скорости в «Heavy» у RADEON HD 4850. При этом, получаемая в разных режимах картинка не отличается визуально.

Direct3D 10: Скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Судя по предыдущим исследованиям, на результаты этого теста влияет не только скорость текстурирования, но и производительность ROP и пропускная способность памяти, и чем проще режим, тем большее влияние на скорость они оказывают. Во всех режимах, кроме простого, лидером является топовая модель серии HD 4800, которую мы сегодня рассматриваем. В простом влияет ПСП, да и многочиповый рендеринг показывает себя неплохо. GTX 260 показывает результат лишь на уровне HD 4850. Посмотрим на результаты этого же теста с увеличенным количеством текстурных выборок:

Ситуация изменилась не слишком сильно, но текстурирование влияет на скорость уже сильнее, что видно по паре Geforce. HD 4870 сдала позиции и не является лидером, хотя отстаёт в сложных режимах от Geforce 9800 GTX совсем чуть-чуть. В простом же лидирует GTX 260 с большой ПСП. Интересно, что с ростом сложности геометрии и разница между HD 4870 и HD 3870 X2 изменяется.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Второй тест этого раздела под названием «Waves» благосклоннее к продукции AMD, новая модель семейства RADEON HD 4800 смотрится очень хорошо, на уровне двухчипового предшественника. И также обгоняет видеокарты Nvidia, кроме самого простого, где GTX 260 чуть-чуть впереди. Похоже, что в таких условиях эффективность TMU у RV770 выше, чем у GPU производства Nvidia. Рассмотрим второй вариант этого же теста:

И снова видим совсем мало нового, хотя с увеличением сложности теста результаты видеоплат AMD относительно скорости карт Nvidia улучшились, последние потеряли несколько больше от изменения условий тестирования. В самом лёгком режиме впереди HD 3870 X2 и HD 4870, в остальных двухчиповому HD 3870 X2 нет равных. Ну а среди одночиповых карт лучшим является герой обзора, он опережает своего младшего брата HD 4850 соответственно разнице в частотах. Карты Nvidia остались в этот раз позади.

3DMark Vantage: Feature тесты

В обзор RADEON HD 4870 мы решили включить и синтетические тесты из 3DMark Vantage. Пакет новый, его feature тесты довольно интересны и отличаются от наших. Вероятно, при анализе результатов карт в этом пакете мы сделаем для себя какие-то новые и полезные выводы.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Соотношение результатов в целом схоже с тем, что показывают наши тесты, используются условия, в которых карты Nvidia не получают дополнительного преимущества от большого количества TMU. Старая одночиповая карта AMD сильно отстаёт от всех, зато и двухчиповый HD 3870 X2 и новая модель HD 4870 значительно обгоняют оба решения производства Nvidia. Geforce GTX 260 отстаёт от Geforce 9800 GTX, как и должно быть по теории. Но вот почему карта на основе RV770 обгоняет и G92 и GT200? Видимо, дело в той самой эффективности текстурных модулей, которая выше у карт AMD.

Feature Test 2: Color Fill

Тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR рендеринг, поэтому такой тест очень своевременен.

Показания этого теста соответствуют тому, что мы получаем в своих синтетических тестах, с учетом того, что у нас используется целочисленный буфер с 8-бит на компоненту, а в тесте Vantage — 16-бит с плавающей точкой. Поэтому все цифры в два раза меньше наших.

Эти цифры скорее показывают не только производительность ROP, но и величину пропускной способности памяти (в случае мультичипов — умноженную на число чипов для AFR). Цифры соответствуют теоретическим и зависят, прежде всего, от ширины шины памяти и её частоты. В данном тесте новая модель HD 4870, пользуясь улучшенными возможностями блоков ROP и большой ПСП GDDR5 памяти, показывает лучший результат, выше, чем у двухчиповой HD 3870 X2 и GTX 260 с 448-битной шиной памяти.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Тест интересен тем, что он не зависит только от шейдерной мощности, эффективности исполнения ветвлений и скорости текстурных выборок, а от всего сразу. То есть, для достижения высокой скорости важен баланс чипа и карты. И больше всего важна эффективность выполнения ветвлений в шейдерах, так называемая гранулярность исполнения.

Старые карты от обоих производителей далеко позади, даже двухчиповый HD 3870 X2 не смог догнать HD 4870, хотя двухчиповый рендеринг этого теста весьма эффективен. И вот тут мы видим интересное расположение RADEON HD 4870 и Geforce GTX 260. Несмотря на то, что в тестах текстурных выборок и математических вычислений решение AMD обычно выигрывало, в тесте POM Geforce сильнее RADEON. И виновата в этом именно лучшая эффективность обработки ветвлений в шейдерах у GT200.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров, и скорость stream out.

В данном тесте традиционно получаются странные результаты у двухчиповых карт, HD 3870 X2 не получает ускорения от своего второго GPU. В остальном, снова видим отставание решений AMD, даже относительно быстрая HD 4870 не дотягивается до Geforce 9800 GTX, не говоря про GTX260. Похоже, что скорость не зависит от шейдерной производительности, а зависит от скорости stream out…

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Тут мы видим почти то же самое, что и в предыдущем случае, только отстал Geforce 9800 GTX, а карты AMD подтянулись повыше. Но всё равно, лидером остаётся Geforce GTX 260, близко к нему следует сегодняшний герой HD 4870. Двухчиповая карта AMD снова не ушла далеко от старой одночиповой и обе расположились в конце списка. И снова предположим, что на скорость влияет производительность stream out, ПСП и текстурная производительность одновременно.

Feature Test 6: Perlin Noise

Этот feature тест можно считать математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он очень сложен математически.

Последний feature тест в Vantage показывает чистую математическую производительность видеочипов. Показанная в нём производительность вполне соответствует тому, что мы видим в наших математических тестах из RightMark 2.0. Видеокарты AMD закономерно выигрывают у своих конкурентов от Nvidia, даже двухчиповый HD 3870 X2 опережает GTX 260. Ну а RADEON HD 4870 является лидером и опережает своего главного конкурента более чем на 25%.

Выводы по синтетическим тестам

На основе результатов проведённых синтетических тестов, мы подтверждаем выводы, сделанные в предыдущей статье. Новые решения компании AMD получились весьма удачными, в чипе RV770 было сделано много изменений, почти во всех синтетических тестах оно в разы опережает по скорости видеокарты предыдущего поколения. Благодаря улучшенной архитектуре RV770, в которой исправили главные недостатки, во многих тестах RADEON HD 4870 обгоняет своего основного конкурента Geforce GTX 260. RV770 стал более эффективным и сбалансированным, что важно для современных и будущих 3D приложений с большим количеством сложных шейдеров.

Чип RV770 обладает большим количеством исполнительных блоков, поддерживает новую память GDDR5, которая позволила выпустить RADEON HD 4870 с высокой ПСП на основе лишь 256-битной шины обмена с памятью. Небольшие вопросы возникают разве что по поводу меньшей эффективности исполнения ветвлений в шейдерных программах, что сказывается на производительности наиболее сложных алгоритмов parallax mapping. Ну и по скорости stream out новые решения AMD уступают конкурирующим от Nvidia. Всё остальное у новой линейки HD 4800 просто отлично! Особенно вычислительная производительность, по которой они далеко впереди.

Следующая часть статьи содержит тесты нового решения компании AMD и других видеокарт в современных игровых приложениях. Игровые результаты должны подтвердить наши выводы. Можно предположить, что в среднем скорость HD 4870 в играх будет примерно на одном уровне с Geforce GTX 260.

Блок питания для тестового стенда предоставлен компанией TAGAN
Монитор Dell 3007WFP для тестовых стендов предоставлен компанией



Рекомендуем почитать

Наверх