Типичное энергопотребление, Вт. Игровые тесты: StarCraft II: Wings of Liberty

И Radeon HD 6970 представленные в начале текущего года действительно являются наиболее эффективными и популярными решениями сегодняшнего дня. Их популярность обусловлена грамотной ценовой политикой со стороны компании AMD и присутствием многих прогрессивных технологий как AMD EyeFinity, которые в графических решениях конкурента присутствуют лишь на "зачаточном уровне".
На нашем портале Мега Обзор ранее уже было представлено не малое количество обзоров видеокарт данного семейства. Среди них можно выделить:
1. Обзор PowerColor Radeon HD 6950 PCS++. Видеокарта с двойными частотами
2. Обзор Sapphire Radeon HD 6950 2GB. Знакомство с референсной видеокартой
3. Обзор HIS Radeon HD 6950. Разблокировка и превращение в HIS Radeon HD 6970
4. Обзор XFX Radeon 6950 1 GB XXX Edition. Как повлияет уменьшение видеопамяти на производительность?
5. Обзор MSI Radeon HD 6950 Twin Frozr II. Модифицированный вариант популярного решения
6. Обзор PowerColor PCS+ Radeon HD 6950 Vortex II Edition. Новая система охлаждения для популярной видеокарты
7. Обзор ASUS Radeon HD 6950. Скромный заводской разгон от ASUS
8. Обзор ASUS Radeon HD 6970 DirectCU II. Нововведения от ASUS в топовой видеокарте от AMD
9. Обзор HIS Radeon HD 6950. Разблокировка и превращение в HIS Radeon HD 6970
10. Обзор PowerColor Radeon HD 6970 PCS+. Заводской разгон и новая система охлаждения
11. Обзор PowerColor Radeon HD 6970 LCS. Попытка обмануть оверклоккера?
12. Обзор HIS Radeon HD 6970 IceQ Turbo. Новая модификация уже на рынке!

Каждый из данных обзоров можно найти на нашем портале Мега Обзор. При их рассмотрении вы можете заметить, что отличие всех графических решений между собой заключается исключительно в модифицированной системе охлаждения и в уровне заводского разгона ядра или чипов видеопамяти. Все это делает часть тестирования видеокарт однотипным и малоинтересным для конечного пользователя.

Учитывая данное обстоятельство, мы бы хотели подготовить иной обзор по данным продуктам, который будет обобщать наш опыт работы с данными видеокартами и позволит конечным пользователям решить многие задачи, которые могли показаться им не решаемыми ранее.
Нам бы хотелось построить сегодняшнюю статью в рамках формата "Вопрос-Ответ", что позволит облегчить поиск нужной информации в будущем. 1. В чем заключается отличие между видеокартами AMD Radeon HD 6950 и HD 6970?
Это первый вопрос, который задают пользователи при выборе видеокарты данного семейства. Отличие видеокарт заключается в следующем:
- младшая видеокарта имеет меньшее количество универсальных процессоров (вместо 1536 у старшей, младшая обладает 1408 штуками),
- младшая видеокарта имеет меньшее количество текстурных блоков (вместо 96 у старшей, 88 штук у младшей)
- младшая видеокарта трудиться при меньших рабочих частотах (частоты у старшей видеокарты 880/1375 Мгц, у младшей 800/1250 Мгц),
- младшая видеокарта обладает меньшим энергопотреблением (старшая видеокарта в пиках нагрузки потребляет до 250 ватт, младшая - до 200 ватт электричества).

Результаты тестирования показывают, что объективно реальная разница в производительности между старшей и младшей видеокартой может достигать 17%. В среднем данный параметр колеблется в районе 12%. Стоит переплачивать за старшую видеокарту семейства или нет - решать вам.

Картинка кликабельна --


2. Каково реальное энергопотребление видеокарт и хватит ли моего блока питания для них?
Данный вопрос наши пользователи задают во вторую очередь. В принципе, дизайн печатных плат видеокарт Radeon HD 6970/6950 не имеет каких-либо кардинальных различий, но данные различия присутствуют в схемах питания видеокарт. Хотя бы отметить, тот факт, что старшая видеокарта оснащается одним шестипиновым и одним восьмипиновым коннектором PCI-Express, а младшая лишь двумя шестипиновыми коннекторами PCI-Express.

Несмотря на это длина печатных плат одинаковая и достигает 27,6 см, что необходимо учитывать при выборе корпуса системного блока. Не каждый системный блок формата mATX сможет вместить графическое решение данного семейства.

Производитель рекомендует для одиночной видеокарты данного семейства блок питания мощностью около 550 ватт. При этом надо учитывать, что это должна быть реальная мощность питающего устройства, а не пиковая. Блок питания должен соответствовать спецификациям ATX2.xx, то есть выдавать основную мощность по линии 12 вольт.

Если вы планируете разгон видеокарты с софтвольтмодом, то рекомендуем подумать задуматься о блоке питания более высокой мощности, так как энергопотребление данных видеокарт может легко приблизиться к цифре 330-340 ватт.

Для тандема видеокарт семейства Radeon HD 6950/6970 в режиме CrossFire рекомендуется к приобретению блок питания мощностью не менее 850 ватт. Как правило, данной мощности оказывается достаточно для энергообеспечения данных графических решений.

Картинка кликабельна --


3. Какие требования к материнской плате у данных видеокарт?
Опыт показывает, что видеокарты семейства Radeon HD 6950/6970 с легкостью и без проблем работают во всех существующих материнских платах со слотами PCI-Express. Официально видеокарты поддерживают шину PCI-Express 2.0, которая обратно совместима с шинами предыдущих поколений, вплоть до 1.0.

Как правило, использование видеокарты в слоте PCI-Express 1.0 может привести к невозможности достижения максимальной производительности в некоторых игровых режимах, где необходим наиболее быстрый обмен данными. Использование тандема видеокарт в режиме CrossFire на шине предыдущего поколения также не рекомендуется, так как ее производительности для двух видеокарт точно не хватит.

Для создание CrossFire конфигураций необходимо приобретать материнские платы сообщающие о поддержке данной технологии или имеющие два и более слотов PCI-Express 2.0. Дорогие материнские платы поддерживают два полноценных слота PCI-Express 2.0 x16, более дешевые варианты обеспечивают работу двух видеокарт в формате PCI-Express 2.0 x8.

Опыт показывает, что разница в уровне производительности при двух разных вариантах построения CrossFire конфигураций незначительна, хотя и может наблюдаться при высоких нагрузках.

Для построения CrossFire рекомендуется соединять видеокарты соответствующими мостиками. В идеальном варианте - это два мостика. Опыт показывает, что можно использовать и один мостик, если вы играете при разрешении менее 1980х1024 пикселей включительно.
4. Видеокарту под какой маркой порекомендуете приобретать?
Это следующий практический вопрос, который начинает интересовать наших пользователей. Действительно, на сегодняшний день отечественный рынок предлагает большое разнообразие продуктов серии Radeon HD 6950/6970 от ASUS, MSI, Palit, Gainward, Sapphire, PowerColor, HIS и т.д. Большинство представленных решений имеет эталонный дизайн, который можно выявить по стандартной системе охлаждения и разводке схем питания на оборотной стороне видеокарты.

Если в вашем случае вы выбираете между эталонными дизайнами, мы рекомендуем приобретать наиболее дешевый вариант. Уровень производительности, качество у данных видеокарт абсолютно одинаковое. Отличие решений заключается лишь в этикетках нанесенных на кожухи системы охлаждения.

Картинка кликабельна --


Если же вы хотите приобрести видеокарту альтернативного дизайна, то здесь окончательный выбор остается за вами. На нашем портале Мега Обзор представлено более 12 обзоров видеокарт альтернативного дизайна. Основные отличия видеокарт, отличного от эталонного дизайна, заключается:
- в рабочих частотах,
- системе охлаждения,
- схеме питания видеокарты.

Как правило, производители устанавливаются более эффективные системы охлаждения на свои видеокарты и осуществляют их небольшой заводской разгон. Ярким примером может быть видеокарта MSI Radeon HD 6950 Twin Frozr II, которая имеет модифицированную систему охлаждения и работает на повышенных относительно номинала частотах.

Недавно на рынок поступила новая модификация видеокарт данной серии - MSI Radeon HD 6950 Twin Frozr III PE, которая имеет модифицированную схему питания. Как правило, модификация схемы питания видеокарты приводит к повышению стабильности ее работы при ее разгоне и позволяет достичь более высоких частот, нежели на обычной видеокарте. К сожалению, этого также вам никто не гарантирует и это лишь теоретическое "может быть", за которое предлагается пользователю немного доплатить.

Картинка кликабельна --


5. Какие технические проблемы выявлены у видеокарт на данный момент?
На сегодняшний день технические проблемы видеокарт AMD Radeon HD 6950/6970 могут быть связаны с появлением надоедливого "свиста" при высоких нагрузках на графическое решение. Как правило, это свистят элементы системы питания видеокарты - дроссели. Основная причина - нехватка мощности блока питания или просадка им подаваемого напряжения по 12 вольт. Просадка ведет к повышению потребности в токе, что увеличивает силу протекающего через дроссели тока, что и приводит к появлению надоедливого визга.

К сожалению, не всегда проблема заключается в блоке питания, она может крыться и в самой видеокарте. Никто не застрахован от распайки несколько некачественного дросселя. Решается данная проблема достаточно просто. На слух выявляется свистящий дроссель, снимается видеокарта и выявленный элемент заливается лаком для радиоэлектроники.

Следует понимать, что данная манипуляция полностью и навсегда лишает вас гарантии на видеокарту. Как правило, свистящий дроссель не признается гарантийным случаем ни одним из сервисных центров.

Возможно и более простое решение данной проблемы. Опыт показывает, что уровня производительности видеокарт Radeon HD 6950/6970 хватает для многих и большая часть вычислительных сил видеокартами расходуется впустую. Поэтому имеет смысл поставить ограничение максимальной частоты кадров, включив в драйвере функцию VSync. Снижение нагрузки на видеокарту приведет к снижению, как энергопотребления, так и к исчезновению надоедливого звука.

В целом видеокарты Radeon HD 6950/6970 сдаются по гарантии не чаще конкурирующих решений и даже меньше, так как имеют на борту два чипа БИОСа и пользователям необходимо постараться, чтоб уничтожить обе записи системы загрузки.

Каких-либо жалоб на несовместимость видеокарт с оборудованием от других производителей мы также не встречали.

Картинка кликабельна --


6. Почему разгонный потенциал видеокарт Radeon HD 6970 выше, чем у Radeon HD 6950?
Действительно, обе видеокарты основаны на одном и том же ядре. Просто младшая модель имеет урезанное ядро в сочетании с меньшим энергопотреблением, которое обеспечивается разностью подаваемых напряжений на ядро в 2D и 3D режимах. Также чипы видеопамяти у видеокарт Radeon HD 6970 трудятся при напряжении 1,6 вольт, а у младшей видеокарты Radeon HD 6950 при напряжении 1,5 вольта.

В принципе повысить данное напряжение вам никто не мешает. Это можно сделать заливкой новой версии БИОСа на видекарту. Некоторые пользователи отмечали выгорание чипа после повышения напряжения на чипах видеопамяти. Как показывает опыт, количество данных случаев не превышает среднестатистические значения даже среди не модифицированных видеокарт, поэтому 1,6 вольт для чипов памяти трудно назвать смертельным.

Картинка кликабельна --


7. Какие драйвера рекомендуете использовать в связке с данными видеокартами?
Мы не имеем какого-либо предпочтения и стараемся всегда использовать последние версии драйверов. Как правило, последние версии драйверов можно найти либо у нас на сайте Мега Обзор, либо на официальном сайте AMD.

Единственным ключевым требованием является предварительная чистка операционной системы от "остатков" драйверов предыдущей видеокарты, особенно, если это была видеокарта NVIDIA. Делается это достаточно просто, в сети и на нашем сайте Мега Обзор представлено несколько программ, к примеру, Driver Sweeper. Заключение
Завершая нашу первую статью о том, на что следует обращать внимание при покупке видеокарт AMD Radeon HD 6950/6970, мы хотим отметить, что данные видеокарты очень популярны среди отечественных пользователей. Практически единственным недостатком видеокарт данного семейства является отсутствие поддержки технологии Nvidia PhysX, из-за чего некоторые пользователи отдают безоговорочное предпочтение продукции конкурента. Энтузиасты достаточно давно решили данную проблему, установкой второй видеокарты от NVIDIA для поддержки данной технологии в играх. При этом NVIDIA PhysX будет без проблем работать только в операционных системах Windows XP и Windows 7, проблему активации данной функции в Windows Vista решить не удалось.

На зарубежных сайтах ходят скриншоты использования новых драйверов AMD, которые включают работу PhysX на видеокартах AMD Radeon HD 6950/6970. К сожалению, данных драйверов в нашей стране никто не видел и все это пока так и остаются простыми скриншотами.

Во второй статье посвященной видеокартам AMD Radeon HD 6950/6970 мы постараемся дать советы по правильной эксплуатации данных видеокарт.

Выход новой версии API DirectX вселяет надежды на очередную революцию в графике, неуклонно приближая ее к обещанному лет семь назад светлому будущему в виде кинематографического качества. Учитывая смещения приоритетов игростроев на консольные проекты, ждать очередной PC-шедевр нам придется не скоро. Пока же разработчики графических процессоров занимают оборону, выпустив по второму поколению настольных видеокарт с поддержкой DirectX 11.

Переход к этому API для NVIDIA оказался тяжелым: опоздавшие на полгода карты были дорогими в производстве, с высоким энергопотреблением и отключенной частью функциональных блоков у флагмана компании. Лишь сейчас она смогла выпустить более-менее достойные решения. AMD, напротив, размеренно следует своей стратегии разработки простых одночиповых продуктов и hi-end акселераторов на базе двух графических процессоров. И если бы не она, интерес к мультичиповым конфигурациям вряд ли был бы на должном уровне.

Смену поколений видеокарт AMD решила осуществить расширением линейки Radeon, тем самым введя путаницу в модельный ряд компании. Новинки серии HD 6800 на самом деле оказались медленнее предшественников, но за счет цены они должны занять нишу между Radeon HD 5800 и HD 5700, составив конкуренцию неплохому по своим характеристикам GeForce GTX 460 .


Для высокопроизводительных решений на базе одного GPU уготовано место, где обычно царили двухчиповые продукты. Таким образом, в серию Radeon HD 6900 теперь будут входить все карты на базе ядра Cayman — приемника Cypress .

Cayman

Графический процессор Cayman, на базе которого основаны видеокарты Radeon HD 6970 и HD 6950, выполнен по все по тому же 40-нм техпроцессу, что и предшественник. Но в отличии от Cypress новое ядро претерпело некоторые изменения. Так, число SIMD-ядер было увеличено с 20 до 24 (по 16 суперскалярных потоковых процессоров в каждом), количество текстурных блоков соответственно выросло до 96. Блоки рендеринга немного улучшили для работы со сглаживанием, но их число осталось без изменений, т.е. 32 штуки. Алгоритм сглаживания тоже подвергся некоторым усовершенствованиям. «Графический движок» теперь разделен на двое, каждая часть которого обслуживает свою половину ядра. Некоторых блоков в нем стало в два раза больше, что позволило увеличить скорость работы с геометрией и тесселяцией (последнее почти в три раза выше, чем у Cypress). Кроме того, к каждой половинке ядра подключен свой диспетчер потоков (Ultra-Threaded Dispatch Processor), отвечающий за распределение нагрузки по исполняющим блокам.


Но самое главное то, что AMD отказалась в суперскалярных процессорах от пятого ALU (T-unit), способного исполнять сложную инструкцию (Special Function) — теперь его роль распределяется между тремя из четырех оставшихся. Такой подход по заверению разработчика позволяет увеличить производительность до 10% на квадратный миллиметр площади кристалла.


В конечном итоге количество потоковых процессоров составило 1536 шт., тогда как в Cypress их 1600. Но это вряд ли негативно повлияет на быстродействие нового GPU, тем более, что его частота стала немного выше — 880 МГц против 800 МГц. Частота памяти GDDR5 также была увеличена — до 5500 МГц, хотя разрядность шины составляет прежние 256 бит. А вот объем видеобуфера, не долго думая, сделали в два раза больше, и теперь он равен целым 2048 мегабайтам, что особо будет полезно при высоких разрешениях экрана и в режиме CrossFireX.

Характеристики младшей модели чуть поскромнее: 1408 потоковых процессоров, 88 TMU, количество ROP прежнее, частоты ядра и памяти составляют 800 и 5000 МГц соответственно. Объем памяти также равен 2048 МБ.

Видеоадаптер Radeon HD6970 Radeon HD6950 Radeon HD6870 Radeon HD6850 Radeon HD5870 Radeon HD5850
Ядро Cayman XT Cayman Pro Barts XT Barts Pro RV870 (Cypress) RV870 (Cypress)
Архитектура VLIW4 VLIW4 VLIW5 VLIW5 VLIW5 VLIW5
2640 2640 1700 1700 2154 2154
Техпроцесс, нм 40 40 40 40 40 40
Площадь ядра, кв. мм 389 389 255 255 334 334
1536 1408 1120 960 1600 1440
Количество текстурных блоков 96 88 56 48 80 72
Количество блоков рендеринга 32 32 32 32 32 32
Частота ядра, МГц 880 800 900 775 850 725
Шина памяти, бит 256 256 256 256 256 256
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Частота памяти, МГц 5500 5000 4200 4000 4800 4000
Объём памяти, МБ 2048 2048 1024 1024 1024 1024
11 11 11 11 11 11
Интерфейс PCI-E 2.1 PCI-E 2.1 PCI-E 2.1 PCI-E 2.1 PCI-E 2.1 PCI-E 2.1
Заявленная максимальная потребляемая мощность, нагрузка/простой, Вт (250) 190/20* (200) 140/20* 151/19 127/19 188/27 170/27

* в скобках указана максимальная мощность


Естественно, с увеличением количества функциональных блоков при неизменном технологическом процессе выросла площадь кристалла Cayman до 389 мм 2 — все-таки он стал «толще» на 500 млн. транзисторов. В таком случае следует ожидать рост энергопотребления новых карт. Но с выходом Cayman компания AMD изменила представление этого показателя. Теперь за счет новой технологии PowerTune частота графического процессора, а не только его напряжение, может динамически меняться в зависимости от нагрузки и уровня энергопотребления. Последнее в процентном отношении можно настраивать самостоятельно в Catalyst Control Center (вкладка ATI Overdrive).


При стандартных настройках энергопотребление Radeon HD 6970 в обычных игровых приложениях равно 190 Вт, тогда как пик в бенчмарке OCCT может достигать 250 Вт. Для Radeon HD 6950 эти значения меньше и составляют 140 и 200 Вт соответственно. В простое карты потребляют всего 20 Вт.


Если ползунок в ATI Overdrive переместить к -20%, частота GPU будет изменяться в пределах 880-500 МГц (при большей нагрузке она будет снижаться, при меньшей — наоборот, повышаться), тем самым снизится энергопотребление и тепловыделение карты.


Если же переместить его к +20%, то вместо изменения частоты пользователю будет доступен более высокий уровень разгона.

Из приятных моментов для энтузиастов отметим поддержку Dual BIOS и специальный переключатель возле разъема CrossFire, позволяющий выбрать тот или иной чип с микрокодом. Одна версия предназначена для постоянного обновления, а вторая защищена от записи для предотвращения порчи информации. Это будет особо полезно любителям перепрошивать карты — если выйдет из строя одна микросхема, то можно будет и дальше использовать акселератор.


Система охлаждения видеокарт Radeon HD 69xx основана на испарительной камере, как у Radeon HD 5970 и новоиспеченного GeForce GTX 580. Ранее такая конструкция встречалась в продуктах Sapphire , и как показала практика, эффективность подобных решений выше, чем у стандартных кулеров на тепловых трубках.


Количество разъемов для подключения мониторов увеличилось и теперь вместо одного стандартного DisplayPort пользователям будет доступно два miniDP версии 1.2. Поддержка Eyefinity осталась на месте.

Как видим, изменений в новом графическом процессоре Cayman достаточно, чтобы говорить о новом поколении видеокарт с поддержкой DirectX 11. Но насколько эти изменения отразятся в реальных приложениях? Это мы и узнаем ниже.

Теперь взглянем непосредственно на сами карты. Перед нами почти что полные близнецы. Вместо плавных линий и округлых форм, характерных для прошлой серии Radeon, новички имеют вид «кирпичика» с красными вставками по бокам.


Radeon HD 6970 оснащается шести- и восьмиконтактным разъемами питания.


Младший Cayman имеет два шестиконтактных гнезда.


Обратная сторона видеокарт закрыта черной металлической пластиной.


На заднюю панель выведено по паре разъемов DVI и mini-DisplayPort, плюс один HDMI.


Система охлаждения обоих моделей одинакова.


Пластина на обратной стороне платы не охлаждает микросхемы памяти, как это было у Radeon HD 5870 или Radeon HD 5970. Все чипы GDDR5 распаяны на лицевой стороне. Конструкция турбины вполне типичная и включает основной радиатор для охлаждения ядра и металлическое массивное основание, играющее роль теплоотвода для памяти и силовых элементов системы питания. Только вместо традиционных тепловых трубок референсные карты на базе Cayman оснащены радиатором c испарительной камерой.

Смотрится родная СО довольно внушительно.


За обдув всей конструкции отвечает вентилятор Foxconn PVB070G12N диаметром 70 мм.


У младшей карты используется другой вентилятор, но такого же диаметра.

Взглянем теперь на дизайн плат. Ниже представлены фото Radeon HD 6970



А вот Radeon HD 6950:


Никакой разницы! Да и с Radeon HD 5870 различия минимальны.

Отличаются видеокартами разными GPU и рабочими частотами.


Radeon HD 6970 (слева) и Radeon HD 6950


Оба адаптера оснащены 2 ГБ видеопамяти GDDR5. У старшей модели используются микросхемы Hynix H5GQ2H24MFR R0C, рассчитанные на рабочую частоту в 6 ГГц.


На Radeon HD 6950 распаяны чипы Hynix H5GQ2H24MFR T2C, номинал которых 5 ГГц.


Утилита GPU-Z правильно определяет частоты новых видеокарт, ошибаясь только в числе вычислительных блоков.



Мониторинг и разгон в MSI Afterburner тоже работает отлично. Пока что только нет поддержки софтвольтмода. Преобразователи питания на картах построены на контроллерах Volterra VT 1556MF, которые поддерживают I2C и программное управление напряжением на них возможно. Так что ожидаем данной функции в будущих версиях Afterburner.

Немного о температурном режиме. Radeon HD 6970 в игровых приложениях легко прогревается до 90 °С (при 23 °С в помещении). Почти как GeForce GTX 480, вот только уровень шума у новинки AMD намного меньше, гул заметен, но терпим.


Стресс-тест Furmark прогрел карту до 92 °С, но уровень шума был уже очень высокий.


Немного прокомментируем функцию Power Control, которая позволяют перевести карту в более экономичный режим. При значении -5% мы не увидели никакого падения производительности, а вот при -20% частота ядра скакала от 500 до 800 МГц и в тесте Crysis Warhead результат упал на 26%.


Повышение Power Control немного помогло в разгоне. Карта смогла работать на более высоких частотах, но стабильности на них добиться все равно не удавалось. Плюс ко всему мы еще заметили мизерное падение производительности в некоторых бечмарках (до 0,2%) при повышении предела Power Control даже на небольшом разгоне. В итоге мы все равно остановились на частоте 965 МГц, которая покорилась ядру даже при номинальном напряжении. Это тоже весьма хороший результат. Память разогналась до 1565 (6260) МГц. Стабильность в таком режиме была возможна лишь при повышенных оборотах турбины.


Младший Radeon HD 6950 оказался прохладнее и тише. В игровом режиме он не грелся выше 80 °С.


Даже в Furmark пиковая температура не превысила значения 87 °С.


С номинальных 800/5000 МГц данный экземпляр нам удалось разогнать до 860/5640 МГц. Результаты памяти объяснимы использованием других чипов, а вот от GPU мы ожидали больше.


Вспоминая результаты разгона старшей карты и одинаковый дизайн плат у обоих Radeon, пользователям пока остается лишь ждать утилит, которые позволят управлять напряжением. Power Control в данном случае на разгон вообще никак не влиял.Характеристики тестируемых видеокарт

Для сравнения с AMD Radeon HD 6970 и HD 6950 использовались карты AMD Radeon HD 5970, Force3D Radeon HD 5870, Zotac GeForce GTX 580 и Inno3D GeForce GTX 480, участвовавшие в недавнем тестировании решения на базе GF110 . Для сравнения их характеристики занесены в следующую таблицу:

Видеоадаптер Radeon HD6970 Radeon HD6950 Radeon HD5970 Radeon HD5870 GeForce GTX 580 GeForce GTX 480
Ядро Cayman XT Cayman Pro RV870 x2 (Hemlock) RV870 (Cypress) GF110 GF100
Количество транзисторов, млн. шт 2640 2640 2154 x2 2154 3000 3200
Техпроцесс, нм 40 40 40 40 40 40
Площадь ядра, кв. мм 389 389 334 x2 334 512 526
Количество потоковых процессоров 1536 1408 1600 x2 1600 512 480
Количество текстурных блоков 96 88 80 x2 80 64 60
Количество блоков рендеринга 32 32 32 x2 32 48 48
Частота ядра, МГц 880 800 725 850 772 701
Частота шейдерного домена, МГц 880 800 725 850 1544 1401
Шина памяти, бит 256 256 256 256 384 384
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Частота памяти, МГц 5500 5000 4000 4000 4008 3696
Объём памяти, МБ 2048 2048 1024 1024 1536 1536
Поддерживаемая версия DirectX 11 11 11 11 11 11
Интерфейс PCI-E 2.1 PCI-E 2.1 PCI-E 2.1 PCI-E 2.1 PCI-E 2.0 PCI-E 2.0
Заявленная максимальная потребляемая мощность, Вт (250) 190 (200) 140 294 188 244 250

Тестовый стенд

Конфигурация тестового стенда следующая:

  • процессор: Core i7-965 (3,2@3,95 ГГц, BCLK 172 МГц);
  • кулер: Thermalright Venomous X;
  • материнская плата: Gigabyte GA-X58A-UD3R (Intel X58 Express);
  • память: G.SKILL F3-12800CL8T-6GBRM (3x2GB, DDR3-1600@1720 МГц, 8-8-8-24-1T);
  • жесткий диск: Hitachi HDS721010CLA332 (1 ТБ, SATA2, 7200 об/мин);
  • блок питания: Seasonic SS-850HT (850 Вт);
  • операционная система: Windows 7 Ultimate x64;
  • драйверы видеокарты: NVIDIA GeForce 260.99, ATI Catalyst 10.11.
В операционной системе были отключены User Account Control, Superfetch, Windows Defender, файл подкачки и визуальные эффекты интерфейса.

Методика тестирования

Игры в нашем тестировании разбиты на три группы, в соответствии с поддерживаемой версией DirectX. Первыми идут приложения под девятую версию этого API, а последними игры под DirectX 11. Внутри каждой группы приложения расположены в соответствии с датой выхода, исключение — Metro 2033, эта самая требовательная игра, и результаты в ней мы традиционно выносим в самый конец статьи. Все тесты проводились в разрешении 1920x1200 на максимальных настройках качества, анизотропная фильтрация AF16x всегда включена. Сглаживание активировалось из меню игры, принудительное форсирование через драйверы не использовалось. Список игр и методикa тестирования более подробно описаны в обзоре GeForce GTX 580.

Результаты тестирования в приложениях под DirectX 9

Borderlands


Данная игра на базе Unreal Engine 3 благосклонно относится к видеоадаптерам NVIDIA. Radeon HD 6950 немного уступает Radeon HD 5870, а вот модель HD 6970 по минимальному fps даже обгоняет двухчиповую карту.

Mafia 2


Не более 12% разницы в производительности между картами Cayman. Старший Radeon HD 6970 на 8% обгоняет GeForce GTX 480.



Сразу бросается в глаза очень низкий результат Radeon HD 5970. Многочиповые конфигурации игрой не поддерживаются. Radeon HD 6950 уступает HD 5870 пару процентов, а вот его старший брат наступает на пятки GeForce GTX 580.

Результаты тестирования в приложениях под DirectX 10



Ничего неожиданного. Radeon HD 6950 отстает на пару процентов от Radeon HD 5870, а Radeon HD 6970 обходит GeForce GTX 480 на 9%.

Far Cry 2



Полное превосходство архитектуры Fermi. Видно и неплохое преимущество Cayman над Cypress, когда разогнанный Radeon HD 6970 почти настигает Radeon HD 5970.

Tom Clancy"s H.A.W.X. 2



Знакомая ситуация. Активное использование тесселяции ставит в тупик карты AMD, особенно старые решения на базе Cypress, даже Radeon HD 6950 оказывается быстрее Radeon HD 5870 на 27%.

Sid Meier"s Civilization 5



Необычные результаты обоих GeForce — при разгоне наблюдался не рост итогового результата, а его крошечное снижение примерно до 3000 баллов (эти данные грубо округлены). В номинале между ними мизерная разница. Но даже с таким мизерным падением результатов карты NVIDIA оставили позади всех одночиповых соперников AMD.

Новые одночиповые флагманы AMD по итогам нашего тестирования продемонстрировали превосходство над старым Radeon HD 5870, но никакого фурора не произвели. От новой серии все же ожидалось чего-то большего. Шлифовка архитектуры и исправление ошибок позволила чуть-чуть поднять производительность, остальное довершили более высокие частоты.

Производительность Radeon HD 6950 близка к Radeon HD 5870, кое-где новичок уступает пару процентов, кое-где выходит вперед с таким же крошечным отрывом. Основное преимущество заметно в играх, активно использующих тесселяцию (Lost Planet 2, H.A.W.X. 2). Неплохой отрыв от предшественника в Metro 2033 частично обусловлен и увеличенным объемом памяти — в остальных случаях второй гигабайт не востребован.

Radeon HD 6970 уже более интересный продукт, он однозначно обходит Radeon HD 5870. Хотя в некоторых играх под старые версии DirectX разница между ними не более 10%. Зато в DirectX 11 мы наблюдаем и тридцатипроцентный прирост. Этого все равно мало, чтобы составить сильную конкуренцию двухчиповому Radeon HD 5970 и флагману NVIDIA. Старший Cayman успешно соперничает лишь с GeForce GTX 480, хотя в DirectX 11 первое место почти всегда остается за старичком NVIDIA. Впрочем, никто и не метил в лидеры — новые графические карты призваны создать конкуренцию для свежеиспеченого GeForce GTX 570, а в качестве соперника для GeForce GTX 580 в арсенале компании имеется все тот же Radeon HD 5970.

Скорее Cayman является ничем иным как подготовкой к переходу на более тонкий техпроцесс, где новые графические процессоры смогут обзавестись большим числом вычислительных блоков с приемлемым уровнем энергопотребления. Сейчас, естественно, такого добиться невозможно. Это подтверждается почти одним и тем же числом потоковых процессоров и уровнем TDP, что и у Cypress. Скорее даже наоборот, Radeon HD 6970 своим горячим нравом напоминает GeForce GTX 480, хотя по шумовым характеристикам, к счастью, не отличается от остальных топовых видеоадаптеров. Главное преимущество новинок AMD — это цена. Стоимость их вполне привлекательна на фоне того же GeForce GTX 580. Для соперничества в топовом сегменте компании придется выпустить решение на базе двух Cayman. Но это уже другая история...

Оборудование для тестирования было предоставлено следующими компаниями:

  • 1-Инком — память G.SKILL F3-12800CL8T-6GBRM;
  • AMD — видеокарты Radeon HD 6970, Radeon HD 6950 и Radeon HD 5970;
  • Gigabyte — материнская плата Gigabyte GA-X58A-UD3R;
  • Inno3D — видеокарта Inno3D GTX 480;
  • PCShop — видеокарта Force3D HD5870-1GB (F5870P-G5-390-FS);
  • Syntex — блок питания Seasonic SS-850HT (S12D-850);
  • — жесткий диск WD3200AAKS;
  • Zotac — видеокарта GeForce GTX 580 (ZT-50101-10P).

Введение

Хотя в последнее время мы видели мало таких примеров, но когда-то добавление большего объёма памяти к GPU начального уровня, в качестве относительно доступного способа улучшить характеристики видеокарты, было распространённой практикой. Оказалось, что геймеры, не понимающие, что действительно делает одну карту быстрее другой, покупали, например, переоцененную GeForce 2 MX, потому что у нее было больше памяти, чем у стандартной GeForce 2 GTS, и в итоге оставались с более медленной моделью.

Конечно, все мы знаем, что Radeon HD 6950 далека от карт начального уровня. Наиболее вероятная причина того, что AMD Radeon HD 6950 первоначально выпускалась с 2 Гбайт оперативной памяти GDDR5, заключается в её происхождении, как карты Radeon HD 6970. Компания определила лучшую память для своей лучшей видеокарты и самый простой способ сделать вторую по мощности карту - это выпустить отдельную прошивку, чтобы отключить шейдерные ядра и понизить частоты. Так появилась Radeon HD 6950, использующая RAM более низкого скоростного класса.

Однако с момента запуска многое изменилось. Для начала Radeon HD 6970 была нацелена на конфигурации с тремя GPU, где очень высокие разрешения и детализация иногда могут использовать дополнительную память. Целевая аудитория более дешёвой HD 6950 – геймеры, желающие немного сэкономить. Более низкое тепловыделение позволяет производителям предлагать карты с более компактной системой охлаждения, что выливается в удобство установки и ещё меньшую стоимость.

Конфигурации с тремя картами и Radeon HD 6950 на 2 Гбайт никуда не делись, но если вы используете одну карту, то можно с уверенностью сказать, что в большинстве случаев вам будет нехватать мощности GPU, а не 1 Гбайта памяти. В результате Radeon HD 6950 1 Гбайт оказывается "золотой серединой" на рынке.

Пять компаний согласились с нами и прислали свои видеокарты для тестов.


Сравнительные характеристики двухслотовых видеокарт
Gigabyte GV-R695OC - 1GD 1 Гбайт HIS ICEQ X H695QN1G2M 1 Гбайт MSI R6950 PE OC 912-V246-047 Sapphire HD 6950 1 Гбайт GDDR5 PCIE XFX 800M HD-695X - ZDFC 1 Гбайт
Частота GPU 870 МГц 800 МГц 850 МГц 800 МГц 800 МГц
Частота DRAM GDDR5-5000 GDDR5-5000 GDDR5-5200 GDDR5-5000 GDDR5-5000
DVI 1 x Dual-Link
1 x Single-Link
1 x Dual-Link
1 x Single-Link
1 x Dual-Link
1 x Single-Link
1 x Dual-Link
1 x Single-Link
1 x Dual-Link
1 x Single-Link
Поддержка HDMI Полная Полная Полная Полная Полная
DisplayPort Полноразм. Два мини Два мини Полноразм. Два мини
VGA Через адаптер Через адаптер Через адаптер Через адаптер Через адаптер
Адаптеры Нет DVI-I to VGA DVI-I to VGA
Full DisplayPort
DVI-I to VGA Нет
Длина, см 28 24.6 27.4 26.1 24.3
Высота, см 11.9 12.1 11.6 11.9 11.6
Общая толщина, см 3.8 4 4 3.8 3.8
Толщина кулера, см 3.3 3.5 3.5 3.3 3.3
Вес, г 708 765 793 680 595
Версия PCB Custom 1.0 Custom V246 2.0 Custom Custom
VRM Восемь фаз Четыре фазы Шесть фаз Четыре фазы Четыре фазы
Гарантийный срок Три года Два года Три года Два года Пожизн. (через регистр.)
Дополнительно DiRT3 Certificate Dual BIOS DiRT3 Certificate

Gigabyte GV-R695OC-1GD

Короткое название не означает короткий список возможностей, зато покупателю проще запомнить его среди конкурентов. Это касается разогнанной видеокарты R695OC-1GD от Gigabyte.

Это единственная видеокарта в сегодняшнем обзоре, которая базируется на печатной плате Radeon HD 6970 от AMD, поэтому она самая длинная (27,4 см.). Зато на ней помещаются три вентилятора, но из-за передней панели её установочная глубина увеличивается до 28 см.

Сборщики производительных ПК обычно покупают корпуса с дополнительным пространством для установки комплектующих и у Gigabyte даже есть несколько собственных моделей. С другой стороны, пользователям, которые надеялись найти переключатель BIOS, как у предшествующих моделей на 2 Гбайта, придётся разочароваться, поскольку у этой карты второго поколения, нет такой возможности.

Хорошее охлаждение позволяет компании Gigabyte обогнать конкурентов по базовой частоте, которая составляет 870 МГц, что на 9% больше, чем в заявленных AMD характеристиках. Память осталась такой же - GDDR5-5000.

За небольшую переплату Gigabyte включила лучшую систему охлаждения и заводской разгон, также фирма добавила в комплект мост AMD CrossFire. Ещё присутствуют два адаптера питания "четырёхконтактный разъём - PCIe", но мы боимся, что многие сборщики будут использовать их для получения слишком большой мощности от старых БП, у которых отсутствуют дополнительные шины +12 В.

На видеокарты Gigabyte GV-R695OC-1GD распространяется стандартная трёхлетняя гарантия.

HIS IceQ XHD 6950 1 Гбайт

Вместо разгона, HIS H695QN1G2M концентрируется на низком уровне шума, хотя покупатели могут не обратить внимания на карту с одним вентилятором, когда у конкурентов их два, а то и три.

Длина карты всего 24,6 см., включая небольшой зазор от панели кулера. IceQ X HD 6950 подходит гораздо большему количеству корпусов, чем Radeon HD 6970 от Gigabyte. HIS использует другую печатную плату и добавляет два выхода DisplayPort.

Данную видеокарту компания HIS не разгоняла, но для тех, кто хочет получить небольшой прирост производительности можно воспользоваться утилитами.

В дополнение к хорошему охлаждению, HIS добавляет сертификат на DiRT3. Конечно, для поклонников автосимуляторов это станет приятным дополнением, но мы уверенны, что другие покупатели предпочли бы хотя бы один полноразмерный разъём DisplayPort, так как у карты есть два коннектора mini DisplayPort.

На H695QN1G2M распространяется двухлетняя гарантия. Это меньше, чем у конкурентов, но среди компаний, продающих только видеокарты, такой срок становиться всё более распространённым.

MSI R6950 Twin Frozr III 1GD5 Power Edition/OC

Мы немного сократили исключительно длинное название high-end карты от MSI на 1 Гбайт до R6950 PE OC. Хотя номер модели 912-V246-047 короче, он менее описателен и не используется большинством поставщиков продукции MSI.

С другой стороны, панель кулера с двумя вентиляторами практически такая же длинная, как и название карты. Она выступает на 3 см за грань печатной платы, длина которой составляет 24,3 см. В итоге общая длина платы составляет 27,3 см.

MSI делает два ключевых улучшения по сравнению с другими негабаритными конкурентами, предлагая два разъёма DisplayPort и два чипа BIOS. Это, по сути, единственная карта с двойным BIOS на укороченной плате, что позволяет оверклокерам восстановить BIOS одним щелчком переключателя.

MSI не блещет частотой GPU, но 850 МГц всё же существенное увеличение по сравнению со стандартными 800 МГц у AMD. Зато компания занимает первую позицию по разгону памяти со своей GDDR5-5200.

MSI не предлагает бесплатные игры, зато предоставляет переходник на полноразмерный DisplayPort с мини разъёма. Что лучше? Ответ зависит от того, насколько важны для вас бесплатные игры.

Ещё одна важная особенность – это стандартная трёхлетняя гарантия MSI, что на 50% дольше, чем у конкурентов, предлагающих бесплатные игры.

Sapphire HD 6950 1 GB GDDR5 PCIE

У Sapphire RadeonHD 6950 1Гбайт с двумя вентиляторами присутствуют неточности в описании. Во-первых, компания использует дизайн с двумя вентиляторами, прибавляя в конце названия пометку PCIe, хотя эта версия использует такой же слот расширения, как и версия с одним вентилятором. Во-вторых, в отличии от собрата с 2 Гбайтами, версия карты на 1 Гбайт, не содержит имени DiRT3 Edition в названии, хотя в комплекте игра присутствует.

Карта с двумя вентиляторами не имеет разъёмов мini DisplayPort и заменяет их одним полноразмерным разъёмом. Эта карта базируется на печатной плате длиной 23,1 см, что делает её единственной укороченной версией с одним портом для дисплея в сегодняшнем обзоре.

Ещё более уникально среди карт Radeon HD 6950 - наличие одного разъёма для моста CrossFire. Это единственная карта в нашем обзоре, у которой отсутствует второй разъём моста, необходимый для конфигурации CrossFire из трёх видеокарт.

Sapphire не разгонял Radeon HD 6950 1Гбайт, однако карта поддерживается утилитами для разгона. Кулер с двумя вентиляторами должен помочь оверклокерам, желающим выжать максимум из GPU.

Поменяв упаковку и модельный номер, Sapphire ещё больше ввел нас в заблуждение. Предыдущая модель (11188-09-40G) не продавалась в США и некоторых странах Европы. Между тем, у новой версии 100312-1GDP, доступной в США, отсутствует дополнительный кабель HDMI. К тому же на сайте производителя показана только старая версия.

Но купив любую из двух моделей вы получите ту же карту, ту же двухлетнюю гарантию и тот же сертификат DiRT3.

XFX HD-695X-ZDFC

XFX пользуется преимуществом укороченной платы Radeon HD 6950, по сути, производя короткую видеокарту, в которой полностью убран выступ кулера, наблюдающийся у большинства конкурентов. Несмотря на компактный дизайн карты, компании всё же удалось вместить кулер с двумя вентиляторами, два выхода DisplayPort и два разъёма для моста CrossFire.

Печатная плана идентична плате HIS, только цвет отличается. Но XFX всё же опережает соперника по свободному месту, полностью убирая выступ корпуса кулера.

Компания XFX не стала разгонять данную модель, что немного огорчает, учитывая наличие двух вентиляторов. Однако пользователям ничего не мешает использовать различные утилиты для разгона, чтобы получить побольше FPS.

В коробке HD-695X-ZDFC нас ждут два небольших разочарования: отсутствие игрового купона и переходника DisplayPort. Но обязательный мост CrossFire всё же присутствует.

Стандартная гарантия XFX длиться три года, но если пользователь ознакомиться с оглашением и зарегистрирует продукт в течении 30 дней, срок увеличивается до пожизненного.

Конфигурация и тесты

Тестовая конфигурация
CPU Intel Core i7-2600K (Sandy Bridge): LGA 1155, 3.40 ГГц, 8 Мбайт общего кэша L3
Разогнан до 4 ГГц на 1.25 В, 40x Turbo Boost, EIST/C1E включен
Материнская плата Asus P8P67 Deluxe, BIOS 1502 (03/02/2011): Intel P67 Express, LGA 1155
Память Kingston KHX1600C9D3K2/8GX: 8 Гбайт DDR3-1600 CAS 9-9-9-27
Сеть Integrated Gigabit Networking
Блок питания Seasonic X760 SS-760KM: ATX12V v2.3, EPS12V, 80 PLUS Gold
Жёсткий диск Samsung 470-й серии MZ5PA256HMDR, 256 Гбайт SSD
ПО и драйвера
Операционная система Microsoft Windows 7 Ultimate x64
Чипсет Intel INF 9.2.0.1019
Графический драйвер AMD Catalyst 11.8

Образец Radeon HD 6950 2 Гбайт от AMD представляет стандарт производительности для более дешёвых карт на 1 Гбайт. Эта карта задаёт тон во всех таблицах, оставаясь внизу, в то время, как остальные располагаются в порядке полученных результатов.

Для того, чтобы графические тесты были наиболее честными, требуется минимизировать узкие места в производительности остальной системы. Мы начали с разгона нашего процессора до 4,0 ГГц, а затем добавили быстрый SSD от Samsung.

Хотя старые игры часто страдают от задержек выше, чем CAS 9 на DDR3-1600, эти "узкие места" возникают только во время умеренных нагрузок на графическую часть. "Тяжелые" графические настройки в сегодняшнем сравнении переносят все "узкие места" на тестируемый GPU. Для базового уровня мы выбрали комплект двухканальной памяти Kingston 8 Гбайт DDR3-1600 CAS 9.

Блок питания Seasonic X760 попал в наш стандартный набор комплектующих благодаря своей превосходной эффективности, надежности и достаточному количеству проводов. Сегодня, его эффективность (80 PLUS Gold) помогает в более точной оценке энергопотребления системы.


Конфигурация тестов
3D Игры
Aliens vs. Predator AvP Benchmark Version

Тестовый сценарий 2: наивысшее качество, 4x AA
F1 2010 v1.01, Run with -benchmark example_benchmark.xml
Тестовый сценарий 1: ультра качество, без AA
Тестовый сценарий 2: ультра качество, 4x AA
H.A.W.X. 2 H.A.W.X. 2 Benchmark Version b_v1.04
Тестовый сценарий 1: наивысшее качество, Tesselation On, без AA
Тестовый сценарий 2: наивысшее качество, Tesselation On, 4x AA
Just Cause 2 Version 1.0.0.2, встроенный тест "Concrete Jungle"
Тестовый сценарий 1: очень высокое качество, без AA, 16x AF
Тестовый сценарий 2: очень высокое качество, 4x AA, 16x AF
Lost Planet 2 Lost Planet 2 Benchmark Version 1.0.0.0
Тестовый сценарий 1: наивысшее качество, без AA
Тестовый сценарий 2: наивысшее качество, 4x MSAA
Metro 2033 Полноценная игра, встроенный тест v1.02, "Frontline" Scene
Тестовый сценарий 1: DX11, Medium, AAA, 4x AF, без PhysX, без DoF
Тестовый сценарий 2: DX11, Medium, 4x AA, 16x AF, без PhysX, без DoF
Синтетические тесты
3DMark 11 Version: 1.0.1.0, только тест

Результаты тестов

Aliens vs. Predator

AvP сильно выигрывает от разгона на картах Gigabyte и MSI, даже при более низких разрешениях, где "узким местом" должен быть CPU.



Из-за отсутствия необходимости в большом объёме видеопамяти, образец на 2 Гбайта попал в самый низ таблицы вплоть до разрешения 2560x1600, даже при включённом 4xAA, где картинка уже начинает дёргаться.

F1 2010

Более разогнанный GPU у Gigabyte даёт немного больше FPS, чем более быстрая графическая память у MSI, но обе карты заметно обгоняют конкурентов.



Это уже вторая игра, где больший объём видеопамяти не даёт никаких преимуществ по производительности при наших самых высоких настройках. Хотя разогнанные карты работают немного лучше, в целом все модели показывают плавную картинку.

Это отличная новость для тех, кто хочет немного сэкономить. Как уже было отмечено ранее, GPU Cayman достигает своего потолка прежде, чем будет задействована вся память объёмом 1 Гбайт.

H.A.W.X. 2

Хотя мы уверены, что некоторые из наших читателей будут жаловаться на производительность без разгона, но лучшие показатели мы видим у разогнанных моделей при разрешении 1680x1050 в HAWX 2.



Даже в этой, "тяжелой" для видеокарт игре, образец с 2 Гбайт не смог показать значимость дополнительной видеопамяти.

Just Cause 2

Just Cause 2 также доказывает выгоду разгона, хотz и маленькую, но всё же заметную.



Опять же оказалось, что дополнительная память у нашего образца просто простаивает, когда один графический процессор Cayman работает на такой скорости.

Lost Planet 2

Lost Planet 2 показывает превосходство Gigabyte и MSI, хотя и другие видеокарты работают отлично.



Уже четвертая игра показывает бесполезность дополнительной видеопамяти нашего образца.

Metro 2033

Как и ожидалось, Metro 2033 показывает преимущества увеличения производительности от разгона, хотя включение сглаживания немного сокращает разрыв.



Одного взгляда достаточно, чтобы понять, где возникает "узкое место". Metro 2033 – единственная игра в нашем обзоре, которая выигрывает от дополнительной памяти. Игровой тест также показывает минимальную частоту кадров и большинство игроков увидят "плавную" игру при разрешении 2560x1600 при средней детализации и с выключенным сглаживанием (получается минимум 19 FPS).

Как и игровые тесты, 3DMark получает огромную выгоду от разогнанного GPU Gigabyte, в принципе, как и от увеличенной частоты памяти MSI.



Мы думали, что предустановка Extreme в 3DMark доведёт память видеокарт до предела, но этого не произошло. Даже учитывая, что у нашего образца Radeon HD 6950 вдвое больше RAM, она всё равно остаётся в самом низу таблицы.

Анализ общей производительности

Благодаря разгону, видеокарта от Gigabyte на 1 Гбайт обгоняет образец в среднем на 6%. Сразу за ней идёт MSI с 5,5% улучшением.

При разрешении 1920x1080 преимущество Gigabyte возрастает до 7%, а MSI до 6,5%.

При разрешении 2560x1600 производительность моделей от Gigabyte и MSI на 6% лучше, чем у конкурентов. Однако наш образец с 2 Гбайтами памяти сокращает этот разрыв при включении 4х АА, что в большей степени обусловлено плохой производительностью других карт в игре Metro 2033 при максимальных настройках качества.

Тепловыделение, шум и энергопотребление

Пониженное тепловыделение и шум являются целями компании HIS и она неплохо начала, являясь лучшей в своём классе. Повышенное энергопотребление Sapphire не обосновано и, возможно, относиться только к данной модели.

Кулер с тремя вентиляторами выводит модель от Gigabyte на первое место по охлаждению, с небольшим отрывом следует HIS. Преимущество IceQ X над конкурентами с двумя вентиляторами довольно заметное.

Значительное изменение температуры при стандартной и полной скорости у HIS отражается на показателях уровня шума. Пользователям, которые хотят тихую карту, подойдёт HIS IceQ X на стандартных настройках, а оверклокеры могут получить лучшее охлаждение при пониженном уровне шума.

Эффективность и производительность

У Gigabyte лучшая производительность, а у HIS меньшее энергопотребление и тепловыделение. Как это отобразиться на эффективности?

Настоящим лидером оказалась модель от MSI, занявшае второе место как по производительности, так и по энергопотреблению.

Более высокая цена видеокарты MSI Power Edition OC оправдывается экономией на счетах за электричество (по сравнению с Gigabyte).

Sapphire занимает второе место в общем сравнении, сразу за Gigabyte с ценой $240.

Какую же видеокарту Radeon HD 6950 1 Гбайт выбрать?

Gigabyte предоставляет лучшую производительность, HIS – самый низкий уровень шума и энергопотребления, а также лучшую эффективность. Так кто же победил?

Давайте рассмотрим несколько функций и дополнений. HIS и Sapphire со своими видеокартами предлагают бесплатную игру DiRT3. Однако, ко всему прочему, у H695QN1G2M есть два выхода DisplayPort, в отличии от моделей Gigabyte и Sapphire, хотя карта на $10 дороже. Sapphire подойдёт тем покупателям, кому нужна бесплатная игра, а HIS для тех, кто хочет и бесплатную игру и два разъёма DisplayPort.

Нельзя не отметить преимущество в производительности Gigabyte, особенно если учесть, что большинству людей не нужна пара разъёмов DisplayPort.

У награды "Рекомендованная покупка" может быть только один получатель. Однако с видеокартами Sapphire и Gigabyte за $240 у нас два потенциальных победителя. Решающим фактором мы выбрали небольшое преимущество в производительности у Gigabyte, а не бесплатную игру у Sapphire, так как знаем, что энтузиасты выбирают скорость.

Именно из-за этого различия между разными (но одинаковыми по важности) критериями оценки, мы предоставили награду "Одобрено THG" , которая может присуждаться заслуживающей внимания продукции, удовлетворяющей разные сегменты. Хотя мы протестировали все карты, две модели больше других заслуживают рекомендаций: Gigabyte R695OC-1GD и Sapphire HD 6950 1GB GDDR5 PCIE с двумя вентиляторами.


XFX заслуживает особого внимания за пожизненную гарантию. Мы, конечно, знаем, что большинство серьёзных геймеров меняют видеокарты через несколько лет, но тем, кто озабочен гарантийным сроком свыше трёх лет следует обратить внимание на XFX и, купив XFX HD-695X-ZDFC, не затягивать с регистрацией покупки.

AMD Radeon HD 6950/6970:

описание видеокарт и результаты синтетических тестов

Есть смысл еще раз напомнить, что карты требуют дополнительного питания, причем 6950 — двумя 6-контактными разъемами. А 6970 — 8-контактным и 6-контактным. Надеемся, что партнеры AMD будут вкладывать в комплект соответствующие переходники-разветвители питания.

О системе охлаждения.

AMD Radeon HD 6950/6970 2048 МБ 256-битной GDDR5, PCI-E

Стоит заметить, что CO очень схожа по принципу с той, что мы видели на GTX 580/570, и она также базируется на испарительной камере, которая заключена в медном узком отсеке, соприкасающемся с GPU. Над этой камерой выстроена конструкция из ребер охлаждения, через которые проходит воздух, гонимый цилиндрическим вентилятором на конце всего устройства. Правда, в отличие от GTX 580, в данном случае вся конструкция выполнена из меди, включая ребра радиатора, поэтому СО получилась весьма тяжелой.

Мы уже писали, что такое решение — более эффективно, нежели традиционно использовавшееся ранее на тепловых трубках. Внутри испарительной камеры особая жидкость, которая моментально передает тепло от нижней пластины к верхней.

Особо стоит также отметить, что СО настроена на незначительные реагирования при нагреве, чтобы обеспечить почти бесшумную работу. Поэтому нагрев ядра может даже превышать то, что мы видели в случае с 5870.

Мы провели исследование температурного режима с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

AMD Radeon HD 6970 2048 МБ 256-битной GDDR5, PCI-E

AMD Radeon HD 6950 2048 МБ 256-битной GDDR5, PCI-E

Результаты исследования показали, что, несмотря на все вышесказанное, СО реально эффективна, и даже при частоте вращения 40% от максимума нагрев равен 92 градуса у 6970, а у 6950 — 84. Это после 6-часового постоянного тестирования под нагрузкой в 3D. Да, кому-то 92 градуса покажутся чрезмерно высокими, однако для акселераторов уровня Hi-End это приемлемо.

Максимальное энергопотребление карт под нагрузкой — 250—260 Вт для 6970 и чуть выше 205 Вт для 6950. Мы специально не приводим всяких графиков потребления, чтобы не усложнять прочтение материала. Читателей ведь всегда интересует — сколько оно потребляет в максимуме, чтобы подобрать нужный БП, а детали уже мало кому интересны.

Комплектация. Учитывая, что референс-образцы никогда не имеют комплектации, мы этот вопрос опустим.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе CPU Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900 Вт.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 10.11; Nvidia версии 263.09 / 260.99.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org .
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка .
  • RightMark3D 2.0 с кратким описанием: под Vista без SP1 , под Vista c SP1 .

За неимением собственных синтетических тестов DirectX 11 мы ещё раз воспользовались примерами из пакетов SDK Microsoft и AMD и демонстрационной программой Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) .

Также мы взяли приложения обоих производителей: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain , также известная как Island11 (автор — Тимофей Чеблоков, очень известный специалист в 3D-графике).

Синтетические тесты проводились на следующих видеокартах:

  • Radeon HD 6970 HD 6970 )
  • Radeon HD 6950 со стандартными параметрами (далее HD 6950 )
  • Radeon HD 6870 со стандартными параметрами (далее HD 6870 )
  • Radeon HD 5870 со стандартными параметрами (далее HD 5870 )
  • Geforce GTX 580 со стандартными параметрами (далее GTX 580 )
  • Geforce GTX 570 со стандартными параметрами (далее GTX 570 )

Для сравнения результатов новых моделей видеокарт серии Radeon HD 6900 были выбраны эти модели, потому что Radeon HD 5870 — предыдущее одночиповое решение компании для топового ценового диапазона, сильнейшее до выхода новых моделей; Radeon HD 6870 — текущее решение компании AMD, стоящее на ступеньку ниже топовых и основанное на недавно вышедшем видеочипе Barts.

А именно эти решения Nvidia были взяты потому, что Geforce GTX 580 — быстрейшая одночиповая модель компании, основанная на свежем GPU. Хотя она не является конкурентом представленных видеокарт по цене, её результаты интересны как некая максимальная для решений Nvidia планка. Ну а GTX 570 взята как прямой конкурент для старшей модели новой серии — HD 6970.

Direct3D 9: тесты Pixel Filling

В этом тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

В данном тесте фильтрации 32-битных (8 бит на цвет) текстур большинство видеокарт показывают цифры, далёкие от теоретически возможных. Вот и результаты нашей текстурной синтетики в случае видеоплат серии HD 6900 не дотягивают до пиковых значений. Далее мы рассмотрим скорость текстурирования ещё раз, в тесте из пакета 3DMark Vantage, где получаются более реалистичные цифры.

А тут получается, что HD 6970 выбирает лишь 67 текселей за один такт из 32-битных текстур при билинейной фильтрации, что почти на треть ниже теоретической цифры в 96 отфильтрованных текселей. Для HD 6950 эти цифры соответствуют 62 текселям из 88 теоретических, то есть эффективность младшей модели получилась чуть выше, и это связано с небольшой разницей по пропускной способности видеопамяти, также влияющей на результаты.

Неудивительно, что все карты AMD показывают такую высокую производительность и значительно опережают своих соперников из стана компании Nvidia. У них ведь и теоретические показатели скорости текстурирования весьма высоки. А вот даже топовая GTX 580 имеет лишь 64 TMU и сильно уступает моделям на Cayman, имеющим 88—96 TMU, да ещё и работающих на более высоких частотах.

Весьма любопытной получилась разница между HD 6950 и HD 5870 в разных условиях. Если в случаях с большим количеством текстур, где больше всего сказывается именно количество TMU и их частота, они идут наравне, то при меньшем количестве текстур на пиксель вперёд выходит модель HD 5870. Причём разницу нельзя списать только на ПСП, и вероятно тут сказываются и различные оптимизации в драйверах.

Рассмотрим эти же результаты в тесте филлрейта:

Эти цифры показывают скорость заполнения, и в них мы видим всё то же самое, разве что с учетом количества записанных в буфер кадра пикселей. Максимальный результат остаётся за новыми топовыми решениями семейства Radeon HD 6900, имеющими просто огромное количество TMU и более эффективными в нашем синтетическом тесте. Удивительно, но в случаях с 0—4 накладываемыми текстурами младшая из рассматриваемых сегодня видеокарт почему-то сильно уступает предыдущему топовому решению AMD, хотя в сложных условиях практически не отстаёт от него.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Тесты очень просты для современных GPU и сильно упираются в производительность текстурирования. Поэтому они показывают далеко не все возможности современных видеочипов, но всё же интересны для оценки баланса между текстурными выборками и математическими вычислениями. В данном случае особых отличий между HD 5870 и HD 6950 нет, результаты этих моделей сопоставимы. Хотя один тест выделился — пиксельный шейдер освещения тремя источниками по Фонгу явно зависит от математической производительности GPU, и поэтому уровня HD 5870 в нём достигла только старшая модель — HD 6970.

Производительность в других тестах ограничена по большей части скоростью текстурных модулей и филлрейтом, но с учётом эффективности блоков и кэширования данных. Новые модели серии Radeon HD 6900 несколько быстрее предшествующих: HD 6970 быстрее HD 5870, а HD 6950 быстрее HD 6870 (из другого ценового диапазона). И почти все они опережают обе топовые модели Geforce — даже GTX 580 в этих тестах показывает результат лишь на уровне HD 6870, и в этом явно виноват недостаток скорости текстурирования.

Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

И в этот раз получилось примерно то же самое, снова GTX 580 конкурирует скорее с HD 6870, чем с реальными топовыми моделями AMD. Тест Cook-Torrance более интенсивен вычислительно, и разница в нём примерно соответствует разнице в количестве ALU и их частоте. Именно поэтому данный тест лучше подходит для архитектуры AMD, чипы которой имеют большее количество математических блоков.

И тут нашлись два интересных момента. Во-первых, HD 5870 обгоняет даже HD 6970, что сложно объяснить одними лишь теоретическими характеристиками. Разница по пиковой математической производительности между этими моделями почти отсутствует, но есть и архитектурные отличия. Похоже, что именно разная эффективность исполнения этого шейдера на тех самых VLIW5- и VLIW4-процессорах и привела к такой разнице не в пользу нового чипа Cayman. Поэтому и HD 6950 в этом тесте выступила лишь на уровне HD 6870, а также GTX 580.

Во втором, сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и видеокарты в нём располагаются по скорости текстурирования, с поправкой на разную эффективность использования TMU.

Вот в этом тесте у новых решений всё прекрасно, HD 6950 обеспечивает результат на уровне HD 5870, а HD 6970 лидирует с хорошим отрывом, почти соответствующим 25-процентной разнице в теоретической скорости текстурирования. Понятно, что видеокартам производства Nvidia здесь ловить нечего, и они показывают результат на уровне заметно более дешёвой модели конкурента.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье .
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU, и от скорости текстурирования, в них важен общий баланс чипа. Производительность новых видеокарт AMD в тесте «Frozen Glass» весьма хороша, HD 6970 снова оказалась заметно быстрее, чем HD 5870, а HD 6950 почти догнала её. Увы для Nvidia, но из-за слабого текстурирования решения компании AMD снова оказались заметно быстрее.

Вот во втором тесте «Parallax Mapping» решения Nvidia чувствуют себя уже немногим лучше, и HD 6870 с HD 6950 близки к результатам карты GTX 580 из другого рыночного сегмента, стоящей дороже. Интересно, что HD 5870 снова оказалась быстрее, чем HD 6970. Это подтверждает нашу теорию о том, что скорость в тесте ограничена математической производительностью и что тест чуть хуже подходит новой архитектуре компании AMD.

Есть ещё одно вероятное объяснение — синтетические тесты зачастую очень сильно грузят GPU параллельными расчётами и энергопотребление новых моделей в синтетике вполне может выходить за рамки выставленного ограничения. Следовательно, может снижаться и тактовая частота, а вместе с ней и результаты оказываются ниже, чем ожидалось. Впрочем, это предположение нужно проверять. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Для решений Nvidia ситуация стала заметно печальнее, так как со скоростью текстурирования у последних чипов AMD, в отличие от конкурентов, всё очень хорошо, поэтому они лишь наращивают своё и без того неоспоримое преимущество. Даже самый-самый GTX 580 уступает тому же HD 6870 в обоих тестах с упором на текстурирование. Ну а наши новые герои из семейства HD 6900 оказались быстрейшими, HD 6950 даже выиграл у HD 5870, пусть и сущие копейки. А HD 6970 снова стал лидером, что вполне объяснимо теоретически, если посмотреть на производительность блоков TMU.

Всё это были устаревшие задачи, в основном с упором в текстурирование, а реже в филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны, и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D-графики .
  • Fur — процедурный шейдер, визуализирующий мех.

В наших самых сложных DX9-тестах видеокарты производства Nvidia всегда выступают сильнее решений AMD, в противоположность всем предыдущим испытаниям. Такое положение связано с тем, что эти тесты не ограничены производительностью текстурных выборок, а зависят скорее от эффективности исполнения кода пиксельных шейдеров.

В тестах сложных пиксельных шейдеров версии 3.0 новые топовые видеокарты AMD всё же не смогли догнать конкурентов, хотя и заметно приблизились к ним. Скорость в обоих тестах PS 3.0 слабо зависит от ПСП и текстурирования, зато код отличается сложностью, с чем очень неплохо справляется новая архитектура Nvidia и… новая архитектура AMD. Пожалуй, это первый тест, где мы видим заметную положительную разницу между предыдущей и новейшей архитектурами компании AMD.

И последняя справляется с задачей явно лучше. Хотя даже HD 6970 с трудом конкурирует с GTX 570, но ведь о таком раньше мы вообще не помышляли. Решения Nvidia всегда были неоспоримыми лидерами в этой паре тестовых задач, и традиционно показывали результат намного сильнее. А видеокарты на новом графическом чипе Cayman смогли к ним приблизиться вплотную.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, но в разных условиях по-разному. Результаты при детализации уровня «High» получаются примерно в полтора раза ниже, чем при «Low», как и должно быть по теории. В D3D10-тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia раньше были заметно сильнее, но последние решения AMD к ним подтянулись, что мы видели уже и ранее.

В варианте без суперсэмплинга большее влияние на производительность оказывает эффективный филлрейт (производительность ROP) и пропускная способность памяти. Поэтому решения Nvidia оказались впереди, и только представленный сегодня топовый Radeon HD 6970 почти догоняет младшую GTX 570. Модель ниже уровнем под именем HD 6950 показывает результат на уровне HD 5870, но примерно того же результата добилась и HD 6870. Это и неудивительно, потому что филлрейт у неё даже больше, чем у старших решений серии HD 6900.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Как всегда, включение суперсэмплинга увеличивает теоретическую нагрузку в четыре раза, и результаты решений Nvidia заметно падают по сравнению с показателями видеокарт AMD. Теперь тройка моделей с близкими результатами (HD 6870, HD 5870 и HD 6950) опережает GTX 570, а старшее решение HD 6970 с успехом конкурирует с GTX 580. Разница между топовыми картами линеек HD 6000 и HD 5000 осталась примерно той же, новая модель выигрывает несколько процентов у предыдущей.

Второй шейдерный DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например в играх Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Диаграмма во многом похожа на предыдущую (без SSAA), только позиции Nvidia несколько ослабли. В обновленном D3D10-варианте теста без суперсэмплинга HD 6970 становится на один уровень с GTX 570, что нормально для прямых конкурентов, а лидером остаётся топовая GTX 580. Остальные три видеокарты производства AMD показывают схожие результаты и отстают. Посмотрим, что изменит включение суперсэмплинга, он может вызвать сильное падение скорости на платах Nvidia.

При включении суперсэмплинга и самозатенения задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается, как и в предыдущем случае — карты производства AMD немного улучшили свои показатели относительно решений Nvidia.

Теперь HD 6970 показывает результаты на уровне GTX 580, а примерно равные по скорости HD 6950 и HD 5870 становятся на одну ступеньку с GTX 570. И лишь более дешёвая HD 6870 немного отстаёт от этой видеокарты Nvidia. Сравнительные цифры в парах HD 6970 и HD 5870 снова повторились, разница в пользу более свежих моделей примерно такая же. По этим тестам можно сделать вывод — обе выпущенные сегодня карты семейства HD 6900 справились с «шейдерными» задачами очень хорошо, на уровне традиционно сильных в этих задачах конкурентов Nvidia.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов привычно соответствуют разнице в частотах и количестве исполнительных блоков, но с влиянием их эффективности. Современная архитектура AMD в таких случаях имеет большое преимущество перед конкурирующими видеокартами Nvidia, и это объясняет результаты тестов, в которых решения AMD явно оказываются значительно более производительными, хотя и не настолько, насколько велико их теоретическое преимущество.

Теоретически, GTX 580 должен быть чуть ли не вдвое медленнее HD 5870 и HD 6970. На практике же разница не доходит и до полутора раз. Конечно, это мало что меняет, ведь даже HD 6870 значительно быстрее обеих карт Nvidia в таких тестах, не говоря уже про топовые модели. В остальном, решения расположились примерно соответственно теории, за некоторыми исключениями.

К примеру, результаты сравнения нового и старого топовых семейств видеокарт AMD получились любопытными. Во-первых, HD 6870 показала идентичный HD 6950 результат в этом тесте при разнице в теоретических цифрах в пользу модели на базе Cayman. Во-вторых, то же самое можно сказать и про связку HD 6970 и HD 5870 — при схожих теоретических цифрах, в реальности с небольшим перевесом побеждает более старая, с потоковыми процессорами на основе архитектуры VLIW5.

И здесь снова есть несколько возможных объяснений — или AMD ещё не полностью оптимизировала драйверы для новых GPU, или архитектура Cayman менее эффективна в этом тесте (при этом вполне возможно, что она будет более эффективной в менее прямолинейных тестах), или повлияла технология PowerTune, или в этом тесте начало сказываться и ограничение пропускной способностью видеопамяти.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

В этот раз все GPU остались примерно на тех же позициях, кроме относительной производительности Cayman и Cypress/Barts. Теперь в этих парах уже всё в строгом соответствии с теоретическими цифрами пиковой производительности, а HD 6970 даже немного обгоняет HD 5870, то есть в этом случае новая архитектура сработала эффективнее. И в паре HD 6950 и HD 6870 теперь такая разница в пользу топового решения, какая и должна быть.

В остальном — ничего нового. Так как скорость рендеринга тут ограничена исключительно производительностью шейдерных блоков, то HD 6970 и HD 5870 являются лидерами, за ними следуют остальные видеокарты AMD, а обе Geforce уступают в том числе и младшей модели из другого ценового диапазона. Хотя преимущество решений AMD всё равно остаётся несколько ниже, чем при сравнении теоретических цифр — это говорит о том, что КПД суперскалярных процессоров VLIW5 и VLIW4 ниже 100%.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не особенно сложная, производительность в целом ограничена не только скоростью обработки геометрии, но и пропускной способностью памяти или филлрейтом в определённой мере (в рамках одного производителя).

Увы, хотя мы видели ранее рост геометрической производительности решений на Barts в этом тесте, в этот раз видеокарты нового семейства оказались примерно на том же уровне, что и Radeon HD 5870 предыдущего поколения. Возможно, виновато ограничение производительности ПСП видеопамяти, но ведь HD 6870 весьма силён в этом тесте и обогнал даже HD 6950. Так что скорее всего виноват эффективный филлрейт, то есть производительность ROP.

В любом случае, всем решениям AMD очень далеко до топовых видеокарт Nvidia, и хотя выполнение геометрических шейдеров может и стало более эффективным, но этого явно недостаточно. Основанные на GF110 видеокарты Nvidia справляются с работой почти вдвое быстрее всех видеокарт конкурента. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры почти не изменились ни для решений Nvidia, ни для AMD. Новые видеокарты семейства HD 6900 в данном тесте слабо реагируют на изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, как и остальные решения, но всё же показывают результаты чуть выше, чем на предыдущей диаграмме. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — ещё и для их отрисовки. То есть в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней.

В этом тесте скорость рендеринга должна быть ограничена геометрической производительностью, но обрабатываемых примитивов явно недостаточно, чтобы новая архитектура компании AMD показала значительно более высокий результат, хотя и есть небольшая разница, которая объясняется архитектурными изменениями в GPU.

Видеокарты Nvidia всё так же остаются лидерами теста, но тот же Radeon HD 6970 уже почти догнал младшую модель GTX 570. А HD 6950 обгоняет HD 5870, пусть и не слишком сильно. И эти неплохие результаты явственно говорят о наличии оптимизаций по обработке геометрических данных в новых чипах.

Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

А вот в этом тесте разница между чипами AMD с традиционным графическим конвейером (в т. ч. и Cayman с его двумя растеризаторами) и чипами с архитектурой Fermi заметна сразу. Хотя мы знаем по предыдущим исследованиям, что младшие чипы Nvidia по скорости исполнения геометрических шейдеров отстают, показывая не такие впечатляющие результаты, так как их возможности по геометрической обработке урезаны. Зато результаты GTX 570 и GTX 580, имеющих в основе чип GF110, очень хороши и почти вдвое выше, чем у лучшего из решений компании AMD.

И это решение — новенький Radeon HD 6970. Возможности нового топового чипа по обработке геометрии и скорости исполнения геометрических шейдеров явно выросли по сравнению с другими видеокартами компании. И новые решения на Cayman показывают в этих тестах результаты выше, чем решения на базе Cypress и Barts, хотя и далеко не втрое, и даже не вдвое. Вероятно, инженерам AMD ещё предстоит решать задачу распараллеливания работы блоков установки треугольников (geometry setup), в которую могут упираться эти тесты.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. Это хорошо видно по сравнительным результатам Radeon HD 5870 и HD 6950, да и прочих решений AMD. Похоже, что именно ПСП и ограничивает их производительность в тесте, поэтому и разница между всеми решениями не так уж велика.

Тем не менее, очень хорошие результаты показывает HD 6970 на новом GPU — он почти достаёт GTX 570, с которым и придётся конкурировать этой модели в реальном мире. Ну и лидером остаётся самая дорогая и производительная GTX 580. Обе карты семейства HD 6900 показали себя неплохо, младшая новая модель идёт почти наравне с предыдущей топовой. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме заметно изменилось, особенно в тяжёлом режиме. Хотя видеокарты Nvidia почему-то потеряли в производительности именно в наиболее лёгких условиях. Как раз при малом количестве полигонов скорость упирается в ПСП и в этом случае новые платы AMD почти догнали топовые решения конкурента.

А вот в тяжёлых режимах разница в пользу Nvidia выросла до полуторакратной, там GTX 580 и GTX 570 остаются недосягаемыми для соперников. Старшая видеокарта семейства HD 6900 обгоняет остальные решения AMD, хотя это снова слабо заметно при сравнении с HD 5870. Можно было бы сказать о влиянии ПСП, но ведь конкурента-то это не останавливает…

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Любопытно, что результаты во втором тесте вершинного текстурирования «Waves» совсем не похожи на то, что мы видели на предыдущих диаграммах. В этом тесте все видеокарты AMD и Nvidia показывают очень близкие результаты, что также можно списать на ограничение пропускной способностью видеопамяти. Этот показатель у всех представленных видеокарт находится в районе 130—190 ГБ/с, и разброс невелик. Лучшей среди видеокарт AMD снова стала свежая модель Radeon HD 6970. Рассмотрим второй вариант этого же теста:

И снова произошли изменения, аналогичные тем, что мы видели ранее — видеокарты Nvidia «просели» только в лёгком режиме, а AMD во всех трёх. И поэтому в режиме с малым количеством полигонов разница между решениями небольшая, а вот в среднем и тяжёлом GTX 580 и GTX 570 заметно опережают все модели Radeon, в том числе и из анонсированного сегодня семейства HD 6900. По сравнению с Cypress новый GPU показывает результат примерно на том же уровне, и мы делаем вывод, что в тестах вершинных выборок никаких заметных изменений при переходе от Cypress к Cayman нет.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage могут показать нам что-то, что мы ранее упустили. Тесты Feature этого тестового пакета обладают поддержкой DirectX 10 и интересны уже тем, что отличаются от наших. При анализе результатов новых видеокарт в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark. К сожалению, ещё более новый тестовый пакет компании — 3DMark11 — не содержит специализированных синтетических тестов и нам в данном случае совсем неинтересен.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Хотя текстурный тест компании Futuremark также не показывает теоретически возможного уровня скорости текстурных выборок, но всё же эффективность новых видеокарт семейства Radeon HD 6900 в нём несколько выше, чем в нашем. Да и решения Nvidia также более эффективно используют имеющиеся текстурные блоки. Поэтому в данном текстурном тесте получается несколько иное соотношение результатов по сравнению с нашим.

Видеокарты нового семейства компании AMD показывают результаты, полностью соответствующие теоретическим параметрам. HD 6950 немного быстрее, чем HD 5870, а модель HD 6970 является явным лидером теста. Наглядно видно, что текстурная производительность Cayman заметно выросла по сравнению с Cypress. А вот HD 6870 на основе чипа Barts показывает худший результат, аналогичный цифрам топовой видеокарты Nvidia. Ну а GTX 570 проигрывает в текстурировании вообще всем, как и в нашем тесте.

Feature Test 2: Color Fill

Это тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Совсем иная ситуация в тесте производительности блоков ROP. Цифры этого подтеста 3DMark Vantage показывают производительность блоков ROP, почти без влияния величины пропускной способности видеопамяти. Модель HD 6970 показывает отличный результат, почти догоняя топовую GTX 580 и опережая своего конкурента GTX 570.

В свою очередь, HD 6950 также оказывается не только впереди своего конкурента GTX 570, а обогнала ещё и предшественницу — HD 5870. Отмечаем несколько бо́льшую эффективность блоков ROP и более высокую скорость заполнения у новых моделей видеокарт компании AMD по сравнению со старыми чипами.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Этот тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. И для достижения высокой скорости важен баланс блоков GPU. Влияет на скорость и эффективность выполнения ветвлений в шейдерах.

Сравнительные результаты видеокарт AMD на диаграмме весьма похожи на то, что мы видели в тесте текстурной производительности из 3DMark Vantage. А вот платы Nvidia в данном случае получили небольшое увеличение производительности, что говорит о том, что не только текстурная производительность влияет на результаты теста.

Новые модели AMD вновь серьёзно заявили о себе, обогнав свою предшественницу в лице HD 5870. А вот HD 6870 из другого ценового сектора показала заметно более слабый результат, став аутсайдером этого теста (что вполне сглаживается её низкой ценой). Что касается сравнения Cayman с конкурирующими решениями Nvidia, то обе новые видеокарты семейства HD 6900 опередили даже топовую модель линейки Geforce GTX 500.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте зависит от многих параметров, но основными являются производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Логично, что видеокарты производства Nvidia чувствуют себя в этом приложении как рыба в воде, и значительно опережают конкурентов, в том числе и представленные сегодня топовые модели.

Это один из немногих тестов без тесселяции, в которых видно преимущество у представленных недавно видеокарт новой серии Radeon HD 6800 и сегодняшних героев HD 6900. Скорость рендеринга всех этих моделей в данном тесте выше, чем у топовой модели предыдущей линейки. Это объясняется тем, что и в Barts, и в Cayman увеличили скорость обработки геометрии и выполнения геометрических шейдеров. И хотя даже HD 6970 продолжает серьёзно отставать от GTX 570, новая модель всё же значительно улучшила позиции компании AMD в этом тесте.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты очередного теста из пакета 3DMark Vantage похожи на те, что мы видели на предыдущей диаграмме, но в нём скорость обработки геометрии ещё важнее. Именно поэтому прошлое поколение в виде карты Radeon HD 5870 отстало как от обеих моделей Geforce, являющихся неоспоримыми лидерами сравнения, так и от всех новых моделей видеокарт AMD, семейств HD 6900 и HD 6800. А все платы, основанные на Cayman и Barts, показали более высокие результаты, чем единственное решение на Cypress, уступив только сильным конкурентам.

Похоже, что в синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, снова нет значительного влияния распараллеленной обработки геометрии на Cayman, так как Barts показал близкий результат. Поэтому и оба решения линейки HD 6900 продолжают отставать от конкурирующих видеокарт соперника, имеющих отличную скорость обработки геометрии — до двух раз выше. От топового решения компании AMD, основанного на новой архитектуре с двумя блоками обработки геометрии, мы всё же ожидали несколько большего прогресса.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует очень много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы увидели ещё более интересную картину, чем в аналогичных тестах из нашего тестового пакета. Показанная на диаграмме производительность решений лишь примерно соответствует тому, что должно получаться по теории и несколько расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Даже по теоретическим характеристикам новых моделей HD 6970 и HD 6950 было понятно, что они не усилили пиковую производительность математических вычислений по сравнению с HD 5870. Но всё же и явного отставания мы не ждали. Да, своих конкурентов из Nvidia обе платы обогнали с огромным запасом, но мы к этому привыкли, ведь видеокарты Geforce показывают не очень высокие результаты в таких случаях; простая и интенсивная математика выполняется на Radeon значительно быстрее.

Неожиданно то, что новая старшая модель проиграла 7% предыдущей топовой, хотя теоретически должна уступать не более 1%. Тут снова можно начинать гадать о том, что послужило причиной этого проигрыша своему же предшественнику. То ли в этом виноват недостаток оптимизации драйверов для новых решений, то ли меньшая эффективность архитектуры VLIW4 в таких тестах, то ли слишком умная система управления питанием на новых моделях, «зарезавшая» тактовую частоту и производительность решений при достижении установленного порога энергопотребления.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новые решения компании AMD в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Возможно, пример для вычислительных шейдеров не самый удачный, но их пока вообще мало. Все видеокарты показывают близкие результаты в этом тесте, но побеждает всё-таки топовая модель Geforce GTX 580. Анонсированные сегодня платы на новом чипе Cayman уступают ей совсем немного, и только при использовании пиксельного шейдера. Прямой конкурент новых решений компании AMD — видеокарта GTX 570 — отстаёт от них в обоих режимах: и с использованием пиксельного, и с использованием вычислительного шейдеров.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

А вот более интересные результаты, для решений AMD чем-то похожие на цифры из математического теста 3DMark Vantage. Несмотря на большое теоретическое превосходство в пиковых цифрах, быстрейшая видеокарта Radeon HD 5870 лишь немного опережает лучшее решение Nvidia. А обе новые модели семейства HD 6900 показывают результаты, близкие к показателям своего прямого конкурента — Geforce GTX 570.

Но нас сегодня больше интересует разница между результатами решений на Cayman и Cypress, и тут мы снова видим, как побеждает старая видеокарта, да с каким преимуществом! 17% между HD 5870 и HD 6970 в пользу первой — в очередной раз математические тесты обнажают разницу между красивой теорией и жестокой практикой. Ну где же те применения, в которых новый GPU сможет показать свою силу? Возможно, в тестах тесселяции всё встанет наконец на свои места.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но главным нововведением в Direct3D 11 всё же считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V и других. В некоторых из них тесселяция используется для моделей персонажей (все игры жанра FPS из перечисленных), в других — для имитации реалистичной водной поверхности (DiRT 2) или ландшафта (Civilization V).

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. Он показывает не только тесселяцию, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

Рассмотрим сначала попиксельные техники. Parallax occlusion mapping (средние столбики на диаграмме) на видеокартах обоих производителей выполняется гораздо менее эффективно, чем тесселяция (нижние столбики), а умеренная тесселяция не даёт большого падения производительности — сравните верхние и нижние столбцы. То есть качественная имитация геометрии при помощи пиксельных расчётов обеспечивает даже меньшую производительность, чем оттесселированная геометрия с displacement mapping.

Что касается производительности видеокарт относительно друг друга, то тут самый важный вывод в том, что видеокарты AMD немного быстрее плат Nvidia в самом лёгком режиме, но медленнее в сложных попиксельных расчётах (вспоминаем тесты parallax mapping ранее). А до выхода плат на Cayman карты Geforce были чуть-чуть быстрее решений AMD и при включенной тесселяции.

Но теперь разница по скорости обработки геометрии между HD 6900 и HD 5870 хорошо видна — новые платы на базе Cayman в подтесте с тесселяцией оказались заметно быстрее Cypress. В этом тесте с небольшим коэффициентом разбиения треугольников HD 6970 даже обогнала своего конкурента GTX 570 с хорошим запасом.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

Лишь в этом примере мы впервые видим по-настоящему полное сравнение геометрической мощи решений AMD и Nvidia. Очень сильно выделяется как графическая архитектура Fermi, так и новый GPU производства AMD под именем Cayman. Отбросим в сторону то, что это чисто синтетический тест и такие экстремальные коэффициенты разбиения не будут использоваться в играх сегодняшнего дня, нам сейчас интересен потенциал. Синтетика ведь и нужна для того, чтобы оценить перспективность и отличия разных решений.

Сразу видно, что с видеокартами Nvidia Geforce на чипе GF110 конкурировать невозможно, в задачах экстремальной тесселяции они в разы быстрее даже обновленной архитектуры AMD. Но это архитектура, специально разработанная изначально с учётом возможностей нового API. А что же с Cayman? По сравнению с Cypress всё очень хорошо!

Новые модели компании AMD в режимах средней нагрузки показывают впечатляющий прирост в скорости, и разница по сравнению с HD 5870 достигает более чем двукратной. Однако такой прирост мы видим не всегда, а чаще всего он укладывается в полуторакратный. Обещанной трёхкратной разницы мы, по крайней мере, точно не увидели. То есть, Cayman хотя и сократил отставание от конкурента в задачах обработки геометрии, но до распараллеленной работы 16 блоков тесселяции в GF110 всё ещё очень далеко.

С другой стороны — наибольшая разница между решениями разных компаний достигается в условиях экстремальной тесселяции, которых нет и пока что не ожидается в реальных играх. Поэтому скорее всего Cayman заметно укрепит позиции компании AMD в существующих игровых бенчмарках с применением тесселяции. Особенно если коэффициент разбиения будет не слишком большим, как в тестах 3DMark11.

Давайте рассмотрим ещё один тест — демонстрационную программу Nvidia Realistic Water Terrain, также известную как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта. Смотрится она просто замечательно, вот чего не хватает в нынешних играх:

Island не является чисто синтетическим тестом для измерения геометрической производительности, он содержит и сложные пиксельные и вычислительные шейдеры, поэтому разница в производительности может быть меньше, чем в предыдущем случае, зато такая нагрузка ближе к реальным играм, в которых используются сразу все блоки GPU.

Мы протестировали программу при четырёх разных коэффициентах тесселяции, эта настройка называется Dynamic Tessellation LOD. Если при самом низком коэффициенте разбиения впереди оказываются видеокарты компании AMD, то при усложнении работы платы на основе GF110 сразу вырываются далеко вперёд. При росте коэффициента разбиения и сложности сцены производительность всех Radeon падает очень сильно, в отличие от скорости конкурирующих решений.

Причём в этот раз HD 5870 почему-то даже опережает обе модели нового семейства. То есть налицо обратная теории разница в задаче со сложной геометрией. И объяснение этому может быть только одно — недостаток оптимизации драйверов для новой архитектуры, ведь в предыдущих тестах мы видели её явное преимущество над Radeon HD 5870, основанном на чипе Cypress. Ну а в этом тесте мы пока что вынуждены констатировать разгром Cayman — при максимальном коэффициенте LOD разница между скоростью Geforce и Radeon достигла 4—6 раз!

Выводы по синтетическим тестам

По результатам проведённых синтетических тестов видеокарт из нового семейства Radeon HD 6900, основанных на графическом процессоре Cayman, а также результатам других моделей видеокарт производства обоих производителей дискретных видеочипов, можно сделать вывод о том, что новинки — неплохая замена линейке Radeon HD 5800, хотя и не слишком сильно отличающаяся от неё по производительности, по крайней мере в синтетических тестах.

Графический процессор Cayman выполнен на основе новой архитектуры и отличается от предыдущих чипов аппаратно, хотя количество некоторых исполнительных блоков в нём не выросло. Зато новый GPU отличается архитектурными улучшениями, направленными на увеличение эффективности вычислений на GPU (таких тестов у нас считайте что и нет) и, что ещё более важно, смягчение важного отставания от конкурента в виде производительности обработки геометрии. Многие из синтетических тестов показывают, что скорость тесселяции и выполнения геометрических шейдеров заметно выросла, пусть и не всегда в несколько раз, как нам было обещано.

Благодаря архитектурным изменениям и своим частотным характеристикам, результаты видеокарт новой серии во многих синтетических тестах являются конкурентоспособными для своего ценового сектора, особенно по сравнению с прямым конкурентом Geforce GTX 570. Ещё более хорошо это видно в вычислительных тестах из пакетов RightMark и Vantage. Да и в остальных приложениях решения семейства HD 6900 показали неплохую скорость, чаще всего уступающую только топовой видеокарте Nvidia.

К сожалению, не обошлось и без не очень приятных сюрпризов. Несмотря на бо́льшую сложность и площадь чипа по сравнению с Cypress, результаты моделей HD 6900 в некоторых математических тестах были ниже, чем у HD 5870, что довольно непросто объяснить, и мы пока не уверены в причинах такого отставания. Возможно, виноват недостаток оптимизации драйверов, а может быть эффективность новой архитектуры VLIW4 в наших тестах оказалась ниже. Вполне вероятно и то, что система управления питанием на новых моделях понижала тактовые частоты при достижении максимального энергопотребления в требовательных синтетических тестах, не позволяя им показать ожидаемую, исходя из числа блоков и их тактовой частоты, производительность.

Наверняка многие ожидали, что Radeon HD 6970 сможет на равных соперничать с GTX 580 во всех тестах, но этого не произошло, хотя результаты были показаны очень неплохие и вполне соответствующие рекомендованным ценам на анонсированные сегодня модели. Предполагаем, что результаты Radeon HD 6970 и HD 6950 в синтетических тестах будут подтверждены и соответствующими цифрами в «игровой» части нашего материала. В играх старшая HD 6970 должна будет выступить примерно на уровне GTX 570, в некоторых тестах чуть медленнее, а в других — быстрее, а HD 6950 хоть и окажется медленнее этой модели Nvidia, но ведь и цена на эту видеокарту установлена ниже. Так давайте же скорее перейдём к исследованию скорости в играх!

Конец прошлого года и практически весь текущий год на рынке настольной графики правит бал компания AMD со своими ускорителями семейства Evergreen. Выпущенные в сентябре 2009 продукты на базе GPU Cypress, а также их младшие модификации по праву заняли своё место в компьютерах множества пользователей. Естественно, успех ускорителей AMD случайным назвать никак нельзя. Пока NVIDIA решала свои производственные проблемы, пытаясь вывести на рынок ускорители на базе GF100, AMD уже вовсю продвигала свои DirectX 11-совместимые решения во всех сегментах рынка настольной графики, активно отвоёвывая рыночную долю у конкурента. Даже появление на свет GeForce GTX 480 не смогло остановить “красный локомотив”, так как новый флагман NVIDIA оказался не так быстр, как того желала публика, кроме того, он был заметно горячее и дороже Radeon HD 5870. Наконец, совсем недавно NVIDIA начала исправлять ситуацию в лучшую для себя сторону. Серьёзная работа над ошибками , проведённая инженерами компании, позволила новым ускорителям GTX 5xx занять достойное место среди самых производительных настольных решений для ПК. Тем временем фанаты AMD с ехидством потирали руки, ожидая мощного ответа от AMD, способного вернуть «красной графике» чемпионский титул среди одночиповых решений.

Сегодня состоялся официальный анонс видеокарт Radeon HD 6950 и Radeon HD 6970 - именно они, по слухам, воспринимались в качестве ответного удара на выпуск GeForce GTX 570 и GeForce GTX 580. Постараемся разобраться, насколько эффективно новое оружие AMD, и как на самом деле компания позиционирует свои новые продукты.

Итак, вопреки ожиданиям публики, AMD не считает свои новые графические ускорители Radeon HD 6970 и Radeon HD 6950 прямыми конкурентами GeForce GTX 580 и GeForce GTX 570. В противовес самому быстрому ускорителю NVIDIA AMD по-прежнему ставит Radeon HD 5970, который, как показало наше тестирование , уже далеко не всегда справляется с возложенной на него миссией. В свою очередь Radeon HD 6970, по мнению AMD, должен оказаться быстрее GeForce GTX 570 и немного медленнее GTX 580, а вот для Radeon HD 6950 уготована особая роль - считается, что новинка должна породить свою собственную нишу в иерархии современных 3D-ускорителей.

При разработке новых GPU перед инженерами AMD ставился целый ряд задач:

  • Создание эффективной архитектуры для графических и неграфических вычислений;
  • Достижение высокой геометрической производительности;
  • Внедрение новых режимов качества картинки;
  • Внедрение эффективных методов управления питанием.

С момента появления графического процессора R600, на базе которого строились ускорители серии HD 2900, тогда ещё компания ATI, а ныне компания AMD использует так называемую VLIW-архитектуру (Very Long Instruction Word - Очень длинное машинное слово).

Блок-схема GPU Cypress

Блок-схема GPU Barts

Блок-схема GPU Cayman

Суть работы этой архитектуры заключается в параллельном исполнении ядром сразу нескольких операций одновременно. До сих пор графические процессоры ATI/AMD использовали так называемую VLIW5-архитектуру. Это означало следующее: в GPU Cypress содержалось 20 SIMD ядер, каждое такое ядро содержало по 16 блоков суперскалярных потоковых процессоров (Stream Core).

Внутренняя структура каждого потокового процессора такова:

  • Четыре исполнительных блока + Блок специальной функциональности (SFU или Special Function Unit);
  • Блок ветвлений;
  • Блок регистров общего назначения.

Выходит, что внутри чипа Cypress находится 20*16=320 потоковых процессоров, а учитывая структуру каждого потокового процессора, можно считать, что GPU Cypress содержит 1600 (320*5) скалярных 32-битных потоковых процессоров. Благодаря такому устройству GPU Cypress обладает пиковой вычислительной мощью до 2,7 Тфлопс при расчётах с одинарной точностью и до 544 Гфлопс в операциях с двойной точностью (FP64). Используемая VLIW-архитектура позволяет отказаться от целого ряда сложных узлов внутри GPU, что делает графические чипы AMD достаточно экономичными, особенно в сравнении с топовыми продуктами конкурента. Однако не всё так гладко, как кажется на первый взгляд. Параллельное исполнение вычислительных операций часто заставляет блоки простаивать в ожидании выполнения той или иной операции, когда результат одного вычисления зависит от результата другого. Ручное программирование для чипов с VLIW-архитектурой требует немало усилий, поскольку программисту требуется учитывать огромное количество внутренних зависимостей нитей кода, вследствие чего эффективность вычислений на таких GPU во многом зависит от оптимизации компиляторов. Графические процессоры Cayman, являющиеся сердцем Radeon HD 6950/6970, получили переработанную VLIW-архитектуру, так называемую VLIW4.

Использование VLIW4 позволяет лучше оптимизировать загрузку потоковых процессоров, улучшить функциональность каждого исполнительного блока (Stream Processing Unit - SPU) и избавиться от блока специальной функциональности (SFU (Special Function Unit)), который отвечал за вычисление так называемых трансцендентных функций. В итоге, по заявлениям AMD, графические чипы Cayman обладают повышенной эффективностью из расчёта на 1 кв.мм. площади кристалла. Благодаря переходу на VLIW4 удалось усовершенствовать дизайн ядра, увеличить количество SIMD-ядер, текстурных блоков, а также переработать ряд других блоков GPU.

Эффективность ROP повышена за счет улучшенного объединения операций записи (более эффективной загрузки шины памяти)

В GPU Cayman впервые реализована технология “Asynchronous dispatch”. Прежде графическое ядро имело одну общую очередь команд, поэтому вычислительные и графические задачи выстраивались в эту очередь по принципу ”первый пришел - первым обслужили”. Это напоминает одноядерный центральный процессор со многими ALU, но всего одним декодером. В ускорителях серии Radeon HD 6900 впервые поддерживается асинхронная обработка многих независимых очередей команд. Каждая очередь имеет свой приоритет и свою виртуальную память. Также доступны два независимых полноскоростных контроллера DMA (Direct Memory Access) для одновременного чтения и записи системной памяти по шине PCI-E. Кроме того, вычисления с двойной точностью достигли ¼ от пиковой скорости вычислений с одинарной точностью.

Не секрет, что AMD долго ругали за невысокую скорость обработки геометрии и медленную работу с тесселляцией. По заявлению разработчика, скорость обработки геометрии выросла вдвое, а при включении тесселляции в некоторых случаях достигается почти трёхкратный рост производительности в сравнении с Radeon HD 5870. Такие результаты стали возможны благодаря наращиванию соответствующих функциональных блоков, отвечающих за работу с примитивами, а также использование более совершенного блока тесселляции.

Наконец, перед тем, как перейти к внешнему осмотру ускорителей Radeon HD 6950/6970, обратимся к сводной таблице с техническими характеристиками и ценами.

Название видеокарты

AMD Radeon HD 5870 1 Гбайт

AMD Radeon HD 6850 1 Гбайт

AMD Radeon HD 6870 1 Гбайт

AMD Radeon HD 6950 2 Гбайт

AMD Radeon HD 6970 2 Гбайт

Кодовое имя ядра

Техпроцесс,нм

Кол-во транзисторов, млн. шт.

Максимальное энергопотребление, Вт (PowerTune Maximum)

Типичное энергопотребление, Вт

Энергопотребление в состоянии покоя, Вт

Частота ядра GPU, МГц

Кол-во блоков ROP, шт

Кол-во TMU, шт

Кол-во универсальных процессоров

Частота шейдерного домена, МГц

Тип видеопамяти

Разрядность шины памяти, бит

Эффективная частота видеопамяти, МГц

ПСП видеопамяти, Гбайт/с

Примерная розничная стоимость по данным Market 3Dnews / рекомендованная розничная стоимость у.е.

Исходя из технических характеристик новинок и памятуя обо всех архитектурных улучшениях в Cayman, мы полагаем, что ускоритель AMD Radeon HD 6950 в целом должен быть примерно на одном уровне по производительности с Radeon HD 5870. Где-то HD 6950 будет быстрее (в случае с тесселляцией - заметно быстрее), где-то медленнее из-за более низкой тактовой частоты графического ядра. В свою очередь Radeon HD 6970 во всех приложениях должен опережать старичка Radeon HD 5870, особенно это касается последних DirectX 11-приложений с поддержкой тесселляции. Если говорить о ценах, то пока данных о розничной стоимости новых ускорителей нет, однако уже сейчас ясно, что новые ускорители AMD окажутся заметно дешевле, чем GeForce GTX 570/580, правда, как нам кажется, по производительности они вряд ли дотянут до уровня флагманских ускорителей NVIDIA. Насколько? Покажет тестирование. А пока переходим к внешнему осмотру героев нашего обзора.

Ускорители AMD Radeon HD 6950/6970 внешне практически ничем не отличаются друг от друга, даже размер плат идентичен. Отличить ускорители можно лишь по наклейке на кожухе СО, а также по разъёмам питания. Ускоритель Radeon HD 6950 питается при помощи двух 6-pin разъёмов PCI-Ex, в свою очередь Radeon HD 6970 требует подключения одного 6-pin и одного 8-pin коннектора. С обратной стороны платы практически полностью закрыты металлическими пластинами. Судя по всему, это сделано для равномерного распределения тепла по поверхности ускорителя.

Количество и тип разъёмов на панели выводов у Radeon HD 6950 и HD 6970 одинаковы: два разъёма Mini DisplayPort версии 1.2, HDMI 1.4A, 2x DVI (DL-DVI + SL-DVI). В сравнении с Radeon HD 6850/6870 никаких отличий в компоновке портов здесь нет.

Демонтируем систему охлаждения Radeon HD 6950/6970. Конструктив СО обеих видеокарт полностью совпадает. К пластиковому кожуху СО крепится массивная металлическая пластина, которая контактирует с чипами памяти и элементами системы питания через специальные термопрокладки. За отвод тепла от GPU отвечает алюминиевый радиатор, подошвой которого является медная испарительная камера. Контакт с GPU происходит через тонкий слой термопасты.

Radeon HD 6950 сзади

Radeon HD 6950 спереди

Radeon HD 6970 сзади

Radeon HD 6970 спереди

Лишь после демонтажа системы охлаждения видно, что PCB ускорителей немного отличаются по цвету. Текстолит ускорителя Radeon HD 6970 имеет коричневый оттенок, а текстолит Radeon HD 6950 - чёрный. Система питания обеих карт идентична:

  • Volterra VT1156MF - напряжение на GPU (6 фаз).
  • Память - 1 фаза.
  • Vddci (контроллер памяти) - 2 фазы.

На обеих видеокартах установлена память Hynix H5GQ2H24MFR . Объём памяти каждой из видеокарт составляет 2 Гбайт, номинальная тактовая частота составляет 6 ГГц (QDR).