Несмотря на не самые лучшие показатели производительности, новая микроархитектура Bulldozer станет основой для большинства будущих продуктов компании AMD на ближайшие несколько лет. Так или иначе, но выход AMD FX был неизбежен, поскольку модернизация ядер, ведущих свою родословную со времен легендарного К8, оказалась бесперспективной. Доподлинно известно, что вычислительные ядра APU нового поколения, известного под кодовым именем Trinity, будут принадлежать к микроархитектуре Piledriver, которая является наследницей Bulldozer. В этой связи нынешние AMD FX можно считать переходным продуктом, на котором происходит обкатка дизайна нового поколения. Следуя современным тенденциям, можно предположить, что в недалеком будущем классические центральные процессоры станут уделом серверного рынка, а в сегменте десктопных и мобильных систем будут доминировать гибридные CPU.
Но, оставим прогнозы на совести профессиональных аналитиков, а пока вернемся к AMD FX. Как помните, побывавший в нашей тестовой лаборатории младший восьмиядерный Bulldozer вышел из строя во время тестов в штатном режиме. Именно поэтому мы не смогли проверить разгонный потенциал и масштабируемости производительности. Сегодня мы решили восполнить данный пробел, благо, в нашем распоряжении оказалась флагманская модель AMD — FX-8150, да еще и в комплекте с фирменной системой водяного охлаждения. Забегая наперед, отметим, что на сей раз процессор неплохо разогнался и позволил провести все необходимые измерения. Но, обо всем по порядку!
Еще раз про микроархитектуру Bulldozer
Прежде чем приступить к исследованию производительности и разгонного потенциала, напомним ключевые особенности архитектуры AMD FX. В основе процессоров Bulldozer лежат монолитные полупроводниковые кристаллы, содержащие по четыре вычислительных модуля. Каждый вычислительный модуль содержит предсказатель ветвлений, декодер инструкций, блок вычислений с плавающей точкой, буфер в 256 Кбайт для хранения инструкций и массив кэш-памяти 2-го уровня объемом два мегабайта. Кроме того, модули включают по два блока целочисленных вычислений, каждый из которых снабжен планировщиком задач и собственным кэшем 1-го уровня размером 16 Кбайт. Общими для всех двухъядерных блоков являются разделяемые 8 МБ кэш-памяти 3-го уровня, четыре 16-битных контроллера шины Hyper Transport 3.1 и пара контроллеров оперативной памяти стандарта DDR3.
Такая организация позволяет процессорам AMD FX одновременно выполнять расчеты в восемь потоков, что, собственно, и стало поводом для присвоения старшим Bulldozer восьмиядерного статуса. Как показывает практика, такой подход оправдан лишь для приложений, основанных на целочисленных алгоритмах и оптимизированных для многопоточного выполнения. В то же время, в некоторых прикладных программ и 3D-играх старшие AMD FX часто демонстрируют производительность на уровне классических четырехъядерных моделей. Но не стоит отчаиваться, ведь внедрение обновленной микроархитектуры принесло поддержку новых дополнительных инструкций, таких как SSE4.2, AVX, которые способны значительно ускорить обработку научных расчетов и мультимедийного контента, а также AESNI, предназначенной для шифрования данных. Конечно, для реализации предлагаемых возможностей необходима поддержка этих инструкций со стороны соответствующего программного обеспечения.
Использование 32-нм литографического процесса производства вместе с применением технологии SOI (Silicon On Isolator) позволили разместить около 1200 млн. транзисторов на площади в 315 мм кв. Несмотря на это, AMD FX получились достаточно экономичными, тепловыделение старших моделей укладывается в 125 ватт и в этом значительная заслуга технологии AMD Turbo Core. Её работа заключается в управлении тактовой частотой вычислительных модулей на основании анализа вычислительной нагрузки, температуры и напряжений питания, а также общем энергопотреблении центрального процессора. Именно поэтому само понятие «штатная частота» применительно к процессорам Bulldozer не совсем корректно, так как эта величина весьма вариативна. Лучше всего данный факт демонстрирует следующая иллюстрация.
При высокой нагрузке на процессор, его частота соответствует базовому уровню, который в данном случае эквивалентен штатной тактовой частоте. При равномерной загрузке всех вычислительных модулей включается режим Turbo Core, при котором тактовая частота может увеличиваться до тех пор, пока тепловыделение укладывается в рамки TDP. В случае загрузки менее половины вычислительных модулей, частота активных ядер достигает максимума, что соответствует режиму Max Turbo. При этом неактивные модули переводятся в режим «глубокого сна» С6, что позволяет высвободить бюджет энергопотребления для работающих процессорных ядер. По информации производителя, таким образом удается получить до 10% прироста в приложениях, не имеющих многопоточной оптимизации.
К сожалению, планировщики заданий операционных систем MS Windows 7, Windows Server и Windows Server 2008 R2 не учитывают особенностей микроархитектуры Bulldozer, из-за чего при выполнении некоторых приложений нагрузка распределяется неоптимальным образом. Как следствие, для отдельных вычислительных модулей не включается режим Max Turbo, что приводит к падению производительности. Для решения этой проблемы программисты Microsoft совместно с инженерами AMD разработали два патча, которые должны улучшить быстродействие AMD FX в ОС MS Windows 7. «Заплатка» KB2645594 оптимизирует работу планировщика задач, а исправление KB2646060 вносит изменения в алгоритмы диспетчера энергосбережения. Мы доверились обещаниям разработчиков и инсталлировали оба этих патча. Как это отразилось на результатах тестирования — мы узнаем во время исследования производительности, а пока перейдем к рассмотрению участника сегодняшнего тестирования — AMD FX-8150.
Процессор AMD FX-8150
Линейка процессоров, основанных на микроархитектуры Bulldozer, включает восьми-, шести- и четырехъядерные модели. Все они базируются на одних и тех же полупроводниковых кристаллах, состоящих из четырех вычислительных модулей, а младшие модели получаются путем отключения отдельных функциональных блоков. Еще одна особенность, объединяющая все модели AMD FX — так называемые «свободные» множители, что делает процессоры привлекательными для любителей разгона. Текущий модельный ряд Bulldozer выглядит следующим образом.
FX-8150 | FX-8120 | FX-8100 | FX-6200 | FX-6100 | FX-4100 | |
Ядро | Zambezi | Zambezi | Zambezi | Zambezi | Zambezi | Zambezi |
Разъем | Socket AM3/AM3+ | Socket AM3/AM3+ | Socket AM3/AM3+ | Socket AM3/AM3+ | Socket AM3/AM3+ | Socket AM3/AM3+ |
Техпроцесс CPU, нм | 32 | 32 | 32 | 32 | 32 | 32 |
Количество транзисторов, млн. | 1200 | 1200 | 1200 | 1200 | 1200 | 1200 |
Площадь кристалла, кв. мм | 315 | 315 | 315 | 315 | 315 | 315 |
Число ядер | 8 | 8 | 8 | 6 | 6 | 4 |
Номинальная частота, МГц | 3600 | 3100 | 2800 | 3800 | 3300 | 3600 |
Частота Turbo Core, МГц | 3900/4200* | 3400/4000* | 3100/3700* | 3900/4100* | 3600/3900* | 3700/3800* |
Частота NB, МГц | 2200 | 2200 | 2200 | 2200 | 2200 | 2200 |
Объем L1 кэша, КБ | 16 x 8 + 64 x 4 | 16 x 8 + 64 x 4 | 16 x 8 + 64 x 4 | 16 x 6 + 64 x 3 | 16 x 6 + 64 x 3 | 16 x 4 + 64 x 2 |
Объем L2 кэша, КБ | 2048 x 4 | 2048 x 4 | 2048 x 4 | 2048 x 3 | 2048 x 3 | 2048 x 2 |
Объем L3 кэша, МБ | 8 | 8 | 8 | 8 | 8 | 8 |
Множитель | 18 | 15,5 | 14 | 19 | 16,5 | 18 |
Каналов памяти | 2 | 2 | 2 | 2 | 2 | 2 |
Поддерживаемый тип памяти | DDR3 1333/1600/1866 | DDR3 1333/1600/1866 | DDR3 1333/1600/1866 | DDR3 1333/1600/1866 | DDR3 1333/1600/1866 | DDR3 1333/1600/1866 |
Шина для связи с чипсетом | Hyper Transport 3.1 | Hyper Transport 3.1 | Hyper Transport 3.1 | Hyper Transport 3.1 | Hyper Transport 3.1 | Hyper Transport 3.1 |
Частота Hyper Transport, МГц | 5200 | 5200 | 5200 | 5200 | 5200 | 5200 |
Рабочее напряжение, В | 0,825—1,4 | 0,825—1,4 | 0,825—1,4 | 0,825—1,4 | 0,825—1,4 | 0,825—1,4 |
TDP, Вт | 125 | 125 | 95 | 125 | 95 | 95 |
Рекомендованная стоимость, $ | 245 | 205 | – | 175 | 165 | 115 |
Побывавший в нашей тестовой лаборатории AMD FX-8150 был выпущен на 37-й неделе 2011 года, причем, сам кристалл изготовлен в Германии, а окончательная сборка производилась в Малайзии.
Как и все Bulldozer, наш FX-8150 предназначен для работы с системными платами Socket AM3+, но допускает установку в «материнки» Socket AM3, для чего необходимо обновить прошивку у последних. Тепловой пакет ограничен 125 ваттами, при этом можно использовать системы охлаждения, совместимые с Socket AM2+/AM3. Двухканальный контроллер ОЗУ официально поддерживает модули SDRAM DDR3 частотой до 1866 МГц, а максимальный объем оперативной памяти может достигать 32 Гбайт.
Штатная тактовая частота участника сегодняшнего тестирования составляет 3600 МГц, что соответствует максимальной загрузке всех вычислительных блоков. При этом напряжение на процессорных ядрах составляет порядка 1,14 В. Северный мост и кэш-память 3-го уровня работают на частоте 2200 МГц синхронно с шиной Hyper Transport 3.1.
В случае, если приложение создает небольшую равномерную нагрузку на все ядра, включается режим Turbo Core, при котором частота процессора возрастает до 3900 МГц при напряжении 1,285 В.
При работе программ, которые не имеют многопоточной оптимизации и загружают только половину вычислительных модулей, частота активных ядер возрастает до рекордных 4200 МГц. При этом напряжение увеличивается до 1,368 В.
Наконец, в моменты простоя начинает работать технология AMD Coll’n’Quite, благодаря которой процессор функционирует на частоте 1400 МГц, а напряжение уменьшается до 0,828 В.
Розничные версии AMD FX оснащаются достаточно эффективным кулером, способным отвести тепло от процессора, работающего в штатном режиме. Данная система охлаждения хорошо известна владельцам коробочных Phenom II Black Edition.
Впрочем, все Bulldozer обладают свободным множителем и позиционируются как решения для любителей оверклокинга. В режиме разгона такой системы охлаждения, даже снабженной тепловыми трубками и высокоскоростным вентилятором, может и не хватить. К счастью, попавший в нашу тестовую лабораторию AMD FX-8150 комплектуется фирменной высокоэффективной жидкостной системой охлаждения. Предполагалось, что процессоры AMD FX, укомплектованные СВО, поступят в розничную продажу, однако, мы не встречали подобных предложений в украинских магазинах. Найти прототип оказалось вовсе не сложно. Им оказался комплект Antec KÜHLER H2O 920, подробно рассмотренный в одном из наших обзоров.
Конструкция СВО состоит из алюминиевого радиатора, рассчитанного на установку двух 120-мм вентиляторов, водоблока, совмещенного с помпой, и, собственно пары высокооборотных «вертушек» Everflow R121225SU, поддерживающих управление PWM и рассчитанных на 2400 об/мин. Отличия от «прародителя» минимальны, комплект поставки ограничен аксессуарами, необходимыми для установки на процессоры Socket AM3+. Из интересных особенностей следует отметить интерфейс USB, который позволяет управлять производительностью системы охлаждения и контролировать температуру теплоносителя при помощи специального ПО. Что касается самого программного обеспечения, то его интерфейс предельно прост, а оформление стилизовано под логотип AMD FX.
Пользователь может выбирать один из двух предустановленных профилей продуктивности СВО, или задать собственные настройки скоростей вращения вентиляторов в зависимости от температуры охлаждающей жидкости. Что касается производительности, то эффективности системы охлаждения оказалось не достаточно, чтобы отвести тепло от разогнанного AMD FX-8150. Не сказать, что мы были удивлены такими результатами, ведь розничный прототип — Antec KÜHLER H2O 920 — также не отличился высокой продуктивностью и существенно проиграл воздушным суперкулерам. Кроме того, СВО обладает весьма серьезным недостатком, который заключается сложности организации охлаждения околосокетного пространства. Большинство системных плат оснащаются пассивными системами охлаждения VRM центрального процессора, которые во время разгона AMD FX работают в чрезвычайно напряженном тепловом режиме. Фирменная СВО не только не предусматривает обдува радиаторов преобразователя напряжения, но и затрудняет установку дополнительных вентиляторов ввиду громоздкости конструкции.
Разгонный потенциал
Поклонники продукции AMD возлагали на процессоры FX большие надежды в плане увеличения частотного потенциала. Технологический предел 45-нм чипов Phenom II находится в районе 4000—4100 МГц, в то время как продукты конкурентов уверенно штурмуют планку в 5000 МГц. Более тонкий 32-нм технологический процесс, разблокированный коэффициент умножения и новая микроархитектура Bulldozer обещали неплохой запас прочности. Кроме того, в канун официального анонса новых процессоров Интернет пестрил новостями об очередном рекорде разгона AMD FX до 8000 МГц и более. На практике, достижения розничных экземпляров оказались несколько скромнее. Чаще всего восьмиядерные процессоры AMD FX способны выдерживать длительные стресс-тесты на частотах порядка 4500—4700 МГц. Для этого напряжение на вычислительных модулях необходимо поднимать до 1,4—1,45 В, что можно считать приемлемым уровнем для 32-нм полупроводниковых кристаллов. Встроенный северный мост и массив кэш-памяти 3-го уровня стабильно работают при 2400—2600 МГц. В отдельных случаях может потребоваться увеличение соответствующего напряжения до 1,25 В.
Имея в своем распоряжении процессор с незаблокированным коэффициентом умножения, мы воспользовались этим преимуществом. После фиксации частоты НТТ на уровне 200 МГц и установки множителя 23 разгон нашего AMD FX-8150 составил 4600 МГц при напряжении 1,425 В. Технология AMD Turbo Core была деактивирована, но функции энергосбережения продолжали функционировать, исправно уменьшая частоту и напряжения вычислительных модулей. При этом встроенный северный мост и шина Hyper Transport синхронно работали на 2400 МГц.
На первый взгляд, даже при нагрузке в программе LinX температура процессорных ядер не вышла за пределы разумного. На самом деле, ориентироваться следует на показания датчика температуры CPU системной платы. А вот он-то и продемонстрировал угрожающие 80 °С, при достижении которых процессор включал режим пропуска тактов. Как оказалось, производительности фирменной СВО не хватило для нормального охлаждения разогнанного Bulldozer при максимальной нагрузке. Заметим, что в прикладных программах и различных комплексных бенчмарках данный эффект замечен не был, а шум оставался на вполне комфортном уровне. Выходит, что для полноценного разгона восьмиядерных AMD FX необходим, как минимум, воздушный суперкулер, либо мощная система водяного охлаждения. Увы, комплектная СВО на эту роль абсолютно не годится.
Итак, разгонный потенциал Bulldozer оказался существенно лучше, чем у процессоров AMD предыдущего поколения, но все же меньше, чем у Intel Sandy Bridge. При этом повышенное энергопотребление предъявляет серьезные требования к производительности процессорного кулера и качеству узла VRM материнской платы. Насколько эффективно масштабируется производительность старшего восьмиядерного AMD FX при повышении частоты — мы узнаем во время изучения быстродействия, а пока рассмотрим конфигурации тестовых стендов.