Особенности архитектуры APU Kaveri
По сравнению с гибридными процессорами предыдущего поколения в Kaveri было сделано столько изменений, что в пору говорить о настоящей революции! Прежде всего, изменился процесс производства, в то время как Richland выпускаются по 32-нм нормам с применением технологии SOI (Silicon on isolator), кристаллы новейших APU изготавливаются с 28-нм детализацией. От SOI было решено отказаться в пользу технологического процесса SHP (Super High Performance), который позволяется добиться значительного повышения плотности элементов ценою некоторого снижения тактовой частоты. Кремниевый кристалл Kaveri состоит из 2410 млн. транзисторов и занимает при этом площадь 245 кв. мм. Для сравнения, полупроводниковое ядро Richland площадью 246 кв. мм насчитывает «всего» 1300 млн. транзисторов, а для четырехъядерных Intel Haswell аналогичные показатели составляют 177 кв. мм и 1400 млн. соответственно, так что, производство новейших гибридных процессоров на фабриках GlobalFoundries обходится AMD вряд ли дороже, чем моделей предыдущего поколения.
Около половины площади полупроводникового кристалла занимает интегрированное графическое ядро Radeon R7, содержащее до восьми вычислительных модулей GCN (Graphics Core Next), подобных тем, что лежат в основе самых современных видеоакселераторов AMD Hawaii. Помимо высокого быстродействия в 3D-играх микроархитектура GCN отлично подходит для неграфических вычислений. Для этого в составе APU имеются восемь блоков ACE (Asynchronous Compute Engines), отвечающие за распределение заданий. Каждый из восьми вычислительных модулей GCN состоит из 64 потоковых процессоров, одного блока растеризации и четырех текстурных юнитов. В максимальной конфигурации графическое ядро Radeon R7, встроенное в APU Kaveri, может иметь до 512 потоковых процессоров, 32 TMU и 8 ROP. Видеоускоритель поддерживает API DirectX 11.2, OpenCL 1.2 и технологию аппаратной обработки звуковых эффектов AMD TrueAudio. В состав графического акселератора входит блок VCE (Video Coding Engine), отвечающий за кодирования видео высокой четкости, а также блок UVD (Unified Video Decoder), призванный разгрузить вычислительные модули при воспроизведении видеопотока.
Еще одной инновацией, реализованной в новейших APU, стала поддержка API Mantle. Этот низкоуровневой программный интерфейс, продвигаемый AMD в качестве альтернативы DirectX и OpenGL, разработан с учетом сильных сторон архитектуры GCN и позволяет оптимально использовать гетерогенный дизайн гибридных процессоров. С помощью Mantle разработчики могут создавать кросс-платформенные продукты, одинаково хорошо работающие как на игровых консолях, так и на персональных компьютерах. При использовании нового API чипмейкер обещает существенный рост быстродействия, правда, на сегодняшний день существует единственная игра с поддержкой Mantle — Battlefield 4, но, как говорится, это только начало.
Что касается процессорной части, то APU Kaveri получил обновленную микроархитектуру Steamroller, которая стала логическим развитием дизайна Piledriver и призвана исправить некоторые его недостатки. Структурной единицей микроархитектуры является модуль, состоящий из одного блока вычислений с плавающей точкой (FPU), двух юнитов для целочисленных вычислений (ALU) и массива кэш-памяти второго уровня размером 2 МБ. Как и раньше пара ALU делят общий блок выборки, но теперь каждый из целочисленных блоков получил собственный декодер инструкций, кроме того, изменения в механизме выборки позволили уменьшить на 30% количество ошибочно предсказанных переходов. Также, были внесены доработки в сами блоки ALU, а емкости кэшей L1 для инструкций были увеличена до 96 КБ, в результате чего возросла эффективность выполнения некоторых целочисленных операций.
Весьма значимые изменения коснулись и модели взаимодействия отдельных узлов гибридного процессора. Важнейшим шагом на пути к развитию гетерогенных вычислений стало внедрение hUMA (heterogeneous Memory Unified Access) и hQ (heterogeneous Queue). Технология hUMA обеспечивает процессорным и графическим ядам равноправный доступ ко всей области системной памяти, а hQ позволяет гибко распределять задания между различными типами вычислительных модулей. Особенность hUMA и hQ заключается в их аппаратной реализации, что вместе с использованием оптимизированного программного обеспечения дает формальное право называть гибридные процессоры Kaveri… 12-ядерными, если под «ядрами» подразумевать вычислительные модули любых типов.
Технологии управления энергоэффективностью в Kaveri получили дальнейшее развитие. Динамическое управление частотой отдельных узлов в зависимости от нагрузки было реализовано еще в APU Trinity, а в новейших гибридных процессорах появилась возможность ручной настройки TDP. Например, для А10-7850К пользователи могут самостоятельно задать тепловой пакет на уровне 45 Вт или 65 Вт, либо оставить параметр TDP в значении по умолчанию 95 Вт, тем самым выбирая между максимальным быстродействием или энергоэффективностью.
Таким образом, новейшие AMD A-Series выглядят очень многообещающе, по сравнению с APU предыдущих поколений прогресс заметен по всем фронтам: в архитектуре вычислительных и графических ядер, в улучшении поддержки гетерогенных вычислений, а также управлении энергопотреблением. Насколько хороши Kaveri в сравнении с предшественниками и конкурентами — вы узнаете совсем скоро, а пока предлагаю взглянуть на платформу Socket FM2+ и модельный ряд AMD A-Series.
Платформа Socket FM2+
Очередное поколение APU получило новый процессорный разъем Socket FM2+, который обратно совместим с гибридными процессорами Trinity и Richland, тогда как поддержки Kaveri на платах Socket FM2, увы, не будет. Все дело в разном количестве контактов: у Socket FM2 их 904, тогда как у версии «плюс» — 906, а также ином расположении направляющих ключей. Хорошо, что крепление системы охлаждения осталось прежним, то есть можно ставить кулеры, предназначенные для Socket AM3+ и Socket FM2.
Для новой платформы AMD предлагает три версии системной логики: A88X для старших материнских плат, A78 для продуктов среднего ценового диапазона и А55 для решений начального уровня. По своим возможностям чипсеты А88Х и А78 в точности наследуют модели предыдущих поколений — А85Х и А75 соответственно, а между собой микросхемы FCH (Fusion Communication Hub) отличаются количеством поддерживаемых портов USB 3.0 и SATA 6 Гбит/с. Единственное заметное отличие новой платформы — официальная поддержка шины PCI Express 3.0, и та доступна только в случае установки APU нового поколения.
На момент анонса продуктовая линейка Kaveri состоит всего из двух наименований: A10-7850 и А10-7700К, но в течение первого квартала 2014 года ассортимент будет расширен за счет экономичной модели А8-7600. Спецификации семейства новейших AMD A-Series в сравнении с предшественниками представлены в следующей таблице:
Процессор | A10-7850K | A10-7700К | A8-7600 | A10-6800K | A10-6790K | A10-6700 | A10-6700T | A8-6600K | A8-6500 | A8-6500T |
Ядро | Kaveri | Kaveri | Kaveri | Richland | Richland | Richland | Richland | Richland | Richland | Richland |
Разъем | FM2+ | FM2+ | FM2+ | FM2 | FM2 | FM2 | FM2 | FM2 | FM2 | FM2 |
Техпроцесс, нм | 28 | 28 | 28 | 32 | 32 | 32 | 32 | 32 | 32 | 32 |
Число ядер | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 |
Номинальная частота, МГц | 3700 | 3400 | 3300 | 4100 | 4000 | 3700 | 2500 | 3900 | 3500 | 3500 |
Частота Turbo Core, МГц | 4000 | 3800 | 3800 | 4400 | 4300 | 4300 | 3500 | 4200 | 4100 | 4100 |
L1-кеш, Кбайт | 16 x 4 + 96 x 2 | 16 x 4 + 96 x 2 | 16 x 4 + 96 x 2 | 16 x 4 + 64 x 2 | 16 x 4 + 64 x 2 | 16 x 4 + 64 x 2 | 16 x 4 + 64 x 2 | 16 x 4 + 64 x 2 | 16 x 4 + 64 x 2 | 16 x 4 + 64 x 2 |
L2-кеш, Мбайт | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 | 4 |
Графическое ядро | Radeon R7 series | Radeon R7 series | Radeon R7 series | Radeon HD 8670D | Radeon HD 8670D | Radeon HD 8670D | Radeon HD 8670D | Radeon HD 8570D | Radeon HD 8570D | Radeon HD 8570D |
Число унифицированных шейдерных процессоров | 512 | 384 | 384 | 384 | 384 | 384 | 384 | 256 | 256 | 256 |
Частота графического ядра, МГц | 720 | 720 | 720 | 844 | 844 | 844 | 720 | 844 | 800 | 800 |
Поддерживаемый тип памяти | DDR3-2133 | DDR3-2133 | DDR3-2133 | DDR3-2133 | DDR3-1866 | DDR3-1866 | DDR3-1866 | DDR3-1866 | DDR3-1866 | DDR3-1866 |
TDP, Вт | 95* | 95* | 45/65 | 100 | 100 | 65 | 45 | 100 | 65 | 45 |
Рекомендованная стоимость, $ | 173 | 152 | 119 | 142 | 122 | 142 | 142 | 97 | 97 | 112 |
Помимо разницы в тактовых частотах и количеству потоковых процессоров встроенных видеокарт между APU разных поколений бросается в глаза увеличившаяся стоимость гибридных процессоров AMD. Так старший A10-7850K стоит дороже любого двухъядерного процессора Intel Core i3, но несколько дешевле младших модификаций Core i5, поэтому, прямых конкурентов у него нет, тогда как A10-7700К предстоит соперничать с Intel Core i3-4330, имеющим аналогичную стоимость. Зато, оба APU обладают разблокированным на повышение множителем, следовательно, их быстродействие можно повысить путем разгона, а что касается TDP, то пользователи смогут самостоятельно выбрать требуемое значение в диапазоне от 45 Вт, 65 Вт или 95Вт. AMD A10-7850K
Попавший в нашу тестовую лабораторию AMD A10-7850K оказался не инженерным образцом, а нормальным розничным экземпляром, так что можно рассказать о его комплекте поставки. Старший гибридный процессор продается в небольшой картонной коробке, выполненной в агрессивных черно-красных тонах.
Внутри коробки помимо процессора обнаружился простенький кулер, состоящий из алюминиевого радиатора и 70-мм вентилятора AVC DESC0715B2U с ШИМ-управлением скорости вращения. На своих максимальных оборотах в 4100 об/мин крыльчатка ощутимо шумит, а в разгоне кулер не способен защитить APU от перегрева. В общем, система охлаждения подойдет для штатного режима эксплуатации, тогда как любители разгона и поклонники тишины будут вынуждены искать альтернативные решения.
Внешне A10-7850K не отличается от других гибридных процессоров AMD, полупроводниковый кристалл скрыт под металлической крышкой теплораспределителя.
C обратной стороны находятся 906 позолоченных ножек, различия с моделью для Socket FM2 видны только при непосредственном сравнении.
Согласно паспортным данным старший Kaveri функционирует на частоте 3700 МГц при напряжении Vcore, равном 1,336 В, встроенный северный мост при этом работает на 1800 МГц.
В приложениях, не оптимизированных для многопоточного выполнения, вычислительные модули разгоняются до 4000 МГц с одновременным повышением напряжения до 1,4 В.
В моменты простоя частота снижается до 1700 МГц, а Vcore падает до 0,8 В, обеспечивая гибридному процессору невысокое энергопотребление.
Встроенное в A10-7850K графическое ядро Radeon R7 series функционирует на частоте 720 МГц. При отсутствии нагрузки видеоакселератор замедляется до 350 МГц, помогая экономить электроэнергию.
Что касается разгонного потенциала, то штатные напряжения достаточно высоки, как для 28-нм полупроводникового кристалла, поэтому, я не рискнул увеличивать Vcore более чем на 10%. В итоге, при подаче на вычислительные ядра 1,47 В гибридный процессор заработал на частоте 4400 МГц, а северный мост удалось разогнать до 2000 МГц при повышении VDDNB до 1,3 В. В таком режиме A10-7850K без сбоев проходил стресс-тест в Prime95, но малейшее повышение частоты приводило к ошибкам в программе и возникновению BSOD.
Во время поиска фактора, сдерживающего разгон, выяснилось, что программный мониторинг AIDA64 не совсем корректно отображает температуру APU. Пришлось воспользоваться утилитой HWiNFO64 версии 4.33-2115, которая позволила определить истинный температурный режим гибридного процессора. Судя по данным с датчика CPU 0 Package вычислительные ядра прогревались до 92° С, и это при том, что для охлаждения использовался мощный воздушный кулер Noctua NH-U14S. Скорее всего, эффективности термоинтерфейса между кристаллом и крышкой процессора недостаточно для нормального отвода тепла, и дальнейший рост частоты ограничен из-за перегрева.
Результаты разгона встроенного графического ядра не слишком впечатлили, с повышением напряжения APU1.2V Voltage на 0,1 В до 1,15 В удалось увеличить частоту интегрированной видеокарты на 25%, то есть до 900 МГц.
Похоже, что новые APU Kaveri — отнюдь не чемпионы по разгону. Тем не менее, у пользователей есть возможность хоть немного, но повысить их быстродействие, тогда как у компании Intel в ценовом диапазоне до 200 долларов США нет ни одной модели процессора из серии «К». Тестовый стенд
Прежде чем приступить к описанию тестовых стендов, стоит привести аргументацию выбора соперников для тестирования AMD A10-7850K. Прежде всего, интересно оценить прирост быстродействия в сравнении с гибридным процессором предыдущего поколения, для этих целей использовался A10-6800K. Что касается продукции Intel, то прямого конкурента у старшего APU Kaveri нет, поэтому мы не были ограничены в выборе модели и взяли старшую модель Haswell c возможностью разгона — i5-4670K. Возможно, такое сравнение не слишком корректное, поскольку рекомендованная стоимость процессора Intel почти на 50% больше, зато, будет интересно сравнить быстродействие новинки с настоящими четырехъядерным процессором. Сравнительные характеристики участников тестирования приведены в следующей таблице:
AMD A10-7850K | AMD A10-6800K | Intel Core i5-4670K | |
Разъем | Socket FM2+ | Socket FM2 | LGA1150 |
Техпроцесс CPU, нм | 28 | 32 | 22 |
Количество транзисторов, млн. | 2410 | 1300 | н/д |
Площадь кристалла, кв. мм | 245 | 246 | н/д |
Число ядер (потоков) | 4 (4) | 4 (4) | 4 (4) |
Номинальная частота, МГц | 3700 | 4100 | 3400 |
Частота Turbo Core, МГц | 4000 | 4400 | 3800 |
Множитель | 37 | 41 | 35 |
Объем L1 кэша, КБ | 16 x 4 + 96 x 2 | 16 x 4 + 64 x 2 | 32 x 4+ 32 x 4 |
Объем L2 кэша, КБ | 2048 x 2 | 2048 x 2 | 256 x 4 |
Объем L3 кэша, МБ | – | – | 6 |
Встроенное видеоядро | Radeon R7 | Radeon HD8670D | HD 4600 |
Частота ядра, МГц | 720 | 844 | 1200 |
Количество потоковых процессоров | 512 | 384 | 20 |
Количество текстурных блоков | 32 | 24 | н/д |
Каналов памяти | 2 | 2 | 2 |
Поддерживаемый тип памяти | DDR3 1333/1600/1866/2133 | DDR3 1333/1600/1866/2133 | DDR3 1333/1600 |
Шина для связи с чипсетом | 2 Gb/s UMI | 2 Gb/s UMI | 5 GT/s DMI 2.0 |
TDP, Вт | 95 | 100 | 85 |
Рекомендованная стоимость, $ | 173 | 142 | 243 |
Для тестирования процессоров в исполнении Socket FM2/FM2+ использовался следующий набор аппаратного обеспечения:
- системная плата: ASUS A88X-Pro (AMD A88X, UEFI Setup 0703 от 03.01.2014);
- кулер: Noctua NH-U14S (вентилятор NF-A15 PWM, 140 мм, 1300 об/мин);
- термопаста: Noctua NT-H1;
- оперативная память: G.Skill TridentX F3-2400C10D-8GTX (2x4 ГБ, DDR3-2400, CL10-12-12-31);
- видеокарта: ASUS GTX670-DCMOC-2GD5 (NVIDIA GeForce GTX 670);
- накопитель: GoodRAM C100 Series (120 ГБ, SATA 6Gb/s);
- блок питания: Seasonic X-650 (650 Вт);
- операционная система: Windows 7 Enterprise 64 bit SP1;
- драйвер чипсета: AMD Catalyst 13.301;
- драйвер видеокарты: GeForce 331.65.
- системная плата: ASUS Maximus VI Hero (Intel Z87, UEFI Setup 1301 от 14.01.2014);
- кулер: Noctua NH-U14S (вентилятор NF-A15 PWM, 140 мм, 1300 об/мин);
- термопаста: Noctua NT-H1;
- оперативная память: G.Skill TridentX F3-2400C10D-8GTX (2x4 ГБ, DDR3-2400, CL10-12-12-31);
- видеокарта: ASUS GTX670-DCMOC-2GD5 (NVIDIA GeForce GTX 670);
- накопитель: GoodRAM C100 Series (120 ГБ, SATA 6Gb/s);
- блок питания: Seasonic X-650 (650 Вт);
- операционная система: Windows 7 Enterprise 64 bit SP1;
- драйвер чипсета: Intel INF Update Utility 9.4.0.1017 и Intel Management Engine 9.5.0.1345;
- драйвер видеокарты: GeForce 331.65.
AMD A10-7850K | AMD A10-7850K OC | AMD A10-6800K | AMD A10-6800K OC | Core i5-4670К | Core i5-4670К OC | |
Частота CPU, МГц | 3700 | 4400 | 4100 | 4800 | 3400 | 4800 |
Напряжение Vcore, В | 1,336 | 1,47 | 1,36 | 1,5 | 1,105 | 1,38 |
Частота NB, МГц | 1800 | 2000 | 1500 | 2200 | 3400 | 4500 |
Частота iGPU, МГц | 720 | 900 | 844 | 1086 | 1200 | 1600 |
Частота ОЗУ, МГц | 1600 | 2400 | 1600 | 2400 | 1600 | 2400 |
Тайминги | 9-9-9-24-1Т | 10-12-12-31-2T | 9-9-9-241Т | 10-12-12-31-2T | 9-9-9-24-1Т | 10-12-12-31-2T |
Использовался следующий набор тестового ПО:
- AIDA64 4.20.2800 (Cache & Memory benchmark);
- SuperPI XS 1.5;
- wPrime Benchmark 2.10;
- Futuremark PCMark 8 v2.0.204;
- 7-zip 9.20 (встроенный тест);
- Adobe Photoshop CS5 (Retouch Artist Benchmark);
- Cinebench R15 (64bit);
- POV-Ray 3.7.0;
- LuxMark v2.0;
- TrueCrypt 7.1a (встроенный тест);
- SVPmark 3.0.3b;
- x264 HD Benchmark v5.0;
- Futuremark 3DMark;
- Batman: Arkham City;
- Hitman: Absolution;
- F1 2012;
- Metro: Last Light.
Производительность с дискретной видеокартой
Синтетические бенчмарки
Как показали результаты в Cache & Memory Benchmark из состава AIDA64, производительность контроллера памяти APU Kaveri превосходит показатели гибридного процессора AMD A10-6800K, но заметно уступает в быстродействии аналогичному узлу Intel Haswell. Вместе с тем, подсистема ОЗУ А10-7850К продемонстрировала худшие показатели латентности.
Тестирование в синтетических бенчмарках SuperPi и wPrime продемонстрировало преимущество новой микроархитектуры в целочисленных вычислениях. Несмотря на превосходство в частоте AMD A10-6800K проиграл новинке, как в штатном режиме, так и после разгона. Правда, до показателей i5-4670K APU Kaveri все равно не дотянул.
В полусинтетическом бенчмарке Futuremark PCMark 8, который отражает уровень быстродействия в типичных повседневных задачах, в штатном режиме скорость работы новинки в точности соответствует показателям APU Richland. И это несмотря на ощутимое преимущество последнего по частоте, а в подтесте MS Office 2010 А10-7850К легко обходит предшественника. Между тем, производительность Intel высока, и даже разгон не позволяет гибридным процессорам AMD приблизиться к результатам конкурента.
Прикладное ПО
Тестирование в архиваторе 7-zip показало, что в штатном режиме оба APU демонстрируют примерно идентичные результаты. Что касается Core i5-4670K, то его превосходство достигает 50% и никакие улучшения в микроархитектуре Steamroller неспособны помочь опередить оппонента.
Результаты встроенного бенчмарка TrueCrypt показали, что скорость аппаратного шифрования у Kaveri выше, чем у предшественника, но гораздо меньше, чем у четырехъядерного Intel. Разгон позволил A10-7850K приблизиться к результатам Core i5-4670K, работающего в штатном режиме.
При выполнении тестового задания в графическом редакторе Adobe Photoshop гибридный процессор Kaveri оказался быстрее APU Richland, как в разгоне, так и в режиме по умолчанию. Впрочем, до быстродействия процессора Intel новинке очень и очень далеко.
Движок 3D-рендеринга Cinebench R15 не использует микроархитектурных улучшений Steamroller, в итоге, AMD А10-6800К показал лучшие результаты, чем новичок, особенно в тесте визуализации OpenGL. Зато, в программе POV-Ray, использующей метод трассировки лучей, APU Kaveri функционировал быстрее своего предшественника, но даже это не помогло ему догнать четырехъядерный Haswell.
В задаче преобразования HD-видео с помощью кодека h.264 разница в быстродействии гибридных процессоров при втором проходе достигла 10% в пользу AMD A10-7850K, тогда как при выполнении первого прохода быстродействие обоих APU оказалось практически идентичным. Результаты Core i5-4670K в комментариях не нуждается, он почти вдвое быстрее Kaveri.
Тесты в 3D-играх
Прежде чем приступить к тестам в видеоиграх, была проведена оценка быстродействия в Futuremark 3DMark.
В обоих сценариях количество очков у гибридных процессоров совершенно идентично, исключение составляет физический подтест Fire strike, где новичок в разгоне немного опередил AMD А10-6800К. От комментариев результатов Intel Core i5-4670К я, пожалуй, воздержусь.
В шутере Batman: Arkham City и гоночном симуляторе F1 2012 гибридный процессор A10-7850K уступил представителю предыдущего поколения, тогда как в двух оставшихся игровых проектах наблюдается примерный паритет. Преимущество четырехъядерного Intel Haswell безоговорочно и может достигать двух раз.
Энергопотребление
Для оценки энергопотребления тестовых стендов использовалось устройство Basetech Cost Control 3000. С его помощью было измерено среднее потребление электроэнергии при отсутствии нагрузки, а также пиковые значения потребляемой мощности во время прохождения стресс-теста Prime95 в режиме In-Place large FFTs.
В штатном режиме при просторе все участники тестирования показали похожие результаты, а во время стресс-теста энергопотребление стендов расположилось в соответствии с заявленным TDP процессоров. Таким образом, новичок оказался экономичнее AMD А10-6800К, но проиграл в энергоэффективности Core i5-4670K. После разгона ситуация резко поменялась, самым экономичным оказался A10-7850K, как при отсутствии нагрузки, так и при работе программы Prime95.
Быстродействие встроенного графического ядра в 3D-играх
Прежде всего, были проведены тесты в графическом бенчмарке Futuremark 3DMark. В подтесте Cloud gate победу одержал Intel Haswell, скорее всего, за счет лучшего быстродействия процессорных ядер, тогда как в более тяжелом Fire strike A10-7850K продемонстрировал 50% большую производительность, чем у Core i5-4670K. Комплексный разгон гибридного процессора принесло неплохие дивиденды, очевидно, за счет увеличения пропускной способности подсистемы памяти, в которую «упирается» скорость работы встроенного видеоядра Radeon R7.
Поскольку новые APU позиционируются как решения, достаточные для запуска современных 3D-игр в разрешении Full HD, тестирование выполнялось с высокими, но не максимальными настройками качества при экранном разрешении 1920х1080. Увы, AMD A10-7850K обеспечил комфортный геймплей только в двух играх: Batman: Arkham City и F1 2012, тогда как в Hitman: Absolution и Metro: Last Light частота смены кадров оказалась ниже комфортного порога, но уменьшением разрешения и оптимизацией настроек можно легко добиться быстродействия в 24 fps и выше. По результатам тестов превосходство графического ядра Kaveri над встроенной видеокартой APU прошлого поколения достигает порой 25%, а что касается разгона, то AMD A10-7850K очень чутко отреагировал на повышение частоты, позволившее поднять быстродействие в играх до 40%. Влияние пропускной способности ОЗУ на производительность, а также быстродействие в популярных видеоиграх, в том числе при использовании AMD DualGraphics мы обязательно рассмотрим в одном из наших следующих материалов.
Энергопотребление
В режиме использования встроенной графики оценивалось среднее потребление электроэнергии тестовыми стендами за время прохождении игровых тестов и бенчмарка Futuremark 3DMark, а также уровень потребляемой энергии при простое.
В штатном режиме наилучшую энергоэффективность показал тестовый стенд, построенный на Intel Core i5-4670K, но система на базе AMD A10-7850K уступила ему в экономичности совсем незначительно. После разгона ситуация изменилась в пользу Kaveri: герой сегодняшнего обзора показал наименьшее энергопотребление в нагрузке, но проиграл системному блоку на Intel Haswell в простое.
Производительность гетерогенных вычислений
Одним из главных преимуществ гибридных процессоров нового поколения является улучшенное быстродействие в гетерогенных вычислениях с использованием API OpenCL. Увы, приложений, эффективно утилизирующих ресурсы графических ядер, совсем немного, а эффективных средств измерения скорости работы GPGPU — еще меньше. К счастью, комплексный тестовый пакет Futuremark PCMark 8 с недавних пор получил поддержку OpenCL, что позволяет определить прирост от его применения.
При использовании гетерогенных вычислений быстродействие APU Kaveri возросла от 35% в подтесте Home до 75% в тестовом сценарии Work. Активация OpenCL позволила AMD A10-7850K опередить четырехъядерный Intel Haswell, который, к слову, показал совсем незначительный прирост от использования для вычислений встроенного видеоядра. Что касается AMD А10-6800К, то эффективность использования интегрированного графического ускорителя достаточно высока и в отдельных случаях достигает 50%.
Гетерогенные вычисления отлично подходят для построения 3D-изображений методом трассировки лучей, примером может служить программа LuxMark. Результаты расчетов силами вычислительных модулей на гибридных процессорах не слишком впечатлили, особенно на фоне четырехъядерного Intel Haswell. Зато, после задействования графических ядер результаты AMD A10-7850K выросли в 2,5 раза, что позволило на равных соперничать с более дорогим Core i5-4670K. Эффект от включения поддержки OpenCL у последнего есть, но он не превысил 50%, а для APU Richland данный показатель составил около 70%.
Приложение SVP (Smooth Video Project), которое обеспечивает плавность изображения видеофайлов путем формирования промежуточных кадров, оптимизировано для вычислений GPGPU. И вновь эффективность от использования OpenCL для APU Kaveri достигла 50%, а для A10-6800K прирост составил порядка 45%. Увы, этого оказалось недостаточно, чтобы опередить процессор Intel Haswell, выполняющий задачу исключительно силами вычислительных ядер.
Выводы
Без сомнения, APU Kaveri ознаменовали новую веху в истории развития гибридных процессоров AMD и на это есть масса причин. Переход вычислительных модулей на микроархитектуру Steamroller улучшил быстродействие гибридного процессора, обеспечив прирост до 20% в зависимости от задачи. Совершенно новое графическое ядро, обладающее дизайном старших видеоакселераторов AMD Hawaii, превосходит решения предыдущего поколения как по быстродействию в современных видеоиграх, так и в скорости вычислений GPGPU, причем, при грамотной оптимизации ПО эффект от использования OpenCL может достигать нескольких раз. Настоящим подарком стала возможность конфигурирования TDP, отныне у покупателей нет нужды искать энергоэффективные модификации, так как один и тот же APU может работать как в составе тихого мультимедйиного центра развлечений, так и внутри игрового системного блока начального уровня. Единственное, что огорчает — это решение AMD использовать для APU Kaveri новый разъем Socket FM2+, которое не совместим с существующие инфраструктурой и требует приобретения новой системной платы.
Что касается AMD A10-7850K, то старший гибридный процессор получился весьма интересным. Несмотря на то, что его тактовая частота на 400 МГц меньше, чем у флагмана предыдущего поколения A10-6800K, среднее быстродействие героя сегодняшнего обзора оказалось выше на 4%, а в отдельных задачах прирост достигает 10% и более. Тем не менее, этого совершенно недостаточно для полноценной конкуренции с четрехъядерными процессорами Intel Haswell, которые, впрочем, стоят несколько дороже. Сильнейший «козырь в рукаве» гибридных решений AMD — мощная графическая подсистема и здесь конкуренту особенно нечем похвастаться.
Разгонный потенциал новинки особенно не впечатлил. Повышение тактовой частоты на 10% сверх номинала — сомнительное достижение, причем, требующее эффективной системы охлаждения. Причина банальна — низкая эффективность термоинтерфейса между крышкой теплораспределителя и полупроводниковым кристаллом. Вызывает вопрос и завышенная розничная стоимость AMD A10-7850K — почти на 20% больше, чем у старшей модели предыдущего поколения. С учетом перехода на 28-нм детализацию и новый технологический процесс SHP производство полупроводниковых кристаллов обходятся Kaveri вряд ли существенно дороже, чем тех же Richland, так что у чипмейкера есть хороший запас для снижения цены, после чего новейшие гибридные процессоры могут стать новым бестселлером в среднем ценовом диапазоне.