Особенности дизайна Trinity
Полупроводниковые кристаллы APU Trinity изготавливаются с соблюдением 32-нм норм литографического процесса, площадь ядра составляет 246 кв. мм, а общее число транзисторов насчитывает около 1300 млн. Ключевой особенностью гибридных процессоров AMD A-series второго поколения стал переход на микроархитектуру Piledriver, в то время как APU Llano использовали вычислительные ядра К10 Stars, ведущие свою родословную от первых Athlon 64. По своей сути Piledriver представляет собой улучшенную и доработанную микроархитектуру Bulldozer, впервые использованную в процессорах AMD FX. В своей максимальной конфигурации AMD A-series второго поколения могут содержать два вычислительных модуля Piledriver, графическое ядро Radeon HD 7000, контроллеры оперативной памяти и шины PCI Express 2.0, ряд вспомогательных блоков, а также встроенный северный мост, который обеспечивает связь между всеми компонентами гибридного процессора.
Каждый из вычислительных модулей Piledriver состоит из двух целочисленных блоков (ALU), которые снабжены собственными кэшами L1, одного устройства для выполнения операций с плавающей точкой (FPU), единственного декодера блока предвыборки инструкций и общего массива кэш-памяти второго уровня объемом 2 МБ. Такое строение позволят каждому из двух вычислительных модулей выполнять до четырех вычислительных потоков одновременно. Однако, скорость работы в приложениях, интенсивно использующих блоки FPU, может сильно снижаться вследствие совместного использования ресурсов двумя потоками вычислений.
От AMD FX гибридные процессоры второго поколения отличает отсутствие кэш-памяти третьего уровня. Тем не менее, производитель заявляет о некоторых нововведениях, улучшающих быстродействие Piledriver по сравнению с Bulldozer. Например, были улучшена работа блока предсказания переходов и планировщика заданий, а также увеличена скорость выполнения операции деления. Размер буфера L1 TLB увеличился вдвое, а эффективность работы кэш-памяти второго уровня была улучшена за счет ускоренной очистки от неиспользуемых при вычислениях данных и улучшенного механизма предвыборки. Появилась поддержка новых дополнительных инструкций, таких как FMA3 и F16C.
Отсутствие кэш-памяти третьего уровня предъявляет повышенные требования к эффективности северного моста и контроллера ОЗУ. Кроме того, графическое и процессорные ядра имеют совместный доступ к оперативной памяти, но характер и объемы данных при этом различны. Вычислительные модули генерируют гораздо меньше запросов, но эти запросы имеют высший приоритет и должны быть обработаны немедленно. Видеоядро же использует гораздо больше памяти для кадрового буфера, поэтому, для обеспечения доступа встроенной видеокарты к контроллерам ОЗУ существует выделенная 256-битная шина Radeon Memory Bus. Также, графическое ядро может общаться со встроенным северным мостом посредством шины FCL (Fusion Control Link), которая, используется для передачи служебной и управляющей информации.
Возможности APU A-series второго поколения по работе с ОЗУ обеспечивают два 64-битных контроллера, которые могут работать в двухканальном режиме. Поддерживаются модули оперативной памяти SDRAM DDR3 с тактовой частотой 1866 МГц, что обеспечивает теоретическую полосу пропускания до 29,8 ГБ/с. Максимальный объем ОЗУ ограничен на отметке в 64 Гбайт. Одним из существенных нововведений контроллера оперативной памяти стала поддержка динамического управления частотой и напряжением модулей ОЗУ в угоду лучшей энергоэффективности.
В сравнении с гибридными процессорами предыдущего поколения графическая составляющая Trinity была полностью переработана. Интегрированное видеоядро, известное под кодовым именем Devastator, получило потоковые процессоры VLIV4, которые широко используется в семействе дискретных акселераторов Southern Islands. Многие надеялись, что обновленные APU A-series получат потоковые процессоры с архитектурой Graphics Core Next (GCN), показывающей лучшие результаты в неграфических вычислениях — одном из основных идеологических принципов APU.
Тем не менее, архитектура VLIV4 обеспечивает поддержку API DirectX 11 и OpenCL, а также обладает лучшей в сравнении с VLIV5 эффективностью использования аппаратных ресурсов. Напомним, что неприятной особенностью дизайна VLIV5 являлся тот факт, что пятый ALU (T-unit) каждого из скалярных SIMD-процессоров, способный исполнять сложную инструкцию (Special Function), часто простаивал из-за отсутствия должной оптимизации со стороны программного кода видеоигр. Отказ от T-unit повысил показатели производительности на единицу площади полупроводникового кристалла, а также снизил энергопотребление графического ускорителя и дал возможность увеличить его таковые частоты. В итоге, в своей максимальной конфигурации графическое ядро Devastator может содержать шесть SIMD-движков, каждый из которых состоит из четырех текстурных блоков и 16 потоковых VLIV4-процессоров.
Таким образом, старшие модели APU A-series располагают 384 унифицированными шейдерными процессорами и 24 текстурными блоками. Кроме этого, в состав графического ядра Devastator входит блок аппаратного декодирования видеопотока (UVD3), а также узел Video Codec Engine (VCE), обеспечивающий ускорение кодирования видео в формате H264. Существует возможность объединения ресурсов встроенной и дискретной видеокарт класса Radeon HD 6570 в связки Dual Graphics, что существенно повышает быстродействие в современных 3D-играх. Остается добавить, что гибридные процессоры Trinity поддерживают фирменную технологию Eyefinity и обеспечивают вывод изображения одновременно на три монитора.
Что касается технологий энергосбережения, то за управление тактовой частотой и напряжением новейших APU A-series отвечает фирменная технология AMD Turbo Core 3.0. Её работа заключается в динамическом управлении быстродействием вычислительных и графического ядер в пределах ограниченного теплового пакета. Диспетчер P-state Manager анализирует текущее энергопотребление гибридного процессора и, в зависимости от характера нагрузки, задает режим работы отдельных функциональных блоков. Таким образом, при выполнении задачи, требующей максимум ресурсов центрального процессора, частота вычислительных модулей будет повышена относительно номинала, а при запуске 3D-приложения будет максимально ускорена работа встроенной видеокарты.
Платформа Socket FM2
По сравнению с AMD A-series предыдущей ревизии, дизайн APU Trinity претерпел кардинальные изменения. Поэтому, нет ничего удивительного, что обновленные гибридные процессоры получили новый разъем Socket FM2, который, увы, не совместим с решениями прошлого поколения. Новый конструктив очень похож на своего предшественника, различие заключается лишь в количестве контактов: у Socket FM2 их 904, в то время как на процессорах в исполнении Socket FM1 было 905 позолоченных ножек. Что касается электрических характеристик, то разъем поддерживает установку гибридных процессоров с TDP до 100 Вт включительно, а конструкция креплений позволяет использование систем охлаждения, предназначенных для Socket AM3+/FM1.
Для APU A-series второго поколения был разработан новый чипсет AMD A85X. Как вы помните, кристалл гибридного процессора содержит графическое и процессорные ядра, встроенный северный мост, контроллеры оперативной памяти DDR3 и шины PCI Express 2.0, а также цифровые интерфейсы для вывода изображения и UMI (Unified Media Interface) для связи с чипсетом. Поэтому, системная логике, имеющей одночиповую компоновку, достается роль «южного моста», который отвечает за работу дисковой подсистемы, периферийных устройств и плат расширения.
Чипсет AMD A85X поддерживает подключение до восьми устройств SATA 6 Гбит/с с возможностью организации RAID 0, 1, 5 и 10, обеспечивает работу четырех портов USB 3.0 и 10 каналов USB 2.0. Для подключения плат расширения и дополнительных контроллеров системная логика предлагает четыре линии PCI Express 2.0 и несколько слотов PCI. Микросхема FCH (Fusion Communication Hub) изготавливается с соблюдением норм 65-нм литографического тех.процесса в корпусе FC-BGA 605, её тепловыделение не превышает 4,7 Вт, что позволяет использовать для её охлаждения компактные пассивные радиаторы.
Что касается отличий системной логики AMD A85X от чипсета AMD A75 — флагманского решении для платформы Socket FM1, то они минимальны и заключаются в официальной поддержке конфигураций AMD CrossFireX, добавлении двух каналов SATA 6 Гбит/с, а также возможности объединения накопителей в массивы RAID 5. Более того, чипсеты, предназначенные для AMD A-series первого поколения, могут с успехом использоваться для построения материнских плат Socket FM2. Для персональных компьютеров начального уровня рекомендуется системная логика AMD A55, лишенная поддержки SATA 6 Гбит/с и USB 3.0, материнские платы среднего класса предполагается оснащать чипсетом AMD A75, а для самых производительных и функциональных систем позиционируется новейший AMD A85X.
Модельный ряд AMD A-series в исполнении Socket FM2 содержит разнообразные модификации, которые отличаются количеством вычислительных модулей, конфигурацией графического адаптера, а также тактовой частотой функциональных блоков и расчетным тепловыделением. Таким образом, на основе единственного полупроводникового кристалла создана целая продуктовая линейка, включающая и доступные модели начального уровня, и производительные решения для игровых системных блоков. Заметим, что кроме APU для Socket FM2 будут выпущены процессоры Athlon с отключенным графическим ядром. Актуальный модельный ряд AMD для платформы Socket FM2 имеет следующий вид:
Процессор | A10-5800K | A10-5700 | A8-5600K | A8-5500 | A6-5400K | A4-5300 | Athlon X4 750K | Athlon X4 740 | Athlon X2 340 |
Разъем | FM2 | FM2 | FM2 | FM2 | FM2 | FM2 | FM2 | FM2 | FM2 |
Техпроцесс, нм | 32 | 32 | 32 | 32 | 32 | 32 | 32 | 32 | 32 |
Число ядер | 4 | 4 | 4 | 4 | 2 | 2 | 4 | 4 | 2 |
Номинальная частота, МГц | 3800 | 3400 | 3600 | 3200 | 3600 | 3400 | 3400 | 3200 | 3200 |
Частота Turbo Core, МГц | 4200 | 4000 | 3900 | 3700 | 3800 | 3600 | 4000 | 3700 | 3600 |
L2-кеш, Мбайт | 4 | 4 | 4 | 4 | 1 | 1 | 4 | 4 | 1 |
Графическое ядро | Radeon HD 7660D | Radeon HD 7660D | Radeon HD 7560D | Radeon HD 7560D | Radeon HD 7540D | Radeon HD 7480D | – | – | – |
Число унифицированных шейдерных процессоров | 384 | 384 | 256 | 256 | 192 | 128 | – | – | – |
Частота графического ядра, МГц | 800 | 760 | 760 | 760 | 760 | 723 | – | – | – |
Поддерживаемый тип памяти | DDR3-1866 | DDR3-1866 | DDR3-1866 | DDR3-1866 | DDR3-1866 | DDR3-1600 | DDR3-1866 | DDR3-1866 | DDR3-1600 |
TDP, Вт | 100 | 65 | 100 | 65 | 65 | 65 | 100 | 65 | 65 |
Разнообразие модификаций позволят каждому пользователю выбрать именно тот продукт, который больше всего отвечает поставленным задачам. Экономных пользователей заинтересуют AMD А4 и младшие Athlon, а любители разгона смогут обратить внимание на модели c литерою «К» в названии модели, оснащенные свободным коэффициентом умножения. Вместе с широким ассортиментом системных плат для платформы Socket FM2 новейшие процессоры AMD представляются неплохим вариантом для построения недорогих игровых и мультимедийных системных блоков.