Месяц спустя началась продажа процессоров нового поколения Matisse. Хотя продажами это трудно назвать, ибо Ryzen 9 3900Х размели как горячие пирожки в считанные часы во всех самых крупных магазинах и по большому счету, эта модель до сих пор имеет только пресса и счастливчики, которым просто повезло. С публикацией данного материала, возможно, я немного затянул, была надежда в скором времени увидеть новые прошивки материнских плат, которые поднимут настроение у энтузиастов, как это обычно происходит спустя пару недель после выхода нового поколения видеокарт — разблокировали разгон, улучшили производительность, поправили мелкие косяки и так далее. Мне очень не хотелось спешить или лить просто воду, рассказывая о характеристиках или закидывать банальным тестированием игр. Но сегодня, пользуясь случаем, я расскажу вам, дождался ли я того чуда, о котором мечтал, и какие секреты хранит под красным капотом двухчиплетный монстр в лице Ryzen 9 3900Х.
Для тех, кто только что присоединился, советую ознакомиться с предыдущим моим обзором, в котором вы можете познакомиться с архитектурой Zen 2 и, в частности, с Ryzen 7 3700Х. В противном случае я не даю гарантии, что вы сможете осознать текущее положение вещей. Приступим!
Ryzen 9 3900Х является действительно уникальным продуктом, ни одна настольная платформа до 7 июля 2019 года не имела в своем распоряжении процессор, у которого на борту 12 и больше ядер с 64 МБ L3-кэша и теплопакетом 105 Вт (145 Вт) по абсолютно адекватной цене в 499 долларов. Также этот процессор не утратил совместимость с текущим сокетом АМ4, что, несомненно, является огромным плюсом для обладателей материнских плат, основанных на чипсетах 300 и 400 серии. Базовая частота CPU составляет 3800 МГц, а максимальный автоматический разгон на одно ядро доходит до 4600 МГц. Число линий PCI Express равно 24 — ровно столько же, сколько и в прошлых поколениях настольных процессоров. Единственная разница заключается в том, что в этот раз заявлена поддержка спецификации PCI-E 4.0, которая позволяет удвоить пропускную способность между процессором и видеокартой, а также накопителями формата NMVe и чипсетом. Востребованность этого стандарта на данный момент минимальна, но уже сейчас можно увеличить производительность дисковой подсистемы до невиданных ранее величин. В качестве примера я хочу вам привести возможность подключить двух разных накопителя форм-фактора M.2.
Первый имеет поддержку старой ревизии скоростного интерфейса и подключен напрямую к процессору (без использования линий чипсета), второй, нового стандарта, передает данные через чипсет. Оба накопителя чувствуют себя отлично и проблем в совместимости не наблюдается. Видеокарта в этом случае работает в режиме X16.
Infinity Fabric и ограничения
Основной вопрос, который многих до сих пор волнует, NUMA или UMA? Конечно же, UMA, время доступа любого ядра с любого CCD идентичное. Хотя в последнее время я довольно часто встречаю в методичках для обзорщиков картинки, на которых CCD имеют соединение. Дабы подтвердить отсутствие прямой связи между двумя CCD я воспользовался тестом MEMbench.
Исходя из результатов, можем наблюдать, что CCD1 может пойти в гости за данными в L3-кэш к CCD2 через чип IO, при этом время доступа к кэшу L3 соседнего CCD гораздо меньше, чем время доступа к оперативной памяти. То-есть процессору выгодно использовать в первую очередь максимум L3 и только потом обращаться к оперативной памяти. Также мы можем заметить, что разгон FCLK (Infinity Fabric) позволяет снизить задержки доступа не только к оперативной памяти, а и к кэшу третьего уровня.
В прошлом материале я говорил о том, что пропускная способность на запись в оперативную память в случае одночиплетного процессора составляет только 16 байт за такт и максимум, который удавалось получить, был равен около 29 ГБ/с. Ryzen 9 3900Х же является более полноценным и суммарная пропускная способность оперативной памяти на запись составляет 2x16 байт за такт. Далее на скриншоте теста AIDA мы можем увидеть, что с записью теперь все хорошо — 57 ГБ/с. Что это нам дало? Почти 5% производительности в задачах, где соотношение запись/чтение составляет не 1:2, а 1:1. Данный нюанс довольно сложно проверить, но, благо, тестовый пакет MEMbench выручил. Если, к примеру, сравнить идентичные пресеты 3200С14 на Ryzen 7 3700Х и Ryzen 9 3900Х в тесте Easy, мы получим 124 и 118 секунд, то есть те самые 5%. Больше результатов будет приведено в разделе тестов.
Несомненно, в обзоре Ryzen 9 3900Х я не могу обойти стороной вопрос утилизации ядер во время нагрузки и как подсистема IF реагирует на разгон оперативной памяти, и FCLK в том числе. Это важная и неотъемлемая часть любого процессора, который состоит из одного и более ядер, ведь именно взаимодействие всех блоков определяет успех той или иной архитектуры. В случае Ryzen 9 3900Х я обнаружил довольно неприятный сюрприз — любой разгон оперативной памяти в режиме 1:1 (MEMCLK синхронно с FCLK и UCLK) существенно ухудшало пропускную способность Infinity Fabric, при этом с задержками этой шины все было в порядке. В качестве примера я хотел бы вам показать два режима FCLK 1066 и 1900 МГц. Разница в частоте почти 90%, тем не менее, ПСП имела свойство проваливаться на любой используемой версии UEFI со 157 ГБ/с до 138–152 ГБ/с, что, несомненно, внесло негативный вклад в производительность системы. От такого разгона было замечено улучшение межъядерных задержек на 43%, при этом вместо роста пропускной способности IF я получил минус 14 ГБ/с («по больнице» –13%). Можно подумать, что пропускной способности IF с запасом, но, к сожалению, нет, большинство тестовых приложений показали очень скудные результаты, далеко не такие как мы могли наблюдать в предыдущих поколениях Zen.
После этого я принял решение проверить поведение ПСП IF на частотах памяти, начиная от 2133 до 3800 МГц. Как оказалось, на 3200–3333 МГц с CL14 система имеет лучшее соотношение ПСП/задержка, нежели разгон до красивых 3800 МГц с CL14. Поднятие напряжений SOC и VDDG не дало никакого эффекта, системе было все равно. Снижение до рекордно низких напряжений тоже не принесло успеха, кроме гаснущего на секунду экрана (перезагрузка контроллера памяти). Использование низких рабочих температур и попытка спустить частоты процессора вручную тоже не дали результатов. У серии процессоров Ryzen 3600–3800Х подобного «нюанса» нет, у них с этим все хорошо. Ознакомиться с результатами вы можете по ссылке.
В моем понимании пропускная способность Infinity Fabric имеет тоже свой Clock Stretcher, который, в некотором смысле, сохраняет стабильность системе, если пользователь задал неверное напряжение. Безусловно, это отличная функция для новичков, но не для энтузиастов, количество которых растет с каждым днем, при этом для них со всех реклам кричат про невероятные возможности разгона систем с помощью новых плат на базе чипсета AMD X570. Только результат совсем не результат.
Что касается контроллера памяти, то он оказался немного лучше, чем на Ryzen 7 3700Х и был способен стабильно работать на частоте 1900 МГц (1866 было у Ryzen 7 3700X). На 1901 МГц старта системы уже не было. Это еще одно искусственное ограничение, которым награждены Matisse. Других отличий в виде иных рабочих напряжениях для SOC, VDDG, DRAM, procODT или RTT замечено не было. То есть, вы можете спокойно использовать пресеты от систем с одним чиплетом для своих Ryzen 9 3900Х.
Арифметическая производительность и ограничения
Следующим подарком для энтузиастов была фиксация арифметической производительности для Ryzen 9 3900Х, отметку в 610 GFlops не удалось преодолеть ни при каких условиях и ни при каких частотах (напомню, что Ryzen 5 3600 с разгоном до 4,2 ГГц дает 360 GFlops). Для сравнения я использовал ручную фиксацию множителя процессора на уровне 36.00Х и 40.00X, все 12 ядер при этом были включены.
Зная любовь Linpack к частоте ОЗУ, была взята самая максимальная отметка в 3800 МГц по памяти (1900 МГц FCLK/UCLK). 600 GFlops в обеих ситуациях, за исключением TDP, разница которого составляла почти 70 Вт. То есть процессор трудился, а результата не было. Аналогичная ситуация была замечена в игровых приложениях, когда ручной разгон процессора до 4400 МГц имел худшие показатели fps, нежели стандартное состояние в режиме авто. Именно по этому я в своих обзорах отказался от идеи ручной настройки множителя процессора. К счастью, я не одинок с подобными результатами и некоторые блогеры уже даже успели выпустить видеообзоры Ryzen 5 3600Х, в которых разгон процессора демонстрировал только отрицательную игровую производительность.
Частота Ryzen 9 3900Х в реальных приложениях
Следующий вопрос, которым завален Reddit.com, это какой же настоящий boost у Ryzen 9 3900Х и где он «бустит» до заявленных 4600 МГц. Начну с прелюдий. Реальная рабочая частота процессора это вечный вопрос, ибо каждая команда, исполняемая процессором, в силу своих особенностей имеет разные коэффициенты тепловыделения. Для простоты понимания LinX (AVX) отлично греет систему, чего не скажешь о Cinebench R15 (non-AVX), который аналогично грузит на 100% систему. В зависимости от команд или тепловыделения процессор регулирует с помощью FIT допустимые значения напряжения и тока для той или иной ситуации. В итоге для Ryzen 9 3900Х мы имеем 4575–4600 МГц только в простое и только для пары удачных ядер (которые в силу своих характеристик SIDD способны держать требуемую частоту не выходя за пределы FIT). Для остальных ситуаций я нарисовал такую табличку:
Энергоэффетивность, маркировка ядер и качество кристаллов
Не обошлось без реально крутых особенностей, Ryzen 9 3900Х действительно получил отборные кристаллы (в частности ССD1), которые способны достигать более высоких частот на более низком напряжении.
Напомню, что на 4400 МГц у Ryzen 7 3700Х лучшее ядро способно было работать на 1,3 В , а худшее только на 1,4 В. В случае Ryzen 9 3900Х лучшему ядру нужно всего лишь 1,1625 В , а худшему только 1,3625 В. Плюс ко всему, разброс вольт-частотных характеристик стал минимальным, что говорит о зрелости техпроцесса и производства двухчиплетных монстров в целом.
Как можно заметить на иллюстрации у нас две линии, одна отвечает за результаты активированных двух чиплетов, а вторая — за ручное отключение второго CCD. Данное сравнение я делал не просто так. Во время тестирования ядер первого чиплета я получал BSOD на одном и том же напряжении в 1,2875 В, это происходило не случайно, в уме я держал надежду что одно из ядер второго чиплета довольно плохое и оно просто не в состоянии быть стабильным даже в режим бездействия при рабочем напряжении в 1,2875 В. Спустя некоторое время этот революционер был найден, им оказалось ядро номер 8.
К моему удивлению, это ядро было промаркировано как удачное и светилось серебристым кружочком как и его сосед номер 9. То есть маркировка ядер опять дала осечку аналогично всем другим экземплярам, которые были у меня за последние 2 года. В данном случае подобная «осечка» не несет какой либо угрозы максимальному boost на 1–4 потока, ибо приоритет для максимального boost имеет именно первый чиплет (CCD1), второй, по сути, является прицепом с кристаллом гораздо худшего качества. После окончания тестирования всех ядер на предмет «удачности» я решил отключить физически второй чиплет, чтобы проверить максимальные способности первого чиплета. Разница составила в 0,1 В, что достаточно существенно для 7-нм техпроцесса. По итогу данный экземпляр способен работать на частотах до 4,7–4,8 ГГц не выходя за границы FIT. Собственно то, о чем рассказал совсем недавно в своем видео Роберт Халлок.
Попытка «навалить» дополнительной частоты с помощью Precision Boost 2 не увенчалась успехом, ни +25 МГц, ни + 200 МГц не заставили процессор работать на более высокой частоте и реализовывать свой железный запас. Данные настройки в UEFI оказались просто муляжом. Попытка обмануть Precision Boost 2 температурным смещением с помощью Sense Mi Skew аналогично не дало результата, данная функция в исполнении ASUS тоже есть муляж.
Не обошлось и тут без аномалий. На 4400 МГц каждое ядро имело разную арифметическая производительность, при этом разница между 18 GFlops и 27 GFlops трудно назвать погрешностью. Невязки LinX при этом отсутствовали, и прогонов для каждого ядра был 10-к, что минимизировало мою возможную халатность во время тестирования. Поднятие напряжения на 0,1 В не меняло результатов арифметической производительность. Но при этом после перезагрузки системы ядро, которое давало 18 GFlops, уже могло дать 24 или 27.
Функции энергосбережения на новых чипсетных драйверах 1.07.29.0115 работали отменно, ядра с низким VID переходили в режим сна (СC6), уже не было засыпаний при напряжении в 1,47 В.
Средняя температура для Ryzen 9 3900Х в простое колебалась в пределах 36–47 градусов. В нагрузке скакала до 80 градусов при использовании жидкостного охлаждения (не кастом).
Если использовать период опроса со значением в 500 мс и ниже можно обнаружить подобную «пилу» с дельтой в 3,5–4 градуса. Хочу заверить вас, что в этом нет ничего плохого, она возникает из-за планировщика Windows, который очень любит будить и перемешивать ядра в прямом смысле слова. Ядро пробуждается на определенном напряжении, изменяется С-state и значение температуры на хотспоте регистрируется, а спустя время только появляется у пользователя в программе мониторинга в виде пика. При 2000 мс температурная «пила», которая так часто наводит шорох на пользователей, сходит на нет.
Total Board Power, указанный в спецификациях на уровне 105 Вт оказался несколько приуменьшен, это число соответствует только частоте процессора без Precision Boost или XFR, в реальности максимальная отметка составляла 145–148 Вт при 1,1–1,15 В. Напряжение я указал не просто так, даже 145 Вт могут оказаться головной болью для материнских плат с 8-фазными модулями питания CPU с посредственными MOSFET, ибо КПД преобразователя VRM находится на довольно слабом уровне при столь низком рабочем напряжении. Моя рекомендация — это выбор материнской платы, которая может обеспечить реальных 120–140 А. Теперь пойти глянуть что там в документации на элементы написано и умножить на количество фаз уже не выйдет, это будет откровенной глупостью, ибо в «шапке» будет указан максимальный ток при окружающей температуре в 25 градусов и при использовании идеального поверхностного монтажа MOSFET, т.е. то, чего не бывает в реальности. Чтоб не пугать вас расчетами, я предложу следующее, если вы выбираете материнскую плату сами, то обратите свое внимание на транзисторы и количество фаз. Для вас я подготовил список рекомендованных MOSFET. Идеальным решением для Ryzen 9 3900Х и 3950Х окажутся материнские платы с 8-мифазным (и более) VRM, основанные на: Infineon IR3555, Infineon TDA21472, Infineon IR3553, Infineon IR3556, OnSemi 4C024N, OnSemi 4C86N (dual), NikoSem PK612DZ (dual), SinoPower SM7341EH (dual), Alpha & Omega AON6354, SinoPower SM4503, Vishay SiC634, Vishay SiC632A, Vishay SiC639 и, конечно же, Texas Instruments CSD87350Q5D.
Тестовый стенд
Тестирование проходило на следующей конфигурации:
- процессор: AMD Ryzen 7 3900X;
- система охлаждения: NZXT Kraken X62;
- материнская плата: ROG Crosshair VIII Hero (WI-FI) (0803, AGESA 1.0.0.3ABВ);
- память №1: G.Skill Trident Z Royal 3600C16 (2x8GB, Samsung B-die 20 nm, Single Rank);
- память №2: G.Skill Trident Z 3000C14 (2x16GB, Samsung B-die 20 nm, Dual Rank);
- видеокарта: MSI GeForce RTX 2080 Ti GAMING X TRIO;
- накопители: Samsung 970 Pro 512GB + Gigabyte AORUS Gen 4 2TB;
- блок питания: Corsair HX750i;
- корпус Fractal Design Meshify S2 TG White;
- операционная система: Windows 10 64-bit 1903;
- драйвер чипсета: 1.07.29.0115;
- драйвер видеокарты: NVIDIA GeForce 431.36 WHQL.
Описание настроек в играх и методики тестирования
Игры в 720р с определенными настройками. Почему не 1080р ультра и так далее? Во-первых, в показания fps всегда входит комплекс результатов, на результаты CPU накладывается производительность видеокарты (ну или наоборот, в зависимости что сильнее/слабее) и мы получаем нечто среднее, что присутствует в обоих результатах. То есть, если у нас слабый процессор и мощная видеокарта, мы увидим результат только процессора, в противоположном случае мы увидим результат видеокарты. Так вот, в современных играх, чтобы получить чистый результат процессора, нам необходима настолько мощная видеокарта, чтобы топовый CPU для нее оказался откровенно слабым и это соответственно вызвало в играх недозагрузку графического акселератора с показателями в 60–70%. К сожалению, таких видеокарт не существует, а связки с двух трех GeForce RTX 2080 Ti не по карману большинству энтузиастов. Именно из-за этого приходится жертвовать разрешением и некоторыми настройками в игре, чтобы сделать видеокарту гораздо сильнее, чем процессор. В прошлом обзоре были некоторые расстроенные пользователи, которые не нашли в тестах 1080р или 1440р. Именно для них сегодня я пытаюсь объяснить, что нужно сделать, чтобы увидеть только результат процессора, и почему в моем тестировании CPU нет очередного теста видеокарты.
Во-вторых, бытует мнение, что с ростом разрешения падает производительность процессора. Напомню, что процессор в играх занимается в основном обработкой физики и интеллекта. Вопрос к «свидетелям» 1080р c ультра-настройками, сидящим на GeForce GTX 970 — как разрешение отразится на интеллекте NPC в вашей любимой игре? Подскажу, никак. От сюда следует, что на процессорный fps влияют только графические настройки, к примеру, тесселяция, трассировка, количество физических частиц, которые будут взаимодействовать в сцене или изменение количества юнитов в отряде (к примеру). При этом в каждой игре влияние настроек качества графики будет откусывать разные процентные соотношения от процессорного fps.
Исходя из всего вышеописанного, для тестирования процессорного fps было выбрано 720р со средними или низкими настройками. Настройки были именно такие, дабы сделать процессор слабым по отношению к видеокарте и увидеть именно его результат, а не результат видеокарты. Возможно, вы скажите, что это синтетика и зачем она нужна, ведь в таком разрешении никто не играет. Да, верно, не играет, но когда заходит речь, чтобы пересесть с GeForce GTX 970 на Radeon RX 5800 XT или GeForce RTX 2080 Ti все кидаются на форумы с вопросом о раскрытии «потанцевала». Именно для этих людей, которые по каким-либо причинам не вникают в суть вопроса, существует данная синтетика. Она продемонстрирует возможности процессора, и вы будете уверены в том, что когда поставите три штуки GeForce RTX 2080 Ti, у вас будет именно та производительность, которую показал я вам в обзоре.
Третье, GeForce RTX 2080 Ti ведь может и 720p с ультра-настройками и даже иногда 1080р со средним качеством, но выбрано именно низкие или средние настройки. Зачем? Среди вас, мои дорогие, обладателей столь сурового топа можно пересчитать по пальцам двух рук и ног, поэтому пришлось выбрать такие настройки в играх, чтобы обладатели, к примеру, GeForce 1080 Ti или Radeon Vega 64/Radeon RX 5700 XT смогли проверить мои показания у себя и эти результаты были чисто результатами процессора. Т.е., как говорится, быть ближе к народу.
Еще один момент о настройках игр, которые использовались — если указаны средние, то глобальные настройки устанавливались именно на таком уровне, и каких-либо вмешательств во второстепенные настройки не было. Сглаживание во всех играх было отключено.
Результаты тестирования
AIDA64
Ryzen 9 3900Х продемонстрировал замечательные результаты по всем четырём дисциплинам. Удивило копирование. Была существенная разница относительно Ryzen 7 3700Х (+15%), хотя сама по себе процедура не требует перемещения данных дальше контроллера памяти, то есть в теории разницы между Ryzen 7 3700Х и Ryzen 9 3900Х тут не должно было быть.
MEMbench
Полноценная шина Infinity Fabric (2х16 такт на запись) позволила отыграть у Ryzen 7 3700Х 5% производительности в задачах, где присутствует высокоинтенсивная запись или копирование. Но опять же, это синтетика и в большинстве приложений разница будет отсутствовать.
Sisoftware Sandra
Безоговорочное превосходство над Ryzen 7 3700Х и Ryzen 7 2700Х. Максимальная разница может достигать 35–44%, если сравнивать Ryzen 7 3700Х и Ryzen 9 3900Х, и до 220%, если сравнивать с Ryzen 7 2700Х. Тем не менее, как показали тесты, присутствует программная блокировка арифметической производительности в случае с Ryzen 9 3900X и, в теории, процессор может продемонстрировать куда лучшие результаты. Также хочу напомнить, эта серия тестов очень чувствительна к пропускной способности IF, которая с разгоном упала, что отразилось на результатах.
y_cruncher
Данный тестовый пакет довольно чувствителен к пропускной способности оперативной памяти, что собственно можно заметить по результатам. Ryzen 9 3900Х опередил Ryzen 7 3700Х на величину 17% и на 82% флагмана поколения Zen+.
AIDA64 Encryption
Плюс 44% относительно Ryzen 7 3700Х. Комментарии излишни.
CB15 / CB20
«Любимые игрушки фанатов AMD», как любят говорить фанаты Intel,также продемонстрировали весь потенциал Ryzen 9 3900X. Плюс 42% относительно Ryzen 7 3700Х и 63% относительно Ryzen 7 2700Х.
Blender
Минус 40% относительно Ryzen 7 3700Х и 65% относительно Ryzen 72700Х, что весьма неплохо.
X265
Ryzen 9 3900Х быстрее Ryzen 7 3700Х на 20% и на 42% мощнее процессора прошлого поколения.
Capture One
Феноменальные результаты, на данный рабочий пакет «отжима» RAW имеет огромное влияние пропускная способность оперативной памяти и объём кэша третьего уровня. На 20% производительнее относительно младшего представителя новой серии CPU, хотя данное приложение все же не задействовало все ядра во время прогонов — количество потоков было равным 16.
Luxmark
На 38% больше «килолучей» по сравнению с Ryzen 7 3700Х и на 60% относительно модели прошлого поколения.
3DMark Time Spy (CPU)
Почти плюс 22% fps относительно восьмиядерного решения трехтысячной серии, вполне отличный результат для бенчмарка, который долгое время не имел поддержки многопоточности.
Игры
В играх оказалось все немного сложнее. В большинстве проектах разница fps варьировалась в нескольких процентах, хотя в AC: Odyssey удвоенный объём L3 дал 4% к среднему количеству кадров в секунду. Возросшая частота в однопотоке ни на что не повлияла. В любом случае, мы имеем отличные результаты, если брать во внимание, что перед нами процессор с двумя чиплетами. Процессор является не только рабочим инструментом, а и полноценно игровым решением.
Выводы
Ограничение арифметической производительности, падение производительности в играх при использовании разгона множителем, бутафория Precission Boost 2 и Sense Mi Skew также внесли свою лепту в мои впечатления использования данного продукта. Они как бы намекают: «псс парень, не лезь, в автомате все отлично». Лично мне непонятна ситуация, которая сложилась вокруг продукта для энтузиастов, который как таковым просто не является. Возможно, этому еще не время и мы увидим в скором времени громкое чудо с релизом Ryzen 9 3950Х в виде кастомного режима для энтузиастов, где можно будет самому решить вместо процессора какие лимиты мы будем использовать, рабочий Undervolt с возможностью полного отключения Clock Stretcher и полной отвязкой частотного boost от внутренней таблицы VID (ручная настройка P-states).
Разгон памяти остался таким же великолепным, который я мог наблюдать на Ryzen 7 3700Х, частота 3800 МГц с СL16 на Dual Rank покорилась в считанные минуты, только вот программные ограничения FCLK и IF мне безусловно испортили настроение.
Несмотря на некоторые странности, Ryzen 9 3900Х оказался очень серьезным, можно даже сказать, профессиональным многофункциональным решением, на котором можно как поиграть, так и поработать. Процессор отменно функционирует из коробки и достаточно включить просто XMP, и он действительно будет стабилен. Это то решение, которое не потребует никакой возни с настройками. В арифметической производительности данному процессору нет равных среди всех настольных продуктов (речь не про HEDT). В играх местами были замечены провалы, которые лично мне говорят о том, что просто не успели подвезти патч, и планировщик Windows вертел как хотел. На крайний случай, вы можете с помощью Ryzen Master или UEFI отключить второй чиплет и получить спорткар для игр в виде 3600Х с жирным «Х». На этом сегодня все.