Что же, пора заканчивать затянувшуюся историю о новой платформе Nehalem. А для этого как раз подойдут сравнительное тестирование системы на базе Core i7 с представителями предыдущего поколения. В качестве процессоров для платформы LGA775 использовались Core 2 Duo E8200 и Core 2 Quad Q9400, работающие на частоте 2,66 ГГц. Первый из них является самым производительным двухъядерным решением на такой частоте, а второй на момент проведения тестирования оказался единственным доступным вариантом, обладающим четырьмя ядрами. Нет смысла говорить, что локальный рынок фактически «заморожен», поставки сократились, а продажи резко упали. И на этой ниве собрать высокопроизводительный тестовый стенд становится проблематично. Но как показало наше тестирование, даже Core 2 Quad Q9400 в некоторых задачах может спокойно конкурировать с Core i7, работающим на одинаковой с ним частоте.
Характеристики сравниваемых процессоров занесены в представленную ниже таблицу.
Процессор | Intel Core i7-920 | Intel Core 2 Quad Q9400 | Intel Core 2 Duo E8200 |
Архитектура | Nehalem | Penryn | Penryn |
Ядро | Bloomfield | Yorkfield | Wolfdale |
Разъем | LGA1366 | LGA775 | LGA775 |
Техпроцесс | 45 нм | 45 нм | 45 нм |
Степпинг | C0 | R0 | C0 |
Количество транзисторов | 731 млн. | 2 х 410 млн. | 410 млн |
Площадь ядра | 263 кв.мм | 2 х 107 кв.мм | 107 кв.мм |
Число ядер | 4 (8 потоков) | 4 | 2 |
Номинальная частота | 2,66 ГГц | 2,66 ГГц | 2,66 ГГц |
Объем L1 кэша | 4 x (32+32) КБ | 4 x (32+32) КБ | 2 x (32+32) КБ |
Объем L2 кэша | 4 x 256 КБ | 2 x 3 МБ | 6 МБ |
Объем L3 кэша | 8 МБ | - | - |
Множитель | 20х, заблокирован на повышение | 8х, заблокирован на повышение | 8х, заблокирован на повышение |
Hyper-Threading | + | - | - |
Поддерживаемый тип памяти | DDR3 800/1066 | - | - |
Шина | QPI (4,8 ГТ/с) | FSB (1333 МГц) | FSB (1333 МГц) |
Номинальное напряжение | 1,20 В | 1,20 В | 1,20 В |
TDP | 130 Вт | 95 Вт | 65 Вт |
Средняя стоимость | $328 | $294 | $181 |
Система на базе Core i7-920 была собрана с тем же составом, что и при разгоне, за исключением видеокарты, памяти и блока питания:
- Процессор: Intel Core i7-920 (2,66 ГГц, 8 МБ кэш L3);
- Материнская плата: ASUS Rampage II Extreme (Intel X58);
- Кулер: Noctua NH-U12P с креплением LGA1366 Mounting-Kit;
- Оперативная память: Aeneon AEH860UD00-10F (3x2048 МБ, DDR3-1066, 6-6-6-18);
- Видеокарта: Leadtek WinFast GTX 280;
- Жёсткий диск: Samsung HD252HJ (250 ГБ, SATA2);
- Блок питания: Seasonic SS-600HM (600 Вт).
Все настройки BIOS Setup платы, кроме основных таймингов памяти и напряжений, выставлялись по умолчанию. Кроме того, Core i7-920 разгонялся до 3540 МГц (опорная частота 177 МГц, напряжение 1,4 В), память при этом работала с коэффициентом 6х, что соответствовало 1062 МГц. Тайминги оставались прежними. Также использовалось несколько режимов работы системы, а именно:
- «2,66/8/3/T» — стандартная частота процессора (2666 МГц), технология Hyper-Threading активирована, трехканальный режим, Turbo Boost включен;
- «2,66/4/3/T» — стандартная частота процессора (2666 МГц), технология Hyper-Threading деактивирована, трехканальный режим, Turbo Boost включен;
- «2,66/4/3/noT» — стандартная частота процессора (2666 МГц), технология Hyper-Threading деактивирована, трехканальный режим, Turbo Boost отключен;
- «2,66/4/2/noT» — стандартная частота процессора (2666 МГц), технология Hyper-Threading деактивирована, двухканальный режим, Turbo Boost отключен;
- «3,54/8/3/noT» — разгон процессора до 3540 МГц, технология Hyper-Threading активирована, трехканальный режим, Turbo Boost отключен;
- «3,54/4/3/noT» — разгон процессора до 3540 МГц, технология Hyper-Threading деактивирована, трехканальный режим, Turbo Boost отключен;
- «3,54/4/2/noT» — разгон процессора до 3540 МГц, технология Hyper-Threading деактивирована, двухканальный режим, Turbo Boost отключен.
Такое количество комбинаций позволит выяснить о необходимости использования технологий Hyper-Threading и Turbo Boost, а также трехканального доступа к памяти.
«Конкурирующая» система имела следующий вид:
- Процессор №1: Core 2 Quad Q9400 (2,66 ГГц, 6 МБ кэш L2);
- Процессор №2: Core 2 Duo E8200 (2,66 ГГц, 6 МБ кэш L2);
- Материнская плата: ASUS Rampage Formula (Intel X48);
- Кулер: Noctua NH-U12P с креплением LGA1366 Mounting-Kit;
- Оперативная память: Team Xtreem Dark TXDD4096M1066HC5-D (2x2048 МБ, DDR2-1066, 5-5-5-15);
- Видеокарта: Leadtek WinFast GTX 280;
- Жёсткий диск: Samsung HD252HJ (250 ГБ, SATA2);
- Блок питания: Seasonic SS-600HM (600 Вт).
Как и в случае с первой системой настройки платы устанавливались в автоматическом режиме, все напряжения и тайминги — вручную. Оба процессора разгонялись до частоты 3544 МГц (FSB 443 МГц, напряжение питания 1,375 В), память при этом функционировала на частоте 1068 МГц с таймингами 5-5-5-15.
В качестве операционной системы использовалась Windows Vista Ultimate x86 c SP1. Драйверы для систем были следующие:
- X58: Intel Chipset Software Installation Utility 9.1.0.1007;
- X58: SoundMAX Audio Driver v6.10.1.6480;
- X48: Intel Chipset Software Installation Utility 8.3.0.1013;
- X48: SoundMAX Audio Driver V6.10.01.6280;
- Общие: ForceWare 180.48.
Брандмауэр и Windows Defender отключались, файл подкачки устанавливался в размере 3072 МБ. Настройки видеодрайвера не изменялись.
Результаты тестирования в прикладном ПО
Синтетика
Начнем, пожалуй, с синтетического пакета PCMark’05, который пользовался особой популярностью во времена противостояния Pentium 4 и Athlon 64, хотя и не отражал реальной картины производительности обеих платформ. Но рассматриваемые в материале системы полностью на базе процессоров Intel, так что, ни о каком «читерстве» и речи быть не может.
Итак, общий балл и результаты по процессорному тесту оказались предсказуемы, так как PCMark’05 чувствителен к многоядерным решениям и высокой частоте. Верхние строчки рейтинга занимает разогнанный Core i7-920 с различными режимами работы, следом идет Core 2 Quad Q9400, работающий на частоте 3,54 ГГц. Разогнанный Core 2 Duo E8200 в процессорном тесте показал примерно такой же результат, как и Core i7-920 без разгона и с активированной технологией Turbo Boost. Но уже в номинальном режиме двухъядерный CPU, естественно, показывает самый низкий результат.
В тесте памяти распределение по результатам закономерное, учитывая встроенный контроллер памяти у Bloomfield, и только Core 2 Duo E8200 показывает более высокий балл, чем Core 2 Quad Q9400.
Подсистема памяти
По той же причине Core i7 демонстрируют высокую производительность подсистемы памяти в Lavalys Everest, которая при разгоне процессора еще больше повышается, особенно при записи. Судя по всему, более высокая частота контроллера способствует росту этого показателя. Переход к двухканальному режиму не так существенно отражается на ПСП, как могло бы показаться. С возможностями Core i7 при записи смогли потягаться Core 2 Duo и Core 2 Quad лишь после повышения частоты, и то, за счет именно FSB, работающей на эффективных 1772 МГц.
Латентность памяти уменьшилась почти в два раза по сравнению с процессорами прошлого поколения, и это несмотря на использование DDR3. Переход к двухканальному режиму даже предпочтительнее в этом плане и можно сразу предположить о более высоком быстродействии в некоторых приложениях систем с двумя модулями памяти.
Архивирование
Оптимизированный под многопоточность архиватор 7-Zip (использовался словарь в 32 МБ) склонен к большему количеству ядер, чем к высокой частоте. Использование HT позволяет увеличить производительность при архивировании до более высокого уровня по сравнению с разогнанным процессором с этой отключенной технологией. При компрессии четырехъядерный Core 2 Quad Q9400 смотрится достойно на фоне Core i7, но только с повышением частоты, хотя уже при декомпрессии способен на равных потягаться с новым CPU.
Встроенный в архиватор WinRAR определяет быстродействие подсистемы «процессор-память» и всегда был неплохим мерилом производительности этой связки, но c Core i7-920 ведет себя странным образом: при частоте 3,54 ГГц с двухканальным режимом результат такой же, как и при «турбированных» 2,66 ГГц и задействованных трех каналах. Естественно, незначительное падение пропускной способности памяти при двух каналах не может так сильно отразиться на результатах. Возможно, с выходом новой версии данная проблема будет исправлена.
Рендеринг
В CINEBENCH 10 при рендеринге сцены с использованием одного CPU все режимы работы процессоров выстроились аккуратной лесенкой: Core 2 в номинале, Core i7 без Turbo Boost и с ним же, разогнанные Core 2 и Core i7. Количество задействованных каналов памяти в системе с Bloomfield особой роли не играет. Переход к мультиядерному тесту немного меняет картину и на первое место становится именно количество ядер в процессоре, а уже потом — частота.
А вот в тесте видеокарты все кардинально меняется и система на новой платформе набирает в полтора раза меньше баллов, чем на базе Core 2 Duo и Core 2 Quad. Что это, ахиллесова пята архитектуры Nehalem или попросту проблемы микрокода BIOS платы или драйверов? Будем надеяться на последнее.
Результаты в POV версии 3.7 beta 29 аналогичны CINIBENCH за исключением того, что при активации Hyper-Threading происходит падение производительности на Core i7 и его место на графике занимает четырехъядерный процессор архитектуры Penryn. Подобная проблема наблюдалась еще с Pentium 4 HT, который показывал более низкое быстродействие, когда одновременно обрабатываемые потоки были чувствительны к размеру кэшей. В случае активирования Hyper-Threading, объем кэш-памяти каждого физического ядра делится пополам и при слабой оптимизации кода программ под эту технологию как раз и будет наблюдаться падение производительности.
Работа с видео
Для кодирования видео все средства хороши: и количество ядер и их частота. Программой Virtual Dub кодировался ролик MPG2 объемом 0,97 ГБ при помощи кодека DivX 6.8.5, который поддерживает несколько ядер. Использование HT положительным образом сказалось на производительности, хотя и не значительно. Процессоры Core 2 лишь с разгоном могут конкурировать с новинкой от Intel.
Еще один тест по кодированию видео — x264 HD Benchmark, благосклонно отнесся к процессору новой архитектуры и безразлично к технологии Hyper-Threading. На графике представлен средний FPS по первому проходу версии 0.58.819M.
Кроме того, были сняты показания температуры во время прохождения всех четырех прогонов этого теста. Напоминаем, что при разгоне напряжение питания на процессоре Core i7-920 было 1,4 В, на остальных — 1,375 В.
Как ни странно, самым холодным оказался Core 2 Quad Q9400. Даже при увеличении частоты его температура не превышала 56 градусов Цельсия. Весьма горячий степпинг Core 2 Duo E8200 позволил ему нагреться при разгоне до 64 °C. Такая же температура у Core i7-920, работающего на номинальной частоте с отключенным Turbo Boost. Активирование HT значительно повышает температуру CPU, особенно при поднятии частоты. Как уже отмечалось выше, нынешняя ревизия Bloomfield отличается высоким тепловыделением и при повышении частоты и напряжения этот показатель сильно увеличивается. Поэтому для работы в нештатных режимах придется позаботиться о производительной системе охлаждения.
Математические расчеты
Fritz Chess Benchmark рассчитывает количество ходов за определенное время и, как и в случае с 7-Zip, решающим является количество логических/физических ядер и их частота.
Бенчмарк wPrime хорошо оптимизирован под многопоточность и в большей степени реагирует именно на количество ядер. Идеальная картина низкой производительности E8200 относительно своих четырехъядерных оппонентов наблюдается и здесь. И если так было бы во всех приложениях, то можно было бы заявить о приходе эры «квадов» в декстопные системы. Но, увы…
Утилита Super PI никакой поддержкой мультиядерности не обладает и полностью зависит от архитектурных особенностей процессора и его частоты, а также от подсистемы памяти. Лидирует по расчету 1-млн. знака числа Пи Core i7-920 на частоте 3,54 ГГц с результатами в 11 секунд. Следом за ним расположился Core 2 Duo E8200, за счет более емкого кэша, и Core 2 Quad Q9400, работающие на той же частоте, что и Core i7. Далее расположение мест идет таким же образом.