|
|
Материал опубликован - 05/03/2003 Технология Intel Hyper-Threading для настольных
ПК Сперва... Итак, сегодня мы поговорим о довольно нашумевшей технологии Intel Hyper-Threading для рынка настольных ПК. Первым "настольным" процессором, поддерживающим эту технологию стал Intel Pentium 4, работающий на частоте 3.06 ГГц, а анонс этого процессора состоялся 14 ноября 2002 г. Однако сама технология Hyper-Threading была объявлена уже больше года назад - официальная дата объявления Hyper-Threading - 28 августа 2001 г. Первыми процессорами, использующими эту технологию, стали Intel Xeon - процессоры для серверов и высокопроизводительных рабочих и графических станций, анонс которых состоялся 6 февраля 2002 г. Уже тогда некоторые завсегдатаи компьютерных форумов предсказывали появление этой технологии на настольных процессорах, неясным был только один вопрос - когда? Кроме того известно, что все процессоры Intel Pentium 4, основанные на ядре Northwood, и даже 0.18-микронные Pentium 4 на ядре Willamette уже имеют все аппаратные блоки, необходимые для реализации Hyper-Threading. Что было Теперь немного из истории Hyper-Threading. Разработка этой технологии корпорация Intel начала около… 10 лет назад! В 1993 году инженеры Intel заметили, что ресурсы процессоров при выполнении каких-либо задач используются не полностью. После проведения ряда исследований в этой области, Глен Хинтон, сотрудник корпорации Intel, предложил идею создания новой технологии, которая бы более интенсивно задействовала процессор. Технология получила название Hyper-Threading. В 1996 г. Инженеры Intel приступили к введению этой технологии в новую разработку - ядро, которое имело рабочее название Willamette. Впервые Hyper-Threading в физической реализации увидела свет в 1999 г., этим же годом датируются и первые тестирования процессоров с этой технологией. На решение корпорации Intel сразу при появлении Wilamette не задействовать Hyper-Threading, скорее всего есть несколько ответов. Первый, и наиболее любимый Intel ответ - рынок был еще не готов к такому событию. И действительно, все новое всегда вызывало если не ненависть, но по крайней мере недоверие… Вспомните например, как внедрялись SIMD инструкции SSE. Кроме того, в те годы технология Hyper-Threading скорее всего еще не была готова к коммерческому применению, необходимо было еще много раз испытать и доработать ее до существующего вида (вспомните хоть один факт выпуска "сырого" продукта от Intel) - "подружить" чипсет и сам процессор, научить BIOS включать эту технологию… Кроме того было необходимо, чтобы и операционные системы поддерживали новую технологию. В настоящее время Hyper-Threading поддерживается ОС Windows XP от Microsoft, a также всеми ОС Linux, основанными на ядре kernel 2.4 и выше. Теперь немного информации к размышлению: общая площадь ядра процессора при добавлении в него блоков Hyper Threading увеличилась меньше чем на 5%...
Суть технологии Hyper-Threading заключается в том, что один физический процессор (с одним конвейером и общей кэш-памятью второго уровня) распознается и работает в системе как два логических процессора. Операционная система при этом "видит" не один, а 2 процессора:
В результате, основная часть ресурсов процессора используется как обычно, но некоторые ресурсы могут быть продублированы и разделены. В результате, ядро будет одновременно обрабатывать две задачи, распределяя ресурсы между этими задачами более эффективно, нежели при похождении одной задачи. Кроме того, любая программа откомпилирована таким образом, что для ее выполнения необходимо занимать только часть ресурсов процессора. Чем лучше будет оптимизирован код программы под конкретный процессор, тем быстрее выполняется обработка этой программы. Технология Hyper-Threading во время выполнения программы способна занять незадействованные блоки для выполнения другой задачи, что позволяет сократить время простоя процессора. Такой способ получил название виртуальная двухпроцессорность или двухпотоковость. Принцип работы технологии Hyper-Threading
Но эффективность применения данной технологии сильно зависит от характера задачи, а также от оптимизации кода - больше приложение оптимизировано под процессор, тем больше может быть выигрыш от использования Hyper Threading. Кроме того, уже сейчас существуют приложения, специально оптимизированные, "заточенные" под Hyper Threading. Одним из таких приложений является Adobe Photoshop 7 - давний союзник Intel по скорейшему введению новых инструкций в свои продукты (речь о SSE и SSE2). Итак, перейдем к тестируемым системам. Достойного конкурента новому зверю от Intel из стана камней от AMD найти не удалось… По-этому в качестве сравниваемых процессоров использовались уже знакомый вам Pentium 4 2.8 ГГц, и его собрат 3.06 ГГц со включенной и выключенной технологией Hyper Threading. Естественно все это было на одной платформе - плата Intel D850EMVR, 512 Мб оперативной памяти RDRAM, жесткий диск Maxtor DiamondMax Plus D740X 60 Гб 7200 об./мин ATA/133 и видеокарта ASUS V8460 Ultra на чипе NVIDIA GeForce4 Ti4600 со 128 Мб локальной памяти DDR. При установке процессора, кулера, памяти, видеокарты и прочих устройств никаких сложностей не возникло, однако стоит обратить внимание на некоторые неудобства - речь идет о очень близком расположении разъемов питания платы и разъемов для IDE и FDD устройств.
Память представляла собой 2 чипа RDRAM PC1066 от Samsung емкостью по 256 Мб. Кроме памяти в комплекте шли еще и заглушки - ведь на плате 4 разъема под память.
Теперь о охлаждении. Корпорация Intel на презентации нового P4 3.06 Ггц особое внимание уделяло охлаждению систем на базе этого процессора. И это не случайно: процессор при включенной технологии Hyper Threading нагревается намного сильнее, чем без нее. В связи с этим в комплекте шла настоящая система охлаждения, которой позавидовал бы любой поклонник разгона процессоров AMD: радиатор не привычная полностью алюминиевая болванка, а смесь медного сердечника и алюминиевых ребер. Медная часть, непосредственно прилегающая к процессору, идеально отшлифована (помните шероховатость медной "таблетки" у ThermalTake Volcano 6 Cu+). Алюминиевым ребрам также стоит уделить внимание: они тоньше, чем у уже упомянутого ThermalTake Volcano 6 Cu+, и расположены, на мой взгляд, более удачно: они загнуты по всей поверхности в сторону вращения вентилятора, за счет этого у них лучшая "продуваемость" а благодаря маленькой толщине - лучшая теплоотдача. Сам вентилятор также представляет собой "монстра" - площадь лопастей у вентилятора увеличена по сравнению с тем же Volcano 6 Cu+, а скорость вращения… этого я найти не смог: в сопроводительной документации ничего о скорости вращения сказано не было, а в сам вентилятор датчик вращения по-видимому не входит - во всех из опробованных BIOS (кроме BIOS тестируемой платы - там вообще нет ни температуры процессора, ни скорости вращения вентилятора) возле скорости вращения стояли 0. Можно только предположить, что скорость вращения составляет около 5000-5500 об/мин, исходя из таких рассуждений: уровень шума у нового детища Intel немного выше, чем у ThermalTake Volcano 6 Cu+, который вращается со скоростью 7000 об/мин., но размер и площадь лопастей вентилятора ThermalTake Volcano 6 Cu+ примерно в 2 раза меньше вентилятора Intel.
Теперь о собственно температуре нового "камня". В представленной ниже таблице указаны температуры работы процессора Intel Pentium 4 3.06 Ггц при включенной и выключенной технологии Hyper Threading. Температура измерялась утилитой Intel Actice Monitor, которая была взята на компакт-диске, идущим в комплекте с материнской платой. Эту утилитку счастливые владельцы материнских плат Intel могут взять также на сайте Intel в разделе ПО. Для начала температура замерялась после полного бездействия системы в течении 10 мин. Затем на 10 мин. включалась на полный экран демка demo001 игры Quake III с разрешением 1024х768 и максимальными по качеству изображениями настройками, после чего температура также замерялась упомянутой утилиткой. И последний тест на "нагреваемость" - одновременный запуск в оконных режимах демка demo001 игры Quake III с разрешением 640х480 и фильм MPEG4 в Windows Media Player xp 8.00.00.4477. Но эти высокие температуры для семейства Pentium 4 не означают потери этими "камушками" звания стабильных процессоров при ошибках пользователя: после проведения тестов с процессором P4 2.8 ГГц я установил в материнскую плату процессор P4 3.06 ГГц и… забыл включить вентилятор. Windows XP нормально загрузилась, я запустил пакет SiSoft Sandra, но тут я обратил внимание на утилитку Intel Actice Monitor, постоянно находящуюся в памяти и отслеживающую температуру системы. Выглядит она так: в systray (внизу справа возле часов) виден аналоговый датчик со стрелкой и шкалой зеленого, желтого и красного цветов, обозначающих соответственно нормальную, среднюю и опасную температуру процессора. Итак, стрелка датчика была на красной шкале... И тут утилитка вывела сообщение: высокая температура процессора и запустилась. Температура составляла 68 градусов! при этом никаких "глюков" и зависаний не было, Sandra нормально завершила свою работу, сама Windows XP также выключилась без проблем. В выключенном состоянии дотронулся до радиатора, и, естественно, обжегся :) После подключения вентилятора радиатор очень быстро остыл: когда загрузилась Windows XP, Intel Active Monitor показывал вполне нормальную для этого процессора температуру: 50 градусов. Тестирование и его результаты
SiSoft Sandra 2003 Традиционно испытания открывались синтетическими тестами, к которым с полным на то основанием можно отнести пакет SiSoft Sandra 2003. Главным отличием не по годам новой версии :) стало распознавание Hyper-Threading. Первым проводился тест CPU Arithmetic Benchmark, который позволяет замерить производительность процессора при операциях с целочисленными переменными, когда задействован блок ALU, а также с переменными с плавающей запятой (блок FPU) и модуля мультимедийных инструкций SSE2.
Сравнение процессоров Pentium 4 с частотами 2,80 и 3,06 ГГц при отключенной через BIOS Hyper-Threading в очередной раз выявило весьма неплохую масштабируемость по тактовой частоте - при разнице в "мегагерцах" около 8,5%, показатели производительности отличались на 7,9%. В принципе, в этом плане ничего нового выявлено не было, гораздо интереснее были результаты при использовании Hyper-Threading - Pentium 4 с частотой 3,06 ГГц опередил своего младшего собрата более чем на 25%, а самого себя, но с отключенной технологией HT - более чем на 18%. Такой порядок цифр роста производительности близок к тому, что заявлялось на пресс-конференции. Однако спешить рано, все-таки Sandra - это вовсе не реальное приложение, да и тестов впереди еще немало.
А модуль FPU показал себя еще лучше, преимущество от использования Hyper-Threading превысило 33%, отставание процессора с частотой 2,80 ГГц от лидера в этом случае составило уже свыше 40%. При тестировании блока мультимедийных инструкций SSE2 результаты получились чуть скромнее, но все равно впечатляющими - 28 и 31% соответственно. Любопытно, что в данном случае разница между процессорами без Hyper-Threading составила всего 3,7%, что в общем-то немного для 260 МГц разницы в тактовой частоте. При тестировании скорости работы с оперативной памятью через процессорную шину тестом Memory Bandwith Benchmark из того же пакета Sandra особых преимуществ от использования технологии Hyper-Treading выявлено не было - продемонстрированные результаты отличались менее, чем на 1,4% что вполне соизмеримо с возможной погрешностью. Надо заметить, что и дополнительные 8% тактовой частоты здесь новому Pentium 4 3,60 ГГц практически ничего не дали.
CD EX Lame MP3 кодирование + Mpeg4/DrWeb 4.27 Как и в прошлый раз, первым "реальным" тестом стало приложение cd ex, в котором осуществлялось кодирование звукового файла размером 634 Мб из формата wav в mp3. При этом использовался кодер Lame MP3 версии 1.27 с engine 3.92 alpha 1 MMX, битрейт Mpeg2 составлял 160 Кбит/с с качеством normal.
Здесь Hyper-Threading показал себя весьма средненько - экономия времени на выполнение операции составила 7%. Но надо заметить, что в данном случае выполнялось всего одно приложение, значит, его код не так уж и плохо разбивался на треды. Мы усложнили эксперимент, и кодирование аудио выполнялось одновременно с проигрыванием видео в формате Mpeg4. Любопытно, что параллельное выполнение двух задач вовсе не привело к увеличению отрыва системы, использующей технологию Hyper-Threading, напротив, разрыв сократился до 2 секунд, а это менее 2%! Вероятно, обе задачи стремились получить доступ к одним и тем же ресурсам процессора, в прошлой части статьи мы уже рассматривали возможность возникновения такой ситуации. Зато прямо противоположный эффект был, когда вместо проигрывания Mpeg4, "в параллель" cd ex был включен антивирус DrWeb версии 4.27. Здесь использование Hyper-Threading позволило сэкономить 24,4% времени - система с HT завершила свою работу практически на четверть быстрее! Отставание Pentium 4 с частотой 2,80 составило 42%. Как видим, многое зависит от характера задачи, а вовсе не от степени "вылизанности" кода, ведь мы использовали неоптимизированное ПО. WinRAR 3.0 Любимый многими тестерами архиватор WinRAR 3.0, при помощи которого осуществлялось сжатие папки объемом 1,28 Гб, также использовался в "чистом" режиме и при параллельном проигрывании видео Mpeg4. Опять наблюдалась картина, аналогичная вышеописанной, только разрыв между системами на Pentium 4 3,06 ГГц со включенной и с отключенной Hyper-Threading при "чистом" архивировании и в "многозадачном" режиме был меньше - всего около 0,1%. Однако так или иначе, а экономия времени для пользователя составила 37 секунд. Система с Hyper-Threading потратила на архивирование при одновременном просмотре видео 18 минут 16 секунд, тогда как ПК с процессором равной частоты, но без поддержки HT закончил архивирование за 18 минут 53 секунды.
Bapco SYSmark 2002 v1.0 Следующим мы использовали пакет тестов SYSmark 2002 версии 1.0, который в настоящее время является одним из наиболее приближенных к реальной модели применения ПК в офисных приложениях. Характерная его черта - эмуляция одновременного выполнения нескольких программ: работа в текстовой редакторе, автоматическая проверка почты, сканирование оперативной памяти антивирусом. Вполне логично было бы ожидать от этого тестового пакета наглядной демонстрации преимуществ технологии Hyper-Threading. Однако Office Productivity при использовании HT показал индекс производительности системы всего на 3,3% больше, а Internet Content Creation - и того меньше -на 2,7%. Тут можно долго рассуждать, кто виноват и что делать, но результаты не блистали.
3DMark 2001 SE Еще более любопытные результаты показал тест 3DMark 2001 SE, замеряющий производительность связки видеоподсистемы и центрального процессора. Настройки были следующие: сглаживание в 4 сэмпла, трилинейная фильтрация, сжатые текстуры, глубина Z-буфера 24/16 бит, высокий уровень детализации, звук был отключен.
Как известно, основная нагрузка ложится на центральный процессор компьютера при низких разрешениях, глубине цвета и прочих настройках, когда нагрузка на графическую подсистему минимальна. Казалось бы, именно в этом случае надо ожидать наибольшего эффекта от Hyper-Threading. Но тут выявилась интересная зависимость: разрыв в производительности между системой, использующей эту технологию, и системой с отключенной HT увеличивался с ростом разрешения и глубины цвета. Получилось так, что при разрешении 640х480 и 16-битном цвете разница между одинаковыми ПК на базе процессора Intel Pentium 4 с частотой 3,06 ГГц с Hyper-Threading и без оной составила всего лишь 8,3%, а при 1600х1200 и 32-битной глубине цвета - свыше 27%. Quake III Конечно, интересно было сравнить полученные в 3DMark данные с реальной игрой, в качестве которой был выбран популярный Quake III версия 1.31. "Крутилось" demo001 при достаточно широком спектре настроек качества "картинки": разрешение менялось от 640х480 до 1600х1200, глубина цвета устанавливалась 16 и 32 бита, способ освещения - от простого lightmap, при котором составляется так называемая "карта освещения", до более требовательного к ресурсам освещения по вершинам треугольников, геометрические детали - высокие и низкие, уровень детализации текстур - 1/4 и 4/4, качество текстур - 16 и 32 бита, текстурная фильтрация - двухлинейная и трехлинейная. "Реальное мультимедийное высоко требовательное к ресурсам" приложение, а попросту - игра, показала зависимость эффективности применения Hyper-Threading от разрешения "картинки" обратную, той, что выявилась в 3DMark - с ростом разрешения и глубины цвета выигрыш от использования HT уменьшался. Максимальный выигрыш составил всего 2,7% при минимальных установках, при максимальном качестве "картинки" разница в выдаваемом системой количестве кадров в секунду была 0,1 fps, что в процентном соотношении никак не отразилось на конечном результате. Возможно, малая эффективность Hyper-Threading в данном случае вызвана особенностями "движка" игры, вероятно, программный код плохо поддается разбиению на треды. Несомненно, 3DMark должен быть более объективным, ведь он моделирует работу множества различных используемых в современных играх "движков". Заметный выигрыш от применения Hyper-Threading проявился в случае "многозадачности", когда параллельно сканировал систему антивирус DrWeb (от 4 до 15,4%) или проигрывался фильм в формате Mpeg4 (до 10,8%). Photoshop 7.0 Последним приложением, используемым в качестве теста, был графический редактор Adobe Photoshop 7.0. В качестве "подопытного кролика" выступал файл в формате tiff с разрешением 5312х8196 точек объемом 124,6 Мб. Над ним выполнялись следующие операции: изменение размера до разрешения 500х771 точек, применение фильтра Blur, размывающего изображение, и фильтра Artistic neon glow, который "сдвигает" цвета в сторону неонового спектра с сохранением всех градаций. Система с Hyper-Threading закончила свою работу быстрее соответственно на 12,5, 14,4 и 3,5%. Так что выигрыш в целом был неплох, но в целом он не слишком отличался от прочих полученных результатов.
Гораздо сильнее эффективность Hyper-Treading-платформы проявилась при выполнении тех же самых операций, но при одновременном проигрывании аудиофайла в формате mp3 при помощи Windows Media player XP 8.00.00.4477. Выигрыш оставил соответственно 31, 21 и 37% - подобный результат не может не впечатлять.
Заключение Итак, мир увидел качественно новый процессор, впервые преодолевший психологический
барьер в 3 ГГц. Технология Hyper Threading получила второе рождение с выходом
на рынок настольных ПК. Ссылки по теме: - Intel Pentium 4 2,53 ГГц,
"Новая шина - новые горизонты?" Новости по теме: - Ноутбуки Acer Aspire 1600 на базе настольной версии Pentium 4 с частотой до 3,06 ГГц [04.05.2003] Автор
Иван "Reg" Пешалов, Дмитрий Коростелев В статье использовались материалы корпорации Intel |
|
Статьи |
Новости |
Файлы |
Словарь |
Форум |
Производители |
Товары и цены |
Каталог ссылок |
Доска объявлений |