Вредоносное ПО (malware) - это назойливые или опасные программы,...
![Лучшие утилиты для удаления вирусов и вредоносных программ](https://i2.wp.com/webhelper.info/images/danger.jpg)
2 февраля официально увидели свет новые процессоры Pentium 4 на ядре Prescott, принципиально отличающиеся от своих предшественников на ядре Northwood. Что реально мы получаем в настоящий момент с выходом Prescott и стоит ли овчинка выделки?
См. остальные части нашего обзора:
Часть 2.
Часть 3. Быстродействие в играх.
Часть 4. Производительность в ряде профессиональных графических приложений.
Второго февраля, наконец, свершилось то, чего вся компьютерная индустрия с нетерпением ожидала по крайней мере последние полгода - Intel «опрескотилась»! Это означает, что официально увидели свет новые процессоры Pentium 4 на ядре Prescott, принципиально отличающиеся от своих предшественников на ядре Northwood по трем важнейшим категориям: прогрессивные множественные изменения в микроархитектуре процессорного ядра, использование более «тонкого» технологического процесса изготовления кристаллов с нормами 90 нанометров, применение усовершенствованных материалов для изготовления кристалла. Всё вместе это обещает открыть новые горизонты дальнейшего наращивания быстродействия процессоров архитектуры Intel NetBurst. Но обещания - обещаниями, а что реально мы получаем в настоящий момент с выходом Prescott и стоит ли овчинка выделки? Это и предстоит нам выяснить.
Давненько корпорация Intel не радовала нас новыми процессорами для настольных ПК. После феерического выхода целого сонма новых продуктов весной этого года - процессоров Pentium 4 на ядре Northwood с частотами от 2,4 до 3,0 ГГц на системной шине 800 МГц и двухканальных DDR400-чипсетов для них серий i875 и i865 (Canterwood и Springdale), см., например, обзоры на www.terralab.ru/system/25198 , www.terralab.ru/system/25235 , а также www.terralab.ru/system/28979 , последовал лишь еще один процессор в июне - Pentium 4 3,2 ГГц (см. www.terralab.ru/system/25250 ). И затем наступило до неприличия длительное затишье, пару раз нарушенное лишь появлением очередных Celeron. По сути дела, корпорация не объявляла новых Pentium 4 для массового рынка более семи (!) месяцев подряд, что в современных условиях является непростительно долгим сроком.
Конечно, в середине осени Intel провозгласила одну новинку - Pentium 4 Extreme Edition 3,2 ГГц с чудовищными для настольных систем размерами кэш-памяти (2 Мбайт третьего уровня), кристалла и количеством транзисторов (см. www.terralab.ru/system/29365 ). Но и цена этого «экстра-геймерского» процессора оказалась не менее чудовищна по понятиям персональных компьютеров - под тысячу долларов США. А если учитывать, что реально в розничных магазинах эти «монстры» появились лишь совсем недавно и их продажи на фоне обычных Pentium 4 до сих пор ничтожно малы, то Extreme Edition вполне можно отнести не к массовому сегменту, а к своеобразному «процессору ради престижа», не делающему никакой погоды на массовом рынке ПК (по самым оптимистическим прогнозам корпорации доля P4EE среди всех «Пентиумов» не будет превышать пяти процентов). В этой связи, нетерпеливое ожидание Prescott, обладающего мегабайтной кэш-памятью второго уровня, еще более усилилось.
Intel готовила индустрию к выходу Prescott задолго до его появления и делала это величественно и громогласно. Первые сведения просочились в прессу пару лет назад, а в феврале прошлого года на Intel Developer Forum в Сан-Хосе корпорация организовала публичное оглашение основных архитектурных особенностей будущего процессора и подробно рассказала о технологиях и материалах, применяемых для его изготовления (см., например, www.terralab.ru/system/23898 ). А спустя полгода продемонстрировала общественности сами процессоры в работе и показала фотографию кристалла Prescott, обнародовав дополнительные подробности - количество транзисторов, размер чипа и пр. (см. www.terralab.ru/system/29227 ).
Первоначально руководители корпорации уклончиво обещали выпустить процессор осенью 2003 года (неофициально ходили слухи то о сентябре, потом о начале декабря)… Но время текло, «уж полночь близилась», а Германа все не было… За это время основной конкурент Intel на рынке процессоров для ПК - корпорация AMD - успела трижды (!) выпустить свои новые процессоры: сперва в конце сентября вышел долгожданный Athlon 64 3200+ (см. www.terralab.ru/system/29375 ), затем в декабре появился первый недорогой настольный Athlon 64 3000+, отличавшийся от 3200+ только уменьшенной вдвое кэш-памятью второго уровня, и, наконец, в начале января появился великолепный Athlon 64 3400+, который мог не только соперничать на равных с самыми мощными настольными процессорами Intel, но даже нередко превосходил их и своего более дорогого собрата Athlon 64 FX-51 (см. www.terralab.ru/system/31549 ). И это при том, что он работал всего с одним каналом обычной памяти DDR400, тогда как все остальные «топ-модели» требовали для реализации своего скоростного потенциала как минимум двухканального DDR400-решения.
Поклонники Intel с надеждой ожидали явно застопорившегося выхода ядра Prescott, надеясь на чудо - увеличенные вдвое кэш-памяти первого и второго уровня вкупе с другими усовершенствованиями ядра (новые инструкции SSE3, улучшенные HyperThreading, механизм предвыборки и предсказание ветвлений) обещали если не прорыв, то, по крайней мере, существенный рост производительности нового ядра по сравнению со старым. Ранние «оценочные» степпинги Prescott «ходили» по лабораториям и OEM-партнерам Intel начиная с осени, однако особых восторгов от тех, кому с ними удалось «пообщаться», слыхивать не доводилось. А пока руководители корпорации уверяли, что процессор «уже готов» и начиная с четвертого квартала 2003 года «уже идут» его коммерческие поставки производителям, из недр Intel доносились слухи о задержках, связанных с необходимостью «дооптимизировать» технологию производства и ядро самих процессоров с целью получения нужного теплового режима старших моделей и приемлемого для массового производства выхода годных кристаллов.
И поскольку дальше затягивать официальное объявление Prescott было уже неприемлемо, процессоры выпустили 2 февраля. Однако удалось ли производителю при этом в полной мере побороть «детские болезни левизны» нового ядра? Судя по тому дефициту старших моделей Prescott (с частотой 3,2 и 3,4 ГГц), который испытывают сейчас даже ведущие тестовые лаборатории - не совсем удалось. Например, модель 3,40Е не видел живьем еще никто из знакомых мне людей (исключая сотрудников Intel J ), а модель 3,20E пробыла у нас в редакции всего три рабочих дня, поскольку ее как жуткий дефицит «рвали на части» другие «поклонники», и в первые дни после выхода я не обнаружил ни одного предложения модели 3,20E в российских магазинах (не уверен, что они были даже в японских). С другой стороны, подобный «ажиотаж» можно попробовать объяснить и другим - процессор настолько великолепен, что его просто «выметают» из-под прилавков толпы поклонников.
Итак, 2 февраля Intel выпустила сразу семь новых Pentium 4. Их перечень и краткие отличительные особенности приведены в таблице 1.
Процессор |
Pentium 4 |
Pentium 4 |
Pentium 4 |
Pentium 4 |
Pentium 4 |
Pentium 4 |
Pentium 4 |
||
Технология производства |
|||||||||
Шина FSB, МГц |
|||||||||
Технология Hyper-Threading |
|||||||||
Кэш-память второго и третьего уровней |
512 кбайт, 2 Mбайт L3 |
512 кбайт L2 |
|||||||
Напряжение питания, В |
|||||||||
Разъём (Socket) |
|||||||||
Оптовая цена, $ |
|||||||||
* В официальном документе Intel для этого процессора указано ядро Northwood, но мы то с вами знаем, что Northwood с кэш-памятью третьего уровня называется ядром Gallatin, официально применяемом только в серверных процессорах Intel Xeon, хотя степпинг кристалла Pentium 4 Extreme Edition - фактически тот же самый, что у аналогичных Xeon MP, см. www.terralab.ru/system/29365 . |
Если Pentium 4 3,40 ГГц (на ядре Northwood) и Pentium 4 Extreme Edition 3,40 ГГц - это по сути те же, что и раньше, процессоры - теперь с чуть более высокой частотой ядра, то наибольший интерес для нас представляет линейка новичков на ядре Prescott. «Прескотты» внешне почти ничем не отличаются от традиционных Pentium 4 - они размещены в том же корпусе для разъема Socket 478 и лишь иное расположение элементов с обратной стороны корпуса (фото 1) напоминает, что перед нами именно они.
Как видим, все новые процессоры используют системную шину 800 МГц и технологию HyperThreading, кроме самого младшего - «гадкого утенка-прескотёнка», «разжалованного» до шины 533 МГц и лишенного HT. Предположительные объяснения появления такой модели: (а) необходимость продать Prescott ранних степпингов, которые не столь высокочастотны и экономичны, как текущие модификации, (б) необходимость иметь «свой Prescott» для низкостоимостных систем на чипсетах, не поддерживающих шину 800 МГц, (в) лазейку для продажи «отходов» производства более высокочастотных моделей (отбраковка старших моделей). Последнее имеет под собой более жесткие обоснования, чем это было ранее для Northwood. Дело в том, что заметно возросшие токи утечки для ядра Prescott и более высокое тепловыделение в рабочем состоянии (более 100 ватт для старших моделей) накладывает более жесткие требования на тестирование ядер для той или иной частоты/модели. Если процессоры на ядре Northwood (и предшественники) имели близкие друг к другу характеристики зависимости рассеиваемой мощности от частоты работы (с неплохой точностью подчинялись известной для структур КМОП формуле мощности от частоты), то для Prescott имеет место (по крайней мере, на данный момент) гораздо больший разброс характеристик кристаллов даже внутри одной партии и кремниевой пластины. В результате, производитель вынужден выпускать каждый конкретный экземпляр кристалла для строго определенной (по частотным и тепловым характеристикам) модели процессора с весьма небольшими допусками (запасом на отклонение в худшую и лучшую сторону). С этим связан и тот факт, что даже младшие модели Prescott будут весьма неохотно разгоняться (первое время?) - даже небольшое повышение частоты будет вызывать у них очень резкое (гораздо больше, чем у Northwood) повышение тока потребления и температуры, что негативно скажется на стабильности и «живучести» процессора. Это, кстати, подтвердил и побывавший в нашей лаборатории экземпляр - Prescott 3,20E с большим трудом удалось разогнать до 3,4 ГГц, причем работал он при этом нестабильно, выделяя гораздо больше тепла, чем на штатной частоте (не в пример аналогичным Northwood и Extreme Edition, которые подобных проблем не имели). Попутно замечу, что с процессорами Prescott стандартный плавкий термоинтерфейс с обратной стороны боксовых кулеров (фото 2) я настоятельно рекомендую заменять хорошей термопастой.
Краткое сравнение кристаллов трех типов процессоров (Extreme Edition, Northwood и Prescott) представлено в таблице 2. Для сравнения там же приведено текущее ядро процессоров AMD Athlon 64.
Таблица 2. Краткое сравнение кристаллов современных высокопроизводительных процессоров для настольных ПК |
||||
Процессор |
Intel Pentium 4 |
Intel Pentium 4 |
Intel Pentium 4 |
AMD Athlon 64 |
Частоты, ГГц |
||||
Технология производства |
90 нм, |
|||
Площадь ядра, кв. мм |
||||
Число транзисторов, млн. |
||||
Длина целочисленного конвейера |
||||
Объем кэш-памяти данных первого уровня |
||||
Латентность кэш-памяти первого уровня* |
||||
Ассоциативность кэш-памяти первого уровня |
||||
Объем кэш-памяти инструкций |
12 тыс. микроопераций |
12 тыс. микроопераций |
12 тыс. микроопераций |
|
Скорость доставки инструкций из кэш-памяти |
||||
Объем кэш-памяти второго уровня, кбайт |
||||
Латентность кэш-памяти второго уровня* |
~30 тактов |
~18 тактов |
~18 тактов |
~12 тактов |
Ассоциативность кэш-памяти второго уровня |
||||
Объем кэш-памяти третьего уровня |
||||
Латентность кэш-памяти третьего уровня* |
~45 тактов |
|||
Расширение набора инструкций |
SSE2/SSE/3Dnow!/ x86-64 |
|||
Технология HyperThreading |
улучшенная |
стандартная |
стандартная |
|
Напряжение питания, В |
||||
Допустимая тепловая мощность, TDP, Вт |
||||
* измеренная в программе CPU-Z 1.21. |
Количество транзисторов у Prescott увеличилось по сравнения с Northwood более, чем вдвое, но площадь кристалла при этом за счет применения нового техпроцесса даже немного уменьшилась. Вместе с тем, оба они заметно уступают по площади и числу транзисторов ядру Gallatin. Если учесть, что ячейка кэш-памяти требует шести транзисторов (плюс примерно один транзистор в расчете на одну ячейку расходуется для «вспомогательных» нужд - магистральные буферы, мультиплексторы и пр.), и это подтверждают оценки из сравнения ядер Northwood и Gallatin, то получается, что добавление 512 кбайт кэш-памяти второго уровня потребовало лишь около 30 миллионов транзисторов, а «остальные» 40 миллионов ушли на другие архитектурные усовершенствования ядра Prescott. И это - огромное количество, ведь ядро Northwood без кэш-памяти второго уровня содержит всего-то около 25 миллионов «затворов»!
Для наглядности приведу фотографии кристаллов Prescott и Northwood, на которых обозначены те или иные блоки процессора (фото 3 и 4). Подробный анализ расположения и состава каждого из этих блоков провели еще весной прошлого года специалисты сайта «Chip Architect» (подробности см. в статьях на www.chip-architect.net/news/2003_03_06_Looking_at_Intels_Prescott.html и www.chip-architect.com/news/2003_04_20_Looking_at_Intels_Prescott_part2.html ). В частности выяснилось, что многие блоки ядра Prescott существенно избыточны и/или содержат скрытые возможности, среди которых не только достаточно очевидные модули для поддержки технологии La Grande (официально Prescott ее пока не поддерживает) и шины для связи с кэш-памятью третьего уровня (самой памяти L3 на кристалле, естественно, нет), но и вероятно, блоки для реализации технологии Vanderpool и 64-битных вычислений (последнее - пока лишь предположение).
Что же касается официально объявленных нововведений ядра Prescott, то о них мы уже писали почти год назад (см. http://www.terralab.ru/system/23898 ) и с тех пор мало, что поменялось (см. таблицу 2 и рисунок 5).
В-третьих, добавлено 13 новых инструкций (Prescott New Instructions или PNI), улучшающих комплексные расчеты по SSE/SSE2/x87-FP-командам и позволяющих ускорить выполнение мультимедийных и игровых приложений (рисунок 6). По аналогии с предшественницами, эти новые инструкции назвали SSE3, они не требуют специальной поддержки со стороны операционной системы (достаточно поддержки обычных SSE) и полностью совместимы с программным обеспечением, написанным ранее для процессоров Intel. По оценкам корпорации, простая перекомпиляция (уже вышел соответствующий компилятор от Intel) приложений под SSE3 способна поднять быстродействие в среднем на 5% (и до десятков процентов в отдельных задачах). Среди уже оптимизированных для SSE3 приложений - будущая версия Unreal II, многие видеокодировщики (MainConcept, xMPEG, Ligos, Real (RV9), On2 (VP5/VP6), Pegasys TMPGEnc 3.0, Adobe Premier, Pinnacle, Sony DVD Source Creator, Ulead (MediaStudio & Video Studio), Intervideo и другие, использующие кодек DivX 5.1.1.
Несмотря на множество улучшений, в новом ядре применено и несколько вынужденных «ухудшений». Эти «ухудшения» возникли не от хорошей жизни - они фактически являются альтернативным подходом при проектировании и призваны на самом деле улучшить те или иные показатели процессора в расчете на долговременную перспективу и рост частоты ядра процессора. Главным и наиболее критичным для быстродействия процессора изменением стало (как мы и писали еще год назад, см. www.terralab.ru/system/23898 ) увеличение длины основного конвейера - с 20 до 31 такта. Именно это, а не применение новой 90-нанометровой технологии, способно в перспективе позволить поднять тактовую частоту ядра процессора до 5 ГГц и выше.
Вместе с тем, как мы прекрасно помним по переходу с 10-стадийного до 20-стадийный конвейер (от Pentium III на Pentium 4), это может существенно ухудшить быстродействие системы в некоторых задачах, где велик процент неудачных предсказаний переходов. Чтобы снова не наступать на те же грабли, корпорация предприняла ряд шагов по существенному улучшению работы блока предсказания ветвлений и предвыборки данных. Этой же цели (уменьшения потерь производительности за счет удлинения конвейера) служит и вдвое увеличенная кэш-память. Вместе с тем, как показали наши тесты, даже всех этих мер порой оказывается недостаточно для того, чтобы в некоторых неоптимизированных для архитектуры Intel NetBurst приложениях полностью скомпенсировать «вредное» влияние длинного конвейера. С другой стороны, на оптимизированных приложениях при таком подходе прирост производительности окажется ощутимым (вспомним, с каким скрипом Pentium 4 Willamette продвигался на рынок именно из-за отсутствия поначалу оптимизированных для него приложений).
Рисунок 9. |
Вторым «ухудшением» стала примерно вдвое возросшая латентность обоих кэшей (см. рисунок 9). Фактически это плата за их возросший объем и «задел» на будущий рост частоты ядра. В некоторых «линейных» задачах это может и не повлиять на быстродействие, но в других может оказаться весьма «болезненным». (Напомним, что длинный конвейер и возросшая латентность кэш-памяти призваны преодолеть трудности с согласованием работы блоков, расположенных в разных частях кристалла и оперирующих с некоторыми задержками друг относительно друга).
Cхемотехника у Prescott существенно изменилась по сравнению с предшественниками, и большинство блоков процессора фактически было спроектировано «с нуля» в тесном сотрудничестве с разработчиками технологии производства кремниевых чипов, чтобы оптимизировать подходы проектирования. Более того, при проектировании топологии кристалла Prescott впервые было применен полностью автоматизированный подход к трассировке и размещению элементов (например, с целью оптимизации задержек и более равномерного распределения тепла по кристаллу), в результате чего элементы блоков не обязательно расположены строго внутри геометрических границ этих блоков, блоки как бы взаимопроникают друг в друга (это видно, например, по размытости фотографии кристалла Prescott), а между блоками и элементами процессора много пустого места, которое удобно для исправления мелких схемотехнических ошибок, дальнейшей оптимизации кристалла и пр.
Рисунок 10. |
Первоначально процессоры Prescott будут работать на чипсетах Canterwood и Springdale на системной шине 800 МГц с памятью DDR400 (см. рисунок 10), но позднее для них выйдут чипсеты Alterwood и Grantsdale с поддержкой памяти DDR II, шины PCI Express, южного моста ICH6 и, видимо, системной шины 1066 МГц. Подавляющее большинство уже выпущенных системных плат на чипсетах Intel 875/865, а также последних чипсетах SiS, VIA и ATI будут совместимы с Prescott путем простого обновления BIOS (оно необходимо для правильной инициализации большей кэш-памяти), поскольку эти платы уже разрабатывались с учетом будущих повышенных требований по питанию (старшие Prescott требуют максимальный ток питания 91 ампер). Вместе с тем, разгон «Прескотта» осилит уже далеко не каждая плата - только самые лучшие.
Процессоры на ядре Prescott изготавливаются по новой для Intel 90-нанометровой технологии (это первый 90-нанометровый процессор, вышедший на рынок), причем сразу на 300-миллиметровых подложках. При производстве Prescott применяются ряд новых материалов и технологий микроэлектроники, подробности по которым мы уже не раз описывали (см., например, статьи на www.terralab.ru/system/30717 и www.terralab.ru/system/30845 ). Перечень основных технологических новшеств приведен в таблице 3. Наиболее важной и них является технология «напряженного» (strained, то есть растянутого или сжатого) кремния: деформированная в ту или иную сторону кристаллическая решетка такого кремния обеспечивает большую подвижность электронов или дырок соответственно, а значит, и более высокие частоты работы полевых транзисторов. Для борьбы с утечками транзисторов также были применены специальные меры - технологические и схемотехнические.
Таблица 3. Основные отличия интеловских технологий производства с нормами 130 и 90 нм |
|
130 нанометров |
90 нанометров |
6 слоёв медных межсоединений |
7 слоёв медных межсоединений |
Диэлектрик SIOF с низкой диэлектрической проницаемостью |
Диэлектрик CDO (легированный кремнием оксид) с низкой диэлектрической проницаемостью |
Силицид кобальта как контакт затвора |
Силицид никеля как контакт затвора |
Ячейка памяти SRAM площадью 2 кв. мкм |
Ячейка памяти SRAM площадью 1,15 кв. мкм |
248-нанометровая литография |
193-нанометровая литография |
Обычный кремний |
Напряженный кремний |
Несмотря на уменьшившуюся площадь ядра, применение новых технологии и новых материалов при производстве Prescott несколько повысило себестоимость кристаллов. Вместе с тем, себестоимость Prescott возросла незначительно, поэтому цена на модели Northwood и Prescott с одинаковой частотой будут одинаковыми. Это позволит избежать неудобных ситуаций на рынке.
Три процессора Pentium 4 с частотой 3,4 ГГц станут, по всей видимости, последними моделями для разъема Socket 478. Это связано с тем, что будущие более высокочастотные Pentium 4, даже изготовленные по более тонкой технологии, будут потреблять существенно большее количество энергии, на которое не рассчитаны существующие нынче и, как правило, приспособленные для Prescott 3,4 ГГц материнские платы. Процессоры 3,6 ГГц и выше потребуют новых спецификаций питания, и чтобы избежать путаницы с системными платами, все они будут выпускаться с разъемом Socket T (известный также как LGA 775). Аббревиатура LGA расшифровывается как Land Grid Array - по аналогии с нынешними Pin Grid Array (PGA) для процессоров или Ball Grid Array (BGA) для чипсетов или микросхем памяти. Конструктив LGA много дешевле, чем PGA или BGA и используется, например, компанией IBM.
У нас в лаборатории побывал экземпляр Pentium 4 3,20E ГГц на ядре Prescott. Безусловно, новая микроархитектура требует весьма пристального подхода для практического изучения, поэтому за те три рабочих дня, что новый процессор был в нашем распоряжении, мы лишь частично смогли постичь его потенциал. В будущем мы планируем еще не раз вернуться к детальному практическому изучению свойств нового ядра от Intel (прежде всего - быстродействия в разнообразных задачах), но уже по первым опытам стало возможным составить первое впечатление от новинки, которое мы и предлагаем вам сейчас.
Подробное описание тестовой конфигурации, участников сравнения и подробный анализ полученных данных вы сможете найти в последующих частях этого обзора на сайте www.terralab.ru , а здесь я подведу лишь предварительные краткие выводы на основе проведенных тестов.
Прежде всего, можно отметить, что у Prescott немного возросла скорость работы с системной памятью по сравнению с Northwood. Причем улучшились не только скорость чтения и полоса пропускания памяти, но и латентность, а также сложные операции (Copy, Scale, Add, Triad). Вместе с тем, на относительно старых приложениях, неоптимизированных под NetBurst, мы наблюдаем существенный проигрыш Prescott своему предшественнику (Northwood) - временами до 15%! Более того, в отдельных задачах Prescott 3,2 ГГц работает даже медленнее, чем Northwood 3,06 ГГц на шине 533 МГц! Вот этого я, признаться, не ожидал. Приложений, в которых Prescott заметно быстрее одночастотного с ним «Нортвуда», как оказалось, пока не так уж много (по крайней мере, в процентном соотношении к общему числу программ). Чаще наблюдается ситуация, когда Prescott немного проигрывает Northwood - этим, например, «грешат» многие современные и недавнего прошлого игры, аудиокодеки, простые математические расчеты. А вот видеокодирование и в некоторые профессиональные трехмерные пакеты моделирования чаще благориятствуют «Прескотту», и его преимущество над Northwood доходит, порой, до 10–15 процентов.
Таким образом, изменения в микроархитектуре NetBurst в процессорах с яром Prescott фактически потребовали новой волны оптимизации приложений. Без такой оптимизации новый процессор часто может работать даже медленнее, чем одинаковый с ним по частоте старый, невзирая на вдвое увеличившуюся кэш-память. На одинаковой частоте Prescott не может (в среднем) соперничать пока с Pentium 4 Extreme Edition. Однако у первого есть ресурсы по заметному наращиванию частоты, в то врем как P4EE и Northwood свои ресурсы практически исчерпали. Хотим мы этого или нет, но будущее Pentium 4 однозначно за Prescott. Хотя на первых порах более выгодным, видимо, будет все же приобретение процессоров на прежнем ядре. Особенно если учесть, что «Прескотты» заметно более горячие в работе, чем аналогичные Northwood и даже Extreme Edition.
Итак, Intel опрескотилась!!!
А хорошо это или плохо - судить вам. Читайте в следующих частях этого обзора:
Часть 2. Простые вычисления, работа кэш-памяти и системной памяти и производительность при работе с видео и аудио.
Часть 3.
Серия процессоров Intel Pentium 4 является наиболее удачной, если сравнивать с другими модификациями разработчика, так как на протяжении многих лет работы было доказано право на ее существование. В представленной статье можно узнать о том, чем отличаются данные процессоры, ознакомиться с их техническими характеристиками.
Поколения процессоров постоянно сменяются одно за другим за счет гонке разработчиков за частотами. Конечно, появились и новые технологии, однако были не на первом плане. Таким образом, не только пользователи, но и производители прекрасно понимали, что в один прекрасный день будет достигнута эффективная частота процессора. Это произошло после выхода в свет четвёртого поколения Intel Pentium.
Частота функционирования одного ядра в 4 GHz стала пределом. Это произошло по той причине, что кристаллу для работы необходимо было много электроэнергии. Таким образом, рассеиваемая мощность в форме колоссального тепловыделения поставила под сомнение функционирование всей системы. Дальнейшие модификации процессоров Intel и аналоги соперников стали производиться в районе 4 ГГц. Следует также упомянуть про технологии, в которых использовалось нескольких ядер, а также о внедрении специальных инструкций, способных оптимизировать работу по обработке данных.
Первый блин комом
В области высоких технологий монополия на рынке не привела ни к чему хорошему. Это подтверждают многочисленные производители электроники, которые смогли убедиться в этом на собственном опыте. Но компании Intel и Rambus приняли решение хорошо заработать. В результате был выпущен совместный продукт, подающий большие надежды. Таким образом, свет увидел первый процессор Intel Pentium 4, работающий на Socket 423 и на достаточно высокой скорости общался с оперативной памятью Rambus. В результате многие пользователи захотели стать обладателями этого быстрого компьютера. Правда, эти две компании так и не стали монополистами на рынке.
Этому стало помехой открытие двухканального режима памяти. Результаты проведенного тестирования показали высокий прирост производительности. Таким образом, новой технологией сразу заинтересовались все разработчики компьютерных комплектующих. А Что касается первого процессора Pentium 4, он и сокет 423 стали историей, так как производителем не была обеспечена платформа возможностью модернизации. На сегодняшний день комплектующие под данную платформу являются востребованными. Оказывается, несколько государственных предприятий закупили сверхбыстрые компьютеры. Таким образом, замена комплектующих несколько дешевле полного апгрейда.
Шаг в правильном направлении
Большинство обладателей персональных компьютеров, играющих в игры и предпочитающих работать с документацией и смотреть мультимедиа контент, имеют установленный Intel Pentium 4 (Socket 478). Многие тесты, которые были проведены профессионалами и энтузиастами, свидетельствуют о том, что мощности этой платформы вполне хватает для выполнения всех задач, поставленных перед рядовым пользователем. Такая платформа задействует две модификации ядер:
Willamette;
Prescott.
Их характеристики свидетельствуют о том, что отличия между двумя процессорами небольшие. Последняя модификация предусматривает поддержку 13 новых инструкций, предназначенных для оптимизации данных, которые получили краткое название SSE3. Частотный диапазон функционирования кристаллов пребывает в промежутке 1,4-3,4 ГГц, что вполне удовлетворяет требования рынка. Разработчик пошел на риск и ввел дополнительную ветку процессоров под сокет 478. Данные устройства должны были привлечь внимание ценителей игр и оверлокеров. Новая серия стала называться Intel Pentium 4 CPU Extreme Edition.
Плюсы и минусы 478 сокета
Отзывы ИТ-специалистов свидетельствуют о том, что процессор Intel Pentium 4, который функционирует на платформе 478 сокета, до сих пор считается востребованным. Далеко не каждый пользователь может позволить себе модернизацию, требующую покупки трёх базовых комплектующих. Стоит отметить, что для решения многих задач, предназначенных для улучшения производительности всей системы, стоит просто установить более мощный кристалл. Хорошо, что вторичный рынок ими переполнен, так как процессор долговечнее даже материнской платы.
Если разрабатывать апгрейд, первостепенное внимание следует уделить наиболее мощным представителям этой категории Extreme Edition, которые сегодня показывают высокие результаты при проведении проверки на производительность. В качестве минусов процессоров под Socket 478 стоит выделить рассеиваемую мощность, требующую достойного охлаждения. Таким образом, к расходам пользователя добавляется и потребность покупки достойного кулера.
Процессоры по низкой стоимости
Наверняка, многие пользователи сталкивались с моделями процессоров Intel Pentium 4, представленными на рынке. Они имеют в маркировке надпись Celeron. Данные устройства являются младшей линейкой агрегатов, которые обладают меньшей мощностью благодаря уменьшению инструкций, а также отключения блоков внутренней памяти микропроцессора (кэш). Intel Celeron предусмотрен для пользователей, которым важна в первую очередь стоимость компьютера, а не его производительность. Многие владельцы подобных устройств высказывают мнение, что младшая линейка процессоров считается отбраковкой в ходе производства кристаллов Intel Pentium 4.
Это предположение возникло на рынке в 1999 году, когда некоторые энтузиасты доказали, что Pentium 2 и его младшая модель Celeron представляют собой один и тот же процессор. Правда, за прошлые годы ситуация сильно изменилась. Теперь разработчик обладает отдельной линией по выпуску сравнительно дешевого устройства, предназначенного для нетребовательных покупателей. Кроме того, стоит помнить о том, что существует еще конкурент AMD, претендующий на вытеснение компании Intel с рынка. Таким образом, все ценовые ниши должны быть заняты высококачественной продукцией.
Новый виток эволюции
Большинство специалистов, работающих в области компьютерных технологий, имеют мнение, что именно возникновение на рынке процессора Intel Pentium 4 Prescott ознаменовало начало эпохи устройств с несколькими ядрами, а также завершило гонку за гигагерцами. С внедрением новых технологий разработчику потребовалось перейти на сокет 775, который и позволил раскрыть потенциал персональных компьютеров в работе с программами и динамическими играми, нуждающимися в больших объемах ресурсов.
Данные статистики свидетельствуют о том, что более 50% всех устройств, существующих на планете, способны работать на легендарном разъёме Socket 775, представленном компанией Intel. Выход процессора Intel Pentium D вызвал ажиотаж на рынке, так как у разработчика на одном ядре получалось запустить два потока инструкций, создавая тем самым прообраз двухъядерного устройства.
Данная технологи стала называться Hyper-threading. На сегодняшний день она является передовым решением в процессе производства кристаллов, обладающих высокой мощностью. Не стала останавливаться на достигнутом компания Intel и презентовала технологии Dual Core, Core 2 Duo и Core 2 Quad, имеющие на аппаратном уровне по несколько микропроцессоров на одном кристалле.
Двуликие процессоры
Если взять ориентир на критерий «цена-качество», то в преимуществе оказываются процессоры, имеющие два ядра. Они отличаются такими важными характеристиками, как низкая себестоимость и высокая производительность. Микропроцессоры Intel Pentium Dual Core и Core 2 Duo считаются наиболее продаваемыми в мире. Основное отличие заключается в том, что последний обладает двумя физическими ядрами, работающими независимо друг от друга. Что касается процессора Dual Core, он выполнен в виде двух контроллеров, установленных на одном кристалле, совместная работа которых неразрывно связана между собой.
Правда, частотный диапазон устройств, обладающих двумя ядрами, слегка занижен и находится в промежутке 2-2,66 ГГц. Основная проблема заключается в рассеиваемой мощности кристалла. Он довольно сильно нагревается на повышенных частотах. В качестве примера можно привести восьмую линейку Intel Pentium D (D820-D840). Они первыми получили два раздельных ядра, а также рабочие частоты, превышающие 3 ГГц. Потребляемая мощность данных процессоров достигает около 130 Вт.
Перебор с четырьмя ядрами
Усовершенствованные устройства, имеющие четыре ядра ядрами Intel(R) Pentium(R) 4 были рассчитаны на потребителей, которые стремятся приобрести комплектующие с запасом на будущее. Но рынок программного обеспечения вдруг остановился. Таким образом, разработка, тестирование, а также внедрение приложений осуществляется для оборудования, которые имеют одно или два ядра максимум. Что же делать с системами, которые обладают 6, 8 и более микропроцессорами?
Это обыкновенный маркетинговый ход, который ориентирован на потенциальных покупателей, желающих приобрести компьютер или ноутбук самой высокой мощности, существующей в мире. Можно провести аналогию с мегапикселями на фотоаппарате – лучшим оказывается не тот, на котором написано 20 Мп, а устройство с большей матрицей и фокусным расстоянием. В процессорах значение имеет набор инструкций, обрабатывающиеся программным кодом приложения. Они и выдают результат пользователю.
Таким образом, программисты должны оптимизировать этот ход, чтобы микропроцессор его без проблем и с высокой скоростью мог обработать. Стоит отметить, что слабых компьютеров на рынке много, поэтому производителям становится выгодно разрабатывать нересурсоёмкие программы. Из этого можно сделать вывод, что большая мощность компьютера на этом этапе эволюции не требуется.
Советы по модернизации
Обладателям процессора Intel Pentium 4 (775 сокет), которые хотят провести модернизацию с минимальными затратами, рекомендуется посмотреть в сторону вторичного рынка. Сначала необходимо ознакомиться с техническими характеристиками материнской платы, установленной в системе. Совершить это легко на официальном сайте разработчика. Там следует найти раздел «поддержка процессоров». Затем в средствах массовой информации нужно отыскать таблицу производительности процессоров, а после этого сравнить ее с характеристиками материнской платы, отобрав несколько оптимальных вариантов. Также необходимо изучить отзывы по выбранным устройствам.
Затем предлагается приступить к поиску требуемого процессора, который уже был в употреблении. Для большинства платформ, где осуществляется поддержка работы микропроцессоров с четырьмя ядрами, желательно устанавливать Intel Core Quad 6600. Когда система способна работать лишь с двухъядерными кристаллами, следует найти серверный вариант Intel Xeon или инструмент, предназначенный для оверлокера Intel Extreme Edition. Их цена на рынке пребывает в промежутке 800-1000 рублей, что значительно дешевле любого апгрейда.
Рынок мобильных устройств
Кроме стационарных компьютеров, процессоры Intel Pentium 4 могут быть установлены на ноутбуки. Для этого разработчики предусмотрели отдельную линейку, которая в собственной маркировке содержала букву «М». Что касается характеристик мобильных процессоров, они были аналогичны стационарным компьютерам. Правда, наблюдался заниженный частотный диапазон. Таким образом, наибольшей мощностью среди процессоров для ноутбуков обладает Pentium 4M 2,66 ГГц. Хотя, с развитием платформ в мобильных версиях настолько все напутано, что даже сам разработчик Intel до сегодняшнего дня не предоставил дерево развития процессоров на собственном официальном сайте.
С применением 478-контактной платформы в ноутбуках компания изменяла только технологию обработки процессорного кода. Как результат, на одном сокете получается развести множество процессоров. Наибольшей популярностью, о чем свидетельствуют данные статистики, пользуется кристалл Intel Pentium Dual Core. Стоит отметить, что он является самым дешёвым устройством в производстве, а его рассеиваемая мощность достаточно мала, если сравнивать с аналогами.
Гонка за энергосбережением
Следует заметить, что для компьютеров потребляемая процессором мощность не считается критичной для системы. В ситуации с ноутбуком дело обстоит несколько иначе. В данном случае устройства Intel Pentium 4 вытеснены менее энергозависимыми микропроцессорами. Если пользователь ознакомится с тестами мобильных процессоров, он сможет убедиться, что по производительности старый Core 2 Quad, входящий в линейку Pentium 4, не особо отстаёт от современного кристалла Core i5. Что касается энергопотребления последнего, оно в 3,5 раза меньше. Таким образом, различие отражается на автономности работы устройства. Если проследить за рынком мобильных процессоров, легко определить, что разработчик снова вернулся к технологиям, которые были популярны в прошлом десятилетии.
Как известно, революции в компьютерном
мире случаются все реже. Да и так ли они необходимы там, где, в общем-то, "все
хорошо", где возможности систем и продуктов с лихвой покрывают нужды большинства
современных пользователей. Это в полной мере относится и к процессорам корпорации
Intel, лидера индустрии. У компании есть полная линейка высокопроизводительных
CPU всех уровней (серверные, десктопные, мобильные), тактовые частоты давно уже
перевалили за "заоблачные" 3 GHz, продажи идут просто "на ура".
И наверное, если бы не оживившиеся конкуренты (точнее, конкурент
), то все
было бы совсем хорошо.
Но "гонка гигагерцев" не прекращается. Оставим в стороне рассмотрение вопросов вроде "Кому это нужно? " и "Насколько это востребовано? " — примем лишь как факт: чтобы удержаться на плаву, производители CPU просто вынуждены тратить силы на выпуск все более быстродействующих (или как минимум более высокочастотных ) продуктов.
Начало февраля Intel отметила представлением целой обоймы новых процессоров. Компания
выпустила сразу семь новых CPU, в числе которых:
Все эти CPU рассчитаны на шину 800 MHz и поддерживают технологию Hyper-Threading. Кроме того, Intel выпустила Pentium 4 на ядре Prescott с частотой 2,8A GHz, также изготовленный по 90-нанометровому процессу, но рассчитанный на частоту FSB 533 MHz и не поддерживающий Hyper-Threading . По информации Intel, предназначен этот процессор специально для OEM-производителей ПК в ответ на их пожелания. От себя добавим — и на радость оверклокерам, которые наверняка оценят его возможности разгона.
С выпуском новых CPU семейство Pentium 4 значительно пополнилось и сейчас выглядит так, как показано в табл. 1. Естественно, пока Intel вовсе не собирается сворачивать производство Pentium 4 на ядре Northwood с FSB 533 и 800 MHz. Кроме того, в линейке остаются и несколько моделей, рассчитанных на шину 400 MHz (пять процессоров от 2A до 2,60 GHz).
Разрабатывая 90-нанометровые технологии, которые должны обеспечить нормальное
функционирование процессоров класса Prescott, инженеры Intel вынуждены
были преодолевать серьезные препятствия. Природа этих преград состояла
не в недостаточном разрешении производственного оборудования, а в проблемах
физического характера, связанных с невозможностью изготовления столь малых
транзисторов по традиционным технологиям.
Первой проявилась утечка заряда с затвора транзистора через истончившийся
слой диэлектрика между затвором и каналом. При разрешении 90 нм он "выродился"
в барьер из четырех атомов SiO2 толщиной 1,2 нм. Появилась необходимость
в новых изолирующих материалах с более высоким значением константы диэлектрической
проницаемости (high-K dielectric). За счет большей проницаемости они позволяют
наращивать толстый (до 3 нм) изолирующий слой, не создавая при этом препятствий
для электрического поля затвора. Таковыми стали оксиды гафния и циркония.
К сожалению, они оказались несовместимы с применяемыми ныне поликристаллическими
затворами, да и фононные колебания, возникающие в диэлектрике, вызывают
снижение подвижности электронов в канале.
На границе с затвором наблюдается иное явление, выражающееся в значительном
повышении порогового уровня напряжения, необходимого для изменения состояния
проводимости канала транзистора. Решение было найдено в виде металлического
затвора. В прошлом году специалисты корпорации подобрали, наконец, два
подходящих металла, которые позволили сконструировать новые миниатюрные
NМOS- и PMOS-транзисторы. Какие именно металлы они использовали — до
сих пор держится в секрете.
Чтобы увеличить быстродействие транзисторов (оно определяется скоростью
перехода в открытое/закрытое состояние), Intel прибегла к формированию
канала из единого кристалла напряженного кремния. "Напряжение"
в данном случае означает деформирование кристаллической решетки материала.
Как оказалось, сквозь структурно нарушенный кремний как электроны (+10%
для NМOS), так и дырки (+25% для PMOS) проходят с меньшим сопротивлением.
Улучшение подвижности увеличивает максимальный ток транзистора в открытом
состоянии.
Для NМOS- и PMOS-транзисторов напряженное состояние достигается различными
методиками. В первом случае все очень просто: обычно транзистор сверху
"укрыт" слоем нитрида кремния, который выполняет функцию предохраняющей
маски, а для создания напряжения в канале толщину слоя нитрида увеличивают
вдвое. Это ведет к созданию дополнительной нагрузки на области истока
и стока и, соответственно, растягивает, деформирует канал.
PMOS-транзисторы "напрягают" по другой схеме. Сначала зоны
истока и стока вытравливают, а потом наращивают в них слой SiGe. Атомы
германия превышают по размерам атомы кремния и поэтому германиевые прослойки
всегда использовались для создания напряжения в кремнии. Однако особенность
технологии Intel заключается в том, что в данном случае сжатие кремниевого
канала происходит в продольном сечении.
Новый технологический процесс также позволил увеличить количество слоев
металлизации с шести до семи (медные соединения). Любопытно, что на производственной
линии "плечом к плечу" трудятся как литографические аппараты
нового поколения с длиной волны 193 нм, так и их предшественники с длиной
волны 248 нм. Вообще процент повторно использованной техники достиг 75,
что позволило снизить стоимость модернизации фабрик.
Особенности Prescott
В дискуссиях, предшествовавших выпуску процессора на ядре Prescott, он в шутку именовался не иначе как "Pentium 5". Собственно, именно таким был типичный ответ компьютерного профи на вопрос "Что такое Prescott?". Конечно, Intel не стала менять торговую марку, да и достаточных оснований для этого не было. Вспомним практику выпуска программного обеспечения — там смена номера версии происходит только при кардинальной переработке продукта, тогда как менее значительные изменения обозначаются дробными номерами версий. В процессорной индустрии дробные номера пока не приняты, и то, что Prescott продолжил линейку Pentium 4, как раз и является отражением того факта, что перемены носят не настолько радикальный характер.
Процессоры на ядре Prescott хоть и содержат немало новшеств и модификаций по сравнению
с Northwood, однако основаны на той же архитектуре NetBurst, имеют ту же корпусировку,
что и предыдущие Pentium 4, устанавливаются в тот же разъем Socket 478 и, в принципе,
должны работать на большинстве материнских плат, поддерживающих 800 MHz FSB и
обеспечивающих должные напряжения питания (естественно, потребуется обновление
BIOS).
Детальное изучение практических вопросов, касающихся Prescott, мы оставим для отдельного материала. А пока попробуем рассмотреть, какие изменения появились в Prescott, и понять, насколько этот процессор отличается от своего предшественника и чего можно в результате ожидать.
Основные новшества, реализованные в ядре Prescott, следующие:
Главные различия трех процессорных ядер, использовавшихся в Pentium 4, сведены в табл. 2. Число транзисторов в Prescott увеличилось более чем вдвое — на 70 млн. Из них, по грубым оценкам, порядка 30 млн. можно отнести на счет удвоившегося L2-кэша (дополнительные 512 KB, по 6 транзисторов на одну ячейку). Причем остается еще вполне солидное число, и даже по одному этому значению можно косвенно судить о масштабах произошедших в ядре изменений. Заметим, что, несмотря на такой рост числа элементов, площадь ядра не только не увеличилась, но даже уменьшилась по сравнению с Northwood.
С 90-нанометровым технологическим процессом все, в общем-то, понятно (конечно, на упрощенном, "пользовательском" уровне). Меньший размер транзисторов позволит снизить напряжение питания процессора и уменьшить рассеиваемую им мощность, а следовательно, и нагрев. Это откроет дорогу для дальнейшего увеличения тактовых частот, которое хотя и будет сопровождаться ростом тепловыделения, но "начало отсчета" для этого роста будет уже другим, несколько ниже. Отметим, что с учетом большего числа транзисторов в Prescott по сравнению с Northwood правильнее было бы говорить не об уменьшении, а о сохранении или же меньшем увеличении рассеиваемой мощности.
Удлиненный конвейер . Как видно из табл. 2, по длине конвейера Prescott (31 стадия) более чем наполовину превосходит Northwood. Что за этим кроется, вполне понятно: это не первый случай, когда Intel увеличивает длину конвейера, нацеливаясь на повышение тактовых частот — известно, что чем длиннее конвейер, тем лучше "разгоняется" процессорное ядро. В принципе, сложно сказать однозначно, так ли необходимо такое "удлинение" на текущем этапе, на частотах в районе 3,5 GHz — энтузиасты-оверклокеры разгоняли Pentium 4 (Northwood) и до более высоких значений. Но рано или поздно рост числа стадий оказался бы неизбежен — так почему бы не совместить это событие с выпуском нового ядра?
Увеличенные объемы кэшей и буферов . В принципе, этот пункт напрямую связан с предыдущим. Чтобы обеспечить работой длинный конвейер на высоких частотах, желательно иметь большего объема "подручный склад" в виде кэша для уменьшения количества простоев, при которых процессор ожидает загрузки требуемых данных из памяти. Кроме того, хорошо известно, что при прочих равных из двух процессоров с разной длиной конвейера производительнее окажется тот, у которого этот параметр меньше. При ошибках предсказания перехода процессор вынужден "сбрасывать" свой конвейер и загружать его работой по-новому. И чем большее число стадий в нем содержится, тем болезненнее оказываются подобные промахи. Полностью их исключить, конечно же, нельзя, и на одинаковых частотах Northwood и Prescott последний оказался бы менее производительным… не будь у него большего L2-кэша, во многом компенсирующего отставание. Естественно, здесь все зависит от специфики конкретных приложений, что мы и попытаемся проверить в практической части.
Как говорилось выше, в Prescott увеличен не только общий L2-кэш, но и L1-кэш данных, объем которого вырос с 8 до 16 KB. Также изменились его организация и часть логики работы — к примеру, введен механизм принудительного продвижения (force forwarding ), уменьшающий задержки в случаях, когда зависимая операция загрузки данных из кэша не может спекулятивно выполняться до завершения предшествующей операции помещения этих данных в кэш.
Кроме объемов кэшей, увеличению подверглась и емкость двух планировщиков, отвечающих за хранение микроопераций (uops ), которые используются в инструкциях x87/SSE/SSE2/SSE3. Это, в частности, позволило более эффективно находить параллелизм в мультимедиаалгоритмах и выполнять их с лучшей производительностью.
Собственно, некоторых новшеств в архитектуре Pentium 4, реализованных в Prescott, мы уже успели коснуться, поскольку они "разбросаны" по ядру процессора и затрагивают многие его блоки. Следующим важным изменением является…
Модифицированный блок предсказания переходов
. Как известно, точность
работы этого блока является критически важной для обеспечения высокой производительности
современного процессора. "Просматривая" программный код, следующий за
выполняемым в настоящий момент, процессор может заранее
выполнять части
данного кода — это хорошо известное спекулятивное выполнение
. Если же
в программе встречается ветвление в результате условного перехода (если-то-иначе
),
то возникает вопрос о том, какую из двух веток "лучше" выполнять заранее.
Алгоритмы в Northwood действовали относительно просто: переходы назад
предполагались
совершающимися, вперед
— нет. Это большей частью работало для циклов,
но не для других видов переходов. В Prescott используется понятие длины
перехода
: исследования показали, что если дальность перехода превышает
определенный предел, то переход с большой долей вероятности совершаться не будет
(соответственно, спекулятивно выполнять эту часть кода не нужно). Также в Prescott
введен более тщательный анализ самих условий перехода, на основании которого принимаются
решения о вероятности выполнения перехода. Кроме статических алгоритмов предсказания,
изменениям подверглись и динамические алгоритмы (кстати, новые идеи были частично
заимствованы из мобильного Pentium M).
Появление новых блоков в процессоре . Два новых блока в Prescott — это блок побитовых сдвигов и циклических сдвигов (shifter/rotator) и выделенный блок целочисленного умножения . Первый позволяет осуществлять наиболее типичные операции сдвига на одном из двух быстрых ALU, работающих на удвоенной частоте ядра CPU (в предыдущих модификациях Pentium 4 эти операции выполнялись как целочисленные и занимали несколько тактов). Для осуществления целочисленного умножения ранее задействовались ресурсы FPU, что достаточно долго — нужно было передать данные в FPU, выполнить там сравнительно медленное умножение и передать результат обратно. В Prescott для ускорения этих операций добавлен новый блок, отвечающий за такие операции умножения.
Улучшенный Hyper-Threading . Конечно, все перечисленные выше новшества введены в Prescott неспроста. По словам специалистов Intel, большинство модификаций в логике работы кэшей, очереди команд и пр. так или иначе связаны с быстродействием процессора при использовании Hyper-Threading, т. е. при одновременной работе нескольких программных потоков. В то же время на производительность "однопоточных" (single-threaded) приложений эти нововведения оказывают лишь незначительное влияние. Также в Prescott увеличился набор инструкций, которым "позволено" исполняться на процессоре параллельно (например, операция с таблицей страниц и операция с памятью, разбивающая строку кэша). Опять-таки, для однопоточных приложений невозможность совмещения подобных операций практически не сказывалась на производительности, тогда как при выполнении двух потоков такое ограничение зачастую становилось "узким местом". Другой пример — если в Northwood происходило "непопадание в кэш" (cache miss) и возникала необходимость чтения данных из оперативной памяти, следующие операции просмотра кэша откладывались до окончания этого действия. В результате одно приложение, часто "промахивающееся" мимо кэша, могло существенно затормозить работу остальных потоков. В Prescott этот конфликт легко преодолевается, операции могут выполняться параллельно. Также в Prescott была переделана логика арбитража и разделения ресурсов между потоками с целью увеличения общей производительности.
Инструкции SSE3.
Как мы помним, последний раз расширение набора SIMD-инструкций
Intel провела, выпустив первый Pentium 4 (Willamette) и реализовав в нем SSE2.
Очередное расширение, получившее название SSE3 и содержащее 13 новых инструкций,
осуществлено в Prescott. Все они, за исключением трех, используют SSE-регистры
и предназначены для повышения производительности в следующих областях:
Естественно, детальное рассмотрение всех новых инструкций выходит за рамки материала, эта информация приведена в соответствующем руководстве для программистов. Инструкции первых четырех категорий служат как для ускорения выполнения самих операций, так и для того, чтобы сделать их более "экономными" в смысле использования ресурсов процессора (и, следовательно, оптимизации работы Hyper-Threading и механизма спекулятивного выполнения). Программный код при этом также значительно сокращается и, что немаловажно, упрощается. Например, инструкция ускоренного преобразования вещественного числа в целое fisttp заменяет семь (!) команд традиционного кода. Даже по сравнению с инструкциями SSE2 (которые сами по себе также ускоряют выполнение кода и сокращают его объем) команды SSE3 во многих случаях дают немалую экономию. Две инструкции последней группы — monitor и mwait — позволяют приложению (точнее потоку ) сообщать процессору, что в данный момент оно не выполняет полезной работы и находится в режиме ожидания (например, записи в определенную ячейку памяти, возникновения прерывания или исключительной ситуации). Процессор при этом может переводиться в режим пониженного энергопотребления или же, при использовании Hyper-Threading, отдавать все ресурсы другому потоку. В общем, с SSE3 для программистов открываются новые возможности по оптимизации кода. Проблема здесь, как всегда в таких случаях, одна: пока новый набор инструкций не стал общепринятым стандартом, разработчикам ПО придется поддерживать две ветки кода (с SSE3 и без оной), чтобы приложения работали на всех процессорах…
Камо грядеши?..
В общем, объем новшеств, реализованных в ядре Prescott, вполне можно назвать
значительным. И хотя до "настоящего Pentium 5" он недотягивает, но к
"четырем с половиной" вполне может приблизиться. Переход от ядра Northwood
к Prescott — в принципе, эволюционный процесс, хорошо укладывающийся в общую
стратегию Intel. Постепенные изменения в архитектуре Pentium 4 хорошо видны на
схеме: архитектура модифицируется и пополняется новыми особенностями — идет последовательная
оптимизация процессора под определенный набор ПО.
Чего же можно ожидать от Prescott? Пожалуй, прежде всего (хотя это может показаться и несколько странным) — новых частот. Intel сама признает, что на равных частотах производительность Prescott и Northwood будет мало отличаться. Положительное влияние большого L2-кэша и прочих новшеств Prescott во многом "компенсируется" его значительно более длинным конвейером, который болезненно реагирует на ошибки предсказания переходов. И даже с учетом того, что блок этого самого предсказателя переходов был усовершенствован, все равно идеальным он быть не может. Главное преимущество Prescott в другом: новое ядро позволит дальше наращивать частоту — до значений, недостижимых ранее с Northwood. По планам Intel ядро Prescott рассчитано на два года, пока его не сменит следующее ядро, изготовленное по технологии 65 нм (0,065 мкм).
Поэтому выпущенный сейчас процессор на новом ядре Prescott не претендует прямо со старта на лавры чемпиона производительности и во всей красе должен проявить себя в будущем. Еще одним подтверждением тому является и позиционирование процессора: Pentium 4 на ядре Prescott рассчитан на mainstream-системы, в то время как топовым CPU был и остается Pentium 4 Extreme Edition. Кстати, хотя планка частот у процессоров Intel номинально поднялась до 3,4 GHz с выходом Prescott, но появление первых OEM-систем на базе Pentium 4 3,4 GHz на новом ядре произойдет несколько позднее в этом квартале (а ведь коммерческие поставки Prescott начаты еще в IV квартале 2003 г.).
Еще одна область, где может проявить себя Prescott (и наверняка проявит), — это работа ПО, оптимизированного под SSE3. Процесс оптимизации уже начался, и на сегодня существует как минимум пять приложений с поддержкой нового набора инструкций: MainConcept (MPEG-2/4), xMPEG, Ligos (MPEG-2/4), Real (RV9), On2 (VP5/VP6). В течение 2004 г. поддержка SSE3 должна появиться в таких пакетах, как Adobe Premiere, Pinnacle MPEG Encoder, Sony DVD Source Creator, Ulead MediaStudio и VideoStudio, всевозможные аудио- и видеокодеки и т. д. Вспоминая процесс оптимизации под SSE/SSE2, можно понять, что результаты SSE3 мы увидим, но отнюдь не сразу — опять-таки, это в определенном смысле "задел на будущее".
Ну а что же "по ту сторону линии фронта"? Главный конкурент Intel по-прежнему идет своим путем, все дальше отдаляясь от "генеральной линии". AMD продолжает наращивать "голую производительность", пока что обходясь значительно более низкими частотами. Контроллер памяти, в Athlon 64 перекочевавший из северного моста в процессор, подлил масла в огонь, обеспечив невиданную ранее скорость доступа к ОЗУ. А недавно был выпущен процессор с рейтингом 3400+ (нет, о полном соответствии продукту конкурентов по частоте никто не говорит…).
Однако Intel и AMD сейчас находятся примерно в равных ситуациях — их топовые процессоры ожидают выхода соответствующего оптимизированного ПО, чтобы проявить себя на полную мощность. Intel все больше "уходит в мультимедиа": для офисного ПО производительности Pentium 4 хватает с лихвой, и чтобы Prescott реализовал свой потенциал, нужны оптимизированные мультимедиаприложения (и/или высокие тактовые частоты, в возможности достижения которых можно не сомневаться). Стоит отметить тот факт, что переработка кодеков под SSE3 — пожалуй, не самая сложная операция, а эффект от этого сразу почувствуют все приложения, использующие такие кодеки (причем переработка самих приложений при этом совсем необязательна).
С другой стороны, в середине 2004 г. выйдет 64-разрядная версия Windows для платформы AMD64, на которой как раз и должны проявиться возможности Athlon 64. Конечно, здесь встанет обычный вопрос о наборе приложений под новую ОС, без которых система остается практически бесполезной. Но вспомним, что уже как минимум существуют те же кодеки, откомпилированные под 64-битные Athlon. Так что есть вероятность того, что в недалеком будущем и платформе AMD будет где себя показать. В общем, создается впечатление, что пока титаны просто накачивают мускулы, строят оборонительные сооружения и готовят тылы перед главным… нет, скорее, очередным сражением…
ВведениеЕщё в прошлом году компания Intel говорила о грядущей смене приоритетов в создании новых процессоров. Ввиду возникших трудностей на пути наращивания тактовых частот процессоров Pentium 4, компания решила сосредоточить основные усилия не на увеличении их производительности, а на расширении функциональности. В течение прошлого года были сделаны первые подвижки в этом направлении: например, CPU стали маркироваться при помощи процессорного рейтинга, а тактовая частота в маркировке была отодвинута на второй план. Однако, реальные шаги, направленные на придание процессорам новых функций, были запланированы на этот, 2005 год. Поэтому, первых в этом году анонсов процессоров мы ждали с особым нетерпением.
И вот, свершилось. Сегодня компания Intel представляет на суд потребителей новые процессоры в семействе Pentium 4, в основе которых лежит обновлённое ядро, известное под кодовым именем Prescott 2M. Хотя, взятый Intel курс на внедрение в настольные системы двуядерных процессоров пока никак не отразился в новинках, новые Pentium 4, обладающие рейтингами вида 6XX, наделены рядом новых и интересных возможностей. Именно поэтому процессоры Pentium 4 6XX на базе ядра Prescott 2M и являются столь интересными объектами для изучения: в этих CPU мы сталкиваемся с увеличенной кеш-памятью второго уровня и с новыми для сектора настольных компьютеров технологиями Enhanced Memory 64 Technology и Enhanced Intel SpeedStep.
Параллельно с линейкой Pentium 4 6XX Intel выводит на рынок и ещё один процессор, нацеленный на энтузиастов. Этот CPU, входящий в семейство Pentium 4 Extreme Edition, в отличие от линейки Pentium 4 6XX, призван поднять планку производительности и стать наиболее быстрым CPU от Intel на сегодняшний день. А потому, новый Pentium 4 Extreme Edition, хотя и лишён некоторой функциональности Pentium 4 6XX, имеет большую тактовую частоту и работает при более высокой частоте шины.
Впрочем, подходить к новым продуктам Intel можно и с другой стороны. На фоне несомненных успехов основного конкурента, компании AMD, процессоры Pentium 4 смотрелись до сегодняшнего дня не лучшим образом. Старшие модели Athlon 64 превосходили аналогичные продукты Intel как по быстродействию, так и по поддерживаемым функциям. Теперь же, очевидно, Intel предпринимает очередную попытку настичь конкурента. Увеличение кеш-памяти второго уровня в процессорах на новом ядре Prescott 2M имеет под собой цель поднять их производительность. А внедрение в Pentium 4 6XX новых технологий Enhanced Memory 64 Technology и Enhanced Intel SpeedStep можно рассматривать как ответ Intel на имеющиеся в процессорах Athlon 64 технологии AMD64 и Cool"n"Quiet.
В данном обзоре мы попробуем оценить новинки от Intel со всех сторон. Мы посмотрим как на то, какие новые возможности способны привнести новые технологии, появившееся в процессорах с ядром Prescott 2M, так и на то, насколько изменилась производительность новых CPU семейств Pentium 4 6XX и Pentium 4 Extreme Edition, и смогут ли они составить достойную конкуренцию старшим моделям процессоров Athlon 64 и Athlon 64 FX. Однако, по традиции, практическое исследование новинок предваряет небольшая теоретическая часть.
PrescottPrescott 2M
Intel Pentium 4 660
Intel Pentium 4 Extreme Edition 3.73 ГГц
Слева-направо: Pentium 4 570, Pentium 4 660,
Pentium 4 Extreme Edition 3.73 ГГц
Память: 1024MB DDR2-533 SDRAM (OCZ PC2 4300, 2 x 512MB, 4-4-4-11);
Процессор: Intel Pentium 4 660 (3.6 ГГц);
Материнская плата: ASUS P5AD2-E Premium (LGA775, i925XE Express);
Память: 1024MB DDR2-667 SDRAM (Corsair XMS2-5300, 2 x 512MB, 4-4-4-12).
Графическая карта: PowerColor RADEON X800 XT (PCI-E x16);
Дисковая подсистема: Maxtor MaXLine III 250GB (SATA150).
Процессоры:
AMD Athlon 64 FX-55 (Socket 939, 1024KB L2, 2.6GHz);
AMD Athlon 64 4000+ (Socket 939, 1024KB L2, 2.4GHz);
AMD Athlon 64 3800+ (Socket 939, 512KB L2, 2.4GHz);
AMD Athlon 64 3500+ (Socket 939, 512KB L2, 2.2GHz);
Intel Pentium 4 570 (LGA775, 1024KB L2, 3.8 GHz);
Intel Pentium 4 560 (LGA775, 1024KB L2, 3.6 GHz);
Intel Pentium 4 550 (LGA775, 1024KB L2, 3.4 GHz);
Intel Pentium 4 660 (LGA775, 2048KB L2, 3.6 GHz);
Intel Pentium 4 650 (LGA775, 2048KB L2, 3.4 GHz);
Intel Pentium 4 Extreme Edition 3.46GHz (LGA775, 2048KB L3, FSB 1066MHz);
Intel Pentium 4 Extreme Edition 3.73GHz (LGA775, 2048KB L2, FSB 1066MHz);
Материнские платы:
EPoX 9NPA Ultra (Socket 939, NVIDIA nForce4 Ultra);
Intel Desktop Board D925XECV2 (LGA775, i925XE Express).
Память:
1024MB DDR400 SDRAM (Corsair CMX512-3200XLPRO, 2 x 512MB, 2-2-2-10);
1024MB DDR2-533 SDRAM (OCZ PC2 4300, 2 x 512MB, 4-4-4-11).
Графическая карта: PowerColor RADEON X800 XT (PCI-E x16).
Дисковая подсистема: Maxtor MaXLine III 250GB (SATA150).
Intel Pentium 4 Extreme Edition 3.73 GHz (3.73 GHz, 1066 MHz FSB, 2 MB L2) - $999;
Intel Pentium 4 660 (3.60 GHz, 800 MHz FSB, 2 MB L2) - $605;
Intel Pentium 4 650 (3.40 GHz, 800 MHz FSB, 2 MB L2) - $401;
Intel Pentium 4 640 (3.20 GHz, 800 MHz FSB, 2 MB L2) - $273;
Intel Pentium 4 630 (3.00 GHz, 800 MHz FSB, 2 MB L2) - $224.
Через несколько дней после официального представления AMD своего последнего процессора Athlon64 FX-53, Intel решила объявить о выпуске на рынок 3,4-ГГц версии Prescott, которая позиционируется на конкуренцию с Athlon64, а не с Athlon64 FX-53, несмотря на одинаковый размер кэша.
Хотя стратегия Intel по гонке тактовых частот пока оказывалась вполне успешной, сегодня становится всё труднее находить аргументы в пользу процессора Prescott, который плохо наращивает свою производительность по сравнению с чипами AMD, использующими встроенный контроллер памяти.
Да, Intel нужна быстрая платформа со всеми выпестованными особенностями типа Socket 775, PCI Express и памятью DDR2, но на тактовую частоту процессора уповать уже не приходится. Это урок, который Intel уже пришлось выучить на серверном рынке, поскольку AMD получает всё более широкую поддержку своего семейства Opteron. И Pentium 4 Prescott не слишком хорошо соответствует репутации Intel, ведь его тепловой пакет TDP составляет более сотни ватт - при этом процессор не даёт сколько-нибудь ощутимых преимуществ по сравнению с предшественником Northwood.
Intel, конечно же, не почивает на лаврах - сегодня компания находится в процессе внедрения нового степпинга D0 ядра Prescott, который позволит процессору достичь тактовой частоты вплоть до 4 ГГц - как и упоминается в планах компании. Поскольку не все 3,4-ГГц версии Prescott имеют степпинг D0, мы решили привести таблицу, которая поможет отличить старые и новые процессоры Prescott.
По информации Intel, последний степпинг позволит увеличивать тактовую частоту из-за внесённых оптимизаций потребления энергии. Однако тепловой пакет нового процессора не изменился и остался на уровне 103 Вт максимум. Хотя процессор и кажется улучшенным по сравнению с 3,2-ГГц версией, его тепловыделение всё ещё несколько непропорционально по отношению к тактовой частоте. В любом случае, при покупке следует быть готовым к высокому тепловыделению процессора.
CPU-Z правильно определяет новый процессор Pentium 4: Model 3, Stepping 3 (CPUID 0F34h). Перед нами старый степпинг C0.
Новый процессор нагревается чуть сильнее.
Как вы, наверняка, знаете, Pentium 4 Prescott является ядром Pentium 4 третьего поколения. Первое, под кодовым названием Willamette, приобрела немалую популярность из-за увеличения производительности по сравнению с Pentium III Tualatin, в то же время потребляя намного больше энергии.
Второе поколение ядра под названием Northwood изготавливалось по 130-нм техпроцессу - на сегодня его по-прежнему можно называть лучшим ядром Pentium 4, поскольку процессор обеспечивает приличную производительность и неплохие возможности по "разгону". Мы уже смогли заставить несколько процессоров Northwood работать на частоте больше 4 ГГц - причём с обычными кулерами.
Сегодня на рынке присутствует большое число процессоров Pentium 4, базирующихся на ядрах Northwood или Prescott. Тактовые частоты сегодня начинаются на отметке 2,4 ГГц и заканчиваются на 3,4 ГГц, причём на этом отрезке потребитель может выбирать 20 разных моделей. Чтобы вы смогли лучше представлять себе ситуацию с процессорами Pentium 4, мы свели все модели вместе в краткую таблицу:
Процессор | FSB | Частота ядра | Ядро | HT |
Pentium 4 | 400 МГц | 2,0, 2,2, 2,4, 2,6 ГГц | Northwood | Нет |
Pentium 4 B | 533 МГц | 2,4 ГГц | Northwood | Нет |
Pentium 4 | 533 МГц | 2,26, 2,53, 2,66, 2,8 ГГц | Northwood | Нет |
Pentium 4 | 533 МГц | 3,06 ГГц | Northwood | Да |
Pentium 4 C | 800 МГц | 2,4, 2,6, 2,8 ГГц | Northwood | Да |
Pentium 4 | 800 МГц | 3,0, 3,2, 3,4 ГГц | Northwood | Да |
Pentium 4 A | 533 МГц | 2,8 ГГц | Prescott | Нет |
Pentium 4 E | 800 МГц | 2,8, 3,0, 3,2, 3,4 ГГц | Prescott | Да |
Чем дальше располагается буква по алфавиту, тем лучше процессор вы получите. Однако это относится только к сравнению двух различных моделей с одинаковой тактовой частотой - типа Pentium 4 на 2,4 ГГц и FSB400 в сравнении с Pentium 4 B на 2,4 ГГц и FSB533. Pentium 4 C работает на FSB800 и поддерживает Hyper-Threading. Единственным исключением является Pentium 4 3,06 ГГц, который работает на FSB533 - и является первым процессором, поддерживающим Hyper-Threading. Буква E обозначает модели Prescott с 1-Мбайт кэшем L2, в то же время версии этого ядра с FSB533 обозначаются буквой A.
Существует много причин, по которым лучше использовать модельные номера, а не тактовые частоты. Во-первых, в номере можно учесть множество технологических деталей, типа FSB, размера кэша, частоты или дополнительных функций - Hyper-Threading и т.д. Во-вторых, исчезнет путаница между разными версиями процессоров с одинаковой тактовой частотой - в результате чего обычный покупатель легко выберет самый быстрый процессор. В-третьих, в индустрии существует множество примеров успешного использования модельных номеров - скажем та же AMD с семейством Opteron 14x, 24x и 84x. Первая цифра номера указывает поддержку числа процессоров: 1 - для одного процессора, 2 - для двухпроцессорных систем и т.д. Цифра x может быть 2, 4, 6 и 8 - что указывает на частоты 1,6, 1,8, 2,0 и 2,2 ГГц.
Наконец, мы должны подумать о процессорах Intel Pentium M, тем более что вскоре появится новая версия с техпроцессом 90-нм (Dothan). Поскольку этот чип будет существенно быстрее Banias из-за увеличенных тактовых частот, Intel будет очень трудно аргументировать покупку 3-ГГц настольного процессора Prescott, который в некоторых приложениях работает медленнее 2,0-ГГц Dothan.
По нашим источникам, тактовые частоты должны полностью исчезнуть из названий процессоров Intel. Поскольку число доступных моделей процессоров вряд ли уменьшится, такой шаг нам кажется вполне логичным. Будущая система именования процессоров будет выглядеть примерно так: процессор Pentium 4 будет дополняться номером 5xx, а линейка Celeron - номером Celeron 3xx.
Мобильные процессоры | Настольные процессоры | |
Производительный сегмент рынка | Pentium M 755 (2,0 ГГц) Pentium M 745 (1,8 ГГц) Pentium M 735 (1,7 ГГц) Pentium M 725 (1,6 ГГц) Pentium M 715 (1,5 ГГц) |
Pentium 4 Extreme Edition |
Массовый сегмент рынка | Pentium 4 Mobile | Pentium 4 560 (3,6 ГГц) Pentium 4 550 (3,4 ГГц) Pentium 4 540 (3,2 ГГц) Pentium 4 530 (3,0 ГГц) Pentium 4 520 (2,8 ГГц) |
"Бюджетный" сегмент рынка | Celeron M 340 (1,5 ГГц) Celeron M 330 (1,4 ГГц) Celeron M 320 (1,3 ГГц) |
Celeron D 340 (2,93 ГГц) Celeron D 330 (2,8 ГГц) Celeron D 320 (2,66 ГГц) Celeron D 310 (2,53 ГГц) |