Классификация архитектур вычислительных систем

Автор работы: Пользователь скрыл имя, 17 Ноября 2013 в 19:45, реферат

Краткое описание

По-видимому, самой ранней и наиболее известной является классификация архитектур вычислительных систем, предложенная в 1966 году М.Флинном. Классификация базируется на понятии потока, под которым понимается последовательность элементов, команд или данных, обрабатываемая процессором. На основе числа потоков команд и потоков данных Флинн выделяет четыре класса архитектур: SISD,MISD,SIMD,MIMD.

Прикрепленные файлы: 1 файл

ref_5394_parta_ua.doc

— 864.50 Кб (Скачать документ)

Все Pentium-процессоры имеют средства SMM, возможности которых расширялись по мере появления новых моделей.

Pentium II/III

Семейство P6/6x86, первые представители появились в мае 1997 г. Семейство этих процессоров объединяет под общим именем процессоры, предназначенные для разных сегментов рынка: Pentium II (Klamath, Deschutes, Katmai) – для массового рынка ПК среднего уровня, Celeron (Covington, Mendocino, Dixon и т.д.) – для недорогих компьютеров, Xeon (Xeon, Tanner, Cascades и т.д.) – для высокопроизводительных серверов и рабочих станций. Имеет модификации для Slot 1, Slot 2, Socket 370, а также соответствующие варианты для мобильных компьютеров.

Katmai

Katmai – наименование  ядра (сентябрь 1999 г.) процессоров Pentium III, пришедшего на смену Deschutes. Добавлен блок SSE (Streaming SIMD Extensions), расширен набор команд MMX, усовершенствован механизм потокового доступа к памяти. Техпроцесс – 0,25 мкм, тактовая частота – 450-600 МГц, кэш-память L2, размещенная на процессорной плате, – 512 Кбайт. Частота шины – 100 МГц, но в связи с задержкой Coppermine были выпущены модели 533 и 600 МГц, рассчитанные на частоту шины процессора 133 МГц.

Celeron

Celeron – семейство процессоров,  ориентированных на массовый  рынок недорогих компьютеров.  В это семейство входят модели, созданные на основе архитектур Covington, Mendocino, Dixon, Coppermine. Впервые появились в апреле 1998 года. Выпускались вначале для Slot 1, в дальнейшем – для Socket 370.

Coppermine

Coppermine – наименование  ядра процессоров Pentium III и Celeron. Технология – 0,18 мкм. Характеризуется  наличием интегрированных на  чипах процессоров 256 Кбайт кэш-памяти L2 для Pentium III и 128 Кбайт – для  Celeron. Частота – от 533 МГц и выше. Наряду с FSB100 МГц версиями Pentium III выпущены и варианты FSB133 МГц. Последние процессоры, рассчитанные на Slot 1, постепенно были вытеснены изделиями в конструктиве FC-PGA 370, рассчитанными на разъем Socket 370. Частота шины для процессоров Celeron – 66 МГц, а начиная с модели Celeron 800 – 100 МГц. Напряжение питания ядра – от 1,5 В до 1,7 В.

Coppermine T – наименование ядра  процессоров Pentium III и Celeron. Является  переходной ступенью от ядра  архитектуры Coppermine к ядру архитектуры  Tualatin. Создан по технологии 0,18 мкм. Ориентирован на работу с чипсетами, поддерживающими процессоры с ядром Tualatin.

Tualatin

Tualatin-256K – кодовое  наименование ядра и процессоров  Socket 370 Pentium III, сделанных по 0,13 мкм  техпроцессу. Это последние Pentium III. Отличаются от Coppermine более совершенными архитектурой и технологией производства. Характеризуются пониженным напряжением питания и меньшим энергопотреблением. Рабочая частота моделей для Desktop с FSB 100 МГц – 1,0, 1,1 ГГц, а с FSB 133 МГц – 1,13 ГГц и выше.

Tualatin-512K – кодовое наименование  ядра и процессоров. Содержит  ядро Tualatin, но имеет 512 Кбайт кэш-памяти L2. Процессоры предназначены исключительно для мобильных устройств, соответствующие версии для Desktop не запланированы, чтобы не конкурировать с Pentium 4. В архитектуре процессоров, созданных на основе ядра Tualatin-512K, осуществлена поддержка технологий энергосбережения. Стандартное напряжение ядра – 1,4 В и ниже. На конец 2001 г. запланирован выпуск нового поколения на ядре Tualatin с FSB 100/133 МГц для экономичных моделей мини- и субноутбуков.

Tualatin-512K DP – кодовое наименование  ядра и процессоров для серверов  и рабочих станций. Выпуск первых  моделей с рабочей частотой 1,13 ГГц и 1,26 ГГц запланирован на  вторую половину 2001 г.

Xeon

Xeon – официальное наименование  линейки процессоров, ориентированных  на использование в составе  мощных серверов и рабочих  станций.

  • Частота ядра процессора до 500 или 550 МГц
  • Системная шина с полосой пропускания 100 МГц
  • Кэш-память L2 емкостью 512 Kб, 1 Mб или 2 Mб, работающая на частоте процессора
  • Технология SSE
  • Архитектура двойной независимой шины
  • Расширенная архитектура памяти сервера
  • Датчик температуры
  • Контроль и исправление ошибок (ECC)
  • Контроль функциональной избыточности (FRC)
  • Шина системного управления - Обеспечивает эффективное взаимодействие компонентов процессора с другими аппаратными и программными средствами управления
  • Корпус процессора стандарта S.E.C.C.

Pentium IV

Будучи выпущенным в 1995 году, процессор Intel Pentium Pro стал первым CPU с архитектурой P6. С тех пор прошло уже достаточно много времени, сменилось несколько поколений процессоров, однако, по сути архитектура не менялась. Семейства Pentium II, Pentium III и Celeron имеют все то же строение ядра, отличаясь по сути только размером и организацией кэша второго уровня и наличием набора команд SSE, появившегося в Pentium III. Естественно, рано или поздно архитектура P6 должна была устареть. И дело тут вовсе не в невозможности дальнейшего наращивания тактовых частот и даже не в обострившейся в последнее время конкуренцией с AMD. Конечно, нельзя отрицать тот факт, что достигнув частоты в 1 ГГц Intel столкнулся с проблемами в дальнейшем наращивании частоты своих процессоров: Pentium III 1.13 ГГц даже пришлось отзывать в связи с его нестабильностью. Однако, эту проблему легко можно решить переходом на 0.13 мкм процесс – тем более, что его повсеместное внедрение не за горами.

Настоящая причина необходимости  новой архитектуры кроется глубже. К сожалению, дальнейшее наращивание частоты существующих процессоров приводит все к меньшему росту их производительности. Проблема в том, что латентности, то есть задержки, возникающие при обращении к тем или иным узлам процессора, по нынешним меркам в P6 уже слишком велики. Именно это явилось основной причиной, по которой Intel затеял разработку Pentium 4, которая выполнена с чистого листа. Таким образом, Pentium 4 - совершенно новый процессор, ничего общего не имеющий со своими предшественниками.

Pentium 4 - следующие после  Coppermine принципиально новые IA-32 процессоры Intel для обычных PC. Вместо традиционных GTL+ и AGTL+ используется новая системная шина Quad Pumped 100 МГц, обеспечивающая передачу данных с частотой 400 МГц и передачу адресов с частотой 200 МГц. Кэш-память L1 – 8 Кбайт, L2 – 256 Кбайт. В архитектуру введен ряд усовершенствований, направленных на увеличение тактовой частоты и производительности. Введен новый набор инструкций SSE2. Первые модели на основе ядра Willamette с тактовой частотой 1,4-1,5 ГГц выпущены 20 октября 2000 года. Разъем – Socket 423. Последняя модель рассчитана на частоту 2 ГГц, после чего ядро Willamette сменяет Northwood.

В основе лежит архитектура, названная Intel NetBurst architecture. Этим названием Intel хотел подчеркнуть, что основная цель нового процессора – ускорить выполнение задач потоковой обработки данных.

NetBurst architecture

Микроархитектура NetBurst имеет  в своей основе несколько инноваций, в комплексе и позволяющих  добиться конечной цели – гарантировать запас быстродействия и будущую наращиваемость для процессоров семейства Pentium 4. В число основных технологий входят:

  • Конвейер PentiumIV
  • Advanced Dynamic Execution.
  • Кеширование памяти
  • L1 кэш
  • L2 Advanced Transfer Cache
  • Арифметико-логическое устройство
  • SSE2. Расширенный набор инструкций для обработки потоковых данных.
  • Cистемная шина.400 MHz System Bus.

Названием Hyper Pipelined Technology конвейер Pentium 4 обязан своей длине – 20 стадий.

Рис. 6. Блок схема микроархитектуры NetBurst

Для сравнения – длина  конвейера Pentium III составляет 10 стадий. Чего же достиг Intel, так удлинив конвейер? Благодаря декомпозиции выполнения каждой команды на более мелкие этапы, каждый из этих этапов теперь может выполняться быстрее, что позволяет беспрепятственно увеличивать частоту процессора. Так, если при используемом сегодня технологическом процессе 0.18 мкм предельная частота для Pentium III составляет 1 ГГц (ну или, по более оптимистичным оценкам, 1.13 ГГц), Pentium 4 сможет достигнуть частоты 2 ГГц.

 

Рис. 7.Схема конвейера PentiumIV

Однако, у чрезмерно длинного конвейера есть и свои недостатки. Первый недостаток очевиден – каждая команда теперь, проходя большее число стадий, выполняется дольше. Поэтому, чтобы младшие модели Pentium 4 превосходили по производительности старшие модели Pentium III, частоты Pentium 4 начинаются с 1.4 ГГц. Если бы Intel выпустил бы Pentium 4 1 ГГц, то этот процессор несомненно бы проиграл в производительности гигагерцовому Pentium III.

Второй недостаток длинного конвейера  вскрывается при ошибках в  предсказании переходов. Как и любой современный процессор, Pentium 4 может выполнять инструкции не только последовательно, но и параллельно, соответственно не всегда в том порядке, как они следуют в программе и не всегда доподлинно зная направления условных переходов. Для того, чтобы выбирать в таких случаях ветви программы для дальнейшего выполнения, процессор прогнозирует результаты выполнения условных переходов на основании накопленной статистики. Однако, иногда блок предсказания переходов все же ошибается, и в этом случае приходится полностью очищать конвейер, сводя на нет всю предварительно проделанную процессором работу по выполнению не той ветви в программе. Естественно, при более длинном конвейере, его очистка обходится дороже в том смысле, что на новое заполнение конвейера уходит больше процессорных

Advanced Dynamic Execution

Целью ряда ухищрений  в архитектуре Pentium 4, под общим  названием Advanced Dynamic Execution, как раз  и является минимизация простоя процессора при неправильном предсказании переходов и увеличение вероятности правильных предсказаний. Для этого Intel улучшил блок выборки инструкций для внеочередного выполнения и повысил правильность предсказания переходов. Правда, для этого алгоритмы предсказания переходов были доработаны минимально, основным же средством для достижения цели было выбрано увеличение размеров буферов, с которыми работают соответствующие блоки процессора.

Так, для выборки следующей инструкции для исполнения используется теперь окно величиной в 126 команд против 42 команд у процессора Pentium III. Буфер же, в котором сохраняются адреса выполненных переходов и на основании которого процессор предсказывает будущие переходы, теперь увеличен до 4 Кбайт, в то время как у Pentium III его размер составлял всего 512 байт.

Результатом этого, а также благодаря небольшой доработке алгоритма, вероятность правильного предсказания переходов была улучшена по сравнению с Pentium III на 33%. Это – очень хороший показатель, поскольку теперь Pentium 4 предсказывает переходы правильно в 90-95% случаев.

Арифметико-логическое устройство (Rapid Execute Engine)

Наиболее простая часть  современного процессора – это ALU (арифметико-логическое устройство). Благодаря этому факту, Intel счел возможным увеличить его тактовую частоту внутри Pentium 4 вдвое по отношению к самому процессору. Таким образом, например, в 1.4 ГГц Pentium 4 ALU работает на частоте 2.8 ГГц.

В ALU исполняются простые целочисленные  инструкции, поэтому, производительность нового процессора при операциях  с целыми числами должна быть очень высокой. Однако, на производительности Pentium 4 при операциях с вещественными числами, MMX или SSE двукратное ускорение ALU никак не сказывается.

Таким образом, латентность ALU существенно  снижается. В частности, на выполнение одной инструкции типа add Pentium 4 1.4 ГГц тратит всего 0.35нс, в то время как выполнение этой команды у Pentium III 1 ГГц занимает 1 нс.

Поскольку Pentium 4 имеет совершенно новую архитектуру, то ему потребовался и новый чипсет. Так как Intel нацеливает свой новый процессор на приложения, работающий с потоками данных, то основной задачей такого чипсета должно являться обеспечение высоких пропускных способностей основных шин: шины памяти и системной шины, соединяющей процессор с северным мостом чипсета.

Pentium 4 использует совершенно  новую Quad Pumped процессорную шину, работающую с частотой 400 МГц. Пропускная способность такой шины в три раза больше, чем пропускная способность шины процессора Pentium III, и составляет 3.2 Гбайт/с. Благодаря такой высокой пропускной способности, минимизируются простои быстрого процессора Pentium 4 в ожидании следующей порции данных. Физически, реализуется новая системная шина путем умножения в контроллерах процессорной шины чипсета и процессора тактовой частоты, которая для Pentium 4 составляет 100 МГц, на 4.

То есть, на частоте 400 МГц работает только участок между  процессором и чипсетом.Наряду с  такой высокопроизводительной шиной, чтобы система была сбалансирована, подсистема памяти для Pentium 4 должна обеспечивать не меньшую, чем 3.2 Гбайт/с, пропускную способность. Поэтому, при создании набора системной логики для нового процессора Intel принял решение адаптировать чипсет i840, который поддерживает два канала Direct RDRAM. Как известно, пропускная способность PC800 RDRAM составляет 1.6 Гбайт/с, то есть, при использовании двух каналов Rambus, пропускная способность памяти оказывается как раз на уровне 3.2 Гбайт/с.

IA-64

Merced

Merced – кодовое наименование  ядра и первого процессора  архитектуры IA-64, аппаратно совместим  с архитектурой IA-32. Включает трехуровневую кэш-память объемом 2-4 Мбайт. Производительность примерно в три раза выше, чем у Tanner. Технология изготовления – 0,18 мкм, частота ядра – 667 МГц и выше, частота шины – 266 МГц. Превосходит Pentium Pro по операциям FPU в 20 раз. Физический интерфейс – Slot M. Поддерживает MMX и SSE2. Официальное наименование – Itanium.

Itanium – торговая марка,  под которой анонсирован 64-разрядный  процессор, ранее известный под  кодовым наименованием Merced.

McKinley

McKinley – кодовое наименование  ядра и моделей второго поколения процессоров архитектуры IA-64. Тактовая частота ядра процессоров начинается с 1 ГГц. Предполагается, что производительность, по сравнению с Merced, возрастет вдвое, а пропускная способность шины данных, имеющей результирующую частоту 400 МГц, – втрое. McKinley будет иметь увеличенные по сравнению с Merced объем кэша второго уровня и скорость работы. Потребляемая мощность составит 150 Вт. Физический интерфейс – Slot M.

Информация о работе Классификация архитектур вычислительных систем