Многоядерные процессы и программирование

Автор работы: Пользователь скрыл имя, 13 Мая 2014 в 15:43, реферат

Краткое описание

Цель работы: разобраться в сути многоядерных систем, в структуре многоядерной архитектуры, ее достоинствах и недостатках. И понять с чем связанно появление этих систем, с какими трудностями это сопряжено и чего ждать в будущем.

Содержание

Введение 3
1. Структура многоядерных вычислительных комплексов 4
1.1. Структура процессора 4
1.2. Структура многоядерных процессоров 4
1.3. Недостатки многоядерных процессоров 6
2. Распараллеливание процессов 10
Физический параллелизм 10
Программирование физически параллельных систем 11
Преимущества «мелкозернистого» логического параллелизма 12
Логический и физический параллелизм 14
3. Программное обеспеченье многоядерных вычислительных комплексов 15
3.1. Расчёт увеличения производительности за счет распараллеливания процессов. 15
3.2. Особенности перехода к параллельным вычислениям 16
3.3. Инструментальные средства многоядерных систем 17
Компиляторы 17
Программные отладчики 17
Аппаратные отладчики 19
Поддержка на уровне ОС 20
4. Перспективы развития многоядерных систем 24
ТЕНДЕНЦИИ РАЗВИТИЯ: ЧТО ОБЕЩАЕТ НАМ БУДУЩЕЕ? 25
ЭКСПЕРИМЕНТАЛЬНЫЕ МНОГОЯДЕРНЫЕ ЧИПЫ 26
МОБИЛЬНЫЕ ЧЕТЫРЕХЪЯДЕРНЫЕ ПРОЦЕССОРЫ 26
Заключение 27
Список использованной литературы 28

Прикрепленные файлы: 1 файл

Многоядерные процессы и программирование.docx

— 72.95 Кб (Скачать документ)

Это и привело к появлению суперкомпьютеров, которые, на данный момент, есть практически у каждой страны. И производительность суперкомпьютера, является способом демонстрации всему миру, возможностей страны, которой он принадлежит.

Производительность суперкомпьютеров увеличивается за счет совершенствования элементной базы и архитектурных решений. Элементная база определяет быстродействие транзисторов и рассеиваемую мощность, а основные архитектурные изменения направлены на распараллеливание обработки данных, то есть одновременное выполнение нескольких действий. Что означает, повышенную сложность на этапе разработки программ адаптированных под данную систему, то есть допускающих распараллеливания для получения многопоточности.

Программисты хорошо знают, как трудно отлаживать многопоточные приложения. При аварийном завершении программы зачастую требуется проанализировать стек вызовов функций во всех потоках, но обычный отладчик показывает только стек потока, на котором произошло аварийное завершение программы. Например, стандартные средства gdb плохо приспособлены для отладки многопоточных приложений, поэтому предлагаются специальные версии этого отладчика для конкретных операционных систем: в их ядра включаются дополнительные возможности отладки многопоточных приложений.

Одна из таких реализаций отладчик компании Etnus TotalView, предназначенный для платформ Linux, Unix и LynxOS. Он поддерживает многопоточность, MPI, OpenMP, языки программирования Cи/C++ и Фортран, а также смешанные коды с использованием разных языков программирования. Полезным средством оптимизации и отладки параллельных программ является пакет Intel Threading Tools. Он обеспечивает диагностику ошибок и анализ производительности многопоточных приложений, использующих модели потоков Win32 и OpenMP. Отладчик позволяет обнаруживать взаимные блокировки и гонки между потоками, локализовать проблемы на уровне исходного кода, анализировать эффективность способов повышения производительности OpenMP-программ.

Аппаратные отладчики

Для работы с виртуальными машинами аппаратный отладчик должен поддерживать ряд специальных функций, в частности, определять, к какой виртуальной машине относятся те или иные процессы и нити. Их обеспечивает, например, TRACE32 компании Lauterbach. Благодаря полной поддержке встроенных аппаратных блоков управления памятью можно одновременно отлаживать процессы на нескольких виртуальных машинах и даже два варианта одного процесса на разных виртуальных машинах. В частности, Lauterbach объявила о выпуске программного инструментария интегрированной поддержки ядра (kernel awareness) для операционной системы LynxOS-178. Чтобы получить доступ ко всем функциями TRACE32, не нужно изменять прикладные программы или ядро (применять заплаты, перехватчики, инструментальные "довески" и др.). Отлаживается именно то приложение, которое будет действовать в конечном продукте, что очень важно для его сертификации.

Среди других аппаратных отладчиков, поддерживающих работу с многоядерными конфигурациями, назовем Green Hills Probe и SuperTrace компании Green Hills, WindPower ICE компании Wind River, RealView ICE от ARM.

При разработке параллельных программ используются специализированные библиотеки и системы параллельного программирования PVM, LAM, CHMP и др. Три основных подхода к реализации этих систем различаются методами взаимодействия параллельных задач. Первый подход базируется на концепции обмена сообщениями, второй - на использовании разделяемой памяти, третий опирается на стандарт POSIX и объединяет эти два подхода.

Наиболее известным представителем первой группы является спецификация MPI (Message Passing Interface) для языков Cи и Фортран, первый вариант которой появился в 1994 году. MPI обеспечивает примерно 200 функций, охватывает множество компиляторов и операционных систем. Среди наиболее распространенных ее реализаций библиотека MPICH. Кроме того, предлагаются несколько коммерческих реализаций MPI, например MPI/Pro компании Verari Systems Software. MPI/Pro оптимизирует время работы параллельных приложений и поддерживает их масштабируемость за счет балансировки параметров производительности и использования ресурсов. Verari предлагает версии MPI/Pro для разных операционных систем, в том числе Windows, Linux, Mac OS X, LynxOS, и таких коммуникационных сред, как Gigabit Ethernet, Myrinet и InfiniBand.

Ко второй группе относится спецификация OpenMP (Open specifications for Multi-Processing). Ее первая версия, которая была выпущена в 1997 году, предназначалась для языка Фортран. К появлению OpenMP "приложили руку" компании IBM, Intel, Sun Microsystems и Hewlett-Packard. В 1998 году были созданы варианты OpenMP для языков Cи/C++, а последней является версия 2.5. Поддержка спецификации OpenMP обеспечена во всех компиляторах Intel начиная с шестой версии, в Microsoft Cи/C++ начиная с Visual Studio 2005, а также в GCC.

OpenMP - это набор специальных директив компилятору, библиотечных функций и переменных среды. Наиболее оригинальны директивы компилятору, которые используются для обозначения областей в коде и могут выполняться параллельно. Компилятор, поддерживающий OpenMP, преобразует исходный код и вставляет соответствующие вызовы функций для параллельного выполнения этих областей кода.

В третью группу входит спецификация POSIX (Portable Operating System interface for unIX), первое описание которой было опубликовано в 1986 году. Основная спецификация разработана как IEEE 1003.1 и одобрена как международный стандарт ISO/IEC 9945-1:1990. С точки зрения организации параллельных вычислений наибольший интерес представляют три части стандарта 1003.1a (OS Definition), 1003.1b (Realtime Extensions) и 1003.1c (Threads). В рамках POSIX можно реализовать параллельные вычисления на основе обмена сообщениями (аналогично MPI) или разделяемой памяти (как в OpenMP). Естественно, в POSIX допустима и любая комбинация этих методов. В наибольшей степени стандарту POSIX соответствуют (и соответствующим образом сертифицированы) операционные системы реального времени LynxOS и Integrity.

Поддержка на уровне ОС

Многоядерные процессоры потребуют от операционных систем поддержки разных архитектур многопроцессорной обработки. Компания QNX Software Systems объявила о выпуске комплекта разработчика QNX Momentics Multi-Core Edition. Этот набор инструментов предназначен для создания программного обеспечения и его миграции на многоядерные аппаратные решения нового поколения, в том числе процессоры BCM12xx и BCM14xx компании Broadcom, процессор MPC8641D компании Freescale и многоядерные процессоры Intel. Будут поддерживаться несколько моделей многопроцессорности для многоядерных архитектур: асимметричная AMP ─ обеспечение полного управления и отказоустойчивости; симметричная SMP ─ максимальные параллелизм и масштабируемость; "исключительная" BMP ─ поддержка миграции кода и снижение сложности разработки.

Поддержку многоядерных систем на базе процессоров AMD64, Sun UltraSPARC T1 и Intel обеспечивает ОС Solaris 10. Например, встроенная система виртуализации и защиты информации Solaris Containers позволяет системному администратору организовывать в рамках единой операционной системы несколько виртуальных системных разделов ─ зон. Каждой зоне допустимо назначить свой контейнер - набор локализованных системных ресурсов. Контейнеры могут служить основой для управления ресурсами на уровне ядер. Реализованные в Solaris 10 функции так называемого "прогнозируемого самовосстановления" (Predictive Self-Healing) обеспечивают автоматическое определение сбоев в работе ядер и их перевод в пассивный режим без влияния на работу остальных ядер процессора. Поддержка многоядерных систем реализована в некоторых дистрибутивах ОС Linux, например Red Hat Enterprise Linux 4.

Появление многоядерных процессоров даст мощный дополнительный толчок массовому внедрению технологий виртуализации. Назовем некоторые из известных подходов. ARINC-653 (Avionics Application Software Standard Interface). Стандартный интерфейс, разработанный компанией ARINC в 1997 году, вводит концепцию изолированных разделов на основе универсального программного интерфейса APEX (Application/Executive) между операционной системой и прикладным программным обеспечением. Требования интерфейса определены так, чтобы разрешить приложениям контролировать диспетчеризацию, связь и состояние внутренних обрабатываемых элементов.

В 2003 году принята новая редакция ARINC-653, в которой введена концепция изолированных виртуальных машин. Ее особенностью является жесткое и заранее определенное квантование времени между виртуальными машинами, а целью -обеспечение гарантий того, что не возникнут общие отказы системы. Стандарт ARINC-653 реализован для операционных систем реального времени LynxOS-178, VxWorks, Integrity, CsLeos и др.

UML ОС Linux в пользовательском режиме ─ самый универсальный эмулятор, позволяющий создавать виртуальное оборудование, которого может и не быть на физическом компьютере. Это весьма удобно для тестирования конфигураций аппаратного обеспечения. UML состоит из набора заплат к ядру Linux, которые позволяют запускать другие операционные системы в консольных окнах, и каждый пользователь может независимо загружать сколько угодно операционных и оконных систем. User-Mode Linux допускается применять для устройств с архитектурой IA-32 и PowerPC G5.

Программные среды виртуальных машин. Наиболее популярными из них являются Microsoft Virtual PC и группа программных продуктов VMware. Система виртуальных машин позволяет запускать на компьютере сразу несколько разных операционных систем и переключаться с одной на другую без перезапуска компьютера. На компьютере, работающем под управлением основной операционной системы, создаются один или несколько виртуальных компьютеров, на каждом из которых можно запустить "гостевую" ОС.

VMWare Workstation позволяет запустить несколько экземпляров Windows, Linux и NetWare. Реализованы полноценная поддержка сети, переносимость окружений и гибкий подход к работе с окружением. Проект Virtual PC изначально разрабатывала компания Connectix, но в начале 2003 года его купила корпорация Microsoft. К сожалению, после этого Virtual PC лишился поддержки "гостевых" Unix-подобных систем и был полностью ориентирован на установку Windows-cистем на других платформах.

Технология виртуализации Intel. VT, компонент многоядерной технологии поддержки виртуализации на аппаратном уровне, обеспечивает поддержку виртуальных машин на уровне процессора с помощью нового режима VMX (Virtual Machine Extensions) и десяти команд vmptrld, vmptrst, vmclear, vmread, vmwrite, vmcall, vmlauch, vmresume, vmxoff и vmxon. При этом повышаются как надежность и производительность работы приложений, так и уровень общей безопасности.

Архитектура VT поддерживает два класса ПО: монитор виртуальной машины VMM и "гостевое" программное обеспечение. Используются два режима работы root operation и non-root operation. Как правило, VMM работает в первом режиме, а "гостевые" программы во втором. Поддержку технологии виртуализации Intel намерены организовать такие производители операционных систем, как RedHat, SuSe и MontaVista. Она будет обеспечена и в других программных средствах виртуализации, например в Vmware.  Появление многоядерных процессоров вызвало опасения, что пользователям придется платить гораздо больше за лицензии на программное обеспечение. В частности, до недавнего времени такую позицию занимала корпорация Oracle. Недавно произошли позитивные изменения: стоимость лицензий на продукты Oracle для многоядерных процессоров AMD и Intel начали рассчитывать путем умножения числа ядер на коэффициент 0,5, для микропроцессоров UltraSPARC T1 на 0,25, а для многоядерных процессоров других производителей на 0,75. При лицензировании своих программных продуктов IBM считает двухъядерные процессоры AMD и Intel одним процессором, но продолжает рассматривать каждое ядро процессоров POWER как отдельный процессор. Понимая сложность задач массового перехода на многоядерные решения, основные поставщики аппаратных и программных средств организовали ассоциацию Multicore .Ее цель - создание промышленных стандартов для многоядерных систем. Сейчас Multicore работает над четырьмя самостоятельными, но взаимосвязанными стандартами: Resource Management (RAPI), Communication API (CAPI), Debug API и Transparent interprocess communication (TIPC). В рабочих встречах принимают участие представители компаний Xilinx, Express Logic, Wind River, Freescale, ARC, MIPS Technologies, Synopsys и PolyCore Software.

Несомненно, распространение многоядерных процессоров будет зависеть от реализации соответствующего программного обеспечения. Если она окажется эффективной, существенно вырастет инсталляционная база многоядерных систем.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. Перспективы развития многоядерных систем

В корпорации Intel уже говорят не о «Мультиядерности» (Multi-Core) процессоров, как это делается в отношении 2-, 4-, 8-, 16- или даже 32-ядерных решений, а о «Многоядерности» (Many-Core), говоря о размещении сотнях ядер на одном киристале.

Структура такого Many-Core-чипа подразумевает работу с тем же набором инструкций, но с помощью мощного центрального ядра или нескольких мощных CPU, «окруженных» множеством вспомогательных ядер, что поможет более эффективно обрабатывать сложные мультимедийные приложения в многопоточном режиме. Кроме ядер «общего назначения», процессоры Intel будут обладать также специализированными ядрами для выполнения различных классов задач – таких, как графика, алгоритмы распознавания речи, обработка коммуникационных протоколов.

Именно такую архитектуру представил Джастин Раттнер (Justin R. Rattner), руководитель сектора Corporate Technology Group Intel, на пресс-конференции в Токио. По его словам, таких вспомогательных ядер в новом многоядерном процессоре может насчитываться несколько дюжин. В отличие от ориентации на большие, энергоемкие вычислительные ядра с большой теплоотдачей, многоядерные кристаллы Intel будут активизировать только те ядра, которые необходимы для выполнения текущей задачи, тогда как остальные ядра будут отключены. Это позволит кристаллу потреблять ровно столько электроэнергии, сколько нужно в данный момент времени. В июле 2008 г. Корпорация Intel сообщила, что рассматривает возможность интеграции в один процессор нескольких десятков и даже тысяч вычислительных ядер. В настоящий момент Intel изучает технологии, которые смогли бы масштабировать вычисления на то количество ядер, которые они пока даже не производят. Что, несомненно, является изменением в мировоззрении, по другому сложно описать. Они поняли основную проблему многоядерных систем, с которой эти системы столкнулись на заре их появления: "Увеличения производительности, за счёт распараллеливания, нельзя добиться одними лишь hardwear-ными решениями! Программа не сможет распараллелиться,  если она этого не умеет, если её создавали для одноядерной системы." В конечном счете успех многоядерных систем будет зависеть от разработчиков, которым, вероятно, придется изменить языки программирования и переписать все существующие библиотеки. А что самое удивительное, в университетах пока не спешат переводить программы обучения в русло параллельных вычислений. При том, что сегодня нужно постараться, чтобы найти компьютер с одним ядром.

Информация о работе Многоядерные процессы и программирование