Автор работы: Пользователь скрыл имя, 29 Октября 2015 в 19:57, реферат
Новая графическая архитектура от AMD имеет общие корни с предыдущими чипами. Cypress и другие чипы AMD остаются более эффективными по соотношению производительности и сложности GPU, а также по энергоэффективности, по сравнению с решениями конкурента, а двухчиповый Radeon HD 5970 до сих пор остаётся быстрейшей видеокартой.
Также для каждого kernel новый чип предоставляет независимую виртуальную память, и все потоки команд теперь защищены друг от друга. А в дополнение к асинхронной подаче команд, чип имеет два двунаправленных контроллера прямого доступа к памяти (DMA), что поможет увеличить пропускную способность в обоих направлениях.
Рисунок 2.3 – Архитектура GPU
Но и это ещё не все «вычислительные» изменения в Cayman. Появилась возможность выборки данных из памяти в обход ALU напрямую в локальную память, а оптимизированные чтение и комбинированная запись данных увеличила производительность подсистемы ввода-вывода. Также в новом GPU было улучшено управление потоком передачи данных (flow control) и многое другое.
Одним из основных архитектурных преимуществ конкурирующих решений от NVIDIA является распараллеленная обработка геометрии, применяемая во всех их современных решениях, которые весьма эффективны при использовании тесселяции. геометрические примитивы в топовых чипах конкурента AMD обрабатываются одновременно 16-ю блоками, в отличие от одного блока у Cypress и Barts, равно как и остальных предшествующих чипах.
Соответственно, AMD нужно было срочно улучшить производительность геометрических блоков. Частичный шаг был сделан ещё в Barts, оптимизации которого привели к повышению скорости обработки геометрии и тесселяции в полтора раза в лучшем случае. Но даже тесселятор седьмого поколения всё ещё серьёзно уступал тесселяторам Fermi первого же поколения.
Блоки обработки геометрии и тесселяции в Cayman названы уже восьмым поколением, и они получили установку геометрических примитивов (geometry setup) удвоенной скорости, улучшенную буферизацию геометрических данных и двойной блок обработки геометрии. Именно так, AMD тоже пришлось распараллеливать работу над геометрическими данными, хотя и не настолько радикально, как это сделано в GPU конкурента.
Рисунок 2.4 – Блок обработки геометрии
Двойной блок геометрии в Cayman обрабатывает два примитива за такт, то есть скорость трансформации и отбрасывания задних граней (backface culling) возросла вдвое, а нагрузка между блоками распределяется при помощи разбиения на тайлы. Вместе с улучшением буферизации, по данным AMD, это приводит к росту производительности тесселяции у топового решения Radeon HD 6970 до трёх раз, по сравнению с HD 5870.
Но всё же, чаще всего скорость обработки геометрии и тесселяции возросла вдвое, а не втрое. Даже по данным самой AMD. Они приводят и цифры из игр и бенчмарков с применением тесселяции, и приросты там достигают впечатляющих цифр порядка 30—70%, в зависимости от количества оттесселированных поверхностей и степени разбиения примитивов.
Одним из наиболее интересных изменений в Cayman, напрямую не связанным с 3D-графикой, является технология, получившая название PowerTune. Центральные процессоры давно умеют плавно или ступенчато изменять производительность и потребление, снижая некоторые параметры в простое и повышая при нагрузке. Да и видеочипы тоже умеют изменять указанные параметры, но до сих пор делали это ступенчато и не имели пределов, за которые нельзя было бы выйти.
Обычные игры и другие приложения, использующие вычисления на GPU, редко когда предъявляют повышенные требования к питанию и не подходят к опасным пределам энергопотребления, превышающим возможности системы. В отличие от тестов стабильности, вроде Furmark и OCCT, которые выжимают из системы всё до капли. Ещё в семействе Evergreen (серия Radeon HD 5000) был некий зачаток ограничителя производительности при превышении определённого уровня потребления, а в HD 6900 эта система перешла на качественно иной уровень.
Новый GPU имеет специальные датчики во всех блоках чипа, которые отслеживают параметры загрузки, таким образом графический процессор постоянно измеряет нагрузку и энергопотребление и не позволяет выйти последнему за определённый порог, автоматически регулируя частоту и напряжение так, чтобы параметры оставались в рамках указанного теплопакета. Эта технология помогает установить высокие частоты GPU и при этом не бояться, что видеокарта выйдет за безопасные пределы по энергопотреблению.
Наиболее требовательными 3D-приложениями являются средства тестирования стабильности и некоторые из синтетических тестов. А вот игры, даже самые тяжёлые, совсем не требуют максимальной энергии от GPU и не выходят за установленные рамки.
В отличие от ранних технологий управления питанием, PowerTune
обеспечивает прямой контроль над энергопотреблением GPU, по сравнению с косвенным управлением при помощи изменения частот и напряжений. И более не требуется ставить ограничитель для избранных приложений, технология будет работать с тем же успехом для всех программ.
Изменение тактовой частоты GPU и полученная при этом производительность при разных уровнях максимального потребления наглядно отображены на следующем графике. На нём указано изменение частоты GPU видеокарты Radeon HD 6950 в тесте Perlin Noise из набора 3DMark Vantage в трёх режимах: по умолчанию и с повышенным пределом по питанию на 5% и 10%. Этот график соответствует тому, что получится при работе наиболее требовательных к питанию приложений:
В режиме по умолчанию GPU не может постоянно работать на частоте в 800 МГц, не превысив установленной AMD границы потребления, и показывает результат на уровне 140 FPS. При добавлении 5% к максимальному потреблению частота GPU становится выше, но всё ещё часто не достигает максимально положенных 800 МГц, и в результате достигается скорость 155 FPS. В случае же добавленных 10% к пределу потребления, чип всегда работает на частоте около 800 МГц и не достигает изменённой границы потребления, показывая при этом 162 средних кадров в секунду.
Если рассматривать обратную ситуацию, когда нужно снизить потребление, то и в таком случае технология будет полезна. AMD приводит пример игры Aliens vs Predator и трёх режимов: по умолчанию, -10% от максимального потребления и -20%. Если в режимах по умолчанию и -10% разница получилась небольшой, то в последнем случае, при снижении потребления на 30 Вт можно получить вполне комфортные 40 FPS вместо 50 FPS при максимальном потреблении:
Таким образом, каждый пользователь может настроить PowerTune под себя (при условии отказа от гарантий, разумеется) и выбрать или меньшее
энергопотребление системы, или более высокую производительность в тех приложениях, в которых GPU становится весьма требовательным к питанию. Можно даже вручную настраивать меньшее потребление для постоянной работы и максимальное — для требовательных приложений.
На протяжении длительного времени считалось, что видеокарты Radeon обеспечивают наиболее красивую картинку на мониторе, а решения от NVIDIA обеспечивают максимальную производительность. Последние поколения видеокарт начали опровергать данную аксиому, так как видеокарты от AMD серии Radeon стали гораздо более производительными, а решения от NVIDIA начали обеспечивать достаточно высокое качество конечного изображения. Компания AMD продолжила усовершенствовать свои решения серии Radeon не только в плане повышения производительности, но и в плане улучшения качества итогового изображения.
В этом тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:
Рисунок 3. – результаты тесты Pixel Filling
В данном тесте фильтрации 32-битных (8 бит на цвет) текстур большинство видеокарт показывают цифры, далёкие от теоретически возможных.
Получается, что HD 6970 выбирает лишь 67 текселей за один такт из 32-битных текстур при билинейной фильтрации, что почти на треть ниже теоретической цифры в 96 отфильтрованных текселей. Для HD 6950 эти цифры соответствуют 62 текселям из 88 теоретических, то есть эффективность младшей модели получилась чуть выше, и это связано с небольшой разницей по пропускной способности видеопамяти, также влияющей на результаты.
Все карты AMD показывают такую высокую производительность и значительно опережают своих соперников из стана компании NVIDIA. У них ведь и теоретические показатели скорости текстурирования весьма высоки. А вот даже топовая GTX 580 имеет лишь 64 TMU и сильно уступает моделям на Cayman, имеющим 88—96 TMU, да ещё и работающих на более высоких частотах.
Таблица -2 Сравнение видеокарт GeForce
|
||||||||||||||||||||||||||||||||||||||||||||
Рисунок 3.1.– Графическое сравнение частоты ядра видеокарт
Рисунок 3.2.– Графическое сравнение обьема памяти
видеокарт
Рисунок 3.3.– Графическое сравнение пропускной способности видеокарт
Таблица -3 Сравнение AMD и NVIDIA видеокарт
Видеокарта AMD Radeon HD 6990 имеет большие размеры в отличие от NVIDIA, также отличаются выходы, она имеет четыре miniDP выхода и
один – DVI. Оснащена двумя восьмиконтактными разъёмами для дополнительного питания, установленными в верхней части видеокарты. Максимальная потребляемая мощность отличается незначительно: для Radeon HD 6990 она составляет 375 Вт. Рекомендуемый блок питания для флагмана AMD – мощностью не менее 750 Вт с двумя 150-ваттными разъёмами дополнительного питания, а для CrossFireX-тандема из двух таких видеокарт рекомендуется блок питания мощностью не менее 1200 Вт. Имеет один разъём для создания CrossFireX- или SLI-конфигураций, размещённый традиционно сверху в передней части.
Рядом с этим разъёмом соседствует маленький переключатель, который отвечает вовсе не за выбор основного или резервного BIOS, как это сделано на Radeon HD 6970 или HD 6950, а за частоту работы графического процессора видеокарты. При его включении в положение «2» частота графического процессора увеличивается на 50 МГц. На GeForce GTX 590 такого переключателя нет, а рядом с разъёмом MIO имеются три прорези в кожухе, через которые выбрасывается часть нагретого видеокартой воздуха.
Компоновка видеокарт принципиально одинакова. И у AMD, и у NVIDIA оба графических процессора располагаются на одной плате, но на немного разной высоте относительно продольной оси. Это следствие расположения микросхем памяти видеокарт, которые, кстати, размещены не только с лицевых, но и с обратных сторон печатных плат. На каждый графический процессор приходится по восемь микросхем видеопамяти.
На Radeon HD 6990 установлены два полноценных графических процессора «Cayman». Графические процессоры несут в себе по 1536 унифицированных шейдерных процессоров, 96 текстурных блоков и 32 блока растровых операций. Защитных крышек (теплораспределителей) у кристаллов процессоров видеокарты AMD традиционно нет, а у NVIDIA, также традиционно – есть.
Видеокарта оснащена графической памятью типа GDDR5, набранной 16 микросхемами в BGA-упаковке. На Radeon HD 6990 установлено в общей сложности 4 Гбайта видеопамяти (по 2 Гбайта на каждый графический процессор). На GeForce GTX 590 на каждый процессор приходится по 1,5 Гбайта памяти, а общий объём таким образом составляет 3 Гбайта. На эталонных видеокартах с процессорами «Cayman» AMD традиционно использует микросхемы Hynix с маркировкой H5GQ2H24MFR T2C и номинальным напряжением 1,5 В при теоретической эффективной частоте 5000 МГц, на которой память и функционирует. В 2D-режиме её частота снижается до 600 МГц. Ширина шины обмена с памятью видеокарты составляет 256 бит.