Теория информации и кодирования: логические основы ЭВМ
Автор работы: Пользователь скрыл имя, 16 Апреля 2014 в 20:32, курсовая работа
Краткое описание
Информационная технология – это совокупность конкретных технических и программных средств, с помощью которых выполняются разнообразные операции по обработке информации во всех сферах нашей жизни и деятельности. Иногда информационную технологию называют компьютерной технологией или прикладной информатикой. Информация аналоговая и цифровая. Термин «информация» восходит к латинскому informatio,– разъяснение, изложение, осведомленность.
В ЭВМ для представления чисел
в памяти используются следующие две формы:
так называемые естественная форма и полулогарифмическая
форма (экспоненциальная форма). Если выбрана
длина поля данных и форма представления
чисел, то независимо от величины числа,
его код всегда имеет фиксированное количество
двоичных цифр. Длина поля данных, используемая
для представления кода чисел, является
одной из важнейших характеристик любой
ЭВМ. Причем всегда в представлении кода
числа присутствует его знак (в отличие
от общепринятых обозначений чисел в математике).
Под естественной формой обычно понимают
представленные числа с фиксированной
запятой или точкой. Положение точки (запятой)
строго устанавливается в зависимости
от типа числа. Для правильных дробей точка
ставится перед старшим разрядом, для
смешанных дробей в определенном месте,
отделяющем целую часть числа от дробной
части. Для целых чисел точка ставится
после младшего разряда. В настоящее время
естественная форма используется в основном
для представления целых чисел. Знак числа,
во всех формах кодируется 0 (+) и 1 (-) и ставится
перед старшим разрядом. Если числа кодируются
в формате полуслова (16 бит), то этот формат
называют – формат H, если числа кодируются
в формате слова (32 бит), то этот формат
называют – формат F. Для кодировки формата
F используется шестнадцатеричная система
счисления, которая позволяет сократить
запись чисел. Достоинством естественной
формы представления чисел является наглядность
и простота, приводящая к высокой скорости
выполнения операций. Существенным недостатком
является ограниченный диапазон представления
величин, что приводит к переполнению
разрядной сетки при выходе за допустимые
границы и искажению результата. Полулогарифмическая
форма (экспоненциальная форма) используется
для представления чисел с плавающей точкой
или запятой. В электронных устройствах
для отделения целой части числа от дробной,
в отличие от привычной математической
записи, то есть запятой, используется
точка. Полулогарифмической
(экспоненциальной) формой
называется запись числа в
виде:
А=± mp^±n,
Где m - мантисса числа, p - основание
системы счисления, n – порядок.
Представленная запись называется
полулогарифмической, так как в логарифмической
форме представляется только часть числа,
а именно, p±n . Положение запятой определяется
значением порядка n. С изменением порядка
в ту или другую сторону запятая перемещается
(плавает) влево или вправо. Так как ЭВМ
для разделения целой и дробной частей
числа используется точка, то такую форму
представления чисел называют формой
числа с плавающей точкой.
2.1.
Кодирование информации
Код - это набор условных обозначений
(или сигналов) для записи (или передачи)
некоторых заранее определенных понятий.
Кодирование информации - это
процесс формирования определенного представления
информации. В более узком смысле под термином
"кодирование" часто понимают переход
от одной формы представления информации
к другой, более удобной для хранения,
передачи или обработки.
Обычно каждый образ при кодировании
(иногда говорят - шифровке) представлении
отдельным знаком. Знак - это элемент конечного
множества отличных друг от друга элементов.
В более узком смысле под термином
"кодирование" часто понимают переход
от одной формы представления информации
к другой, более удобной для хранения,
передачи или обработки.
Компьютер может обрабатывать
только информацию, представленную в числовой
форме. Вся другая информация (например,
звуки, изображения, показания приборов
и т.д.) для обработки на компьютере должна
быть преобразована в числовую форму.
Например, чтобы перевести в числовую
форму музыкальный звук, можно через небольшие
промежутки времени измерять интенсивность
звука на определенных частотах, представляя
результаты каждого измерения в числовой
форме. С помощью программ для компьютера
можно выполнить преобразования полученной
информации, например "наложить"
друг на друга звуки от разных источников.
Аналогичным образом на компьютере
можно обрабатывать текстовую информацию.
При вводе в компьютер каждая буква кодируется
определенным числом, а при выводе на внешние
устройства (экран или печать) для восприятия
человеком по этим числам строятся изображения
букв. Соответствие между набором букв
и числами называется кодировкой символов.
Как правило, все числа в компьютере
представляются с помощью нулей и единиц
(а не десяти цифр, как это привычно для
людей). Иными словами, компьютеры обычно
работают в двоичной системе счисления,
поскольку при этом устройства для их
обработки получаются значительно более
простыми. Ввод чисел в компьютер и вывод
их для чтения человеком может осуществляться
в привычной десятичной форме, а все необходимые
преобразования выполняют программы,
работающие на компьютере.
2.2. Способы кодирования информации
Одна и та же информация может
быть представлена (закодирована) в нескольких
формах. C появлением компьютеров возникла
необходимость кодирования всех видов
информации, с которыми имеет дело и отдельный
человек, и человечество в целом. Но решать
задачу кодирования информации человечество
начало задолго до появления компьютеров.
Грандиозные достижения человечества
- письменность и арифметика - есть не что
иное, как система кодирования речи и числовой
информации. Информация никогда не появляется
в чистом виде, она всегда как-то представлена,
как-то закодирована.
Двоичное кодирование - один
из распространенных способов представления
информации. В вычислительных машинах,
в роботах и станках с числовым программным
управлением, как правило, вся информация,
с которой имеет дело устройство, кодируется
в виде слов двоичного алфавита.
Кодирование символьной (текстовой)
информации. Основная операция, производимая
над отдельными символами текста - сравнение
символов.
При сравнении символов наиболее
важными аспектами являются уникальность
кода для каждого символа и длина этого
кода, а сам выбор принципа кодирования
практически не имеет значения.
Для кодирования текстов используются
различные таблицы перекодировки. Важно,
чтобы при кодировании и декодировании
одного и того же текста использовалась
одна и та же таблица.
Таблица перекодировки - таблица,
содержащая упорядоченный некоторым образом
перечень кодируемых символов, в соответствии
с которой происходит преобразование
символа в его двоичный код и обратно.
Наиболее популярные таблицы перекодировки:
ДКОИ-8, ASCII, CP1251, Unicode.
Исторически сложилось, что
в качестве длины кода для кодирования
символов было выбрано 8 бит или 1 байт.
Поэтому чаще всего одному символу текста,
хранимому в компьютере, соответствует
один байт памяти.
Различных комбинаций из 0 и
1 при длине кода 8 бит может быть 28 = 256,
поэтому с помощью одной таблицы перекодировки
можно закодировать не более 256 символов.
При длине кода в 2 байта (16 бит) можно закодировать
65536 символов.
2.3. Кодирование
числовой информации
Сходство в кодировании числовой
и текстовой информации состоит в следующем:
чтобы можно было сравнивать данные этого
типа, у разных чисел (как и у разных символов)
должен быть различный код. Основное отличие
числовых данных от символьных заключается
в том, что над числами кроме операции
сравнения производятся разнообразные
математические операции: сложение, умножение,
извлечение корня, вычисление логарифма
и пр. Правила выполнения этих операций
в математике подробно разработаны для
чисел, представленных в позиционной системе
счисления.
Основной системой счисления
для представления чисел в компьютере
является двоичная позиционная система
счисления.
2.4. Кодирование текстовой
информации
В настоящее время, большая
часть пользователей, при помощи компьютера
обрабатывает текстовую информацию, которая
состоит из символов: букв, цифр, знаков
препинания и др. Подсчитаем, сколько всего
символов и какое количество бит нам нужно.
10 цифр, 12 знаков препинания,
15 знаков арифметических действий,
буквы русского и латинского
алфавита, ВСЕГО: 155 символов, что соответствует
8 бит информации.
Единицы измерения информации.
1 байт = 8 бит
1 Кбайт = 1024 байтам
1 Мбайт = 1024 Кбайтам
1 Гбайт = 1024 Мбайтам
1 Тбайт = 1024 Гбайтам
Суть кодирования заключается
в том, что каждому символу ставят в соответствие
двоичный код от 00000000 до 11111111 или соответствующий
ему десятичный код от 0 до 255.
Необходимо помнить, что в настоящее
время для кодировки русских букв используют
пять различных кодовых таблиц (КОИ - 8,
СР1251, СР866, Мас, ISO), причем тексты, закодированные
при помощи одной таблицы не будут правильно
отображаться в другой
Основным отображением кодирования
символов является код ASCII - American Standard Code
for Information Interchange - американский стандартный
код обмена информацией, который представляет
из себя таблицу 16 на 16, где символы закодированы
в шестнадцатеричной системе счисления.
Кодирование
графической информации
Важным этапом кодирования
графического изображения является разбиение
его на дискретные элементы (дискретизация).
Основными способами представления
графики для ее хранения и обработки с
помощью компьютера являются растровые
и векторные изображения
Векторное изображение представляет
собой графический объект, состоящий из
элементарных геометрических фигур (чаще
всего отрезков и дуг). Положение этих
элементарных отрезков определяется координатами
точек и величиной радиуса. Для каждой
линии указывается двоичные коды типа
линии (сплошная, пунктирная, штрихпунктирная),
толщины и цвета.
Растровое изображение представляет
собой совокупность точек (пикселей), полученных
в результате дискретизации изображения
в соответствии с матричным принципом.
Матричный принцип кодирования
графических изображений заключается
в том, что изображение разбивается на
заданное количество строк и столбцов.
Затем каждый элемент полученной сетки
кодируется по выбранному правилу.
Pixel (picture element - элемент рисунка)
- минимальная единица изображения, цвет
и яркость которой можно задать независимо
от остального изображения.
В соответствии с матричным
принципом строятся изображения, выводимые
на принтер, отображаемые на экране дисплея,
получаемые с помощью сканера. Качество
изображения будет тем выше, чем "плотнее"
расположены пиксели, то есть чем больше
разрешающая способность устройства,
и чем точнее закодирован цвет каждого
из них. Для черно-белого изображения код
цвета каждого пикселя задается одним
битом. Если рисунок цветной, то для каждой
точки задается двоичный код ее цвета.
Поскольку и цвета кодируются
в двоичном коде, то если, например, вы
хотите использовать 16-цветный рисунок,
то для кодирования каждого пикселя вам
потребуется 4 бита (16=24), а если есть возможность
использовать 16 бит (2 байта) для кодирования
цвета одного пикселя, то вы можете передать
тогда 216 = 65536 различных цветов. Использование
трех байтов (24 битов) для кодирования
цвета одной точки позволяет отразить
16777216 (или около 17 миллионов) различных
оттенков цвета - так называемый режим
“истинного цвета" (True Color). Заметим,
что это используемые в настоящее время,
но далеко не предельные возможности современных
компьютеров.
Кодирование звуковой информации
Из курса физики вам известно,
что звук - это колебания воздуха. По своей
природе звук является непрерывным сигналом.
Если преобразовать звук в электрический
сигнал (например, с помощью микрофона),
мы увидим плавно изменяющееся с течением
времени напряжение.
Для компьютерной обработки
аналоговый сигнал нужно каким-то образом
преобразовать в последовательность двоичных
чисел, а для этого его необходимо дискретизировать
и оцифровать.
Можно поступить следующим
образом: измерять амплитуду сигнала через
равные промежутки времени и записывать
полученные числовые значения в память
компьютера.
ЗАКЛЮЧЕНИЕ
Наиболее удобной для построения
ЭВМ оказалась двоичная система счисления,
т.е. система счисления, в которой используются
только две цифры: 0 и 1, т.к с технической
точки зрения создать устройство с двумя
состояниями проще, также упрощается различение
этих состояний.
Для представления этих состояний
в цифровых системах достаточно иметь
электронные схемы, которые могут принимать
два состояния, четко различающиеся значением
какой-либо электрической величины - потенциала
или тока. Одному из значений этой величины
соответствует цифра 0, другому - 1. Относительная
простота создания электронных схем с
двумя электрическими состояниями и привела
к тому, что двоичное представление чисел
доминирует в современной цифровой технике.
При этом 0 обычно представляется низким
уровнем потенциала, а 1 - высоким уровнем.
Такой способ представления называется
положительной логикой.
Кодирование информации - это
процесс формирования определенного представления
информации. В более узком смысле под термином
"кодирование" часто понимают переход
от одной формы представления информации
к другой, более удобной для хранения,
передачи или обработки.
Компьютер может обрабатывать
только информацию, представленную в числовой
форме. Вся другая информация (звуки, изображения,
показания приборов и т.д.) для обработки
на компьютере должна быть преобразована
в числовую форму. Например, чтобы перевести
в числовую форму музыкальный звук, можно
через небольшие промежутки времени измерять
интенсивность звука на определенных
частотах, представляя результаты каждого
измерения в числовой форме. С помощью
компьютерных программ можно преобразовывать
полученную информацию, например "наложить"
друг на друга звуки от разных источников.
Аналогично на компьютере можно
обрабатывать текстовую информацию. При
вводе в компьютер каждая буква кодируется
определенным числом, а при выводе на внешние
устройства (экран или печать) для восприятия
человеком по этим числам строятся изображения
букв. Соответствие между набором букв
и числами называется кодировкой символов.