Автор работы: Пользователь скрыл имя, 13 Января 2014 в 00:12, курсовая работа
Multimedia – это подхваченный всеми термин, обозначающий интерактивный инструмент для работы с графикой, анимацией, звуком и видео. Мультимедиа привносит блеск в презентации, живопись и игры, и, кроме того, доставляет удовольствие при обучении. Она превращает компьютер из настольной системы с клавиатурой и монитором в некий «космический аппарат», укомплектованный динамиками, микрофоном, наушниками, джойстиками и компакт-дисками.
Теперь вы видите важность повышения частоты квантования и разрядности звуковой платы при записи звука. Вам необходимо знать не только амплитуду каждого выбранного интервала, но и все, что происходит с волной за единицу времени. Повышение частоты квантования и разрядности звуковой платы обеспечивает качественную запись звука, однако, следует помнить, что это приводит к значительному увеличению дискового пространства, необходимого для хранения записываемого звука. К счастью, если вы записываете голос, то нет необходимости использовать большую частоту квантования и разрядность звуковой платы.
Рис. 3. реальные звуковые волны имеют весьма сложную форму и для получения их высококачественного цифрового представления требуется высокая частота квантования
Ниже приводится формула расчета требуемого дискового пространства для хранения цифрового звука:
В табл. 1. приведено требуемое пространство на диске для хранения записи звука продолжительностью одна минута для каждой частоты квантования при разрядности 8 бит. Первая строка в таблице соответствует низкокачественной записи голоса, а последняя строка – стандартам, установленным для цифровых аудиокомпакт-дисков.
Таблица 1. Требования по хранению звуковых файлов
Разрядность |
Частота квантования |
Байт для хранения |
8 бит |
11,025 кГц |
0,66 Мбайт/мин |
8 бит |
22,05 кГц |
1,32 Мбайт/мин |
8 бит |
44,1 кГц |
2,646 Мбайт/мин |
16 бит |
44,1 кГц |
5,292 Мбайт/мин |
Заметим, что высокая частота
квантования и разрядность не
требуются, если звук был записан
и проигрывается на оборудовании
более низкого качества. Например,
карманный микрофон записывает звук
гораздо более низкого
Звук – это физическое природное явление,
распространяющееся посредством колебаний
воздуха и, следовательно, можно сказать,
что мы имеем дело только с волновыми характеристиками.
Задачей преобразования звука в электронный
вид является повторение всех его этих
самых волновых характеристик. Но электронный
сигнал не является аналоговым, и может
записываться посредством коротких дискретных
значений. Пусть они имеют малый интервал
между собой и практически неощутимы,
на первый взгляд для человеческого уха,
но мы должны всегда иметь в виду, что имеем
дело только с эмуляцией природного явления
именуемого звуком.
Такая запись именуется импульсно-кодовой
модуляцией и являет собой последовательную
запись дискретных значений. Разрядность
устройства, исчисляемая в битах, говорит
о том сколькими значениями одновременно
в одном записанном дискрете, берется
звук. Чем больше разрядность, тем больше
звук соответствует оригиналу.
Любой звуковой файл можно представить,
чтобы Вам было наиболее понятно, как базу
данных. Она имеет свою структуру, о параметрах
которой указывается обычно вначале файла.
Потом идет структурированный список
значений по определенным полям. Иногда
вместо значений стоят формулы, позволяющие
уменьшать размер файла. Данные файлы
могут читать только специализированные
программы, в которые заложен блок чтения.
РСМ
РСМ расшифровывается как pulse code modulation,
что и является в переводе как импульсно-кодовая.
Файлы именно с таким расширением встречаются
довольно редко (я встречал только в программе
3D Audio). Но РСМ является основополагающей
для всех звуковых файлов. Я бы не сказал,
что это очень экономный метод для хранения
данных на диске, но думаю, что от этого
уже никогда точно не уйдешь, причем объемы
современных винчестеров уже позволяют
не обращать внимания на пару десятков
мегабайт.
DPCM
Изыскания по поводу экономного хранения
звуковых данных на диске. Если Вы встречаете
данную аббревиатуру, то знайте, что имеете
дело с разностным РСМ. В основе данного
метода лежит та вполне оправданная идея,
что вычисления гораздо более громоздки
по сравнению с тем, что можно просто указать
значения разности.
ADPCM
Адаптивный DPCM. Согласитесь, что при указании
просто значений разности может возникнуть
проблема с тем, что есть очень маленькие
и очень большие значения. В результате,
какие бы супер-точные измерения не были
все равно имеет место искажение действительности.
Поэтому в адаптивном методе добавлен
коэффициэнт масштабируемости.
WAV
Самое простое хранилище дискретных даннных.
Я бы сказал прямое. Один из типов файлов
семейства RIFF. Помимо обычных дискретных
значений, битности, количества каналов
и значений уровней громкости в wav может
быть указано еще множество параметров,
о которых Вы, скорее всего, и не подозревали
– это: метки позиций для синхронизации,
общее количество дискретных значений,
порядок воспроизведения различных частей
звукового файла, а также есть место для
того, чтобы Вы смогли разместить там текстовую
информацию.
RIFF
Resource Interchange File Format. Уникальная система
хранения любых структурированных данных.
IFF
Эта технология хранения данных проистекает
от Amiga-систем. Interchange File Format. Почти то же,
что и RIFF, только имеются некоторые нюансы.
Начнем с того, что система Amiga – одна из
первых, в которой стали задумываться
о программно-сэмплерной эмуляции музыкальных
инструментов. В результате, в данном файле
звук делится на две части: то, что должно
звучать вначале и элемент того, что идет
за началом. В результате, звучит начало
один раз, за тем повторяется второй кусок
столько раз, сколько Вам нужно и нота
может звучать бесконечно долго.
MOD
Файл хранит в себе короткий образец звука,
который потом можно использовать в качестве
шаблона для инструмента. Проще говоря,
прошитый в синтезатор сэмпл.
AIF или AIFF
Audio Interchange File Format. Данный формат распространен
в системах Apple Macintosh и Silicon Graphics. Заключает
в себе сочетание MOD и WAV.
AIFC или AIFF-С
Тот же AIFF, только с заданными параметрами
сжатия (компрессии).
AU
Опять же та же гонка за экономией места.
Структура файла намного проще, чем в wav,
но там указан метод кодирования данных.
Файлы очень мало "весят", за счет
чего получили довольно широкое распространение
в Интернете. Чаще всего Вы можете встретить
параметры m-Law 8 кГц – моно. Но есть
и 16-битные стерео-файлы с частотами 22050
и 44100 Гц. Это звуковой формат предназначен
для работы со звуком в рабочих системах
SUN, Linux и FreeBCD.
MID
Файл, хранящий в себе сообщения MIDI-системе,
установленной на Вашем компьютере или
в устройстве.
МР3
Самый скандальный формат за последнее
время. Многие для объяснения параметров
сжатия, которые в нем применяют, сравнивают
его с jpeg для изображений. Там очень много
наворотов в вычислениях, чего и не перечислишь,
но коэффициент сжатия в 10-12 раз сказали
о себе сами. Если говорят, что там есть
качество, то могу сказать, что там его
немного. Специалисты говорят о контурности
звука как о самом большом недостатке
данного формата. Действительно, если
сравнивать музыку с изображением, то
смысл остался, а мелкие нюансы ушли. Качество
МР3 до сих пор вызывает много споров, но
для "обычных немузыкальных" людей
потери не ощутимы явно.
VQF
Хорошая альтернатива МР3, разве что менее
распространенная. Есть и свои недостатки.
Закодировать файл в VQF – процесс гораздо
более долгий. К тому же, очень мало бесплатных
программ, позволяющих работать с данным
форматом файлов, что, собственно, и сказалось
на его распространении.
VOC
Восьмибитный моно-формат от семейства
SoundBlaster. Можно встретить в большом количестве
старых программ, использующих звук (не
музыкальных).
НСОМ
То же самое, что и VOC (восемь бит, моно),
но только для Apple Macintosh.
UL
Стандартный формат U-Law. 8 кГц, 8 бит, моно.
RA
Real Audio или потоковая передача аудиоданных.
Довольно распространенная система передачи
звука в реальном времени через Интернет.
Скорость передачи порядка 1 Кб в секунду.
Полученный звук обладает следующими
параметрами: 8 или 16 бит и 8 или 11 кГц.
SND
Бывает двух видов. Один – это тот же
AU для SUN и NeXT. Другой – это 8-мибитный моно-файл
для РС и Маков с различной частотой дискретизации.
Существуют и другие типы звуковых файлов, но это, скорее всего, файлы различных программ для создания и обработки музыки. В основном, такие файлы читаются только той программой, в которой они были созданы.
Мультимедиа-информация состоит из огромного количества цифровых данных, которые необходимо хранить в сжатом виде. Windows включает в себя средства управления компрессией аудио- и видеоизображений, которые работают с одним или более модулями декомпрессии и называются кодеками (от Компрессия и ДЕКомпрессия). Большое количество программных кодеков поставляются с Windows. Когда вы записываете или воспроизводите звук или видеофайл, Windows автоматически использует кодек.
Многие звуковые и видеокарты имеют встроенные аппаратные кодеки. Windows сначала использует аппаратный кодек, поскольку он быстрее и не очень нагружает процессор. Если аппаратный кодек отсутствует, то Windows применяет программные кодеки. Если она не смогла найти кодек, на экране появится сообщение об ошибке, поскольку сжатый файл невозможно распаковать.
Программа управления компрессией аудиоданных (Audio Compression Manager, ACM) в Windows использует следующие кодеки для компрессии/декомпрессии аудиоданных.
Существует множество программ-
Наиболее популярные программы-кодеки приведены ниже.
Программное обеспечение
состоит из четырёх модулей, которые
могут работать как на одном компьютере,
так и на разных.
Первый модуль, работающий в среде Windows,
отвечает за работу с внешней аппаратурой,
производит непосредственно запись с
телефонной (радио) линии и воспроизведение
в телефонную (радио) линию звуковых файлов.
Рис. 4. Диалоговое окно программы Voice
Второй программный модуль, отвечающий
за сжатие звуковых файлов, использует
в свой работе стандартные алгоритмы
сжатия Wav-файлов. Используемые алгоритмы
сжатия позволяют упаковывать
Третий программный модуль отвечает за ведение базы данных (добавление разговоров в базу данных и автоматическое удаление из неё по мере их старения). В базе данных информация хранится в течение заданного отрезка времени, после чего она либо архивируется, либо автоматически удаляется.
Последний, четвёртый программный
модуль предназначен для работы с
базой данных: поиск разговоров,
их прослушивание, перезапись и ручное
удаление.
Все модули работают в 32х разрядных средах
Windows. Всё программное обеспечение одновременно
может работать как друг с другом, так
и с другими Windows-приложениями.
Одна из лучших программ-кодеков уходящего столетия.
Рис.5. Диалоговое окно программы mpeg Encoder
Один недостаток mpeg Encoder – уходит много времени на сжатие файла с цифровой записью. На обработку звукового файла продолжительностью около 3-5 минут уходит порядка 25-40 минут. Но ожидания стоят того – качество не отличается от оригинала.
Программа состоит только из одного диалогового окна, что упрощает работу. Не требуется каких-либо дополнительных знаний в области преобразований цифровой информации и т.п., вы указываете путь к исходящему файлу в поле SOURCE и в поле TARGET конечную папку, в которой будет находиться сжатый файл в формате mp3 (по умолчанию). Задаете частоту квантования, параметры качества – стерео или моно и… вперед! Смело жмем кнопку Encode.
LameBatch - это незатейливая оболочка, написанная с целью упрощения работы с командными строками mp3-кодеров, называющегося LAME от Mark Taylor и компании. Оболочки основана на простом ядре.
Рис. 6. Диалоговое окно с
параметрами программы LameBatc
Содержит всего две вкладки «Files» и «Settings», в последней вы указываете все нужные вам параметры сжатия.