Мультимедиа. Форматы звуковых файлов

Автор работы: Пользователь скрыл имя, 13 Января 2014 в 00:12, курсовая работа

Краткое описание

Multimedia – это подхваченный всеми термин, обозначающий интерактивный инструмент для работы с графикой, анимацией, звуком и видео. Мультимедиа привносит блеск в презентации, живопись и игры, и, кроме того, доставляет удовольствие при обучении. Она превращает компьютер из настольной системы с клавиатурой и монитором в некий «космический аппарат», укомплектованный динамиками, микрофоном, наушниками, джойстиками и компакт-дисками.

Прикрепленные файлы: 1 файл

Информатика - Мультимедиа. Форматы звуковых файлов.doc

— 373.50 Кб (Скачать документ)

Теперь вы видите важность повышения частоты квантования  и разрядности звуковой платы  при записи звука. Вам необходимо знать не только амплитуду каждого выбранного интервала, но и все, что происходит с волной за единицу времени. Повышение частоты квантования и разрядности звуковой платы обеспечивает качественную запись звука, однако, следует помнить, что это приводит к значительному увеличению дискового пространства, необходимого для хранения записываемого звука. К счастью, если вы записываете голос, то нет необходимости использовать большую частоту квантования и разрядность звуковой платы.

 

Рис. 3. реальные звуковые волны имеют  весьма сложную форму и для получения их высококачественного цифрового представления требуется высокая частота квантования

 

 

Ниже приводится формула  расчета требуемого дискового пространства для хранения цифрового звука:

 

на секунду

 

В табл. 1. приведено требуемое пространство на диске для хранения записи звука продолжительностью одна минута для каждой частоты квантования при разрядности 8 бит. Первая строка в таблице соответствует низкокачественной записи голоса, а последняя строка – стандартам, установленным для цифровых аудиокомпакт-дисков.

 

Таблица 1. Требования по хранению звуковых файлов

 

Разрядность

 

Частота квантования

 

Байт для  хранения

8 бит

11,025 кГц

0,66 Мбайт/мин

8 бит

22,05 кГц

1,32 Мбайт/мин

8 бит

44,1 кГц

2,646 Мбайт/мин

16 бит

44,1 кГц

5,292 Мбайт/мин


 

Заметим, что высокая частота  квантования и разрядность не требуются, если звук был записан  и проигрывается на оборудовании более низкого качества. Например, карманный микрофон записывает звук гораздо более низкого качества, чем запись при частоте квантования 44 кГц. Если у вас высококачественная запись, то для ее воспроизведения соответственно требуется аппаратура высокого качетва.

 

Звук и типы звуковых файлов

 

Звук – это физическое природное явление, распространяющееся посредством колебаний воздуха и, следовательно, можно сказать, что мы имеем дело только с волновыми характеристиками. Задачей преобразования звука в электронный вид является повторение всех его этих самых волновых характеристик. Но электронный сигнал не является аналоговым, и может записываться посредством коротких дискретных значений. Пусть они имеют малый интервал между собой и практически неощутимы, на первый взгляд для человеческого уха, но мы должны всегда иметь в виду, что имеем дело только с эмуляцией природного явления именуемого звуком.  
     Такая запись именуется импульсно-кодовой модуляцией и являет собой последовательную запись дискретных значений. Разрядность устройства, исчисляемая в битах, говорит о том сколькими значениями одновременно в одном записанном дискрете, берется звук. Чем больше разрядность, тем больше звук соответствует оригиналу.  
     Любой звуковой файл можно представить, чтобы Вам было наиболее понятно, как базу данных. Она имеет свою структуру, о параметрах которой указывается обычно вначале файла. Потом идет структурированный список значений по определенным полям. Иногда вместо значений стоят формулы, позволяющие уменьшать размер файла. Данные файлы могут читать только специализированные программы, в которые заложен блок чтения.

 

РСМ 
РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко (я встречал только в программе 3D Audio). Но РСМ является основополагающей для всех звуковых файлов. Я бы не сказал, что это очень экономный метод для хранения данных на диске, но думаю, что от этого уже никогда точно не уйдешь, причем объемы современных винчестеров уже позволяют не обращать внимания на пару десятков мегабайт.

DPCM 
Изыскания по поводу экономного хранения звуковых данных на диске. Если Вы встречаете данную аббревиатуру, то знайте, что имеете дело с разностным РСМ. В основе данного метода лежит та вполне оправданная идея, что вычисления гораздо более громоздки по сравнению с тем, что можно просто указать значения разности.

ADPCM 
Адаптивный DPCM. Согласитесь, что при указании просто значений разности может возникнуть проблема с тем, что есть очень маленькие и очень большие значения. В результате, какие бы супер-точные измерения не были все равно имеет место искажение действительности. Поэтому в адаптивном методе добавлен коэффициэнт масштабируемости.

WAV 
Самое простое хранилище дискретных даннных. Я бы сказал прямое. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали – это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.

RIFF 
Resource Interchange File Format. Уникальная система хранения любых структурированных данных.

IFF 
Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga – одна из первых, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.

MOD 
Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента. Проще говоря, прошитый в синтезатор сэмпл.

AIF или AIFF 
Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.

AIFC или AIFF-С 
Тот же AIFF, только с заданными параметрами сжатия (компрессии).

AU 
Опять же та же гонка за экономией места. Структура файла намного проще, чем в wav, но там указан метод кодирования данных. Файлы очень мало "весят", за счет чего получили довольно широкое распространение в Интернете. Чаще всего Вы можете встретить параметры m-Law 8 кГц – моно. Но есть и 16-битные стерео-файлы с частотами 22050 и 44100 Гц. Это звуковой формат предназначен для работы со звуком в рабочих системах SUN, Linux и FreeBCD.

MID 
Файл, хранящий в себе сообщения MIDI-системе, установленной на Вашем компьютере или в устройстве.

МР3 
Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Если говорят, что там есть качество, то могу сказать, что там его немного. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для "обычных немузыкальных" людей потери не ощутимы явно.

VQF 
Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF – процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.

VOC 
Восьмибитный моно-формат от семейства SoundBlaster. Можно встретить в большом количестве старых программ, использующих звук (не музыкальных).

НСОМ 
То же самое, что и VOC (восемь бит, моно), но только для Apple Macintosh.

UL 
Стандартный формат U-Law. 8 кГц, 8 бит, моно.

RA 
Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.

SND 
Бывает двух видов. Один – это тот же AU для SUN и NeXT. Другой – это 8-мибитный моно-файл для РС и Маков с различной частотой дискретизации.

 

Существуют и другие типы звуковых файлов, но это, скорее всего, файлы различных программ для  создания и обработки музыки. В  основном, такие файлы читаются только той программой, в которой они  были созданы.

 

Компрессия аудиоданных

 

Мультимедиа-информация состоит из огромного количества цифровых данных, которые необходимо хранить в сжатом виде. Windows включает в себя средства управления компрессией аудио- и видеоизображений, которые работают с одним или более модулями декомпрессии и называются кодеками (от Компрессия и ДЕКомпрессия). Большое количество программных кодеков поставляются с Windows. Когда вы записываете или воспроизводите звук или видеофайл, Windows автоматически использует кодек.

Многие звуковые и  видеокарты имеют встроенные аппаратные кодеки. Windows сначала использует аппаратный кодек, поскольку он быстрее и не очень нагружает процессор. Если аппаратный кодек отсутствует, то Windows применяет программные кодеки. Если она не смогла найти кодек, на экране появится сообщение об ошибке, поскольку сжатый файл невозможно распаковать.

 

Программа управления компрессией  аудиоданных (Audio Compression Manager, ACM) в Windows использует следующие кодеки для компрессии/декомпрессии аудиоданных.

 

    • TrueSpeech Сodec. Кодек, ориентированный на голос, разработанный компанией DSP Group. Используйте этот кодек только при сжатии и передачи по сетям или телефонным линиям файлов, содержащих запись голоса. TrueSpeech производит компрессию данных не в реальном времени, в свою очередь, декомпрессия производится в реальном масштабе времени.
    • Microsoft GSM Audio Codec. Кодек, производящий компрессию данных монохромных звуковых записей низкого качества в реальном масштабе времени. Используйте этот кодек при записи голосовых сообщений, вставленных в сообщения электронной почты (e-mail). Для записи голосовых сообщений вы можете использовать приложение Фонограф.
    • Microsoft CCITT G.711 A-Law and U-Law Codec. Этот  кодек обеспечивает совместимость телефонных стандартов в Европе и северной Америке. Он обеспечивает коэффициент сжатия данных 2:1.
    • Microsoft ADPCM Codec. Этот кодек обеспечивает компрессию как в реальном, так и не в реальном масштабе времени, последняя используется пользователями авторских систем мультимедиа. Аудиофайлы лучше генерируются кодеком не в реальном времени масштабе времени.
    • IMA ADPCM Codec. Этот кодек был рекомендован Interactive Multimedia Association для использования на различных платформах мультимедиа. Он осуществляет компрессию в реальном масштабе времени и подобен кодеку Microsoft ADPCM.
    • Microsoft PCM converter. Этот конвертер позволяет проигрывать 16-разрядный звук на 8-разрядной звуковой карте. Вы также можете использовать этот кодек в случае, когда необходимо поддерживать частоту квантования 1 МГц для карты, поддерживающую другую частоту квантования.

 

Программное обеспечение  по преобразованию цифровой записи

 

Существует множество программ-кодеков, разработанных специально для преобразований файлов с цифровой записью. Цель каждой такой программы одна – сжатие звукового файла с наименьшей потерей качества и наибольшей степенью сжатия. У каждой из них свои плюсы и минусы: у одних качество сжатия высоко, однако скорость этого сжатия желает лучшего, другие моментально кодируют но с потерей качества, кто же захочет слушать файл с любимой музыкальной композицией, которая кряхтит, свистит и шуршит как старая дедова пластинка.

Наиболее популярные программы-кодеки приведены ниже.

 

Voice

Программное обеспечение  состоит из четырёх модулей, которые  могут работать как на одном компьютере, так и на разных. 
Первый модуль, работающий в среде Windows, отвечает за работу с внешней аппаратурой, производит непосредственно запись с телефонной (радио) линии и воспроизведение в телефонную (радио) линию звуковых файлов.

 

Рис. 4. Диалоговое окно программы Voice

 

Второй программный модуль, отвечающий за сжатие звуковых файлов, использует в свой работе стандартные алгоритмы  сжатия Wav-файлов. Используемые алгоритмы  сжатия позволяют упаковывать поступающие  сообщения до уровня 4Кбайт - 600байт за секунду. Алгоритмы сжатия можно оперативно изменять в зависимости от требуемой степени сжатия и качества звучания.

Третий программный модуль отвечает за ведение базы данных (добавление разговоров в базу данных и автоматическое удаление из неё по мере их старения). В базе данных информация хранится в течение заданного отрезка времени, после чего она либо архивируется, либо автоматически удаляется.

Последний, четвёртый программный  модуль предназначен для работы с  базой данных: поиск разговоров, их прослушивание, перезапись и ручное удаление. 
Все модули работают в 32х разрядных средах Windows. Всё программное обеспечение одновременно может работать как друг с другом, так и с другими Windows-приложениями.

 

Mpeg Encoder

Одна из лучших программ-кодеков  уходящего столетия.

 

Рис.5. Диалоговое окно программы mpeg Encoder

 

Один недостаток mpeg Encoder – уходит много времени на сжатие файла с цифровой записью. На обработку звукового файла продолжительностью около 3-5 минут уходит порядка 25-40 минут. Но ожидания стоят того – качество не отличается от оригинала.

Программа состоит только из одного диалогового окна, что упрощает работу. Не требуется каких-либо дополнительных знаний в области преобразований цифровой информации и т.п., вы указываете путь к исходящему файлу в поле SOURCE и в поле TARGET конечную папку, в которой будет находиться сжатый файл в формате mp3 (по умолчанию). Задаете частоту квантования, параметры качества – стерео или моно и… вперед! Смело жмем кнопку Encode.

 

LameBatch

LameBatch - это незатейливая оболочка, написанная с целью упрощения работы с командными строками mp3-кодеров, называющегося LAME от Mark Taylor и компании. Оболочки основана на простом ядре.

 

Рис. 6. Диалоговое окно с  параметрами программы LameBatch

 

Содержит всего две вкладки  «Files» и «Settings», в последней вы указываете все нужные вам параметры сжатия.

Информация о работе Мультимедиа. Форматы звуковых файлов