Обработка звуковой информации

Автор работы: Пользователь скрыл имя, 10 Мая 2013 в 18:25, курсовая работа

Краткое описание

Цель: Рассмотреть основные приемы обработки звуковой информации средствами программ обработки аудиофайлов.
Задачи:
- познакомиться с программами обработки звука и их основными возможностями.
- изучить приемы работы программ обработки аудиофайлов.
- рассмотреть основные способы обработки звуковой информации.

Содержание

ВВЕДЕНИЕ……………………………………………………………………….3
ГЛАВА 1. ОБЩИЕ СВЕДЕНИЯ ОБ ОБРАБОТКЕ ЗВУКОВОЙ ИНФОРМАЦИИ………………………………………………………………….5
1.1. Профессиональная обработка звука…………………………………5
1.2. Цифровая и аналоговая запись……………………………………….7
1.3.Импульсная и частотная модуляция. Хранение оцифрованного звука………………………………...............................................................9
1.4.Аппаратное обеспечение обработки звуковой информации……………………………………………………………….10
1.5 Запись образцов звучания и модуляционные эффекты…………….12
ГЛАВА 2. ПРОГРАММЫ ДЛЯ ОБРАБОТКИ ЗВУКОВОЙ ИНФОРМАЦИИ………………………………………………..………………..18
2.1. Редакторы цифрового аудио и программы для написания музыки………………………………………..............................................18
2.2. Программы-анализаторы, аудио реставраторы аудио и трекеры……………………………………………………………………..20
2.3. Программы для копирования и сжатия цифрового звука с компакт-дисков……………………………………....................................................22
ЗАКЛЮЧЕНИЕ…………………………………………………………………..24
СПИСОК ЛИТЕРАТУРЫ……………………………………………………….26

Прикрепленные файлы: 1 файл

Programmy_dlya_obrabotki_zvukovoy_informatsii.doc

— 176.50 Кб (Скачать документ)


ОГЛАВЛЕНИЕ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ВВЕДЕНИЕ

 

Программы для работы с аудиоинформацией (звуком). Для серьезной работы со звуковой информацией, как правило, требуется вызвать внешний аудиоредактор, то есть как раз программу для работы со звуком. В отличие от MIDI-секвенсеров, здесь качество программы определяется не только удобством и функциональностью интерфейса, не только наличием дополнительных утилит, но и собственно алгоритмами обработки. При одних и тех же условиях и параметрах на одном и том же звуковом материале разные программы могут дать совершенно непохожие результаты. Вообще говоря, звуковая информация — вещь «неуловимая»: порой незначительное изменение одного из многих параметров обработки может дать совершенно новый на слух результат. Так что, получив хорошие звуковые результаты, не поленитесь лишний раз записать получившийся файл на диск.

Перспективы развития и использования  цифрового аудио видятся очень  широкими. Казалось бы, все, что можно  было сделать в этой области, уже  сделано. Однако это не так. Остается масса еще совсем незатронутых проблем. Например, область распознавания речи еще очень не развита. Давно уже делались и делаются попытки создать программное обеспечение, способное качественно распознавать речь человека, однако все они пока не приводят к желаемому результату. А ведь долгожданный прорыв в этой области мог бы неимоверно упростить ввод информации в компьютер. Только представьте себе, что вместо набора текста его можно было бы просто надиктовывать, попивая кофе где-нибудь неподалеку от компьютера. Имеется множество программ якобы способных предоставить такую возможность, однако все они не универсальны и сбиваются при незначительном отклонении голоса читающего от заданного тона. Такая работа приносит не столько удобств, сколько огорчений. Еще куда более сложной задачей (вполне возможно, что и неразрешимой вовсе) является распознавание общих звуков, например, звучания скрипки в звуках оркестра или выделение партии рояля. Можно надеяться, что когда-нибудь такое станет возможным, ведь человеческий мозг легко справляется с такими задачами, однако сегодня говорить о хотя бы малейших сдвигах в этой области рано.

В области синтеза звука также  есть пространство для изучения. Способов синтеза звука сегодня существует несколько, однако ни один из них не дает возможности синтезировать звук, который нельзя было бы отличить от настоящего. Если, скажем, звуки рояля или тромбона еще более-менее поддаются реализации, до правдоподобного звучания саксофона или электрогитары добиться еще так и не смогли – существует масса нюансов звучания, которые почти невозможно воссоздать искусственно. Таким образом, можно смело сказать, что в области обработки, создания и синтеза звука и музыки еще очень далеко до того решающего слова, которое поставит точку на развитии этой отрасли человеческой деятельности.

Как и графика, компьютерный звук бывает двух основных типов:

-Цифровой звук - аналог фотографии, точная цифровая копия введенных извне звуков. Это может быть сделанная с микрофона запись вашего голоса, копия звуковых дорожек с компакт-диска и т. д. Как и фотография, такой звук занимает много места... впрочем, аппетиты фотографии по сравнению со звуком просто ничтожны! Одна минута цифрового звука, записанного с максимальным качеством, занимает около 10 Мбайт. 

-Синтезированный звук - точнее, музыка в формате MIDI.

Суть MIDI-технологии можно изложить так: компьютер не просто проигрывает  нужную вам мелодию, а синтезирует  ее с помощью звуковой карты. MlDI-мелодии - это всего лишь системы команд, управляющие звуковой картой, коды нот, которые она должна "изобразить". Эта технология идеальна для компьютерных композиторов, поскольку позволяет с легкостью изменять любые параметры созданной на компьютере мелодии - заменять инструменты, добавлять или удалять их, изменять темп и даже стиль композиции. И файлы с MIDI-музыкой - крохотные, всего в несколько десятков килобайт. Но и недостатки у MIDI есть - голос в MIDI-файле не запишешь, да и музыка хорошо звучит лишь на очень качественной звуковой карте.

Можно выделить два основных типа музыкальных программ, с которыми придется работать:

-Программы для записи и обработки цифровой музыки (Sound Forge, WaveLab, CoolEdit, SAW Plus);

-Секвенсоры - редакторы синтезированной (MIDI) музыки (MidiStudio, MIDI Orchestrator Plus, Cakewaik Pro, Cubase).

Объект: Программы для обработки звуковой информации.

Предмет: Возможность обработки звуковой информации средствами программ обработки аудиофайлов.

Цель: Рассмотреть основные приемы обработки звуковой информации средствами программ обработки аудиофайлов.

Задачи:

- познакомиться с программами обработки звука и их основными возможностями.

-   изучить приемы работы программ обработки аудиофайлов.

-   рассмотреть основные способы обработки звуковой информации.

Гипотеза: Программы работы с аудиоинформацией позволяют записывать живой звук и преобразовывать его, изменяя тембр, улучшая качество звучания. 

ГЛАВА 1. ОБЩИЕ СВЕДЕНИЯ ОБ ОБРАБОТКЕ ЗВУКОВОЙ ИНФОРМАЦИИ

 

    1. Профессиональная обработка звука

 

Под обработкой звука следует понимать различные преобразования звуковой информации с целью изменения каких-то характеристик звучания. К обработке звука относятся способы создания различных звуковых эффектов, фильтрация, а также методы очистки звука от нежелательных шумов, изменения тембра и т.д. Все это огромное множество преобразований сводится, в конечном счете, к следующим основным типам:

1. Амплитудные преобразования. Выполняются  над амплитудой сигнала и приводят  к ее усилению/ослаблению или  изменению по какому-либо закону  на определенных участках сигнала.

2. Частотные преобразования. Выполняются над частотными составляющими звука: сигнал представляется в виде спектра частот через определенные промежутки времени, производится обработка необходимых частотных составляющих, например, фильтрация, и обратное "сворачивание" сигнала из спектра в волну.

3. Фазовые преобразования. Сдвиг  фазы сигнала тем или иным  способом; например, такие преобразования  стерео сигнала, позволяют реализовать  эффект вращения или "объёмности" звука.

4. Временные преобразования. Реализуются  путем наложения, растягивания/сжатия сигналов; позволяют создать, например, эффекты эха или хора, а также повлиять на пространственные характеристики звука.

Echo (эхо). Реализуется с помощью  временных преобразований. Фактически  для получения эха необходимо  на оригинальный входной сигнал наложить его задержанную во времени копию. Для того, чтобы человеческое ухо воспринимало вторую копию сигнала как повторение, а не как отзвук основного сигнала, необходимо время задержки установить равным примерно 50 мс. На основной сигнал можно наложить не одну его копию, а несколько, что позволит на выходе получить эффект многократного повторения звука (многоголосного эха). Чтобы эхо казалось затухающим, необходимо на исходный сигнал накладывать не просто задержанные копии сигнала, а приглушенные по амплитуде.

Reverberation (повторение, отражение). Эффект  заключается в придании звучанию  объемности, характерной для большого  зала, где каждый звук порождает  соответствующий, медленно угасающий  отзвук. Практически, с помощью  реверберации можно "оживить", например, фонограмму, сделанную в заглушенном помещении. От эффекта "эхо" реверберация отличается тем, что на входной сигнал накладывается задержанный во времени выходной сигнал, а не задержанная копия входного. Иными словами, блок реверберации упрощенно представляет собой петлю, где выход блока подключен к его входу, таким образом уже обработанный сигнал каждый цикл снова подается на вход смешиваясь с оригинальным сигналом.

Chorus (хор). В результате его применения  звучание сигнала превращается  как бы в звучание хора или в одновременное звучание нескольких инструментов. Схема получения такого эффекта аналогична схеме создания эффекта эха с той лишь разницей, что задержанные копии входного сигнала подвергаются слабой частотной модуляции (в среднем от 0.1 до 5 Гц) перед смешиванием со входным сигналом. Увеличение количества голосов в хоре достигается путем добавления копий сигнала с различными временами задержки.

"Обычный" аналоговый звук  представляется в аналоговой  аппаратуре непрерывным электрическим  сигналом. Компьютер оперирует с данными в цифровом виде. Это означает, что и звук в компьютере представляется в цифровом виде.

Цифровой звук - это способ представления  электрического сигнала посредством  дискретных численных значений его  амплитуды. Допустим, мы имеем аналоговую звуковую дорожку хорошего качества (говоря "хорошее качество" будем предполагать нешумную запись, содержащую спектральные составляющие из всего слышимого диапазона частот - приблизительно от 20 Гц до 20 КГц) и хотим "ввести" ее в компьютер (то есть оцифровать) без потери качества. Звуковая волна - это некая сложная функция, зависимость амплитуды звуковой волны от времени. Эту функцию описывают путем хранения ее дискретных значений в определенных точках. Иными словами, в каждой точке времени можно измерить значение амплитуды сигнала и записать в виде чисел. Однако и в этом методе есть свои недостатки, так как значения амплитуды сигнала мы не можем записывать с бесконечной точностью, и вынуждены их округлять. Говоря иначе, мы будем приближать эту функцию по двум координатным осям - амплитудной и временной. Таким образом, оцифровка сигнала включает в себя два процесса - процесс дискретизации (осуществление выборки) и процесс квантования. Процесс дискретизации - это процесс получения значений величин преобразуемого сигнала в определенные промежутки времени.

Квантование - процесс замены реальных значений сигнала приближенными  с определенной точностью. Таким  образом, оцифровка - это фиксация амплитуды  сигнала через определенные промежутки времени и регистрация полученных значений амплитуды в виде округленных цифровых значений (так как значения амплитуды являются величиной непрерывной, нет возможности конечным числом записать точное значение амплитуды сигнала, именно поэтому прибегают к округлению). Записанные значения амплитуды сигнала называются отсчетами. Очевидно, что чем чаще мы будем делать замеры амплитуды (чем выше частота дискретизации) и чем меньше мы будем округлять полученные значения (чем больше уровней квантования), тем более точное представление сигнала в цифровой форме мы получим.

Оцифрованный сигнал в виде набора последовательных значений амплитуды  можно сохранить.

Однако, надо иметь в виду, что  память компьютера не бесконечна, так  что каждый раз при оцифровке  необходимо находить какой-то компромисс между качеством (напрямую зависящим от использованных при оцифровке параметров) и занимаемым оцифрованным сигналом объемом.

А также, частота дискретизации  устанавливает верхнюю границу  частот оцифрованного сигнала, а  именно, максимальная частота спектральных составляющих равна половине частоты дискретизации сигнала. Попросту говоря, чтобы получить полную информацию о звуке в частотной полосе до 22050 Гц, необходима дискретизация с частотой не менее 44.1 КГц.

Существуют и другие проблемы и  нюансы, связанные с оцифровкой звука. Не сильно углубляясь в подробности отметим, что в "цифровом звуке" из-за дискретности информации об амплитуде оригинального сигнала появляются различные шумы и искажения. Так, например, джиттер (jitter) - шум, появляющийся в результате того, что осуществление выборки сигнала при дискретизации происходит не через абсолютно равные промежутки времени, а с какими-то отклонениями. То есть, если, скажем, дискретизация проводится с частотой 44.1 КГц, то отсчеты берутся не точно каждые 1/44100 секунды, а то немного раньше, то немного позднее. А так как входной сигнал постоянно меняется, то такая ошибка приводит к "захвату" не совсем верного уровня сигнала. В результате во время проигрывания оцифрованного сигнала может ощущаться некоторое дрожание и искажения. Появление джиттера является результатом не абсолютной стабильности аналогово-цифровых преобразователей. Для борьбы с этим явлением применяют высокостабильные тактовые генераторы. Еще одной неприятностью является шум дробления. При квантовании амплитуды сигнала происходит ее округление до ближайшего уровня. Такая погрешность вызывает ощущение "грязного" звучания.

На практике, процесс оцифровки (дискретизация и квантование  сигнала) остается невидимым для  пользователя - всю черновую работу делают разнообразные программы, которые дают соответствующие команды драйверу (управляющая подпрограмма операционной системы) звуковой карты. Любая программа (будь то встроенный в Windows Recorder или мощный звуковой редактор), способная осуществлять запись аналогового сигнала в компьютер, так или иначе оцифровывает сигнал с определенными параметрами, которые могут оказаться важными в последующей работе с записанным звуком, и именно по этой причине важно понять как происходит процесс оцифровки и какие факторы влияют на ее результаты.

 

1.2. Цифровая и аналоговая запись

 

Для преобразования дискретизованного  сигнала в аналоговый вид, пригодный  для обработки аналоговыми устройствами (усилителями и фильтрами) и последующего воспроизведения через акустические системы, служит цифроаналоговый преобразователь (ЦАП). Процесс преобразования представляет собой обратный процесс дискретизации: имея информацию о величине отсчетов (амплитуды сигнала) и беря определенное количество отсчетов в единицу времени, путем интерполирования происходит восстановление исходного сигнала.

Сначала в качестве простейшего  звукового устройства в компьютере использовался встроенный динамик (PC speaker). Этот динамик присоединен  к порту на материнской плате, у которого есть два положения - 1 и 0. Если этот порт быстро-быстро включать и выключать, то из динамика можно извлечь более-менее правдоподобные звуки. Воспроизведение различных частот достигается за счет того, что диффузор динамика обладает конечной реакцией и не способен мгновенно перескакивать с места на место, таким образом, он "плавно раскачивается" вследствие скачкообразного изменения напряжения на нем. И если колебать его с разной скоростью, то можно получить колебания воздуха на разных частотах. Естественной альтернативой динамику стал так называемый Covox - это простейший ЦАП, выполненный на нескольких подобранных сопротивлениях (или готовой микросхеме), которые обеспечивают перевод цифрового представления сигнала в аналоговый - то есть в реальные значения амплитуды. Covox прост в изготовлении и поэтому он пользовался успехом у любителей вплоть до того времени, когда звуковая карта стала доступной всем.

Информация о работе Обработка звуковой информации