Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Компьютерный практикум по цифровой обработке аудиосигналов

Учебное пособие для вузов
Покупка
Артикул: 165799.01.01
Цифровая обработка «сопровождает» звуковой вещательный сигнал (ЗВС) от пульта звукорежиссера до абонентского приемника — и при аналоговой и при цифровой передаче. Цель обработки заключается в согласовании свойств сиг- нала как с возможностями канала передачи, так и с особенностями слухового восприятия. В учебном пособии приведены примеры практических работ по об- работке и анализу свойств аудиосигналов в трактах канала звукового вещания. В ходе выполнения работ анализируются основные характеристики сигналов и каналов звукового вещания. Изучаются результаты использования базовых ма- тематических процедур при цифровой обработке ЗВС. Моделируются способы представления и основные алгоритмы обработки сигнала в канале звукового вещания, включая анализ искажений сигнала на всех этапах его передачи — при первичном цифровом преобразовании и компактном представлении, в про- цессе автоматического регулирования уровня и аудиопроцессорной обработки. Практические работы выполнены на базе программного звукового редактора COOL-2000, математических пакетов Mathcad и Matlab, но при их выполнении могут быть использованы и другие программы. Для студентов вузов, обучающихся по направлению подготовки дипломиро- ванных специалистов 210400 — «Телекоммуникации», может быть полезна спе- циалистам эксплуатационных служб радиосвязи, радиовещания и телевидения.
Попов, О. Б. Компьютерный практикум по цифровой обработке аудиосигналов: Учебное пособие для вузов / О.Б. Попов. - Москва : Гор. линия-Телеком, 2010. - 176 с.: ил.; . - (Специальность). ISBN 978-5-9912-0131-5. - Текст : электронный. - URL: https://znanium.com/catalog/product/245479 (дата обращения: 24.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
УДК 681.84
ББК 32.884.1
П58
Рецензенты: доктор техн. наук, профессор Ю. А. Ковалгин;
доктор техн. наук, профессор А. А. Волков
Попов О. Б.

П58
Компьютерный практикум по цифровой обработке аудиосигналов. Учебное пособие для вузов. — М.: Горячая линия — Телеком, 2010. — 176 с.: ил.
ISBN 978-5-9912-0131-5.

Цифровая обработка «сопровождает» звуковой вещательный сигнал (ЗВС)
от пульта звукорежиссера до абонентского приемника — и при аналоговой и при
цифровой передаче. Цель обработки заключается в согласовании свойств сигнала как с возможностями канала передачи, так и с особенностями слухового
восприятия. В учебном пособии приведены примеры практических работ по обработке и анализу свойств аудиосигналов в трактах канала звукового вещания.
В ходе выполнения работ анализируются основные характеристики сигналов и
каналов звукового вещания. Изучаются результаты использования базовых математических процедур при цифровой обработке ЗВС. Моделируются способы
представления и основные алгоритмы обработки сигнала в канале звукового
вещания, включая анализ искажений сигнала на всех этапах его передачи —
при первичном цифровом преобразовании и компактном представлении, в процессе автоматического регулирования уровня и аудиопроцессорной обработки.
Практические работы выполнены на базе программного звукового редактора
COOL-2000, математических пакетов Mathcad и Matlab, но при их выполнении
могут быть использованы и другие программы.
Для студентов вузов, обучающихся по направлению подготовки дипломированных специалистов 210400 — «Телекоммуникации», может быть полезна специалистам эксплуатационных служб радиосвязи, радиовещания и телевидения.
ББК 32.884.1

Адрес издательства в Интернет WWW.TECHBOOK.RU
Учебное издание
Попов Олег Борисович
Компьютерный практикум
по цифровой обработке аудиосигналов

Учебное пособие

Редактирование и верстка Ю. Н. Чернышова
Корректор С. П. Сергеева
Обложка художника В. Г. Ситникова

Подписано в печать 27.12.09. Формат 60×90/16. Уч. изд. л. 11. Изд. № 9131. Тираж 500 экз.

ISBN 978-5-9912-0131-5
c⃝ О. Б. Попов, 2010
c⃝ Оформление издательства
«Горячая линия—Телеком», 2010

Список сокращений

АМ — амплитудная модуляция
АП — аудиопроцессор
АРУР — автоматический регулятор уровня
АЦП — аналого-цифровое преобразование
АЧХ — амплитудно-частотная характеристика
БПФ — быстрое преобразование Фурье
ВЧ — высокочастотный, высокие частоты
ДПФ — дискретное преобразование Фурье
ЗВ — звуковое вещание
ЗВС — звуковой вещательный сигнал
ЗС — звуковой сигнал
ИКМ — импульсно-кодовая модуляция
КЗВ — канал звукового вещания
МК — мгновенное компандирование
МКЗВ — междугородный канал звукового вещания
НЧ — низкочастотный, низкие частоты
ОСМ — относительная средняя мощность (энергетический параметр сигнала)
ОСШ — отношение сигнал-шум
ПК — персональный компьютер
ПМК — почти мгновенное компандирование
ПО — программное обеспечение
ПТЭ — правила технической эксплуатации
РВ — радиовещание
РВС — радиовещательная станция
РС — речевой сигнал
СКО — среднеквадратическое отклонение
СП — сигнал придыхания
СПМ — спектральная плотность мощности
ССИ — субъективно-статистические испытания
СЧ — среднечастотный, средние частоты
ТВРП — тракт вторичного распределения
ТПРП — тракт первичного распределения
ТФП — тракт формирования программ
ФВЧ — фильтр высоких частот
ФНЧ — фильтр низких частот
ЦАП — цифро-аналоговое преобразование
ЦСП — цифровая система передачи
ЧМ — частотная модуляция

Список сокращений

ЭКЗВ — электрический канал звукового вещания
FFT — Fast Fourier Transform — БПФ
ISO — International Organization for Standardization — Международная организация по стандартизации
ITU — International Telecommunications Union — Международный
союз электросвязи (МСЭ)
MOS — Mean Opinion Score — средняя оценка мнений; средняя субъективная оценка
MPEG — Moving Picture Expert Group and associated audio (при ISO) —
формат сжатия данных
RMS — Root Mean Square — среднеквадратическое значение

Введение

Звук, звуковые сигналы, возможность слухового восприятия —
неотъемлемые составляющие полноценной жизни человека, среды его
обитания.
Звуковое и радиовещание стали неотъемлемой частью жизни общества, важным средством политического, эстетического и нравственного воздействия на население. Радиовещание по-прежнему, несмотря на популярность телевидения, остается основным источником
информации для миллионов людей. Одним из главных преимуществ
радиовещания как средства доставки информации является оперативность, недостижимая пока телевидению.

Рис. 1. «Слушаете ли вы радио?» Данные опроса 1500 респондентов из 65 городов России, проведенного в марте 1999 г.

В стране сосуществуют общероссийское, региональное и местное вещание с государственными, муниципальными и частными
формами собственности.
Становление полноценных вещательных
компаний, создающих или ретранслирующих программы и распространяющих их при помощи собственных радиовещательных передатчиков, идет крайне медленно. Тем не менее радиовещание в России
по-прежнему популярно и его регулярно слушает более 80 % населения нашей страны (риc. 1).
Компьютерная цифровая обработка звуковых вещательных сигналов (ЗВС) — не самоцель, а средство оптимизации передачи таких
сигналов по каналам и трактам. Цифровая передача ЗВС получила
очень широкое распространение. Основная причина использования
именно цифровых методов обработки заключается в возможности реализовать достаточно сложные алгоритмы обработки, причем часто
в виде одной микросхемы. Не менее важной причиной применения
цифровых систем, в частности, в подвижной связи является также
возможность обеспечения скрытности передачи.
Вопросы, связанные с обработкой сигналов в каналах звукового
вещания (КЗВ), рассмотрены в [1–9]. В настоящем пособии акцентируется внимание на специфических вопросах, связанных с углубленным изучением первичного цифрового преобразования и компактного представления ЗВС, автоматического регулирования уровня таких
сигналов в канале звукового вещания и их аудиопроцессорной обра
Введение

ботки в трактах вторичного распределения с анализом искажений сигнала на всех этапах его передачи по многозвенным (составным) КЗВ.
Практикум по цифровой обработке аудиосигналов построен с использованием редактора звуковых файлов Cool Edit и математических пакетов Mathcad и Matlab.
Предусмотрено освоение работы с
редактором непосредственно в ходе выполнения заданий, поэтому в
каждом из них подробно описана последовательность действий и приведены иллюстрации соответствующих интерфейсов.
Серия аудиоредакторов Cool Edit создана Дэвидом Джонсом. Редактор является свободно распространяемым (ShareWare), его всегда
можно найти в Интернете на сайте www.syntrillium.com.
Редакторы из серии Cool Edit работают под управлением Windows ME, NT, XP и Vista с любым типом звуковых карт (хоть с восьмибитными), при этом расширяя свои возможности в зависимости
от класса качества звуковой карты.
В 2003 году продукт Cool Edit Pro был продан корпорации Adobe
(www.adobe.com), после чего получил новое название Adobe Audition.
Работа с редактором подробно описана в книгах Романа и Юрия
Петелиных [10–12] (http://www.petelin.ru). Редактор рассчитан на неискушенного пользователя, не вызывает трудностей при освоении и
во многом напоминает текстовый редактор Word.
В верхней части главного окна программы расположена панель
инструментов, внешний вид и состав которой можно формировать по
своему усмотрению. В правой нижней части окна расположены кнопки, похожие на кнопки управления магнитофоном. С их помощью
осуществляется управление отображением, записью и воспроизведением сэмплов. Предполагается, что в ходе выполнения практикума
учащиеся будут, в основном, использовать заранее подготовленные
записи радиовещательных программ или музыкальные диски.
Это
обеспечивает возможность работы с высококачественными звуковыми сигналами.
Редактор обеспечивает возможность выполнения практически
всех видов преобразования и компактного представления звукового
сигнала, которые используются в трактах канала звукового вещания:
студийная обработка, которая используется в тракте формирования
программ, согласование параметров сигнала с возможностями тракта
первичного и вторичного распределения программ, системы регулирования уровня, шумопонижения, компактного представления, частотной обработки.
Достоинством редактора является возможность анализа статистических и частотных свойств сигнала, анализ мгновенных и усредненных спектров, построение гистограмм вероятности появления сигнала с заданными амплитудными значениями.

Введение
7

Возможности редактора не ограничиваются только процессами
обработки звукового сигнала.
С его помощью можно изучать процессы амплитудной модуляции радиосигнала, формирования сигнала
одной боковой полосы частот, фазовой манипуляции, формирования
цифровых последовательностей.
Поэтому освоение аудиоредактора
полезно и при изучении других дисциплин университетского курса.
Программа Cool Edit предназначена для работы с оцифрованным звуком, т.е. аналоговые звуковые волны должны быть предварительно преобразованы (сэмплированы) в последовательность двоичных цифровых отсчетов. Такое преобразование осуществляется в
аналого-цифровом преобразователе (АЦП). В результате работы АЦП
получается цифровой образ звука, то, что в английском языке именуется Waveform.
Волновые формы хранятся на жестком диске в
файлах различных форматов. Чаще всего, это файлы с расширением
waw. Таким образом, waw-файлы служат стандартными элементарными блоками, кирпичиками при синтезе в Cool Edit аудиокомпозиции (например, песни).
В принципе, существует два метода редактирования звуковых
данных: разрушающий и неразрушающий.
При разрушающем методе преобразования (вырезка, вставка, обработка эффектом и т.д.)
применяются непосредственно к исходному waw-файлу так, что изменяются сами первоначальные звуковые данные, в то время как неразрушающее редактирование подразумевает, что файл на диске фактически не изменяется. Вместо этого каждая операция редактирования
сохраняется как команда, которую нужно выполнить при воспроизведении волновой формы. Например, при разрушающем редактировании изменение громкости звука фактически изменило бы амплитуду
волновой формы. А при неразрушающем редактировании изменение
громкости будет вызвано выполнением последовательности команд,
которые, по существу, являются инструкциями программе о том, как
перестраивать коэффициент передачи усилителя звуковой карты.
В Cool Edit используются и разрушающие, и неразрушающие методы редактирования. Однако даже разрушающее редактирование не
будет применено непосредственно к исходной волновой форме до тех
пор, пока вы не сохранили файл. Здесь реализован метод, который
можно назвать отсроченным разрушающим редактированием. Когда вы в Cool Edit открываете waw-файл, программа помещает копию
файла во временный каталог и использует эту копию для редактирования. Исходный файл остается неизменным до тех, пока вы не
сохраните изменения на диске (например, выбирая из меню File команду Save...). И только когда вы сохраняете внесенные изменения,
Cool Edit записывает поверх исходного файла файл с теми изменениями, которые вы сделали в файле-копии.

Введение

Поскольку весь редактируемый в Cool Edit материал хранится
во временных файлах-копиях, имеется принципиальная возможность
защитить вашу работу от всевозможных сбоев компьютера, питания,
операционной системы и т.п. Если в процессе редактирования произойдет, например, отключение питания, то после перезагрузки компьютера и запуска Cool Edit программа предложит вам продолжить
редактирование с того места, на котором оно было прервано.
В Cool Edit существуют два принципиально различных режима работы: редактирование отдельных волновых форм и совместное
мультитрековое редактирование совокупности волновых форм. Для
каждого из режимов предусмотрены свое главное меню и свое главное
окно: Edit Waveform и Multitrack View — два различных по назначению звуковых редактора, объединенных в функциональный комплекс. Важно понимать, что операции редактирования, выполняемые
Edit Waveform (подобные вырезке, вставке и обработке эффектами),
по своей сути являются разрушающими, и когда вы сохраняете файл,
изменения вносятся непосредственно в волновую форму.
Редактирование, выполненное в Multitrack View (типа переноса, состыковки
волновых форм, изменения громкости, панорамы, параметров эффектов реального времени), является неразрушающим.
При отсроченном разрушающем редактировании есть возможность использовать в Cool Edit функцию многократной отмены операций Undo. Когда вы применяете разрушающее редактирование к
waw-файлу, Cool Edit сохраняет копию того файла, который существовал до редактирования. Это делается для каждой выполненной
вами операции редактирования.
Вы можете «путешествовать» как
назад, так и вперед по всей предыстории редактирования. Многократная функция Undo дает вам свободу при работе над волновыми
формами. Вам не стоит переживать о том, что самый интересный
результат творчества окажется безвозвратно утраченным. Однако за
свободу приходится платить. В данном случае возможность многократной отмены операций достигается ценой затрат дисковой памяти.
Правда, все автоматически созданные копии будут также автоматически и удалены с жёсткого диска, когда вы закроете файл или выйдете из программы. Но непосредственно в процессе работы с Cool Edit
нужно иметь на диске много свободного места. Впрочем, вы можете
ограничить максимальное число уровней Undo или вовсе выключить
эту функцию, если есть проблемы с дисковым пространством.
Во многих музыкальных редакторах, имеющих средства обработки аудиоданных, предусмотрены два варианта использования эффектов: применение эффекта в реальном времени и пересчет звуковых
данных. Первый вариант удобнее, поскольку вы регулируете параметры эффекта и тут же слышите результат. Однако при этом требу
Введение
9

ется высокопроизводительный компьютер. Применение эффекта путём пересчета позволяет обрабатывать звуковые данные с помощью
относительно слабого компьютера, но процесс обработки может продолжаться десятки минут. Поневоле не захочешь лишний раз вносить
улучшения, пробовать что-нибудь новенькое.
Оптимальная стратегия использования эффектов могла бы состоять в следующем. Сначала, включив циклический режим воспроизведения волновой формы, в реальном времени вы подбираете параметры эффекта, наилучшим образом соответствующие вашему замыслу,
затем единственный раз пересчитываете волновую форму, применив
к ней эффект с уже подобранными параметрами.
Результаты работы оформляются в виде звуковых файлов, распечаток сигналограмм, а также результатов спектрального и статистического анализа свойств сигнала до и после обработки, выводов после проведения пробного прослушивания или субъективностатистических экспертиз.

Г л а в а
1

Исследование распознаваемости,
разборчивости и качества передачи
аудиосигналов

Закономерности восприятия являются общими для всех сенсорных каналов.
Это позволяет некоторым исследователям распространять результаты, полученные при изучении одного органа чувств
(например, обоняние), на другие (например, зрение). Существенным
является ограничение числа одновременно воспринимаемых стимулов
по любому каналу восприятия — около семи стимулов одновременно. Были проведены исследования по восприятию звуковых сигналов,
где под стимулами понимались гармонические составляющие сигнала, подтвердившие эту закономерность.

Рис. 1.1. К понятию модели слухового восприятия

К настоящему времени не создано модели работы слухового анализатора, которая включала бы все свойства слуха. На практике полезна следующая механическая аналогия. Покровная мембрана, раскачивание поперечно
натянутых волокон которой вызывает
возбуждение расположенных вдоль нее
нервных окончаний, может быть представлена набором разновеликих маятников, слабо связанных между собой.
При раскачивании одного из маятников под внешним воздействием приходят в движение и остальные, в меньшей степени тяжелые (низкочастотные), в большей — легкие (высокочастотные) (риc. 1.1).
Порог слышимости в тишине, т.е. минимальное осознаваемое
возбуждение, показан жирной линией на риc. 1.2, порог слышимости
при наличии сигнала — пунктиром. Увеличение уровня интенсивности тона (сигнала), в конце концов, приводит к появлению ощущения
боли, наступает болевой порог. Между болевым порогом и порогом
слышимости несколько сотен элементарных скачков ощущения, причем на низких и высоких частотах их значительно меньше, чем на
средних.
Дискретность восприятия слуха по частоте и амплитуде
дает около 22000 элементарных градаций во всей области слухово