Повышение эффективности кодирования коэффициентов вейвлетного преобразования в кодеках с компрессией цифровых аудиоданных

Фадеев, Даниил Романович

Повышение эффективности кодирования коэффициентов вейвлетного преобразования в кодеках с компрессией цифровых аудиоданных тема диссертации и автореферата по ВАК РФ 05.12.04, кандидат наук Фадеев, Даниил Романович

Фадеев, Даниил Романович
кандидат наук
2017

Специальность ВАК РФ05.12.04

Количество страниц 152

Фадеев, Даниил Романович. Повышение эффективности кодирования коэффициентов вейвлетного преобразования в кодеках с компрессией цифровых аудиоданных: дис. кандидат наук: 05.12.04 - Радиотехника, в том числе системы и устройства телевидения. Санкт-Петербург. 2017. 152 с.

Оглавление диссертации кандидат наук Фадеев, Даниил Романович

Оглавление

ВВЕДЕНИЕ

1 СОВРЕМЕННОЕ СОСТОЯНИЕ СИСТЕМ КОДИРОВАНИЯ С КОМПРЕССИЕЙ ЦИФРОВЫХ АУДИОДАННЫХ. ТЕОРИЯ И ПРАКТИКА

1.1 Общие сведения

1.2 Теоретические основы методов сжатия звука с потерями

1.3Алгоритмы сжатия звука с потерями

1.3.1 MASCAM

1.3.2 MUSICAM

1.3.3 Вейвлетные кодеки

1.3.4 Гибридные кодеки

1.3.5 FV-MLT

1.4 Коммерческие алгоритмы сжатия звука

1.4.1 Алгоритмы сжатия группы MPEG

1.4.2 ATRAC

1.4.3Dolby AC-3

1.5 Постановка задачи и цель диссертационной работы

2 ИССЛЕДОВАНИЕ ПСИХОАКУСТИЧЕСКИХ МОДЕЛЕЙ АЛГОРИТМОВ КОДИРОВАНИЯ С КОМПРЕССИЕЙ ЦИФРОВЫХ АУДИОДАННЫХ С ПОТЕРЯМИ

2.1 Психоакустическая модель 1 стандартов MPEG-1 ISO/IEC 11172-3 и MPEG-2 ISO/IEC 13818-3

2.2 Психоакустическая модель 2 стандартов MPEG-1 ISO/IEC 11172-3 и MPEG-2 ISO/IEC 13818-3

2.3 Психоакустическая модель стандартов MPEG-2 ISO/IEC 13818-7 и MPEG-2 ISO/IEC 14496-3

2.4 Экспериментальная психоакустическая модель на основе вейвлетного преобразования

2.5 Аппаратно-программный комплекс для исследования психоакустических моделей

2.6 Результаты тестирования психоакустических моделей тональными сигналами

2.7 Результаты тестирования психоакустических моделей реальными звуковыми сигналами

Выводы по результатам исследования

3 МЕТОД АДАПТАЦИИ К ВЕЙВЛЕТНОМУ ДОМЕНУ АЛГОРИТМА РАСЧЕТА ПОРОГА МАСКИРОВКИ С ИСПОЛЬЗОВАНИЕМ ПАМ_ААС

3.1 Критический анализ метода расчета порога маскировки непосредственно в вейвлетном домене

3.2 Анализ распределения шумов квантования коэффициентов вейвлетного преобразования

3.3 Алгоритм контроля уровня энергии шумов квантования вейвлетных коэффициентов

Выводы по главе 3

4 РАЗРАБОТКА СТРУКТУРЫ И ПРОГРАММНОЙ МОДЕЛИ ВЕЙВЛЕТНОГО КОДЕКА И ОЦЕНКА ЭФФЕКТИВНОСТИ ЕГО РАБОТЫ

4.1 Алгоритм компрессии звуковых сигналов на основе квантования вейвлетных коэффициентов с использованием ПАМ_ААС

4.2 Программная модель вейвлетного кодека

4.3 Коэффициент запаса по числу разрядов кодового слова

4.4 Экспертная оценка качества работы вейвлетного кодека

Выводы по главе 4

ЗАКЛЮЧЕНИЕ

СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

ПРИЛОЖЕНИЕ A

ПРИЛОЖЕНИЕ Б

133

Введение диссертации (часть автореферата) на тему «Повышение эффективности кодирования коэффициентов вейвлетного преобразования в кодеках с компрессией цифровых аудиоданных»

ВВЕДЕНИЕ

Актуальность темы диссертации

В последнее десятилетие весьма отчетливо проявились очертания грядущей информационной эпохи. Новые сетевые сервисы, предоставляемые пользователю, порождают новые запросы и требования к качеству мультимедийного контента. Если в конце 20 века доступ к Интернет осуществлялся со скоростями в 10-ки кБайт в секунду, что само по себе исключало возможность воспроизведения звука высокого качества из сети в режиме реального времени, то в настоящее время большинство провайдеров сотовой связи обеспечивают уверенное 3G/4G-покрытие в крупных городах России.

На этом фоне алгоритмы сжатия аудиоданных и сегодня не теряют своей актуальности. Изначально разработанные для более эффективного использования носителей информации алгоритмы сжатия звука с потерями в настоящее время находят новые сферы применения. Необходимость передачи мультимедийной информации в условиях работы новых протоколов, ориентированных на сети пост-NGN (Next Generation Networks), обуславливает как использование существующих алгоритмов сжатия, так и разработку новых, ориентированных на конкретные приложения. Широкое применение они находят также и в системах цифрового телевидения и радиовещания, в системах мобильной связи, различного рода мобильных устройствах.

Значительный вклад в развитие теории и практики психоакустики и компрессии цифровых аудиоданных внесли работы таких авторов как: J. Blauert, M. Bosi, K. Brandenburg, J. Johnston, R. Kapust, B. Moore, R. Plomp, F. Spanias, E. Terhard, E. Zwiker, И.А. Алдошина, М.В. Зырянов, Ю.А. Ковалгин, Я.Г.Д Придаршан, Г.Г. Рогозинский, М.А. Стефанов, И.А. Стефанова и ряд других. [72, 89-91, 144-146]

Дальнейшая оптимизация алгоритмов сжатия и исследования в этой области являются по-прежнему актуальными. При этом основными направлениями иссле-

дований в области алгоритмов сжатия звука с потерями являются модификация ранее используемых или разработка новых моделей психоакустического анализа, оптимизация и разработка новых алгоритмов устранения различных видов избыточности, а также улучшение производительности, качества и эффективности работы кодеков.

Цель и задачи исследования

Цель диссертационной работы состоит в разработке кодека с вейвлетным доменом, обеспечивающим повышение эффективности кодирования коэффициентов дискретного вейвлетного преобразования.

Для достижения поставленной цели необходимо решить следующие задачи:

1. Выполнить сравнительный анализ существующих психоакустических моделей, применяемых в алгоритмах компрессии цифровых аудиоданных с потерями.

2. Разработать метод адаптации выбранной психоакустической модели к вейв-летному домену.

3. Исследовать распределение энергии шумов квантования по частоте и разработать метод контроля их уровня при кодировании коэффициентов вейвлетного преобразования.

4. Разработать структуру и программную модель кодека с вейвлетным доменом, обеспечивающие повышение эффективности кодирования коэффициентов дискретного вейвлетного преобразования.

5. Проверить экспериментально результаты выполненных в работе теоретических исследований.

Соответствие паспорту специальности

Содержание исследования соответствует следующим пунктам специальности 05.12.04 - Радиотехника, в том числе системы и устройства телевидения:

пункт 6. Исследование и разработка радиотехнических систем и устройств передачи информации, в том числе радиорелейных и телеметрических, с целью повышения их пропускной способности и помехозащищенности;

пункт 7. Разработка методов и устройств передачи, приема, обработки, отображения и хранения информации. Разработка перспективных информационных технологий, в том числе цифровых, а также с использованием нейронных сетей для распознавания изображений в радиотехнических устройствах;

пункт 10. Разработка радиотехнических устройств для использования их в промышленности, биологии, медицине, метрологии и др.

Разработана и выполнена оценка качества и эффективности кодеков, работающих в базисе дискретного вейвлетного преобразования для развития и совершенствования устройств кодирования аудиоданных, применяемых в медиаинду-стрии.

Методы исследования

При решении поставленных задач применялись методы спектрального анализа, теории вейвлетов, психоакустики, компьютерного моделирования, математической статистики.

Научная новизна работы

1. Оценена эффективность работы психоакустических моделей (ПАМ) стандартов MPEG (ПАМ_1, ПАМ_2 и ПАМ_ААС) и вейвлетной психоакустической модели (ПАМ_ВП). Доказано, что ПАМ_ААС наиболее полно учитывает особенности распределения энергии звукового сигнала по частоте, наиболее экономно расходует биты при кодировании звукового сигнала.

2. Разработан метод, позволяющий оценить распределение энергии шумов квантования в кодеке, работающем в вейвлетном пространстве и представить полученные результаты в виде матрицы шумов квантования, содержащей число строк, равное числу субполос кодирования дерева фильтров и число столбцов равное числу полос психоакустического анализа. Данный метод универсален, он пригоден для оценки уровня шумов квантования для анализирую-

щих/синтезирующих банков фильтров любой структуры и сложности в кодеках с компрессией цифровых аудиоданных.

3. Разработан итерационный пошаговый метод контроля энергии шумов квантования, позволяющий, используя матрицу М, элементами которой являются значения энергии шумов квантования, психоакустическую модель ПАМ_ААС и предложенный в работе алгоритм масштабирования энергии шумов квантования, найти требуемую для прозрачного кодирования длину кодовых слов вейвлетных коэффициентов в каждой из субполос кодирования.

4. Реализована в среде МЛТЬЛБ модель кодека, использующего вейвлетное преобразование сигнала выборки, психоакустическую модель ПАМ_ААС и алгоритм контроля энергии искажений квантования. Методом субъективно-статистических экспертиз подтверждена эффективность ее работы на реальных звуковых сигналах.

Достоверность полученных результатов и выводов подтверждается компьютерным моделированием, опорой на результаты научных трудов ведущих отечественных и мировых ученых в данной области, корректным применением математического аппарата, использованием современных методов статистических обработки полученных результатов, обсуждениями на научных конференциях, результатами субъективно-статистических экспертиз, публикациями результатов работы в рецензируемых научных журналах.

Научные положения, выносимые на защиту

1. Характеристики моделей психоакустического анализа, полученные в диссертации, позволяют обосновать возможности применения каждой из них в кодеках с компрессией цифровых аудиоданных в зависимости от предъявляемых к ним требований.

2. Метод получения матрицы шумов квантования вейвлетных коэффициентов позволяет найти реальное распределение их энергии по субполосам психоакусти-

ческого анализа/кодирования при любой структуре дерева анализирующих/синтезирующих фильтров.

3. Метод контроля энергии шумов квантования позволяет найти минимально возможную длину кодовых слов коэффициентов дискретного вейвлетного преобразования, при которой искажения квантования остаются еще незаметными на слух.

4. Кодек с вейвлетным доменом, содержащий ПАМ_ААС, матрицу шумов квантования и итерационный алгоритм контроля их уровня обеспечивает прозрачное кодирование при средней длине кодовых слов вейвлетных коэффициентов равной 3,35...4,7 бит при использовании вейвлетного базиса Добеши 10 и 3,71... 5,22 бит при использовании вейвлетного базиса Добеши 4.

Практическая значимость

1. Разработан аппаратно-программный комплекс на базе MATLAB, позволяющий подключать в виде модулей различные психоакустические модели, исследовать характер распределения бит по субполосам психоакустического анализа, оценивать пороги маскировки, требуемое для прозрачного кодирования аудиоданных число бит, а также автоматизировать процесс обработки полученных при этих исследованиях результатов.

2. Предложенный метод оценки энергии шумов квантования по субполосам кодирования универсален, он пригоден для оценки уровня шумов квантования в субполосах кодирования для анализирующих/синтезирующих банков фильтров любой структуры и сложности.

3. Разработанная программная модель кодека на основе вейвлетного преобразования, психоакустической модели ПАМ_ААС, а также метод получения матрицы шумов квантования и алгоритм контроля энергии искажений квантования, позволяет оценить его эффективность и определить возможности дальнейшего использования на практике в современных мультимедийных системах инфокомму-никаций.

Реализация и внедрение результатов исследований

Результаты диссертационной работы использованы:

-в научно-исследовательском институте телевидения (АО «НИИ телевидения») в 2016-2017 годах при разработке Эскизного и Технического проектов ОКР «Садко» и позволили оптимизировать структуру информационных потоков на оснащаемом локальной телевизионной сетью объектов МО РФ (акт внедрения от «21» матра 2017 г.;

-в Санкт-Петербургском государственном университете телекоммуникаций им. проф. М.А. Бонч-Бруевича при выполнении научно-исследовательских и выпускных работ магистров, обучающихся по направлениям (акт внедрения в учебный процесс от «13» марта 2017 г.):

-11.04.02 - «Инфокоммуникационные технологии и системы связи» профиль «Системы и сети радиосвязи, радиовещания и радиодоступа» при изучении дисциплины «Стандарты, системы и средства цифрового радиовещания» и

-11.04.01 - Радиотехника, профиль «Аудиовидеосистемы и медиакоммуника-ции» при изучении дисциплины «Формирование, хранение, обработка и передача аудиоконтента в медиакоммуникациях», а также:

Подготовлено учебное пособие для проведения практических занятий, курсового и дипломного проектирования/ Психоакустический анализ в алгоритмах компрессии цифровых аудиоданных. Ковалгин Ю.А., Фадеев Д.Р.; СПбГУТ. -СПб., 2016.

Апробация работы

Материалы диссертационной работы были обсуждены на: Международной научно-технической конференции, посвященной 125-летию со дня рождения В.И. Волынкина, «Актуальные проблемы радио- и кинотехнологий», СПб.: СПбГИКиТ, 26-28 октября 2016 г.; V Международной научно-технической и научно-методической конференции «Актуальные проблемы инфотелекоммуникаций в науке и образовании», СПб.: СПбГУТ им. проф. М.А. Бонч-Бруевича, 10-11 марта 2016 г.; VI Международной научно-технической и научно-методической

конференции «Актуальные проблемы инфотелекоммуникаций в науке и образовании», СПб.: СПбГУТ им. проф. М.А. Бонч-Бруевича, 3-4 марта 2015 г.; III Международной научно-технической и научно-методической конференции «Актуальные проблемы инфотелекоммуникаций в науке и образовании», СПб.: СПбГУТ им. проф. М.А.Бонч-Бруевича, 25-26 февраля 2014 г.; II Международной научно-технической и научно-методической конференции «Актуальные проблемы инфо-телекоммуникаций в науке и образовании», СПб.: СПбГУТ им. проф. М.А. Бонч-Бруевича, 26-27 февраля 2013 г.; XVIII международной научно-технической конференции «Приоритетные направления развития науки и технологий», (два доклада), Тула 2015 г.

Публикации

Основные теоретические и практические результаты диссертации опубликованы в 9 печатных работах, среди которых 4 научные статьи в рецензируемых изданиях, входящих в перечень рекомендованных ВАК РФ, 5 - статей, опубликованы в других изданиях и материалах конференций.

Личное участие автора в получении научных результатов

В исследованиях, результаты которых приведены в диссертационной работе, автору принадлежит определяющая роль. Диссертант лично разрабатывал компьютерные программные модели, исследовал приведенные в работе алгоритмы, выполнял анализ и обобщение полученных данных. Часть опубликованных работ по проведенным исследованиям написана в соавторстве с научным руководителем, Заслуженным деятелем науки РФ, д.т.н. профессором Ю.А. Ковалгиным.

Структура и объем диссертации

Диссертация состоит из введения, четырех глав с выводами по каждой из них, заключения, выводы, списка литературы и двух приложений.

Диссертация изложена на 152 страницах текста, содержит 65 рисунков, 9 таблиц, список литературы включает в себя 52 отечественных, 110 зарубежных источников.

ГЛАВА 1. СОВРЕМЕННОЕ СОСТОЯНИЕ СИСТЕМ КОДИРОВАНИЯ С КОМПРЕССИЕЙ ЦИФРОВЫХ АУДИОДАННЫХ. ТЕОРИЯ И ПРАКТИКА

1.1 Общие сведения

В последнее десятилетие весьма отчетливо проявились очертания грядущей информационной эпохи. Бурное развитие инфокоммуникационных технологий приобрело ведущую роль и привело к возникновению так называемых сетей нового поколения NGN (New Generation Networks) и следующих за ними пост-NGN (Next Generation Networks) сетей, основным концептуальным феноменом которых является Интернет вещей. К настоящему времени мир оказался практически полностью погружен во «Всемирную сеть». Многочисленные аналитические прогнозы предвещают, что количество устройств, выходящих в сеть, к 2020 году пройдет порог пятидесяти триллионов.[1]

Рост количества пользователей сети приводит к постоянному увеличению объемов информации, которые передаются через нее. Новые сетевые сервисы, предоставляемые пользователю, порождают новые запросы и требования к качеству мультимедийного контента. Отношение пользователей к последнему, в условиях массового широкополосного доступа, претерпевает характерные метаморфозы. Так, если в 90х годах ХХ века обычным (фактически единственным) вариантом доступа в Интернет был DSL-модем со скоростью передачи десятки килобайт в секунду, что само по себе исключало воспроизведение звука высокого качества из сети в режиме реального времени, то к настоящему времени большинство провайдеров сотовой связи обеспечивает уверенное 3G-4G покрытие большей части России. При этом воспроизведение высококачественного звука через Интернет при устойчивом соединении начинается практически мгновенно. С другой стороны, миниатюризация сетевых клиентов и удешевление каналов связи вместе с со-

путствующей элементной базой привело к тому, что полноценный компьютер с сетевым интерфейсом умещается на ладони пользователя. Количество устройств в сети на сегодняшний день уже превышает население планеты, по оценкам специалистов их число будет неуклонно расти [2].

На этом фоне алгоритмы сжатия звуковых данных не теряют своей актуальности. Алгоритмы сжатия звука с потерями, разработанные для более эффективного использования носителей информации и увеличения скорости передачи высококачественного звука между профессиональными студиями, в настоящее время находят новые сферы применения. В частности, сетевой протокол верхнего уровня ZigBee [3,], рассчитанный, главным образом, на применение в самоорганизующихся сенсорных сетях, накладывает строгое ограничение на размер пакета. Необходимость передачи мультимедийной информации в условиях работы подобных протоколов обуславливает как использование существующих алгоритмов сжатия, так и разработку новых, ориентированных на конкретные приложения.

Для пользователя практически полностью отпадает необходимость в хранении звука в сжатом виде при средней стоимости жесткого диска объемом 1 ТБ в несколько тысяч рублей. Существующие алгоритмы сжатия без потерь, оптимизированные для работы со звуком, такие как FLAC [4], оказываются достаточными для хранения огромного количество музыкальных произведений на современных носителях информации. Однако, для переносных устройств записи и воспроизведения этот аспект все же не теряет своей актуальности. Более того, процесс развертывания сотовых систем связи в странах третьего мира открывает новые ценовые сегменты на рынке сетевых услуг.

Так, на ежегодном международном форуме в области радиовещания и телекоммуникаций IBC 2014 на стенде Fraunhofer Institut широкой публике был представлен новый алгоритм xHE-AAC (Extended High-Efficiency Advanced Audio Codec) [5, 6, 142,143], рассчитанный для использования в бюджетных мобильных устройствах. Данный алгоритм обеспечивает приемлемое, с точки зрения политики данного ценового сегмента, качество речи и музыки при скорости всего лишь 6 кбит/с.

Отдельного рассмотрения требует область цифрового телевидения и радиовещания, где компрессия цифровых аудиоданных является наиболее весомым вопросом. В этой области на сегодняшний день сформировались две разные технологические платформы [7, 8], первая - европейская: включает в себя технологии DAB (Digital Audio Broadcasting), DRM(Digital Radio Mondiale), DVB(Digital Video Broadcasting) с разновидностями DVB-T, DVB-C и DVB-S; вторая - американская: базируется на стандарте ATSC (Dolby AC-3). Каждая из этих технологических платформ включает в себя различные алгоритмы компрессии звука. Набор технологий цифрового радиовещания DRM позволяет передать большее количество каналов с высоким качеством звучания благодаря использованию различных кодеков ISO/IEC MPEG-4. Принятая в качестве вещательного стандарта в конце августа 2009 года последняя версия стандарта DRM под названием DRM+ включает в себя как традиционный режим для АМ-диапазона, так и расширение для использования в полосе частот от 30 до 240 МГц, т.е. в УКВ и FM диапазонах. [134-137] В полосе частот шириной 50 кГц становится возможным получение качества звучания, близкого к CD, при скорости передачи данных 350 кбит/с [9, 116, 117].

Что касается американской технологической платформы для цифрового телерадиовещания ATSC, то используемый в качестве звукового кодека Dolby AC-3 позволяет передавать звук в формате 5.1, делая реальностью цифровое вещание с объемным звуком. Кроме того, на смену ему приходит Dolby Digital Plus, позволяющий передавать до 15 полноценных каналов звука.

Из материалов статьи В.В. Бутенко, генерального директора ФГУП НИИР [10], среди вопросов, требующих решения в долгосрочной перспективе (до 2025 г), особо следует выделить методы и алгоритмы обработки аудиоконтента. В первую очередь алгоритмы сжатия информации, и развитие перспективных технологий, включая телевидение высокой и ультравысокой четкости, а также трехмерное телевидение, мобильное телевидение и телевидение с элементами интерактивности. В [11] отмечается наличие четких тенденций в плане уплотнения каналов. По сравнению с предыдущим стандартом, при равных условиях передачи, DVB-S2 позволяет передавать на 30% больше данных в тех же полосах, что очевидным

образом сказывается на стоимости аренды космического сегмента. Неоспоримым фактом при этом является рост объемов информации, что стимулирует совершенствование технологий передачи данных, в том числе и кодеков звука. При этом есть две очевидные тенденции;

Первая связана с достижением максимально возможного качества изображения и звука, в том числе и перехода в новые плоскости восприятия потребителем аудиовизуального контента. Так, все доступнее и, одновременно с этим, совершеннее становятся технологии объемного телевещания. В области звука последним достижением на сегодняшний момент написания является вышедший в апреле 2012 года стандарт Dolby Atmos [12], позволяющий получить до 128 отдельных дорожек звука на цифровом носителе и до 64 независимых каналов воспроизведения в кинозале.

Вторая тенденция связана с предоставлением пользователю доступа к всевозможным информационным ресурсам в любое время и в любом месте, разумеется, с некоторыми ограничениями. Это весьма востребовано для мобильного телевидения, разработок в области пространственного звука головных телефонов и многих других устройств.

В первом случае мы имеем дело с большими объемами данных, приближающимися к максимальным возможностям современных носителей, в другом - с необходимостью передать по ограниченному в возможностях передачи большого объема информации каналу максимально качественное изображение и звук, при этом передача звука может не ограничиваться двумя каналами.

Оба случая, наряду с требованиями к разработке новых носителей медиа и улучшению систем связи, обуславливают необходимость совершенствования методов сжатия аудиовизуальных данных.

Таким образом, подытоживая вышесказанные факты, являющиеся лишь незначительной частью значительного количества предпосылок, алгоритмы сжатия с потерями не теряют своей актуальности. Следовательно, их дальнейшая оптимизация и исследования в данной области являются актуальными. Основными направлениями исследований в области алгоритмов сжатия звука с потерями яв-

ляются модификация ранее используемых или разработка новых психоакустических моделей, оптимизация или разработка новых алгоритмов устранения различных видов избыточности, разработка новых инструментов, позволяющих эффективнее устранять тот или иной вид избыточности, а также улучшение производительности работы кодеков.

Данная работа посвящена разработке нового алгоритма компрессии, важнейшей частью которого является психоакустическая модель, работающая в вейвлет-ном пространстве, базирующаяся на предыдущих исследованиях в области применения вейвлетов в сжатии звука, с одной стороны, и психоакустической модели MPEG-4 ISO/IEC 14496-3, с другой. [151, 153] Именно психоакустическая модель во многом определяет минимально возможную (достижимую) скорость цифрового потока и, в конечном итоге, эффективность кодека в целом.

1.2 Теоретические основы методов сжатия звука с потерями

Практически все кодеки, использующие методы сжатия с потерями, базируются на принципах устранения так называемой психоакустической избыточности. По этой причине сжатие звука с потерями в ряде источников называют перцепционным сжатием звука с потерями [8, 14, 140,]. При этом, как правило, используются также и методы устранения статистической избыточности, однако, обеспечиваемая ее устранением эффективность оказывается существенно меньшей.[13]

В соответствии с современными представлениями о физиологии слуха, человек в состоянии воспринять всего лишь несколько процентов от всего объема звуковой информации [13, 15, 118, 133]. Другими словами, звуковая информация обладает значительной избыточностью. Эти результаты легли в основу принципа устранения избыточности, базирующегося на том, что после обнаружения составляющих сигнала, являющихся для человека неслышимыми на фоне громких звуков, эти составляющие безвозвратно устраняются. При этом фактически происходит потеря качества звучания, однако, в результате маскирующего эффекта уве-

личение уровня шумов квантования до некоторой степени остается неразличимым для слушателя.

Согласно современным представлениям о механизме анализа звука в слуховой системе, во внутреннем ухе происходит процесс, сравнимый со спектральным анализом сигнала. На каждую частоту реагирует соответствующая область бази-лярной мембраны, что приводит к аналогии с обработкой сигнала набором полосовых фильтров, которые получили название критические полосы слуха. В слышимом диапазоне частот всего выделяют 24 таких полосы. [110, 111, 131] Ширина пропускания соответствующих фильтров модели слуховой системы остается практически неизменной до частот в районе 500 Гц, а затем начинает расти. Зависимость ширины критических полос от центральной частоты соответствующих полосовых фильтров приведена на рисунке 1.1.

При колебаниях базилярной мембраны в волосковых клетках находящегося на ней органа Согй генерируется электрический потенциал и в нервных волокнах возбуждаются потоки импульсов. При увеличении интенсивности сигнала скорость импульсов увеличивается в единичном волокне, соответствующем данной области мембраны, и доходит до насыщения (порог 1000 импульсов в секунду [16, 79, 128]), по достижении которого начинает возникать возбуждение в соседних нервных волокнах; при этом соответственно увеличивается площадь под кривой возбуждения.

Таким образом, ощущение громкости связано с увеличением количества импульсов в единичном волокне и увеличением числа нервных волокон, в которых возникает возбуждение в соответствии с изменением площади под кривой возбуждения. На основании проведенных экспериментов была высказана гипотеза, что слуховая система производит интегрирование площади под кривой воздуждения с учетом распределения нервной активности на базилярной мембране. [55-57]

Следовательно, внутри каждой критической частоты происходит интеграция энергии независимо от вида звукового сигнала. Отрезок шума или тональные сигналы, если они находятся внутри критической полосы и имеют одинаковый уровень интенсивности, создают одинаковый уровень громкости.

Рисунок 1.1 Зависимость ширины критических полос от их центральных частот

Феномен одновременной маскировки был неоднократно описан на страницах как зарубежной, так и отечественной литературы. Особо стоит отметить труды H. Fletcher [17,70], D.D. Greenwood [18], B. Scharf [19], M.R. Schroeder [20], E. Zwicker [21, 58-62, 77, 87, 88], И.А. Алдошиной [16, 56], Ю.А. Ковалгина [15] и др.[49, 50, 113-115] Одновременная маскировка связана с тем, что из-за описанного выше эффекта интеграции звукового давления в пределах критической полосы слуха слабые составляющие звука становятся неразличимыми на фоне более громких звуков (маскируются). Таким образом, количественно эффект маскировки оценивается по сдвигу (повышению) порога слышимости маскируемого тона. Анализ зависимостей этих сдвигов от частоты и интенсивности маскируемого и маскирующего тонов позволяет выявить ряд закономерностей:

Список литературы диссертационного исследования кандидат наук Фадеев, Даниил Романович, 2017 год

СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

1. Dave Evans. The Internet of Things. How the Next Evolution of the Internet is Changing Everything

2. Гольдштейн Б.С., Кучерявый А.Е. Сети связи пост-NGN. - СПб, БХВ-Петербург, 2014.

3. ZigBee Specification. ZigBee Standards Organization. Version 1.0, June 27, 2005.

4. Mat Hans, Ronald W. Schafer. Lossless Compression of Digital Audio. HP Laboratories Palo Alto, November 1999.

5. Manfred Lutzky, Nikolaus Rettelbach. Audiocodierung in MPEG: Aktueller Stand und Ausblick auf Zukuenftige Entwicklungen. Fraunhofer IIS. MPEG Audio Codecs IRT Kolloquium, 2013

6. MPEG Unified Speech and Audio Coding - The ISO/MPEG Standard for High-Efficiency Audio Coding of All Content Types"; Neuendorf et al; AES Convention:132 (April 2012) Paper Number:8654

7. Ковалгин Ю.А., Николаев В. Новый важный шаг на пути перехода к цифровому радиовещанию в России. Broadcasting. Телевидение и радиовещание, 2, 2010

8. Ковалгин Ю. А., Вологдин Э. И. Цифровое кодирование звуковых сигналов. — СПб.: КОРОНА-принт, 2004. — 240 с

9. Радиовещание и электроакустика: Учебник для вузов / С.И. Алябьев, А.В. Выходец, Р. Гермер и др.; Под ред. Ю.А. Ковалгина. — М.: Радио и связь, 1998. — 792 с.

10. Бутенко В.В. Основные направления развития цифрового ТВ-вещания в России. Электросвязь №11 2013.

11. Зубарев Ю., Сагдуллаев Ю. Тенденции развития видеоинформационных технологий и систем телевидения. Broadcasting. Телевидение и радиовещание, 3, 2011

12. Dolby Atmos Specifications. Issue 3. Dolby. 2015

13. M.Bosi and R.E.Goldberg, "Introduction to Digital Audio Coding and Standards," Boston: Kluwer Academic Publishers, 2003.

14. Ковалгин Ю. А., Вологдин Э. И. Аудиотехника. — М.: Горячая линия - Телеком, 2013. — 742 с.

15. Ковалгин Ю. Компрессия цифрового звука: психоакустические основы и алгоритмы // 625. - 2000. №6.

16. Алдошина И.А. Основы психоакустики. Оборонгиз., Москва, 2000. - С. 154.

17. H.Fletcher, "Auditory Patterns", Rev. Mod. Phys., pp. 47-65, Jan. 1940.

18. D.D.Greenwood, "Critical Bandwidth and the Frequency Coordinates of the Basilar Membrane", J. Acous. Soc. Am., pp. 1344-1356, Oct. 1961.

19. B.Scharf, "Critical Bands", in Foundations of Modern Auditory Theory, New York: Academic Press, 1970.

20. M.Schroeder, et al., "Optimizing Digital Speech Coders by Exploiting Masking Properties of the Human Ear," J. Acoust. Soc. Am., pp. 1647-1652, Dec. 1979.

21. E.Zwicker and H.Fastl, Psychoacoustics Facts and Models, Springer-Verlag, 1990.

22. T.Painter, A.Spanias, "Perceptual Coding of Digital Audio," in Proc. of the IEEE, v.88, №4, p.451-513, April 2000.

23. K. Brandenburg, "OCF: Coding High Quality Audio with Data Rates of 64 kbit/sec," in Proc. 85th Conv. Aud. Eng. Soc., preprint #2723, Mar.1988

24. J. Johnston, "Transform Coding of Audio Signals Using Perceptual Noise Criteria," IEEE J. Sel. Areas in Comm., pp. 314-323, Feb. 1988.

25. K. Brandenburg and J.D. Johnston, "Second Generation Perceptual Audio Coding: The Hybrid Coder," in Proc. 88th Conv. Aud. Eng. Soc., preprint #2937, Mar. 1990.

26. Y. Mahieux, et al., "Transform Coding of Audio Signals Using Correlation Between Successive Transform Blocks," in Proc. Int. Conf. Acous., Speech, and Sig. Process. (ICASSP-89), pp. 2021-2024, May 1989.

27. Y. Mahieux and J. Petit, "Transform Coding of Audio Signals at 64 kbits/sec," in Proc. Globecom '90, pp. 405.2.1-405.2.5, Nov. 1990.

28. K. Brandenburg, et al., "ASPEC: Adaptive Spectral Entropy Coding of High Quality Music Signals," in Proc. 90th Conv. Aud. Eng. Soc., preprint #3011, Feb. 1991.

29. G. Theile, et al., "Low-Bit Rate Coding of High Quality Audio Signals," in Proc. 82nd Conv. Aud. Eng. Soc., preprint #2432, Mar. 1987.

30. R.N.J. Veldhuis, "Subband Coding of Digital Audio Signals without Loss of Qual i-ty," in Proc.Int. Conf. Acous., Speech, and Sig. Proc. (ICASSP-89), pp. 2009-2012, May 1989.

31. Y.F. Dehery, et al., "A MUSICAM Source Codec for Digital Audio Broadcasting and Storage," in Proc. ICASSP-91, pp. 3605-3608, May 1991.

32. D.Sinha and A.Tewfik, Low bit rate transparent audio compression using adapted wavelets, IEEE Trans. Signal Processing, vol.41, no.12, pp.3463 - 3479, December 1993.

33. K. Hamdy, et al., "Low Bit Rate High Quality Audio Coding with Combined Harmonic and Wavelet Representations," in Proc. Int. Conf. Acous., Speech, and Sig. Proc. (ICASSP-96), pp. 1045-1048, May 1996.

34. D. Sinha and J. Johnston, "Audio Compression at Low Bit Rates Using a Signal Adaptive Switched Filterbank," in Proc. Int. Conf. Acous., Speech, and Sig. Proc. (ICASSP-96), pp. 1053-1056, May 1996.

35. M. Purat and P. Noll, "Audio Coding with a Dynamic Wavelet Packet Decomposition Based on Frequency-Varying Modulated Lapped Transforms,"in Proc. ICASSP-96, pp. 1021-1024, May. 1996

36. Рогозинский Г.Г. Перцепционное сжатие звука с использованием вейвлетных пакетов. Диссертация СПбГУКиТ, 2010.

37. Рогозинский Г.Г. Применение метода оптимизации вейвлетов в перцепционном кодировании звука //Радиотехника. 2010, №5.

38. P.Lee, Wavelet Filter Banks in Perceptual Audio Coding, Master Thesis, University of Waterloo, Canada, 2003.

39. ITU-R BS.1116

40. http://id3.org/id3v2.4.0-frames

41. Рогозинский Г.Г. К вопросу выбора оптимального вейвлета для перцепционного кодирования звуковых сигналов // Тезисы докладов 12-ой Международной

конференции «Цифровая обработка сигналов и ее применение - 2010». М.: ИПУ РАН, 2010.

42. M.V.Wickerhauser, "Adaptive Wavelet Analysis from Theory to Software," A.K. Peters Ltd., Massachusetts, 1994.

43. D.Pan, A tutorial on MPEG/Audio compression, IEEE Multimedia, vol.2, no.2, pp.60-74, 1995.

44. Малла С. Вэйвлеты в обработке сигналов: Пер. с англ. - М.: Мир, 2005.

45. http: //www.petitcolas. net/fabien/software/mpeg/index.html

46. Зырянов М.В. Повышение эффективности алгоритмов компрессии цифровых аудиоданных на основе учета временной маскировки. 05.12.04 2007

47. Добеши И. Десять лекций по вейвлетам. - Ижевск: НИЦ «Регулярная и хаотическая динамика», 2001.

48. P.S.Addison, The Illustrated Wavelet Transform Handbook, Taylor & Francis, July, 2002.

49. Айфичер Э., Джервис С., Барри У. Цифровая обработка сигналов: практический подход, 2-е издание: Пер. с англ. - М.: Издательский дом "Вильямс", 2004. -992 с.

50. Блаттер К. Вейвлет-анализ. Основы теории. - М.: Техносфера, 2004. - 280 с.

51. ISO/IEC 15444-1:2004 "JPEG 2000 image coding system: Core coding system".

52. ITU-R BS.562-3

53. https://www.telosalliance.com/support/MPEG-AAC-

54. ITU-R BS.1284

55. Акустика: Учебник для вузов/в, Ю.А.Ковалгин, А.А.Фадеев, Ю.П.Щевьев; Под ред. профессора Ю.А.Ковалгина.- М.: Горячая линия - Телеком, 2009. - 660 с. (41,5 уч. изд. листа); имеет гриф УМО «Учебник»

56. Алдошина И.А., Приттс Р. Музыкальная акустика. Учебник. - СПб.: Композитор, 2006.-720 с.

57. Вахитов Я.Ш. Слух и речь. Конспект лекций для студентов, обучающихся по специальности 0615 «Звукотехника». Л.: ЛИКИ, -1972.- 123 с.

58. Цвикер Э., Фельдкеллер Р. Ухо как приемник информации. Перевод с немецкого под редакцией Б.Г.Белкина. М.: Связь, 1971. - 255 с.

59. Moore B., Glasberg B., Bauer T. A. A Model for the Prediction of Thresholds, Loudness and Partial Loudness/ Journal of Audio Engineering Society, vol. 45, № 4, April 1997. P.224-240

60. Zwicker E., Fastl H. Psychoacoustics: Facts and Models Second Ed. Verlag: Springer, 1999.

61. Zwiker E., Zwiker T. Audio Engineering and Psychoacoustics: Matching Signals to the Final Receiver, the Human Auditory System/ Journal of Engineering Society, vol. 39, № 3, March 1991.

62. Zwiker E. Subdivision of the Audible Frequenvy Range into Critical Bands (Frequenzgruppen) / The Journal of Acoustical Society of America, Vol. 33, Number 2, February, 1961.- P.248.

63. Thiede T., Steinke G. Arbeitsweise und Eigenschaften von Verfahren zur Gehoer-richtigen Qualitaetsbewertung von Bitratenreduzierten Audiosignalen/Rundfunktechnische Mitteilungen, Nummer 3, 1994.-S. 102-114

64. Kapust R. Qualitaetsbeurteilung codierter Audiosignale mittels einer BARKTransformation. Technische Fakultaet der Universitaet Erlangen-Nuernberg. Dissertation. Erlangen, 1993.

65. Plomp R. Aspects of Tone Sensation. London.: Academic Press, 1976. 1.15.E.Terhard. The SPINC function for Scaling of Frequency in Auditory Mod-els/Acustica Vol. 77, 1992.

66. Rosisng T.D. The Science of Sound. New York .: Addision-Wesley Publ, 1982/

67. Therhard E. Akustische Kommunikation: Grundlagen mit Hoerbeispielen. Berlin, Heidelberg: Springer, 1998.

68. Bregman A.S. Auditory Science Analysis: The Perceptual Organization of Sound. Cambridge.: MIT Press, 1990.

69. Ковалгин Ю.А. и др. Акустические основы стереофонии / Ковалгин Ю.А., Бо-рисенко А.В., Гензель Г.С. - М.: Связь, 1978.-336 с.

70. Fletcher H. Speech and hearing in Communication. New York: Van Nostrad, 1953.

71. ISO/IEC 11172-3: Information Technology - Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to about 1.5 Mbit/s - part 3: Audio, 1993; 17

72. Colomes C., Lever M., Rault J.B., Dehery Y.-F., Faucon G., "A Perceptual Model Applied to Audio Bit-Rate Reduction", J. Audio Eng. Soc., vol.43(4), April 1995, pp.233-238; 9

73. Schroeder M.R., Atal B.S., Hall J.L., "Optimizing Digital Speech Coders by Explot-ing Masking Properties of the Human Ear", J.Acoust.Soc.Am.,vol.66(6), December 1979;

74. Mahieux Y., Petit J.P., "High-Quality Audio Transform Coding at 64 kbps", IEEE Trans. on Communications, vol.42(11), November 1994, pp.3010-3019; 29

75. ITU-R Document TG 10-2/3, Oct. 1991.

76. Brandenburg K., "Ein Beitrag zu den Verfahren und Qualitätsbeurteilung für hochwertige Musikcodierung", Erlangen-Nürnberg, Universität (Lehrstuhl für Technische Elektronik), Dissertation, 1989.

77. Zwicker E, Feldtkeller R. "Das Ohr als Nachrichtenempfänger.", Stuttgard: S.Hirzel Verlag, 1967; 53

78. Solbach, L.An Architecture for Robust Partial Tracking and Onset Localization in Single Channel Audio Signal Mixes. Dissertation, 1998, http://www.ti6.tu-harburg.de/~ti6ls/diss.

79. Brian C.J.Moore. Masking in the human auditory system // Collected Papers on Digital Audio Bit-Rate Reduction (Journal of the audio engineering society). - 1996. - P. 919.

80. Jesteadt W., Bacon S. P., Lehman J. R. Forward masking as a function of frequency, masker level, and signal delay // J. Acoust. Soc. Am. 1982. Vol. 71. P. 950-962.

81. Fastl H. Temporal masking effects: I. Broad band noise masker // Acustica. 1976. Vol. 35, S.287-302.

82. Fastl H. Temporal masking effects: II. Critical band noise masker // Acustica . 1977. Vol. 36. S. 317-331.

83. Fastl H. Temporal masking effects: III. Pure tone masker // Acustica. 1979. Vol. 43, S. 282-294.

84. Plomp R. The rate of decay of auditory sensation // J. Acoust. Soc. Am. 1964. Vol. 36. P. 277-282.

85. Stein H. J. Das Absinken der Mitho'rschwelle nach dem Abschalten von weißem Rauschen // Acustica. 1960. Vol. 10. S. 116-119.

86. Moore B.C.J., Glasberg B. R. Growth of forward masking for sinusoidal and noise maskers as a function of signal delay: Implications for suppression in noise // J. Acoust. Soc. Am. 1983. Vol. 73. P. 1249-1259.

87. Zwicker E., Fastl H. Zur Abhängigkeit der Nachverdeckung von der Störimpulsdauer Acustica. 1972. Vol. 26. S. 78-82.

88. Zwicker E. Dependence of post-masking on masker duration and its relation to temporal effects in loudness // J. Acoust. Soc. Am. 1984. Vol. 75. P. 219-223.

89. Widin G. P., Viemeister N.F. Intensive and temporal effects in pure-tone forward masking // J. Acoust. Soc. Am. 1979. Vol. 66. S. 388-395.

90. Duifhuis H. J. Consequences of peripheral frequency selectivity for no simultaneous masking // Acoust. Soc. Am. 1973. Vol. 54(6). Dec. P. 1471-1488.

91. Nelson D.A., Freyman R.L. Temporal Resolution in Sensor neural Hearing-Impaired Listeners // J. Acoust. Soc.Am. 1987. Vol. 81. P. 709-720.

92. Moore B.C.J., Glasberg B.R., Plack C.J., Biswas A.K. The shape of the ear's temporal window // J. Acoust. Soc. Am. 1988. Vol. 83. P. 1102-1116.

93. Plack C.J., Moore B.C.J. Temporal window shape as a function of frequency and level // J. Acoust. Soc. Am. 1990. Vol. 87. P. 2178-2187.

94. Plack C. J., Oxenham A. J. Basilar-membrane nonlinearity and the growth of forward masking // J. Acoust. Soc. Am. 1998. Vol. 103. № 3. P.1598-608.

95. Hawksford M.O.J., Hollier, M. P. (1993) "Characterizationof CommunicationsSys-temsUsing a Speechlike Test Stimulus" J. Audio Eng. Soc., 41, No. 12,

96. Widin, G. P., Viemeister, N.F.(1979) "Intensive and temporal effects in pure-tone forward masking" J.Acoust.Soc.Am., 66, 388-395

97. ITU-R Recommendation BS.1387. (1998). "Method for Objective Measurements of Perceived Audio Quality".

98. Terhardt, E. (1979). "Calculating virtual pitch". Hearing Research, 1, p.155-182.

99. Meddis, R., O'Mard, L.P.(2005) "A computer model of the auditory-nerve response to forward-masking stimuli" J.Acoust.Soc.Am 117(6), 3787-3798

100. Moore, B.C. (1978). "Psychophysical tuning curves measured in simultaneous and forward masking." J Acoust Soc Am. Feb;63(2):524-32.

101. Houtgast, T.(1972) "Psychophysical Evidence for Lateral Inhibition in Hearing" J.Acoust.Soc.Am 51(6B)

102.Альтман Я.А. Локализация звука (нейрофизиологические механизмы). Л.:

Наука, 1972.-214 с.

103. Schenkel K. Ueber die Abhaengigkeit der Mithoerschwellen von der interauralen Phasenlage des Testschals. - Acustica, vol. 4? 1964, S.337-346.

104. Schenkel K. Accumulation theory of binaural masked thresholds. -J.Acoust. Sos. Amer., vol. 41, N 1, 1967, p.20-30

105. Durlach N.J. Equalization and cancellation theory of binaural masking-level differences. - J. Acoust. Sos. Amer., vol. 35, 1963, p.1206-1218

106. Durlach N.J. On the application of the EC-model to interaural jund's. - J. Acoust. Sos. Amer., vol. 40, N 6, 1966, p.162-181.

107. G^are (Theile G. Zur Theorie der Optimalen Wiedergabe von Stereofonen Signalen ueber Lautsprecher und Korphoerer// Rundfunktechnische Mitteilungen. - 1981, J.25, Heft 4.- S.155-170

108. Ланге Ф. Корреляционная электроника. Л.: Судпромгиз, 1963.-447 с.

109. Cherry E.C., Sayers M.A. Human cross-correlator./ J. Acoust. Sos. Amer., vol. 28, N 5, 1956, p.889-895. Госэнергоиздат,1954.-524 с.

110. Ковалгин Ю.А. Стереофония. -М.: Радио и связь, 1989.-272 с.

111. Блауэрт Й. Пространственный слух: Пер. с нем. - М.: Энергия, 1979.-224 с.

112. Blauert J. Raeumlichen Hoeren. Nachschrift. Neue Ergebnisse und Trends seit 1972. - S.Hirzel Verlag Stuttgart, 1985.-119 S.

113. G. Kendall & W. Martens, «Simulating the cues of spatial hearing in natural env i-ronments» //Proceedings of the 1984 International Computer Music Conference.

114. A.W. Mills, «Auditory Localization» //In.: J.V. Tobias, ed., Foundations of Modem Auditory Theory. - Academic Press, 1972, vol. 2, p.337.

115. Schubert E. Some preliminary experiments on binaural time delay and intelligibili-ty//J. Acoust. Soc. Amer., vol. 28, №5, 1956. p.456-464

116. Электроакустика и звуковое вещание: Учебное пособие для вузов / И.А. Ал-дошина, Э.И.Вологдин, А.П. Ефимов и др.; Под ред. Ю.А.Ковалгина. -М.: Горячая линия - Телеком, Радио и связь, 2007. - 872 с.

117. Стереофоническое радиовещание и звукозапись: Учебное пособие для вузов/ Ю.А.Ковалгин, Э.И.Вологдин, Л.Н.Кацнельсон; Под ред. профессора Ю.А.Ковалгина.-М.: Горячая линия - Телеком, 2007, - 720 с.

118. Ковалгин Ю.А., Вологдин Э.И. Цифровое кодирование звуковых сигналов: Учебное пособие.- СПб.: КОРОНА-принт, 2004, - 240 с.

119. Попов О.Б.Б., Рихтер С.Г. Цифровая обработка сигналов в трактах звукового вещания: Учебное пособие для вузов. - М.: Горячая линия - телеком, 2007. - 341 с.

120. Оппенгейм А., Шафер Р. Цифровая обработка сигналов. - М.: Техносфера, 2006. - 856 с.

121. Сэломон Д. Сжатие данных изображений и звука. - М.: Техносфера, 2004. -368 с.

122. ISO/IEC 13818-7. Information Technology -Generic coding of moving pictures and associated audio - Part 7: Advanced Audio Coding", 1997. Super Audio CD Player SCD-1 Technology.

123. International Standard ISO/IEC 11172-3. Information technology-Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/sPart 3: Audio, 1993-08-01.

124. International Standard ISO/IEC 13818-3. Information technology-Generic coding of moving pictures and associated audio information. Part 3:Audio, 1995-05-15.

125. International Standard ISO/IEC 13818-7. Information technology-Generic coding of pictures and associated audio information. Part 7: Advanced Audio Coding (AAC), 1997 (E).

126. ISO/IEC FCD 14496-3 Subpart 1. Information Technology-Very Lov Bitrate Audio-Visual Coding. Part 3: Audio, 1998-05-10 (ISO/JTC 1/SC 29, N2203).

127. Digital Audio Compression Standard (AC-3). Doc.A/52, 1995-12-20.

128. Ковалгин Ю.А. Алгоритмы компрессии цифровых аудиоданных// Системы и средства связи, телевидения и радиовещания, номер 3, 2000. -c. 17-29.

129. Ятагама Гамаге Д.П. Повышение эффективности алгоритмов компрессии цифровых данных при кодировании сигналов стереопары. Автореферат диссертации на соискание ученой степени кандидата технических наук, СПб.: СПбГУТ 2005. - 16 с.

130. Зырянов М.В. Повышение эффективности алгоритмов компрессии цифровых аудиоданных на основе учета временной маскировки. Автореферат диссертации на соискание ученой степени кандидата технических наук, СПб.: СПбГУТ, 2007. -16 с.

131. Захаренко А.В. Учёт временных свойств слуха при сокращении психофизической избыточности звукового сигнала//Труды учебных заведений связи, СПб.: СПбГУТ, № 172, 2005.

132. Johnston J., Transform Coding of Audio Signals Using Perceptual Noise Criteria // IEEE J. Sel. Areas in Comm., pp. 314-323, Feb. 1988.

133. Bosi M., Goldberg R. E. Introduction to Digital Audio Coding and Standards. -Springer, 2003. - 458 p.

134. Кацнельсон Л.Н. Системы цифрового радиовещания DAB, DMB и DAB+; Часть 1: учебное пособие; ГОУВПО СПбГУТ, 2009.- 100 с.

135. Кацнельсон Л.Н. Системы цифрового радиовещания DAB, DMB и DAB+; Часть 2: учебное пособие; ГОУВПО СПбГУТ, 2009.- 64 с.

136. Кацнельсон Л.Н. Системы цифрового радиовещания DAB, DMB и DAB+; Часть 3: учебное пособие; ГОУВПО СПбГУТ, 2009.- 68 с.

137. Кацнельсон Л.Н. Система цифрового радиовещания DRM. - СПб.: Изд.-во «Линк», 2010. - 76 с.

138. Шелухин О.И., Лукъянцев Н.Ф. Цифровая обработка и передача речи/Под ред О.И.Шелухина. - М.: Радио и связь, 2000.-456 с.

139. Документ ETSI TS 101 980 V1.1.1 (2001-09). Digital Radio Mondiale (DRM); System Specification.

140. Акустика:Учебник для вузов/ Ш.Я.Вахитов, Ю.А.Ковалгин, А.А.Фадеев, Ю.П.Щевьев; Под ред. Профессора Ю.А.Ковалгина. - М.: Горячая линия -Телеком, 2009.- 660 с.

141. J.Princen and J.D.Johnston, Audio Coding with Signal Adaptive Filterbanks, in Proc. ICASSP-95, pp.3071 - 3074, May 1995.

142. ISO/IEC 23003-1:2007, "Information Technology— MPEG Audio Technologies—Part 1: MPEG Surround," International Standards Organization, Geneva, Switzerland (2007).

143. ISO/IEC 23003-1:2007/Cor. 1:2008, "Information Technology—MPEG Audio Technologies—Part 1: MPEG Surround, TECHNICAL CORRIGENDUM 1," International Standards Organization, Geneva, Switzerland (2008).

144. J. Herre, "From Joint Stereo to Spatial Audio Coding— Recent Progress and Standardization," presented at the 7th Int. Conf. on Digital Audio Effects (DAFX04) (Naples, Italy, 2004 Oct.).

145. H. Purnhagen, "Low Complexity Parametric Stereo Coding in MPEG-4," presented at the 7th Int. Conf. on Audio Effects (DAFX-04) (Naples, Italy, 2004 Oct.).

146. R. Dressler, "Dolby Surround Prologic Decoder— Principles of Operation," Dolby Publi.,

http://www.dolby.com/assets/pdf/tech_library/209_Dolby_Surround_Pro_Logic_II_Dec oder_Principles_of_Operation.pdf

147. ISO/IEC JTC1/SC29/WG11 (MPEG), "Call for Proposals on Spatial Audio Coding," Doc. N6455, Munich, Germany (2004).

148. ISO/IEC JTC1/SC29/WG11 (MPEG), "Report on Spatial Audio Coding RM0 Selection Tests," Doc. N6813, Palma de Mallorca, Spain (2004).

149. J. Herre, H. Purnhagen, J. Breebaart, C. Faller, S. Disch, K. Kjo'rling, E. Schuijers, J. Hilpert, and F. Myburg,"The Reference Model Architecture for MPEG Spatial Audio Coding," presented at the 118th Convention of the Audio Engineering Society, J. Audio Eng. Soc. (Abstracts), vol. 53, pp. 693, 694 (2005 July/Aug.), convention paper 6447.

150. ISO/IEC JTC1/SC29/WG11 (MPEG), "Report on MPEG Spatial Audio Coding RM0 Listening Tests," Doc.N7138, Busan, Korea (2005); available at http://www.chiariglione.org/mpeg/working_documents/mpeg-d/sac/ RM0-listening-tests.zip.

151. J. Breebaart, J. Herre, C. Faller, J. Roden, F. Myburg, S. Disch, H. Purnhagen, G. Hotho, M. Neusinger, K.Kjorling, and W. Oomen, "MPEG Spatial Audio Coding/ MPEG Surround: Overview and Current Status," presented at the 119th Convention of the Audio Engineering Society, J. Audio Eng. Soc. (Abstracts), vol. 53, p. 1228 (2005 Dec.), convention paper 6599.

152. J. Breebaart, S. van de Par, and A. Kohlrausch, "Binaural Processing Model Based on Contralateral Inhibition— I. Model Setup," J. Acoust. Soc. Am., vol. 110, pp. 10741088 (2001).

153. J. Breebaart, J. Herre, L. Villemoes, Craig Jin, K. Kjo'rling, J. Plogsties, and J. Koppens: "Multi-ChannelGoes Mobile: MPEG Surround Binaural Rendering," presented at the 29th AES Int. Conf. (Seoul, Korea, 2006). [18] L. Villemoes, J. Herre, J. Breebaart, G. Hotho, S. Disch, H. Purnhagen, and K. Kjo'rling, "MPEG Surround: The Forthcoming ISO Standard for Spatial Audio Coding," presented at the 28th Int. Conf. (Piteä, Sweden, 2006).

154 Фадеев Д.Р. Оценка качества и эффективности работы кодека в вейвлетном пространстве / Ковалгин Ю.А., Фадеев Д.Р. // Системы управления и информационные технологии, №2(64),2016 - С. 58-62.

155 Фадеев Д.Р. Исследование психоакустических моделей кодеков с компрессией цифровых аудиоданных / Ковалгин Ю.А., Фадеев Д.Р. // Современная наука актуальные проблемы теории и практики, 2016, №7, 2016. - С. 29-38.

156 Фадеев Д.Р. Контроль искажений квантования при работе кодека в вейвлетном пространстве / Ковалгин Ю.А., Фадеев Д.Р. // Электросвязь, № 8, 2016. - С. 68-73.

157 Фадеев Д.Р. Программный комплекс для исследования эффективности психоакустических моделей в алгоритмах перцепционного сжатия звуковых сигналов / Фадеев Д.Р. // Системы управления и информационные технологии, №1(63), 2016. - С. 47-50.

158 Фадеев Д.Р. Исследование эффективности психоакустических моделей в алгоритмах перцепционного сжатия звуковых сигналов/Фадеев Д.Р.//Приоритетные направления развития науки и технологий. Сборник докладов XVIII международный научно-технической конференции, издательство «Инновационные технологии», Тула, 2015. - С. 70-72.

159 Фадеев Д.Р. Вейвлетная психоакустическая модель с переключением деревьев/Фадеев Д.Р.//Приоритетные направления развития науки и технологий. Сборник докладов XVIII международный научно-технической конференции, издательство «Инновационные технологии», Тула, 2015 - С. 72-75.

160 Фадеев Д.Р. Применение вейвлет-преобразований в алгоритмах компрессии цифровых аудиоданных/Фадеев Д.Р.//Сборник: Актуальные проблемы инфотеле-коммуникаций в науке и образовании «международная научно-техническая научно-методическая конференция» 2013. - С. 357-363.

161 Фадеев Д.Р. Метод контроля шумов квантования вейвлетных коэффициентов в перцепционном сжатии звуковых сигналов/Фадеев Д.Р.// Актуальные проблемы инфотелекоммуникаций в науке и образовании»; СПбГУТ.-СПб., 2016.

162 Фадеев Д.Р. Учет искажений квантования при кодировании коэффициентов вейвлетного преобразования/Фадеев Д.Р//Актуальные проблемы радио- и кинотехнологий: материалы Международной научно-технической конференции, посвященной 125-летию со дня рождения русского радиотехника, проф. Ленинградского института киноинженеров В.И. Волынкина.: СПбГИКиТ, 2016. - С. 48.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.

Оглавление диссертации кандидат наук Фадеев, Даниил Романович

Рекомендованный список диссертаций по специальности «Радиотехника, в том числе системы и устройства телевидения», 05.12.04 шифр ВАК

Похожие диссертационные работы по специальности «Радиотехника, в том числе системы и устройства телевидения», 05.12.04 шифр ВАК

Перцепционное сжатие звука с использованием вейвлетных пакетов2010 год, кандидат технических наук Рогозинский, Глеб Гендрихович

Спектрально-временные методы и алгоритмы обработки звуковой информации2004 год, кандидат технических наук Кудряшов, Максим Юрьевич

Список литературы диссертационного исследования кандидат наук Фадеев, Даниил Романович, 2017 год