Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат технических наук Пчелинцев, Алексей Викторович

  • Пчелинцев, Алексей Викторович
  • кандидат технических науккандидат технических наук
  • 2003, Москва
  • Специальность ВАК РФ05.13.17
  • Количество страниц 109
Пчелинцев, Алексей Викторович. Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением: дис. кандидат технических наук: 05.13.17 - Теоретические основы информатики. Москва. 2003. 109 с.

Оглавление диссертации кандидат технических наук Пчелинцев, Алексей Викторович

ВВЕДЕНИЕ.

Глава 1. ОБЗОР МЕТОДОВ ЦИФРОВОЙ ПЕРЕДАЧИ РЕЧИ, СОПРОВОЖДАЕМЫХ КОРРЕЛИРОВАННЫМИ С РЕЧЕВЫМ СООБЩЕНИЕМ ШУМАМИ.

1.1 Шумы квантования при ИКМ.

1.2 Шумы квантования при АДИКМ.

1.3 Шумы при прерывистой передаче речи в сотовых системах.

1.4 Шумы, коррелированные с речевым сообщением.

Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением»

В настоящее время явно определилась тенденция перехода от классической телефонии, к передаче речевых сообщений по сетям передачи данных с использованием, например, протоколов семейства ЕР (TCP, UDP) и др. Такой переход становится возможным при снижении требований к ширине полосы пропускания канала в результате применения кодеков современных типов, например, удовлетворяющих рекомендациям ITU-T стандарта Н.323 серии G.

Сказанное естественно относится и к применениям в цифровых сетях железнодорожного транспорта фиксированных и подвижных.

При оценивании качества восстановления речи с использованием кодеков, необходимо учитывать коррелированные и некоррелированные с сообщением шумы, которые имеют различную природу происхождения -акустические, процедур квантования и дискретизации, цифрового вокодерного преобразования, канальные и др.

В данной диссертационной работе рассматриваются вопросы аналитической оценки качества восстановления речи на фоне различной природы шумов, в том числе коррелированных с речевым сообщением. В условиях преимущественного использования в настоящее время субъективных методов оценивания качества восстановления речи актуальность оценки аналитической достаточно высока.

Цель работы состоит в развитии теории восстановления подвергнутых обработке речевых сообщений, в разработке методики и математического аппарата аналитического оценивания качества речи, при ее обработке в современных кодеках, что имеет существенное значение для анализа и рационального проектирования использующих эти кодеки цифровых систем.

Реализуется следующая последовательность их решения:

1. Обзор и анализ методов цифровой передачи речи, сопровождаемых коррелированными с речевым сообщением. Шумы квантования при ИКМ.

2. Разработка методов определения акустических шумов, в том числе применительно к мобильным системам.

3. Выбор модели речевого сигнала и его основных вероятностных характеристик (прежде всего спектральных).

4. Разработка методики комплексной оценки прерывистой передачи речи.

5. по критерию отношения сигнал/шум.

6. Совершенствование методики оценивания качества восстановления речи по критерию разборчивости и ее применение к анализу кодеков, в том числе кодеков, используемых при прерывистой передаче и кодеков G.711. Диссертация основывается на результатах:

- фундаментальных работ теории информации В. А. Котельникова, Н. Винера, К. Шеннона и др.

- теоретических и прикладных исследований по обработке и передаче речи Дж.Беллами, А.И.Величкипа, М.Д.Вепедиктова, Г.В.Вемяпа, В.Н.Гордиепко, Г.В.Горелова, А.Г.Зюко, Г.В. Кузнецова, М.В. Назарова, А.Ф. Фомина и др.

- теоретических и прикладных исследований цифровых средств и систем передачи информации JI.A. Баранова, И.А. Лозового, А.П.Мановцева, Н.И.Пилипчук, В.П.Яковлева и др.

На защиту выносятся следующие основные положения и результаты исследования:

Методика аналитического оценивания по критерию разборчивости качества восстановления речи на фоне различной природы шумов, в том числе коррелированных с речевым сообщением.

Аналитические модели процесса передачи речи в сети при применении кодеков современных типов, например, удовлетворяющих рекомендациям ITU-T стандарта Н.323 серии G.

Результаты оценивания качества передачи речи в сети с использованием разработанных методики и моделей.

В работе использованы методы теории вероятностей, математического анализа, теории массового обслуживания.

Научная новизна определяется разработкой методики и результатами аналитического оценивания качества передачи речи в сетях при применении кодеков рекомендованных стандартом Н.323 ГШ-Т, в частности -предложенными моделями процессов восстановления речи на фоне различной природы шумов и моделей потоков отсчетов сообщения (в том числе - моделью с распределением Парето интервала в потоке отсчетов).

Практическое значение заключается в том, что разработанный аналитический аппарат предоставляет возможность получения объективных оценок (по критерию разборчивости) качества восстановления речи в современных сетях и может быть иснользован при анализе качества восстановления речевых сообщений.

1 .ОБЗОР МЕТОДОВ ЦИФРОВОЙ ПЕРЕДАЧИ РЕЧИ, СОПРОВОЖДАЕМЫХ КОРРЕЛИРОВАННЫМИ С РЕЧЕВЫМ СООБЩЕНИЕМ ШУМАМИ

Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Заключение диссертации по теме «Теоретические основы информатики», Пчелинцев, Алексей Викторович

5.4. Основные выводы и результаты

1. Предложена методика аналитической оценки качества прерывистой передачи речи по критерию разборчивости, учитывающая шумы, коррелированные и некоррелированные с передаваемым сообщением и основанная на предложенных в работе моделях.

2. Получила развитие методика аналитической оценки по критерию разборчивости качества кодеков 0.711, получивших широкое распространение прежде всего в цифровых сетях стационарной связи.

Для оценки качества передачи речи использованы модели рекуррентных потоков отсчетов с гиперпричинным и пуассоновским распределением вероятностей интервала.

Предложена модель рекуррентного потока отсчетов с распределением вероятностей интервала по усеченному (нормированным в диссертации с целью учета конечности значения интервала) закону Парето. В отличие от большинства используемых с той же целью моделей потока отсчетов, она позволяет практически в неограниченных пределах изменять значение коэффициента вариации интервала в потоке.

Рассмотрен ряд практически важных примеров аналитической оценки качества кодеков, использующих представление отсчетами: в штатном режиме, при изменении тактовой частоты, при отбраковке отсчетов, при дрожании фронтов тактовых импульсов и т.п.

Аналитическое моделирование позволяет получать сравнительные оценки качества для весьма сложных условий моделирования, позволяет относительно просто изменять условия функционирования кодека в процессе анализа его качества. Например, задаваясь интенсивностью дискретизации, отвечающей условиям функционирования первичной ДСП (условиям теоремы В.А.Котелышкова) и фиксируя динамический диапазон изменения интервала в потоке (4,48 дБ в табл.5.6), можно моделировать характер нерегулярности потока отсчетов, изменяя параметр усеченного распределения Парето, меняя тем самым значения коэффициента вариации интервала (в табл.5.6 от 0,24 до 0,008), получая при этом оценки качества для всех его градаций: от неудовлетворительного до отличного (в табл.5.6 значения ОСШ от 6,73 до 779,57 дБ).

Заключение

Подводя итог вышеизложенному, сформулируем основные выводы и результаты по диссертационной работе в целом.

Проведенные в работе исследования позволяют сделать следующие выводы:

1. Процедуры преобразования речевого сообщения в цифровую форму присутствуют как в стационарных информационных сетях (прежде всего в соответствии с рекомендацией G.711 стандарта Н.323 ITU-T), так и в мобильных сетях (где в большинстве остальных рекомендаций семейства "G" стандарта Н.323 предусматривается система прерывистой передачи (Discontinuous Transmission — DTX), которая отключает передатчик в паузах и по окончании разговора). В обеих ситуациях приходится решать задачи, связанные с оцениванием качества восстановления речевого сообщения на фоне шумов, коррелированных и некоррелированных с ним. К числу первых относятся не только шумы квантования, но, как показано в диссертации, и некотторые другие шумы аналого-цифрового преобразования.

Одним из наиболее гибких и универсальных средств оценивания качества восстановления речи представляется аналитический аппарат, нашедший свое развитие в данной диссертации. Он составляет альтернативу широко используемым в последнее время при анализе качества различных субъективным методам оценивания, например MOS.

2. Для различных условий размещения оконечного устройства системы связи (стационарного помещения, кабины движущегося и неподвижного автомобиля) определены величины суммарных невзвешенных уровней звукового давления акустических шумов в полосе частот, охватывающую полосу частот речевого сигнала. Они использованы при нормировании спектральных плотностей, то есть получении зависимостей, предназначенных для расчетов характеристик речевого сигнала при различных значениях суммарного невзвешенного уровня звукового давления акустических шумов во всей полосе частот сигнала.

Полученные аппроксимации нормированных спектральных плотностей звукового давления могут быть использованы и для описания спектральной плотности интенсивности, спектральной плотности мощности первичного (на выходе микрофона) электрического сигнала, порождаемого акустических шумами, и т.п. характеристик.

При определении нормированных спектральных плотностей устранены неточности представления исходного материала, присутствующие в рекомендации [8] ITU-T.

3. С использованием представленных рекомендациями Р.51 ITU-T [9] данных о спектральной плотности звукового давления (долговременного спектра) искусственного голоса предложена аппроксимация спектральной плотности интенсивности звука. Получено выражение нормированной спектральной плотности, применимое как для описания спектральных плотностей акустического речевого сообщения (звукового давления и интенсивности звука), так и для описания спектральной плотности мощности речевого сигнала, являющегося результатом линейного преобразования в микрофоне.

При определении нормированных спектральных плотностей устранены неточности представления исходного материала, присутствующие в рекомендации [9] ITU-T.

Определена степень соответствия известной и предложенной в диссертации моделей нормированной спектральной плотности мощности речевого сигнала.

4. Для используемых в системе прерывистой передачи речи методов цифрового вокодера (например, метода линейного предсказания с возбуждением регулярной последовательностью импульсов RPE-LPC) предложена модель полосного вокодера, с линейным интерполированием в каждой подполосе спектра сообщения. В рамках такого моделирования определена мощность шума вокодера в общем виде и для предложенной в диссертации модели нормированной спектральной плотности сообщения. Сделан вывод о коррелированное™ с речевым сообщением шума вокодера Определено отношение мощности сигнала к мощности шума вокодера.

5. Для используемых в системе прерывистой передачи речи методов экстраполяции фрагментов сообщения, потерянных из-за ошибок в канале (замена потерянного кадра предыдущим при потере одного кадра, постепенное заглушение сигнала на приемной стороне и воспроизведение "комфортного" шума при потере подряд двух и более кадров), определены аналитические оценки мощностей соответствующих шумов, в том числе, с учетом искажений, вносимых вокодером.

6. Для используемых в системе прерывистой передачи речи методов цифрового вокодера и экстраполяции разработана методика комплексного аналитического оценивания качества, в том числе, основанная на предложенной в диссертации модели спектральной плотности мощности сообщения и учитывающая наличие корреляции с сообщением тех или иных составляющих шума. Например, при числе полос разбиения 11, длительности речевого кадра 20 мс, входном отношении сигнал/шум 30 дБ, вероятности потери кадра 0,001, при потере подряд двух или более речевых кадров сигнал на выходе речевого декодера заменяется шумом, эквивалентным шуму на входе передатчика, можно получить значение эквивалентного ОСШ на выходе равное 23,54 дБ.

7. Предложена методика аналитической оценки качества прерывистой передачи речи по критерию разборчивости, учитывающая шумы, коррелированные и некоррелированные с передаваемым сообщением и основанная на предложенных в работе моделях.

8. Получила развитие методика аналитической оценки по критерию разборчивости качества кодеков G.711, нашедших широкое распространение прежде всего в цифровых сетях стационарной связи.

Для оценки качества передачи речи использованы модели рекуррентных потоков отсчетов с гиперпричинным и пуассоновским распределением вероятностей интервала.

Предложена модель рекуррентного потока отсчетов с распределением вероятностей интервала по усеченному (в результате нормирования, проведенного в диссертации с целью учета конечности значения интервала) закону Парето. В отличие от большинства используемых с той же целью моделей потока отсчетов она позволяет практически в неограниченных пределах изменять значение коэффициента вариации интервала в потоке.

Рассмотрен ряд практически важных примеров аналитической оценки качества кодеков, использующих представление отсчетами: в штатном режиме, при изменении тактовой частоты, при отбраковке отсчетов, при дрожании фронтов тактовых импульсов и т.п.

Аналитическое моделирование позволяет получать сравнительные оценки качества в весьма сложных условиях, позволяет относительно просто изменять условия функционирования кодека в процессе анализа его качества. Например, задаваясь интенсивностью дискретизации, отвечающей условиям функционирования первичной ЦСП (условиям теоремы В.А.Котельникова), и фиксируя динамический диапазон изменения интервала в потоке (4,48 дБ в табл.5.6), можно моделировать характер нерегулярности потока отсчетов, изменяя параметр усеченного распределения Парето, меняя тем самым значения коэффициента вариации интервала (в табл.5.6 от 0,24 до 0,008), получая при этом оценки качества, проходя все его градации: от неудовлетворительного до отличного (в табл.5.6 значения ОСШ от 6,73 до 779,57 дБ).

Список литературы диссертационного исследования кандидат технических наук Пчелинцев, Алексей Викторович, 2003 год

1. Лозовой И.А. Параметры каналов тональной частоты аппаратуры с ИКМ. М.: Радио и связь, 1981

2. Гуревич В.Э., Лопушнян Ю.Г., Рабинович Г.В. Импульсно-кодовая модуляция в многоканальной телефонной связи. М.: Связь, 1973.

3. Лозовой И. А. К вопросу о погрешностях в системах с импульсно-кодовой модуляцией. Сборник научных грудов ЦНИИС, N1, 1962.

4. Пилипчук Н.И., Яковлев В.П. Адаптивная импульсно-кодовая модуляция. М.: Радио и связь, 1986

5. Пилипчук Н.И., Пилипчук М.И. Применение адаптивной импульсно-кодовой модуляции //Тр.ин-та/ РТИ им.ак. А.Л.Минца РАН, 1989. Сборник Радиолокационные методы в радиофизических исследованиях. - с. 198-206.

6. Величкин А.И. Теория дискретной передачи непрерывных сообщений. -М.: Сов.радио, 1970

7. CCITT Volume V Supplément No. 13.-р.267-270.

8. CCITT Volume V Section 4 Recommendation P.51.-p.85-93.

9. Вемян Г.В. Передача речи по сетям электросвязи. М.: Радио и связь, 1985

10. Gorelov G., Romashkova О. Influence of russian, spanish and vietnamese speech characteristics on digital infonnation transmission quality. Proceedings of the ШЕЕ Internatonal Symposium on Industrial Electronics. ISIE'96. Warsaw Vol 1. -p.311-313.

11. Горелов Г.В., Ромашкова О.Н., Чан Туан Ань Свойства энергетического спектра сообщения вьетнамской речи. Обработка сигналов в системе двусторонней телефонной связи. Тезисы докладов. М.: 1995. -с.103-105.

12. Горелов Г.В., Ромашкова О.Н., Кинтана М. Моделирование спектральной плотности мощности испаноязычного речевого сообщения. Обработка сигналов в системе двусторонней телефонной связи. Тезисы докладов. Новосибирск: 1995. - с.30-32.

13. Горелов Г.В., Казанский Н.А., Лукова О.Н. Методика оценки качества пакетной передачи речи в интегральных цифровых сетях. М.: Электросвязь, N9, 1992. -с.31-32.

14. Громаков Ю.А. Системы и стандарты подвижной радиосвязи. М.: МЦНТИ, 1996.

15. CCITT Contribution Com.XII-N. Study period. vol.V, Q IS/ХП, Annex3,4.

16. Ситняковский И.В., Мейкшап В.И., Маглицкий Б.Н. Цифровая сельская связь; Под ред.Венедиктова М.Д. М.: Радио и связь, 1994

17. Горелов Г.В., Каргулин С.Г., Рогов М.А. Оценивание качества передачи речи в цифровых сотовых системах связи. М. - 3 с.

18. Волков В.М., Лебединский А.К., Павловский А.А., Юркин Ю.В.; Под ред. Волкова В.М. Автоматическая телефонная связь на железнодорожном транспорте М.: Транспорт, 1996

19. Волков В.М., Зорько А.П., Прокофьев В.А. Технологическая телефонная связь на железнодорожном транспорте. М.: Транспорт, 1990

20. Сидоров И.П., Димитров А.А. Микрофоны и телефоны: Справочник. -М.: Радио и связь, 1993

21. Горелов Г.В. Нерегулярная дискретизация сигналов. М.: Радио и связь. 1982.

22. Горелов Г.В., Ромашкова О.Н., Чан Туан Ань, Пчелинцев A.B., Иваний Ю.Б. Качество управления речевым трафиком в телекоммуникационных сетях. М.: Радио и связь, 2001

23. Горелов Г.В., Ромашкова О.Н., Пчелинцев A.B. К оценке качества алгоритмов обработки речи в информационных сетях. //Телекоммуникации. -2001г. №8

24. Горелов Г.В., Ромашкова О.Н., Пчелинцев A.B. Аналитическая оценка качества кодеков стандарта G.711 //Телекоммуникации. 2001г. №5

25. Горелов Г.В., Ромашкова О.Н., Иваний Ю.Б. Качество фильтрации при пуассоновском распределении интервала в потоке отсчетов на входе восстанавливающего фильтра. Информационно-управляющие системы на железнодорожном транспорте. Харьков 2000 г. N4 с.68-752

26. Фомин А.Ф. Помехоустойчивость систем передачи непрерывных сообщений. М.: Советское радио, 1975.

27. Горелов Г.В., Каргулин С.Г., Рогов М.А. К оценке качества передачи речи в стандарте GSM.// Информационно-управляющие системы на железнодорожном транспорте. Харьков 1997, N1, с.30-33

28. Горелов Г.В., Кочнов JI.JL, Пчелинцев A.B., Пчелинцева Н.М. К оценке качества полосного вокодера. Обработка сигналов в системах телефонной связи. 1998 с. 71-74

29. Каргулин С.Г. Разработка методики оценки качества прерывистой передачи речи в цифровых сетях подвижной связи. Диссертация на соискание ученой степени кандидата технических наук М. 1998. 109с.

30. Горелов Г.В., Пчелипцев A.B. Анализ кодеков G.711 с использованием распределения Парето длительности интервалов в потоке отсчетов.//Телекоммуникации.-2003г. №5

31. Горелов Г.В., Казанский H.A., Иваний Ю.Б., Пчелинцев A.B. Методика многокритериального выбора цифровых АТС для сети связижелезнодорожного транспорта // Материалы третьей международной научно-технической конференции, М.-1999, с. 96-98.

32. Горелов Г.В., Казанский Н.А., Иваний Ю.Б., Пчелинцев А.В. Выбор и использование цифровых АТС в ведомственных сетях связи // ВКСС Connect, М. N2, 2000г., с. 107-126.

33. Горелов Г.В., Казанский Н.А., Иваний Ю.Б., Пчелинцев А.В. Цифровые АТС в ведомственных сетях связи // Мир связи, М. N10, 2000г., с.82-85.

34. Бронштейн И.П., Семендяев К.А. Справочник по математике для инженеров и учащихся втузов. 13-е изд., исправленное. -М.: Наука, гл. ред. физ.-мат. лит., 1986.-544с.

35. Гольдштейн Б.С., Пинчук А.В., Суховицкий А.С. IP-телефония. М.: Радио и связь, 2001. - 336 с.

36. Вокодерная телефония. Методы и проблемы. Под. ред. А.А. Пирогова. -М.: Связь, 1974,-С. 536.

37. Михайлов В.Г., Златоустова JI.B. Измерение параметров речи./ Под ред. М.А. Сапожкова. -М.: Радио и связь, 1987. С. 168.

38. Gersho A., Paksoy Н. Variable rate speech coding for cellular networks. / Speech and Audio Coding for Wireless and Network Application. Kluwer Academic Publishers. 1993, p. 77-84.

39. Paksoy E., Srinivasan K., Gersho A. Variable Bit-Rate CELP Coding of Speech with Phonetic Classification. // HIT, Vol.5, № 5 September-October 1994, pp. 591-602.

40. Cellario L., Sereno D. CELP Coding at Variable Rate. // ETT, Vol.5, № 5 September-October 1994, pp. 603-613.

41. Berutto E., Sereno D. Variable-rate for the basic speech service in UMTS. VTC. Secaucus NJ 1993, pp. 520-523.

42. Q4401 Variable Rate Vocoder. General Description. QUALCOMM Incorporated, ASIC Products 6455 Lusk Boulevard, San Diego, 1997.

43. Горелов Г.В. Телекоммуникационные технологии на железнодорожном транспорте". М.:УМК МПС РФ, 1999.-576 с.

44. Нейман В.И. Системы сотовой связи. М.:МИИТ, 1995.

45. Тамаркин В.М. и др. Транкинговые системы радиосвязи. М.:Связь и бизнес, 1997.1. УТВЕРЖДАЮ»

46. Московского jHoro университета шя(МИИТ)2003 г.

47. Члены комиссии: д.т.н., профессор д.т.н., доцент к.т.н., доцент

48. Волков A.A. Ромашкова О.Н. Казанский H.A.1oS1. УТВЕРЖДАЮ»

49. Главный инженер ^^Ä^bi сигнализации и связи ^^Р'с^^Ш^осковский метрополитен» Щг CjJ^Jpb^-i<---ТШ. Козлов

50. Акт об использоШйШрезультатов диссертации Пчелинцева A.B. на тему "Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением"

51. Применена методика оценки качества передачи речи для различных условий связи с абонентом (кабина электропоезда, помещение поездного диспетчера).

52. Получены аналитические результаты оценки качества восстановления речи по критерию отношения сигнал/шум на входе приемного устройства радиостанции РС-46МЦ с использованием реальных исходных данных о параметрах системы.

53. Проведено сравнение аналитических оценок с экспериментальными данными, полученными путем измерений характеристик каналов связи. Выявлена высокая степень соответствия полученных результатов.1. УТВЕРЖДАЮ»

54. Главный инженер Рижско-Савеловской Дистанции сигнали^&ции и связи Москощ^ой жед^зщж дороги1. Шаронов Ю.А.1. IОу>1. О^2003 г.

55. Акт об использовании результатов диссертации Пчелинцева A.B. на тему «Разработка методики оценки качества восстановления речи на фоне шумов, коррелированных с речевым сообщением»

56. При выполнении работ были использованы следующие результаты исследований:

57. Методика оценки качества передачи речи по критерию отношения сигнал/шум и слоговой разборчивости.

58. Проведено сравнение аналитических оценок и экспериментальных данных, полученных путем измерения характеристик каналов связи. Отмечена высокая степень соответствия полученных результатов.

59. Применен пакет прикладных программ для расчета слоговой разборчивости.

60. Председатель комиссии: Замначальника Рижско-Са. дистанции по связи

61. Члены комиссии: Начальник технического

62. Начальник участка радиосвязи1. Яцула С.Н.1. Экснер Е.В. Гранин Б.П.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.