Разработка новых методов и алгоритмов компьютерной обработки речевых данных в информационно-телекоммуникационных системах

Прохоренко, Екатерина Ивановна

Разработка новых методов и алгоритмов компьютерной обработки речевых данных в информационно-телекоммуникационных системах тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Прохоренко, Екатерина Ивановна

Прохоренко, Екатерина Ивановна
кандидат технических наук
2006

Специальность ВАК РФ05.13.01

Количество страниц 162

Прохоренко, Екатерина Ивановна. Разработка новых методов и алгоритмов компьютерной обработки речевых данных в информационно-телекоммуникационных системах: дис. кандидат технических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Белгород. 2006. 162 с.

Оглавление диссертации кандидат технических наук Прохоренко, Екатерина Ивановна

Введение.

Глава 1. Хранение и передача речевых данных в информационнотелекоммуникационных системах.

1.1. Обзор использования существующих информационно- телекоммуникационных систем для обмена речевыми сообщениями и хранения речевых данных.

1.2. Анализ свойств речевых сигналов и восприятия звука слухом человека.

1.3. Компьютерная обработка речевых сигналов в информационно-телекоммуникационных системах.

1.4. Задачи исследования.

Глава 2. Частотный анализ речевых сигналов.

2.1. Методы частотного анализа-синтеза речевых сигналов.

2.2. Разработка нового алгоритма вычислений долей энергии отрезков речевых сигналов, соответствующих заданным частотным диапазонам (частотный анализ).'.

2.3. Оптимальные алгоритмы субполосного преобразования.

Введение диссертации (часть автореферата) на тему «Разработка новых методов и алгоритмов компьютерной обработки речевых данных в информационно-телекоммуникационных системах»

В настоящее время значительно возрос интерес специалистов к проблеме обработки в информационно-телекоммуникационных системах (ИТС) речевых данных, это во многом обусловлено развитием технологий глобальных и корпоративных компьютерных сетей, позволяющих обмениваться речевыми сообщениями, которые часто целесообразно архивировать.

Необходимость в хранении данных речевого обмена возникает при проведении между удаленными участниками аудиоконференций, которые могут продолжаться длительное время, что требует специальных процедур уменьшения объемов битовых представлений сохраняющихся машинных кодов (сжатие данных). Другим достаточно важным примером может служить хранение звукозаписей выступлений лекторов, театральных постановок и т.п.

Стоит так же отметить развивающуюся в настоящее время такую Интернет-услугу, как голосовая электронная почта, что в целях экономии затрат на реализацию трафика так же требуют применения сжатия передаваемых данных (сигналов).

Проблема сжатия речевых данных рассматривается в работах многих авторов, особенно специалистов в телекоммуникациях. При этом отмечаются два основных аспекта: необходимость удаления пауз, возникающих между отдельными словами и в режиме диалога занимающих до 60% длительности исходных звукозаписей, и сокращение объемов битовых представлений собственно звуковых данных.

В первом случае задача сводится к построению решающей процедуры, позволяющей на основе предварительно (при отсутствии звуков речи) оцененных вероятностных характеристик последовательностей данных в паузе (шумов) определить является ли анализируемый отрезок порбждением шума или содержит аддитивную смесь сигнал+шум.

Применяемые (в основном в телекоммуникациях) в настоящее время решающие процедуры обнаружения пауз основываются на использовании так называемых фильтров линейного предсказания. Среди несовершенств такого подхода можно выделить: принципиальную невозможность построить фильтр линейного предсказания конечного порядка для «белого» шума; наличие в решающей функции «мертвых зон», когда изменение одних параметров компенсируется изменениями других; возможное совпадение максимумов энергетических спектров шума и звука, что приводит к совместному их подавлению и ошибочному отнесению анализируемого участка к паузе.

Можно указать и другие особенности использования фильтров линейного предсказания, которые для повышения достоверности принятия решения о наличии паузы приводят к необходимости анализа достаточно больших отрезков (до 0,6 с), что не позволяет достигать максимального сжатия данных.

Поэтому целесообразно разрабатывать более совершенный метод обнаружения пауз, что можно сделать за счет более тонкого учета различий в распределении энергий шумов и звуковых данных в частотной области. Для этого необходимо создать метод точного вычисления долей энергии анализируемых отрезков, соответствующих заданным частотным интервалам.

Другим важным применением этого метода будет служить построение так называемых спектрограмм (сонограмм), которые к настоящему времени приобрели статус стандартных процедур анализа речевых сигналов, в том числе в задачах распознавания.

Для сжатия участков звуковых данных так же разработаны различные процедуры обработки, в основном применяемые для уменьшения объемов трафика в телекоммуникациях. Основой этих процедур служат необратимые преобразования исходных данных либо за счет более грубого квантования по уровню, либо путем построения моделей генерации, позволяющих осуществить их воспроизведение (вокодеры). Наибольшей степени сжатия удается достичь в случае применения вокодеров. Однако, при этом, наряду с разборчивостью воспроизводимой речи существенно искажается тембр и другие характеристики, что неприемлемо для качественного воспроизведения звукозаписей и аудиоконференций.

Поэтому представляется целесообразным при сжатии звуковых данных использовать процедуру квантования по уровню, т.к. тогда появляется возможность варьирования количеством сохраняемых двоичных разрядов для достижения приемлемого качества звучания воспроизводимой речи. Реализуемость такого подхода обеспечивается тем, что обработку звукозаписей можно осуществлять после их окончания (в отличие от передачи в темпе реального времени).

Существующие методы сжатия звуковых данных с использованием грубого квантования по уровню основываются на психоакустической модели, что приводит к необходимости применения так называемых субполосных преобразований отрезков (векторов) отсчетов речевых сигналов, позволяющих получить другие векторы, подвекторы которых отражают частотные свойства исходного вектора в выбранных диапазонах оси частот. Именно компоненты этих подвекторов подвергаются квантованию по уровню с различными шагами, чем достигается учет частотно-избирательных свойств человеческого слуха.

В настоящее время для субполосного преобразования принято использовать процедуру прореживания выходных последовательностей КИХ-фильтров (фильтров с конечной импульсной характеристикой), настроенных на соответствующие участки оси частот. После квантования этих данных по уровню они могут либо сохраняться, либо подвергаться статистическому обратимому кодированию для достижения большей степени сжатия. Восстановление исходных данных для воспроизведения речи принято осуществлять с использованием специально рассчитанных КИХ-фильтров.

Не вдаваясь в подробности, можно отметить, что такая процедура субполосного преобразования не является оптимальной в смысле минимума погрешностей аппроксимации спектров исходных векторов в выбранных частотных диапазонах, что приводит к увеличению погрешностей восстановления данных по квантованным значениям и, как следствие, к ухудшению качества воспроизводимой речи.

Поэтому представляется целесообразным разработать метод обратимого субполосного преобразования, оптимальный в смысле минимума погрешностей аппроксимации спектров исходного вектора в выбранных частотных диапазонах.

Дальнейшее заключается в разработке на основе новых подходов к обнаружению пауз и субполосному преобразованию процедуры сжатия речевых данных, позволяющей варьировать количество уровней квантования.

Целью работы является совершенствование методов частотной обработки речевых данных в задачах сжатия объемов их битовых представлений в информационно-телекоммуникационных системах.

Для достижения этой цели на основе анализа состояния вопроса были сформулированы и решены следующие задачи:

1. Разработка метода и алгоритмов точного вычисления долей энергий анализируемых отрезков речевых данных в заданных частотных интервалах.

2. Разработка метода обнаружения пауз в речевых данных на основе сравнения распределения энергий шума и смеси сигнал+шум по заданным частотным интервалам.

3. Разработка оптимальных алгоритмов обратимого субполосного преобразования отрезков речевых данных.

4. Разработка информационной технологии сжатия-восстановления речевых данных с использованием метода обнаружения пауз и квантования по уровню компонент векторов оптимального субполосного преобразования.

5. Создание программно-алгоритмической поддержки информационной технологии сжатия-восстановления речевых данных.

Методы исследований

Методы системного анализа и синтеза на основе использования вариационных принципов.

Методы цифровой обработки сигналов.

Вычислительный эксперимент.

СОДЕРЖАНИЕ РАБОТЫ

Диссертация состоит из Введения, четырех глав, Заключения и Приложений, в которых приведены результаты исследования свойств собственных векторов рассматриваемой в работе матрицы специального вида, полученные в результате вычислительных экспериментов спектры различных звуков речи и документы, подтверждающие внедрение результатов работы.

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Прохоренко, Екатерина Ивановна

4.5. Основные результаты и выводы главы

1. Разработана процедура сжатия-восстановления речевых данных

Разработка данной процедуры предполагает объединение разработанных в работе методов:

- точного вычисления долей энергии анализируемых отрезков, соответствующих заданным частотным интервалам;

- обнаружения пауз, за счет более тонкого учета различий в распределении энергий шумов и звуковых данных в частотной области;

- обратимых субполосных преобразований, оптимальных в смысле минимума погрешностей аппроксимации спектров исходного вектора в выбранных частотных диапазонах, с квантованием по уровню с различными шагами компонент полученных подвекторов. Указанная процедура состоит из нескольких этапов:

- кодирование пауз с использованием учета различий в распределении энергий шумов и звуковых данных в частотной области;

- обратимого субполосного преобразования, оптимального в смысле минимума погрешностей аппроксимации спектров исходного вектора в выбранных частотных диапазонах;

- квантования по уровню компонент векторов субполосного представления;

- восстановления исходных данных.

2. Разработан программно-алгоритмический комплекс сжатия-восстановления речевых данных состоящий из двух модулей:

- модуля построения спектрограмм, позволяющего осуществлять частотный анализ речевых сигналов;

- модуля сжатия-восстановления речевых данных, позволяющего осуществлять сжатие WAV-файлов с использованием метода кодирования пауз и квантования по уровню компонент подвекторов субполосного преобразования.

3. Проведенные вычислительные' эксперименты показали, что качество воспроизведения восстановленных речевых данных зависит от выбора параметров процедуры сжатия-восстановления - длины анализируемого отрезка N, количества частотных интервалов R и количества разрядов квантования т. Для использования данной процедуры могут быть рекомендованы значения //=200+500 отсчетов, R=\0+50 интервалов и т= 1,2, 3 разряда, а так же знаковое квантование.

4. Применение данного программно-алгоритмического комплекса позволяет достичь 20-тикратного уменьшения объемов битового представления речевых данных при достаточно высоком качестве воспроизведения речи.

5. На указанную информационную технологию сжатия-восстановления речевых данных получено свидетельство о регистрации в Отраслевом фонде алгоритмов и программ Федерального агентства по образованию № регистрации 6845 (приложение 3).

ЗАКЛЮЧЕНИЕ

В ходе выполнения диссертационного исследования были получены следующие результаты:

1. Разработан алгоритм точного вычисления долей энергий анализируемых отрезков речевых данных в заданных частотных интервалах, который позволил разработать более совершенный метод обнаружения пауз, за счет тонкого учета различий в распределении энергий шумов и звуковых данных в частотной области и процедуру построения спектрограмм речевых сигналов.

2. Разработан метод обнаружения пауз в речевых данных на основе сравнения распределения энергий шума и смеси сигнал+шум по заданным частотным интервалам.

3. Разработаны оптимальные, в смысле минимума погрешностей аппроксимации спектров исходного вектора в выбранных частотных диапазонах, алгоритмы обратимого субполосного преобразования отрезков речевых данных, позволяющие минимизировать количество уровней квантования.

4. Разработана информационная технология сжатия-восстановления речевых данных с использованием метода обнаружения пауз и квантования по уровню компонент векторов оптимального субполосного преобразования.

5. Создана программно-алгоритмическая поддержка информационной технологии сжатия-восстановления речевых данных.

6. Исследования с использованием вычислительных экспериментов показали, что указанный подход позволяет достичь 20-тикратного уменьшения объемов битового представления речевых данных при достаточно высоком качестве воспроизведения речи.

7. Использование разработанной информационной технологии сжатия речевых данных повышает их скрытность, в том смысле, что для их восстановления необходимо использовать специальные алгоритмы и программную поддержку.

Список литературы диссертационного исследования кандидат технических наук Прохоренко, Екатерина Ивановна, 2006 год

1. Алдошина, И. Основы психоакустики. Слух и речь. Часть 1 Текст. / И. Алдошина // Информационно-технический журнал «Звукорежиссер». -2002. -№1.- С.38-44.

2. Алдошина, И. Основы психоакустики. Слух и речь. Часть 2 Текст. / И. Алдошина // Информационно-технический журнал «Звукорежиссер». 2002. - №3. - С.54-58.

3. Алдошина, И. Основы психоакустики. Слух и речь. Часть 3 Текст. / И. Алдошина // Информационно-технический журнал «Звукорежиссер». 2002. - №4. - С.38-44.

4. Алдошина, И. Основы психоакустики. Слух и речь. Часть 4 Текст. / И. Алдошина // Информационно-технический журнал «Звукорежиссер». 2002. - №5. - С.44-50.

5. Алдошина, И. Основы психоакустики. Слух и речь. Часть4 Текст. / И. Алдошина // Информационно-технический журнал «Звукорежиссер». 2002. - №8. - С.60-68.

6. Андерсон, Т. Статистический анализ временных рядов Текст.: Пер. с англ. / Т.Андерсон; под. ред. Ю. К. Беляева. М.: Мир, 1976. - 755 с.

7. Бабков, В.Ю. Передача информации в системах подвижной связи Текст. /

8. B.Ю.Бабков, М.А. Вознюк, В.А. Петраков, А.Е. Рыжков, М.А. Сивере. СПбГУТ, СПб, 1999.-152 с.

9. Батлук, А.В. Исследование применения банков фильтров для сжатия изображений Текст. / А.В. Батлук, М.К. Чобану // Научно-технический журнал Цифровая обработка сигналов. 2005. - № 4 (16). - С. 29-41.

10. Беллами, Дж. Цифровая телефония Текст.: Пер. с англ. / Дж. Беллами. М.: Радио и связь, 1986. - 544 с.

11. Блейхут, Р. Быстрые алгоритмы цифровой обработки сигналов Текст. / Р. Блейхут; пер. с англ. И. И. Грушко. М.: Мир, '1989. - 448 е.: ил.

12. Быков, С.Ф. Цифровая телефония Текст. / С.Ф. Быков, В.И. Журавлев, И.А. Шалимов. М.: Радио и связь, 2003. - 144 е.: ил.

13. Вайдьнатхан, П.П. Цифровые фильтры, блоки фильтров и полифазные цепи с многочастотной дискретизацией Текст.: метод, обзор / П. П. Вайдьнатхан // ТИИЭР, 1990. Т. 78, № 3. - С. 77-120.

14. Васюков, В.Н. Цифровая обработка сигналов и сигнальные процессоры в системах подвижной радиосвязи Текст. / В.Н. Васюков. Новосибирск: Изд-во НГТУ, 2003. 120 с.

15. Воеводин, В. В. Вычислительные основы линейной алгебры Текст. / В. В. Воеводин. -М.: Наука, 1977.-304 с.

16. Воеводин, В. В. Вычислительные процессы с теплицевыми матрицами Текст. / В. В. Воеводин, Е. Е. Тыртышников. М.: Наука, 1987. - 319 е.: ил.

17. Воеводин, В. В. Матрицы и вычисления Текст. / В. В. Воеводин, Ю. А. Кузнецов. -М.: Наука, 1984.-318 с.

18. Вокодерная телефония. Методы и проблемы Текст. / Под ред. А.А. Пирогова М.: Связь, 1974.-246 с.

19. Вологдин, Э. И. Аналоговая и цифровая звукозапись Текст. / Э. И. Вологдин. СПб.: СТ «Факультет ДВО», 2004. - 52 с.

20. Вологдин, Э. И, Слух и восприятие звука Текст.: учеб. пособие / Э. И. Вологдин. -СПб.: СТ «Факультет ДВО», 2004. 52 с.

21. Воробев, В.И. Теория и практика вейвлет-преобразования Текст. / В.И. Воробев, В.Г. Грибунин. СПб.: Изд-во ВУС, 1999. - 204 с.

22. Ворсано, Д. Кодирование речи в цифровой телефонии Текст. / Д. Ворсано // Сети и системы связи. -1996. №8. - С. 24-27.

23. Галунов, В. И. О моторной теории восприятия звуковых сигналов Текст.: Вопросы бионики / В. И. Галунов, В. В. Люблинская, JI. А. Чистович М.:Наука, 1967. - 286с.

24. Гардишян, Г. Оптимизация обработки данных в реальном масштабе времени для систем VoIP Текст. / Г. Гардишян // Научно-технический журнал Цифровая обработка сигналов. 2005. - № 1 (15) - С. 36-41.

25. Гельфанд, С.А. Слух: Введение в психологическую и физиологическую акустику Текст. / С.А. Гельфанд. М.: Медицина, 1984. - 350 с.

26. Гихман, И. И. Теория случайных процессов Текст. / И. И. Гихман, А.В. Скороход. -М.: Наука, 1971.-644 с.

27. Голд, Б. Цифровая обработка сигналов Текст.: пер. с англ. / Б. Голд, Ч. Рейдер. М.: Сов. радио, 1973.-376 с.

28. Гольденберг, JI. М. Цифровая обработка сигналов Текст.: справочник / JI. М.

29. Гольденберг, Б. Д. Матюшкин, М. Н. Поляк. М.: Радио и связь, 1985. - 308 с.

30. Гольденберг, Л. М. Цифровая обработка сигналов Текст.: учеб. пособие / JI. М. Гольденберг, Б. Д. Матюшкин, М. Н. Поляк. 2-е изд., перераб. и доп. - М.: Радио и связь, 1990.-256 с.: ил.

31. Гольдштейн, B.C. IP-Телефония Текст. / B.C. Гольдштейн, А.В. Пинчук, АЛ.Суховицкий. М.: Радио и связь. 2001. - 336с.: ил.

32. Гантмахер, Ф.Р. Теория матриц Текст. / Ф.Р. Гантмахер. М.: Физматлит, 2004. -560с.

33. Гордиенко, В. Н. Многоканальные телекоммуникационные системы. Учебник для вузов Текст. / В. Н. Гордиенко, М. С. Тверецкий. М: Горячая линия-Телеком, 2005. -416 е.: ил.

34. Гусинская, Е.И. Оптимизация банка фильтров в задачах субполосного кодирования: тематический обзор Текст. / Е.И. Гусинская, А.А. Зайцев // Научно-технический журнал Цифровая обработка сигналов. 2004. - № 3(12). - С. 18-29.

35. Дженкинс, Г. Спектральный анализ и его приложения Текст.: Пер, с англ. / Г.Дженкинс, Д. Ватте; под ред. В. Ф. Писаренко. М.: Мир, 1971. - 316 с.

36. Дьяконов, В.П. MATLAB. Обработка сигналов и изображений. Специальный справочник Текст. / В.П. Дьяконов. СПб.: Питер, 2002. - 608 с.

37. Дьяконов, В.П. Matlab Текст. / В.П. Дьяконов. СПб.: Питер, 2001. - 553 с.

38. Жиляков, Е.Г. Вариационные методы частотного анализа звуковых сигналов Текст. / Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко // Труды учебных заведений связи. СПб, 2006.-№ 174.-С.163-170.

39. Жиляков, Е.Г. О кодировании пауз в речевых сигналах Текст. / Е.Г. Жиляков, С.П.Белов, Е.И. Прохоренко // Материалы Шестой Международной научно-технической конференции «Проблемы техники и технологии телекоммуникаций». -Уфа, 2005.-С. 73-74.

40. Жиляков, Е.Г. Программная система цифровой обработки речевых данных / Е.Г.Жиляков, С.П. Белов, Е.И. Прохоренко. Отраслевой фонд алгоритмов и программ «Государственный координационный центр информационных технологий», 2006.-№50200601604.

41. Жиляков, Е.Г. Методы и алгоритмы обработки экспериментальных данных в атомно-абсорбционной спектрометрии Текст. / Е.Г. Жиляков, Н.И. Корсунов, Д.П. Лагода. -Киев: Наукова думка, 1992. -125 с.

42. Жиляков, Е.Г. О субполосном кодировании сигнала Текст. / Е.Г. Жиляков, И.Г.Попов, И.И. Чижов // Вестник национального технического университета «ХПИ». -2004.-№46.-С.

43. Жиляков, Е.Г. Частотный анализ речевых сигналов Текст. / Е.Г. Жиляков, Е.И.Прохоренко // Научные ведомости Белгородского государственного университета. Белгород, 2006. - №2(31), выпуск 3. - С. 201-208. - (Серия: информатика и прикладная математика).

44. Жиляков, Е.Г. Статистики максимальной чувствительности в задаче обнаружения изменений параметров процессов авторегрессии Текст. / Е.Г. Жиляков, Э.К.Шпилевский // Заводская лаборатория. -1992. №7. - С.31 -34.

45. Загоруйко, Н. Г. Методы распознавания и их применение Текст. / Н. Г. Загоруйко. -М.: Сов. радио, 1972. 206 с.

46. Иконин, С.Ю. Система автоматического распознавания речи SPIRIT ASR Engine Текст. / С.Ю. Иконин, Д.В. Сарана // Научно-технический журнал Цифроваяобработка сигналов. -2003. -№ 4 (10). С. 2-13.

47. Калинцев, Ю.К. Разборчивость речи в цифровых вокодерах. / Ю.К. Калинцев. М.: Радио и связь, 1991. - 220 е.: ил.

48. Кендалл, М. Дж. Многомерный статистический анализ и временные ряды Текст.: Пер. с англ. / М. Дж. Кендалл, А. Стьюарт; под ред. А. Н. Колмогорова, Ю.

49. B.Прохорова. М.: Наука, 1976. - 736 с.

50. Кириллов, С.Н. Проектирование банков фильтров на основе теории кратномасштабного анализа Текст. / С.Н. Кириллов, С.В. Зорин // Научно-технический журнал Цифровая обработка сигналов. 2005. - № 4 (16). - С. 9-16.

51. Ковалгин, Ю.А. Цифровое кодирование звуковых сигналов Текст. / Ю.А. Ковалгин, Э.И. Вологодин. СПб: Корона-принт, 2004. - 240 е.: ил.

52. Кораблин, М.А. Оценка эффективности использования технологий VoIP и VAD в корпоративных IP-сетях Текст. / М.А. Кораблин, А.В. Мороз // Электросвязь. 2004. -№8.-С. 15-18.

53. Коротаев, Г.А. Анализ и синтез речевого сигнала методом линейного предсказания Текст./ Г.А. Коротаев // Зарубежная радиоэлектроника. -1990. №3. - С. 31 -52.

54. Коротаев, Г.А. Некоторые аспекты линейного предсказания при анализе речевого сигнала Текст. / Г.А. Коротаев // Зарубежная радиоэлектроника. 1991. - № 7.1. C.13-31.

55. Куля, В. И. Влияние фазовых соотношений в спектре речи на ее восприятие Текст. / В. И. Куля // Электросвязь. -1970. № 7. - С. 23-31.

56. Куприянов, М.С. Цифровая обработка сигналов Текст. / М.С. Куприянов, Б.А.Матюпткин. С-Пб.: Питер, 1998. - 416 с.

57. Лабутин, В. К. Модели механизмов слуха Текст. / В. К. Лабутин, А. П. Молчанов. -М.: Энергия, 1973. 200 с.

58. Ланнэ, А. А. Передача информации о состоянии фильтра-предсказателя с помощью спектральных пар Текст. / А. А. Ланнэ, Д. А. Улахович // Радиоэлектроника и связь. -1991.-№ 1.-С. 43-47.

59. Ланцош, К. Практические методы прикладного анализа Текст.: справ, рук. / КЛанцош ; пер. с англ. М. 3. Кайнера. М.: Физматгиз, 1961. - 524 с.

60. Линович, А.Ю. Субполосная адаптивная фильтрация в задачах обратногомоделирования Текст. / А.Ю. Линович, В.В. Витязев // Научно-технический журнал Цифровая обработка сигналов. 2004. - № 1 (11). - С. 31-38.

61. Маркел, Дж. Линейное предсказание речи Текст.: Пер. с англ. / Дж. Маркел, А.Х.Грэй; под ред. Ю.Н. Прохорова и B.C. Звездина. М.: Связь, 1980. - 308 с.

62. Мартынович, П.В. Специфика детектора речи для системы верификации диктора по голосу Текст. / П.В. Мартынович // Научно-технический журнал Цифровая обработка сигналов. 2004. - № 3 (12). - С. 43-47.

63. Методы сжатия данных: устройство архиваторов, сжатие изображений и видео Текст. / Д. Ватолин, А. Ратушняк, М. Смирнов, В. Юкин. М.: ДИАЛОГ-МИФИ, 2003.-384 с.

64. Минин, С.А. Кодер АДИКМ аппаратуры цифровой спутниковой связи Текст. / С.А.Минин // Электросвязь. -1992. №11. - С. 32-44.

65. Михайлов, В.Г. Измерение параметров речи Текст. / В.Г.Михайлов, Л.В.Златоустова; под ред. М.А. Сапожкова. М.: Радио и связь, 1987. -168 е.: ил.

66. Назаров, Х.З. Методы цифровой обработки и передачи речевых сигналов Текст. / Х.З. Назаров, Ю.Н. Прохоров. М.: Связь, 1982. - 236с.

67. Никольский, С. М. Квадратурные формулы Текст. / С. М. Никольский. М.: Наука, 1988.-256 е.: ил.

68. Нуссбаумер, Г. Быстрое преобразование Фурье и алгоритмы вычисления сверток Текст. / Г. Нуссбаумер ; ред.: В. М. Амербаев, Т. Э. Кренкель ; пер. с англ.: Ю. Ф. Касимов, И. П. Пчелинцев. М.: Радио и связь, 1985. - 248 с.: ил., табл., граф.

69. Оберхеттингер, Ф. Преобразование Фурье распределений и их обращения Текст.: табл. / Ф. Оберхеттингер; пер. с англ. М. С. Никулина. М.: Наука, 1979. - 248 с.

70. Оппенгейм, А.В. Цифровая обработка сигналов Текст.: Пер. с англ. / А.В.Оппенгейм, Р.В. Шафер; под ред. С.Я. Шаца. М.: Связь, 1979. - 416 с.

71. Основы цифровой обработки сигналов Текст.: курс лекций : учеб. пособие / А.И.Солонина, Д. А. Улахович, С. М. Арбузов и др. СПб.: БХВ-Петербург, 2003. -608 с.: ил.

72. Перцева, Л.В. Качество передачи речи при использовании низкоскоростных кодеков на абонентских линиях Текст. /Л.В. Перцева//Электросвязь. -1987. №8. - С. 48-64.

73. Петленко, Б.И. Речевая связь в искусственных атмосферах Текст. / Б.И. Петленко,

74. JI.C. Бутырский; под ред. И.Т. Турбовича. М.: Связь, 1978. - 144 с.

75. Петровский, А.А. Низкоскоростной вокодер с моделью речеобразования «гармоники + шум» Текст. / А.А. Петровский, В.В. Серков // Цифровая обработка сигналов. -2002. №2. - С.2-12.

76. Применение цифровой обработки сигналов Текст. / С. JI. Фрини, Дж. Ф. Кайзер, X. С. Макдональд и др.; пер. с англ. А. М. Рязанцева; под ред. Э. Оппенгейма. М. : Мир, 1980.-552 с.

77. Прокис, Дж. Цифровая связь Текст. / Дж. Прокис; под ред. Д.Д. Кловского. М.: Радио и связь, 2000. - 800 с.

78. Прохоренко, Е.И. Метод обнаружения пауз в речевых сигналах Текст. / Е.И.Прохоренко // Вестник московской академии рынка труда и информационных технологий. Москва, 2006. - №4(26). - С.13-20.

79. Прохоренко, Е.И. О пакетной передаче речи Текст. / Е.И. Прохоренко // Вестник национального технического университета «ХПИ». Харьков, 2004. - №46. - С. 5661. - (Сборник научных трудов. Тематический выпуск: Информатика и моделирование).

80. Прохоров, Ю.Н. Статистические модели и рекуррентное предсказание речевых сигналов Текст. / Ю.Н. Прохоров. М.: Радио и связь, 1986. - 316 с.

81. Рабинер, JI.P. Цифровая обработка речевых сигналов Текст.: Пер. с англ. / Л.Р.Рабинер, Р.В. Шафер; под ред. М. В. Назарова, Ю. Н. Прохорова. М.: Радио и связь 1981.-495 с.

82. Рабинер, Л. Теория и применение цифровой обработки сигналов Текст. / Л. Рабинер, Г. Годц. М.: Мир, 1988. - 512 с.

83. Радзишевский, А. Компьютерная обработка звука Текст. / А. Радзишевский. М.: Нолидж, 2000.-240 с.

84. Рамишвили, Г. С. Автоматическое распознавание говорящего по голосу Текст. / Г. С.Рамишвили. М.: Радио и связь, 1981, - 224 с.

85. Росляков, А.В. IP-телефония Текст. / А.В. Росляков, М.Ю. Самсонов, И.В. Шибаева.- М.: Эко-Тредз, 2001. 250 с.

86. Савченко, В.В. Автоматическая обработка речи по критерию минимума информационного рассогласования на основе метода обеляющего фильтра Текст. / В.В. Савченко // Радиотехника и Электроника. 2005. Том 50. - №3. - С. 309-315.

87. Савченко, В.В. Метод переопределенного словаря в задаче распознавания речевых сигналов Текст. / В.В. Савченко, П.Г. Лукин // Радиотехника и Электроника. 2006.- Том 51. №2. - С. 202-207.

88. Сапожков, М. А. Речевой сигнал в кибернетике и связи Текст. / М. А. Сапожков. -М.: Связьиздат, 1963.-452 с.

89. Сапожков, М.А. Вокодерная связь Текст. / М.А. Сапожков, В.Г. Михайлов. М.: Радио и связь, 1983.-248 с.

90. Себер, Дж. Линейный регрессионный анализ Текст.: Пер. с англ. / Дж. Себер; под ред. М. Б. Малютова. М.: Мир, 1980. - 456 с.

91. Секунов, Н.Ю. Обработка звука на PC Текст. / Н.Ю. Секунов. СПб.: БХВ-Петербург, 2001.-1248 с.

92. Сергиенко, А. Б. Цифровая обработка сигналов Текст.: учеб. пособие для студ. вузов / А. Б. Сергиенко. СПб.: Питер, 2002. - 603с.: ил. - (Учебник для вузов).

93. Сжатие данных в системах сбора и передачи информации Текст. / В.И. Орищенко, В.Г. Санников, В.А. Свириденко; под ред. В.А. Свириденко. М.: Радио и связь, 1985. -184 е., ил.

94. Сиберт, У. Преобразование стимула в периферической слуховой системе Текст. / В кн.: Распознавание образов: Пер. с англ./ У. Сиберт; под ред. Л. И. Титомира. М.: Мир, 1970.-236 с.

95. Слуховая система Текст. / Сб. статей под ред. Я.А. Альтман. Л.: Наука, 1990. -620 с.

96. Смирнов, Д.В. Аудиосистема PC Текст. / Д.В. Смирнов. СПб.: Питер, 1999. -384с.

97. Сорокин, В. Н. О роли подглоточной области в процессе речеобразования Текст. / В кн.: Проблемы построения систем понимания речи. / В. Н. Сорокин. М.: Наука, 1980.-354 с.

98. Сорокин, В. Н. Потери в речевом тракте Текст. / В. Н. Сорокин // Акустический журнал. 1977. - Т. 23. - № 6. - С. 939-946.

99. Спектральные методы сокращения избыточности высококачественных звуковых сигналов Текст. / В. М. Колесников, М. У. Банк, А. М. Синильников, В. А. Сучилин // Радио и телевидение ОИРТ. 1989. -№ 1. - С. 36-39. -№ 2. - С. 35-39.

100. Таблицы математической статистики Текст. / Л.Н. Большее, Н.В. Смирнов. М.: Наука. Главная редакция физико-математической литературы, 1983. - 416с.

101. Титчмарш, Е. Введение в теорию интеграла Фурье Текст. / Е. Титчмарш ; пер. с англ. Д. А. Райкова. М.: ОГИЗ Гостехиздат, 1948. - 479 с.

102. Фант, Г. Акустическая теория речеобразования Текст. / Г. Фант. М.: Наука, 1964. -283 с.

103. Физиология речи. Восприятие речи человеком Текст. / Л. А. Чистович и др.— М.:1. Наука, 1976-386 с.

104. Фланаган, Дж. Анализ, синтез и восприятие речи Текст.: Пер. с англ. / Дж.Фланаган; под ред. А. А. Пирогова. М.: Связь, 1968. - 396 с.

105. Хорн, Р. Матричный анализ Текст. / Р. Хорн, Ч. Джонсон. М.: Мир, 1989. - 395 с.

106. Хургин, Я. И. Финитные функции в физике и технике Текст. / Я. И. Хургин, В. П. Яковлев. М.: Наука, 1971. - 408 е.: ил.

107. Цвикер, Э. Ухо как приемник информации Текст.: Пер. с нем./ Э. Цвикер, Р. Фельдкеллер; под ред. Б. Г. Белкина. М.: Связь, 1971. - 256 с.

108. Шелухин, О.И. Цифровая обработка и передача речи Текст. / О.И. Шелухин, Н.Ф.Лукьянцев; под ред. О.И. Шелухина. М.: Радио и связь, 2000. - 456с.: ил.

109. Шульгин, В.И. Основы теории передачи информации Текст.: Учебное пособие / В.И. Шульгин. Харьков: Нац. аэро-косм. ун-т. «Харьк. авиац. ин-т», 2003. - 102 с.

110. Aikoh, S. 32 kbit/s toll quality ADPCM codec using a single chip processor, IEEE Int. Text. / S. Aikoh, T. Nishitani, K. Ozawa, R. Marita // Conf. Acoust. Speech. Sig. Process. Paris, France, 1982. - Vol. 2. - P. 960-963.

111. Alrera Devices. -15.06.2004. http://www.altera.com/products/devices/dev-index.jsp.

112. Atol, B.S. High quality speech at very low bit rates: multipulse and stochastically excited linear predictive coders Text. / B.S. Atol // Proc. of the Int. Conf. on ASSP, 1986. -P.1065-1069.

113. Alessandro, C. Effectiveness of a periodic and aperiodic decomposition method for analysis of voice sources / C. Alessandro, V. Darsinos, B. Yegnanarayana // IEEE Transactions on Speech and Audio Pr6cessing. -1998. vol.6 - № 1. - P. 12-23.

114. DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus, Department of Commerce, NIST. Springfield, Virginia, 1990.

115. Gardner, W.R. Theoretical analysis of the high-rate vector quantization of LPC parameters. / W.R. Gardner, B.D. Rao // IEEE Transactions on Speech and Audio Processing. 1995. - vol.3. - № 5. - P. 367-381.

116. Gersho, A. Vector quantization and signal compression. / A. Gersho, R. Gray. Boston, Kluwer Academic Publishers, 1992.

117. Gray, A.H. Distance measures for speech processing. / A.H. Gray, J.D. Markel // IEEE Transactions on Acoustics, Speech and Signal Processing. 1976. - vol.24. - № 5. - P. 380-391.

118. Griffin, D.W. Multiband excitation vocoder. / D.W. Griffin, J.S. Lim // IEEE Transactions on Acoustics, Speech and Signal Processing. 1988. - vol. 36. -№8. - P. 1223-1235.

119. Itakura, F. Line spectrum representation of linear predictive coefficients of speech signals.

120. F. Itakura, J. Acoust. Soc. America, 1975. - vol. 57. -35 p.

121. ITU-T Recommendation G.721 32 kbit/s Adaptive ADPCM. 1990. - 43 p.

122. ITU-T Recommendation G.726 40, 32, 24, 16 kbit/s Adaptive Embedded ADPCM. -1990.-68 p.

123. ITU-T Recommendation G.726. 40, 32, 24, 16 kbit/s Adaptive Differential Pulse Code Modulation (ADPCM). -1990. 47p.

124. ITU-T Recommendation G.727 5-, 4-, 3-, 2-Bit Sample Embedded ADPCM. -1994. -47p.

125. Jackson, P.J.B. Pitch-scaled estimation of simultaneous voiced and turbulence-noise components in speech. / P.J.B. Jackson, C.H. Shadle // IEEE Transactions on Speech and Audio Processing. 2001. - vol.9. -№ 7. - P. 713-726.

126. Jayant, N. Digital Coding of Waveforms: Principles and Applications to Speech and Video. / N. Jayant, P. Noll. New Jersey, 1984. - 320 p.

127. Kim, S.-J. Split vector quantization of LSF parameters with minimum of dLSF constraint / S.-J. Kim, Y.-H. Oh, // IEEE Signal Processing Letters. 1999. - vol. 6. - № 9. - P. 227229.

128. Kondoz, A.M. Digital speech: coding for low bit rate communication systems. / A.M.Kondoz. John Wiley & Sons, Inc., NY, 1996. - 442 p.

129. Linde, Y. An algorithm for vector quantizer design. / Y. Linde, A. Buzo, R.M. Gray // IEEE Transactions on Communications. -1980. vol. COM-28. - P. 84-95.

130. Mitsubishi Electric Corporation. The characteristics of the turbulences appeared in objective test and voice signal transmission of Rec. G.726, COTT contribution D. 301/XV, 1991.-39 p.

131. National P/N TP11368 Octal Adaptive Differentia. PCM Processor. - 12.08.2003. http://ww.mtioml.com/pfiTP/TPl 1368.html

132. Palival, K.K. Efficient vector quantization of LPC parameters at 24 bits/frame. / K.K.Palival, B.S. Atal // IEEE Transactions on Acoustics, Speech and Signal Processing. 1993. - vol.1.-№1.-P. 3-14.

133. Peifomiance of various ADPCM algorithms with very high speed modems, ITU-T Contribution No. COM 15-D.9,1994. 34 p.

134. Petrovsky, A. Tonal and noise components separation based on a pitch synchronous DFTanalyzer as a speech coding method. / A. Petrovsky, P. Zubricki, A. Savicki //i

135. Proceedings European Conference on Circuit Theory and Design. Cracow, Poland, 2003.-vol.3.-P. 169-172.

136. Stylianou, Y. Applying the harmonic plus noise model in concatenative speech synthesis. / Y. Stylianou // IEEE Transactions on Speech and Audio Processing. 2001. - vol. 9. -№1.-P. 21 -29.

137. Xilinx Home: Products and Services: Spartan-11 fPGAs. 11.06.2004. http://www.xilirLx.com/xlnx/xil prodcat landingpage.jsp?title=Spartan-l 1.

138. Yegnanarayana, B. An iterative algorithm for decomposition of speech signals into periodic and aperiodic components. / B. Yegnanarayana, C. d'Alessandro, V. Darsinos. // IEEE Transactions on Speech and Audio Processing. -1998. vol.6. -№ 1. - P. 1-11.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.

Оглавление диссертации кандидат технических наук Прохоренко, Екатерина Ивановна

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Разработка и исследование субполосных методов и алгоритмов сегментации речевых сигналов2013 год, кандидат технических наук Фирсова, Александра Александровна

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Алгоритмы распознавания речевых команд в управляющих системах2006 год, кандидат технических наук Литвиненко, Сергей Леонидович

Разработка методов и алгоритмов субполосного моделирования эмпирических данных2011 год, кандидат физико-математических наук Туяков, Самат Валерьевич

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Прохоренко, Екатерина Ивановна

Список литературы диссертационного исследования кандидат технических наук Прохоренко, Екатерина Ивановна, 2006 год