Рекуррентные авторегрессионные методы исследования речевых сигналов тема диссертации и автореферата по ВАК РФ 05.12.13, кандидат технических наук Брауде-Золотарев, Михаил Юрьевич

  • Брауде-Золотарев, Михаил Юрьевич
  • кандидат технических науккандидат технических наук
  • 2000, Москва
  • Специальность ВАК РФ05.12.13
  • Количество страниц 155
Брауде-Золотарев, Михаил Юрьевич. Рекуррентные авторегрессионные методы исследования речевых сигналов: дис. кандидат технических наук: 05.12.13 - Системы, сети и устройства телекоммуникаций. Москва. 2000. 155 с.

Оглавление диссертации кандидат технических наук Брауде-Золотарев, Михаил Юрьевич

ВВЕДЕНИЕ.

ГЛАВА 1. АНАЛИЗ МЕТОДОВ НИЗКОСКОРОСТНОГО КОДИРОВАНИЯ РЕЧИ.

1.1. Теоретические основы сжимающего кодирования.

1.1.1. Верность воспроизведения и оценка качества речи

1.1.2. Методы рекуррентного анализа

1.2. Методы низкоскоростного кодирования речи.

1.2.1. Линейное предсказание с кодовым возбуждением

1.2.2. Многополосное возбуждение, интерполяция формы и другие алгоритмы

1.3. Выводы по главе 1.

ГЛАВА 2. АДАПТИВНЫЙ РЕКУРРЕНТНЫЙ КВАНТОВАТЕЛЬ.

2.1. Известные алгоритмы квантования.

2.2. Модель адаптивного рекуррентного квантования.

2.2.1. Оценка текущего динамического диапазона речи

2.2.2. Взвешивание оценок динамического диапазона

2.2.3. Прореживание и интерполяция оценки динамического диапазона речи

2.2.4. Коэффициент нормировки

2.2.5. Детектирование пауз

2.2.6. Методика эксперимента

2.3. Оптимизация параметров модели.

2.4. Выводы по главе 2.

ГЛАВА 3. ЛИНЕЙНОЕ ПРЕДСКАЗАНИЕ НОРМАЛИЗОВАННОЙ РЕЧИ.

3.1. Линейное предсказание.

3.2. Исследование линейного предсказания нормализованной речи.

3.2.1. Энергетический выигрыш предсказания

3.2.2. Корреляционные свойства разностных сигналов

3.2.3. Энергетические свойства параметров линейного предсказания

3.3. Оценка устойчивости.

3.3.1. Обусловленность матрицы линейного предсказания

3.3.2. Спектральное расстояние между параметрами линейного предсказания

3.4. Качество синтеза линейного предсказания.

3.5. Вычислительный выигрыш.

3.6. Выводы по главе 3.

ГЛАВА 4. РЕКУРРЕНТНОЕ ЛИНЕЙНОЕ ПРЕДСКАЗАНИЕ.

4.1. Методы рекуррентного линейного предсказания.

4.2. Взвешивающая фильтрация.

4.3. Автокорреляционное рекуррентное линейное предсказание.

Список используемых сокращений

АДИКМ — адаптивная дифференциальная импульсно-кодовая модуляция

АФ — анализирующий (отбеливающий) формантный фильтр

АКФ — автокорреляционная функция

ВКФ — взаимнокорреляционная функция

ДИКМ — дифференциальная импульсно-кодовая модуляция

ИКМ — импульсно-кодовая модуляция

ИХ — импульсная характеристика фильтра

КК — корреляционные коэффициенты

КП — коэффициенты предсказания

ЛСП — линейные спектральные пары

JIC4 — линейные спектральные частоты

ЛП — линейное предсказание

ОТ — основной тон речи

СФ — синтезирующий (формантный) фильтр

СКО — среднеквадратическое отклонение

ФНЧ — фильтр нижних частот

40 — число обусловленности

AbS — анализ через синтез

CELP — линейное предсказание с кодовым возбуждением GSM — стандарт цифровой сотовой связи

НЕ LPC — линейное предсказание с гармоническим возбуждением

ITU — International Telecommunication Union (Международный союз электросвязи)

MOPS — миллион операций в секунду

MOS — субъективная средневзвешенная оценка качества речи PARCOR — метод частичных корреляций

RAM — оперативная память (оперативное запоминающее устройство) ROM — энергонезависимая память (постоянное запоминающее устройство) SNR — отношение сигнал/шум

TETRA — европейская транкинговая радиосвязь (Trans European Trunked Radio) WI — интерполяция формы

Рекомендованный список диссертаций по специальности «Системы, сети и устройства телекоммуникаций», 05.12.13 шифр ВАК

Введение диссертации (часть автореферата) на тему «Рекуррентные авторегрессионные методы исследования речевых сигналов»

В современных системах связи обработка и передача речевой информации — основного средства человеческой коммуникации — производится в цифровом формате, и как можно более экономное и вычислительно эффективное описание речевого сигнала представляет собой серьезную научную и прикладную проблему. Сокращенное описание речевой информации снижает требования к пропускной способности каналов связи; аналогично этому в задачах хранения сжатие речевых сигналов повышает эффективность использования емкости носителей, что особенно важно в связи с бурным развитием интерактивных форм персональной коммуникации и глобальных сетей связи.

Несмотря на постоянно растущую емкость каналов связи и носителей информации, задача сжатия неизменно сохраняет свою актуальность, т. к. новые возможности носителей и каналов порождают новые приложения, связанные с передачей речи, например, сотовые системы связи, аудио конференц-связь. мультимедийные интернет-приложения. Также важным фактором является то. что существенная доля стоимости систем речевой связи, приходится именно на кодеки речи из-за дороговизны и большого энергопотребления сложных микропроцессоров, применяемых сегодня для их реализации. Эта причина в определенной степени сдерживает развитие массового рынка персональных, и в особенности мобильных, средств связи.

Важнейшими признаками, характеризующими низкоскоростные кодер-декодеры (кодеки) речи, являются: полоса частот, сохраняемая кодеком речи после сжатия, скорость передачи сжатого сигнала, качество восстановленной речи, вычислительная сложность алгоритма, вносимая кодеком задержка, чувствительность к акустическим шумам, в которых работает кодек, чувствительность к ошибкам канала передачи. При этом относительная важность различных параметров зависит от области применения кодека. Например, в задаче сжатия речи для целей хранения (архивации) приоритет имеют качество звучания и степень сжатия, а сложность и вносимая задержка играют меньшую роль, а в задаче передачи речи по каналу связи помимо скорости и задержки анализа критичной оказывается сложность алгоритма сжатия. Причем сложность играет даже более существенную роль, т. к. построение низкоскоростных кодеков с приемлемым качеством звучания принципиальных трудностей не составляет, но их высокая вычислительная сложность оказывает серьезные ограничения на область применения алгоритма. Технико-экономические факторы особенно важны в портативных системах связи с автономным питанием, в приложениях, работающих в режиме реального времени, или в массовых и дешевых системах, ориентированных на конечного пользователя (например, в системах сотовой связи, пакетной интернет-телефонии), где высокая сложность зачастую исключает применение алгоритма, приемлемого по другим параметрам (скорости передачи, качеству звучания и т. д.). Особенности применения различных алгоритмов обработки речи и связанные с ними ограничения рассмотрены в главе 1 настоящей работы.

К вычислительным операциям, работающим непосредственно с речевыми отсчетами, относятся: входная фильтрация (ограничение спектральной полосы речи перед обработкой, предкоррекция спектра [3-5. 11]), автокорреляционный анализ (линейное предсказание, выделение основного тона речи), фильтрация в анализирующем и синтезирующем формантных фильтрах и другие. При этом для обеспечения достаточной точности вычислений дискретизированный во времени и квантованный по уровням речевой сигнал представляется в линейном 16-разрядном формате ИКМ [1. 2] обычно с частотой дискретизации 8 кГц. Соответственно, большая удельная емкость вычислительных операций с 16-разрядными данными во многом определяет совокупную вычислительную сложность современных алгоритмов. В большинстве современных приложений требуется, чтобы кодек речи (вычислитель и необходимая для его работы память) был реализован на единственном микропроцессоре или микросхеме. Выполнение этого условия часто приводит к запретительно-высоким энергетическим или стоимостным параметрам кодека.

Опережающее развитие элементной базы за последние 10-15 лет в какой-то мере снизило интерес к поиску решений, уменьшающих сложность и цену устройств. Тем не менее, экстенсивное развитие не позволяет в полной мере реализовать накопленный научный и инженерный потенциал, поскольку при любом текущем уровне элементной базы упрощение используемых моделей и алгоритмов приводит к соответствующему выигрышу, в том числе и на очередном уровне сложности нового поколения элементной базы. Во второй главе рассматриваются вопросы адаптивного малоразрядного квантования речи и возможность сокращения вычислительной сложности устройств обработки речевых сигналов, подвергнутых адаптивному малоразрядному квантованию.

Хорошо известное блоковое линейное предсказание (авторегрессионный анализ с сегментацией речевого сигнала, [6, 7, 14]), несмотря на свои ограничения, описанные в главе 1, до сих пор является основой для разработки низкоскоростных кодеков речи. Поэтому представляет большой интерес исследование адаптивного малоразрядного квантования речи применительно к алгоритмам, построенным на основе ЛП. Этому вопросу посвящен материал третьей главы. Особое внимание в главе уделяется влиянию малоразрядного представления речевого сигнала в блоковом ЛП на качество обработки. Также в главе 3 подробно исследованы такие важные для низкоскоростного кодирования речи вопросы, как устойчивость получаемых решений и вычислительная эффективность алгоритма при использовании малоразрядного представления.

Несмотря на многочисленные исследования, к сожалению, до настоящего момента отсутствуют серьезные результаты, преодолевающие недостатки, связанных с сегментацией речевого сигнала. Одним из наиболее перспективных путей здесь является переход от блоковых методов авторегрессионного анализа к рекуррентным, имеющим серьезные преимущества. Это, например, отсутствие искажений параметров авторегрессии, вызванных сегментацией и обработкой взвешивающим окном, меньшая скорость кодирования параметров ЛП и др. Реализовать указанные преимущества до сегодняшнего дня не удавалось [7, 15, 25, 37, 43], поэтому изучению вопроса рекуррентного оценивания параметров речевого сигнала посвящена глава 4. Особого внимания заслуживает обоснование выбора параметров, определяющих накопление текущих корреляций речевого сигнала, поскольку на сегодняшний день исследований этого вопроса не проводилось.

В настоящей работе при анализе проблем низкоскоростного сжатия речи были использованы методы математического анализа и теории вероятности, теории статистической радиотехники, теории информации, теории цифровой обработки сигналов, теории фильтров. Для целей экспериментальной проверки предлагаемых моделей и алгоритмов широко применялось имитационное моделирование с помощью ЭВМ.

Экспериментальные данные, полученные с помощью машинного моделирования, подтверждают применимость результатов работы в инженерной, научной и потребительской сферах. Основная практическая ценность работы заключается в доказательстве возможности снижения разрядности вычислителей, реализующих основные операции обработки речевого сигнала, в том числе в рекуррентных авторегрессионных алгоритмах, что позволяет получить сильное сжатие, сохранив при этом высокое качество без увеличения сложности по сравнению с другими алгоритмами.

Научная новизна работы заключается в следующем:

1. Разработан метод малоразрядного квантования речевого сигнала, основанный на адаптивной рекуррентной нормализации его динамического диапазона, позволяющий существенно сократить вычислительную сложность реализации алгоритмов сжатия речи.

2. Предложен новый тип «взвешивающих» фильтров с положительно определенной импульсной характеристикой, позволяющих повысить эффективность рекуррентных алгоритмов обработки речевого сигнала (снизить задержки анализа, увеличить отношение сигнал/шум).

3. Предложен метод параллельного рекуррентного авторегрессионного анализа, имеющий ряд преимуществ по сравнению с известными блоковыми и рекуррентными методами сжатия речевых сигналов (большая устойчивость, меньшие задержки анализа, вычислительная простота).

Благодаря лучшему соответствию рекуррентных методов обработки статистическим свойствам речевого сигнала открываются перспективы дальнейшего совершенствования авторегрессионных методов кодирования, применения их для целей сжатия речевого сигнала и для определения ОТ речи.

Результаты, полученные в диссертационной работе, были отражены в публикациях и сделанных на конференциях сообщениях, а также реализованы в виде алгоритмов и имитационных моделей и внедрены в научно-исследовательских, опытно-конструкторских и проектных разработках, проводимых в ФГУП НИИ Радио, НПФ «Кодек», ГУП СНПО «Элерон» и др. Помимо этого, результаты работы были внедрены в учебный процесс Московского технического университета связи и информатики.

На защиту диссертации выносятся следующие основные положения: 8

• Получен вывод, что нормализацию динамического диапазона речевого сигнала целесообразно проводить на начальном этапе анализа речи, а не при формантном анализе, как принято в известных алгоритмах.

• Установлено, что применение для взвешивания АКФ традиционных ФНЧ 1-го порядка неэффективно, и по всем параметрам (задержка анализа, подавление помех ОТ, устойчивость формантных фильтров, энергетический выигрыш предсказания) предпочтения заслуживают взвешивающие ФНЧ более высоких порядков.

• Показано, что адаптивное рекуррентное квантование речевого сигнала позволяет в блоковых и рекуррентных методах авторегрессионного анализа без потери степени сжатия и качества звучания применять 8-ми разрядные процессоры вместо традиционных 16-ти разрядных, вдвое сократить объем постоянной и оперативной памяти кодека речи и более чем в три раза— вычислительные затраты.

• Показано, что предложенный рекуррентный метод параллельного авторегрессионного анализа нормализованного речевого сигнала с динамической адаптацией коэффициентов главной диагонали матрицы линейного предсказания обеспечивает по сравнению с известными методами меньшую задержку анализа, лучшее сжатие, большую устойчивость формантных фильтров.

Похожие диссертационные работы по специальности «Системы, сети и устройства телекоммуникаций», 05.12.13 шифр ВАК

Заключение диссертации по теме «Системы, сети и устройства телекоммуникаций», Брауде-Золотарев, Михаил Юрьевич

4.5. Выводы по главе 4

В главе был предложен новый метод ЛГ1. основанный на параллельном рекуррентном оценивании АКФ сигнала речи. При этом:

1. Был получен больший ЭВП по сравнению с последовательными методами оценки частных корреляций [15, 25]. причем:

• Вероятность возникновения неустойчивого состояния составляет для 5-ти разрядной нормализации менее 0,05, для 6-ти и 7-ми — менее 0,01, для 8-ми — менее 0,02, что существенно меньше полученных ранее значений [15, 25] и не препятствует практическому применению метода.

• Предложены способы борьбы с неустойчивостью СФ, позволяющие получить ЭВП, не существенно уступающий традиционному блоковому методу (менее 1 дБ при 5-ти разрядной нормализации и менее 0,25 дБ при 6-ти, 7-ми и 8-ми разрядной нормализации).

Исследованы взвешивающие ФНЧ с нулями передаточной функции и даны рекомендации по выбору порядка фильтра, при котором для заданного ослабления минимизируется задержка, а также по инженерному расчету параметров таких фильтров. Показано, что:

• При 6. 7, и 8-ми разрядной нормализации использование традиционного ФНЧ-1 приводит к вероятности неустойчивости СФ около 0.18-0.25 (что делает невозможным их применение при взвешивании). Также показана нецелесообразность применения ФНЧ-2. поскольку вероятности неустойчивости для него составляет 0.20—0.45. ФНЧ-4 и ФНЧ-6 обеспечивают малую вероятность неустойчивости (менее 0.02). а наибольшая эффективность по комбинированному параметру устойчивость/сложность достигается применением ФНЧ 4-го порядка.

• ФНЧ с нулями позволяют снизить приведенную задержку в сравнении с ФНЧ-1 (при равном затухании вне полосы пропускания) примерно в 4 раза, а но сравнению с ФНЧ-4 (без нулей) на 20-25%.

• Исследованы и обоснованы допустимые пределы дискретизации оценок АКФ. позволяющие получить приблизительно в 2 раза большее сжатие параметров ЛП по сравнению с используемыми сегодня методами. Показано, что энергетический проигрыш предсказания ухудшается при этом всего менее, чем на 1 дБ. без роста вероятность неустойчивости СФ.

Также показано, что:

• Рекуррентное ЛП имеет наибольшую эффективность с точки зрения сложности. устойчивости и энергетического выигрыша при использовании нормализованного сигнала и квантовании на 6 и 7 бит.

• Вероятность неустойчивости СФ при увеличении порядка предсказания (с Р=10 до Р=14) не снижается.

Список литературы диссертационного исследования кандидат технических наук Брауде-Золотарев, Михаил Юрьевич, 2000 год

1. 1.U Recommendation G.711 (11/88) — Pulse code modulation (PCM) of voicc frequencies.

2. ITU Recommendation G.712 (11/96) — Transmission performance characteristics of pulse code modulation channels.

3. Spcech codec for full-rale iraffic channel. P.2. TF.TRA codec. European Telecommunication Standard ETS 300 395-2.

4. GSM full Rate Speech Transcoding. European Telecommunication Standards Institute. ETSI. July 1. 1993.

5. ITU Recommendation G.723.1 — Dual Rate Speech Coder For Multimedia Communications Transmitting at 5.3 and 6.3 kbit/s. Geneva. 1996.

6. JI. P. Рабппср. P. В. Шафер. Цифровая обработка речевых сигналов. ■■— М.: Радио и связь. 1981.

7. Дж. Д. Маркел. A. X. Грей. Линейное предсказание речи. М. Связь. 1980.

8. Брауде-Золотарев К). М. Брауде-Золотарев М. Ю. Математическая модель речепреобразу юшего устройства. Разд. 3 1П НИОКР «К7-М10-Т». тема 242/89. ген. заказчик ВЧ I 1232. 1994.

9. Михайлов В. Г. Златоустова Л. В. Измерение параметров речи/ под ред. М. Л. Сапожкова. — МлРадио и связь. 1987.

10. Бонч-Бруевич A. M., Брауде-Золотарев M. IO. Технико-экономические показатели кодеков речи на низкие скорости передачи. 51-я СНТК, программа, тезисы докладов, ООП МП «Информсвязьиздат», Москва, 1996.

11. Бонч-Бруевич А. М., Брауде-Золотарев М. Ю. Кодек речи на скорость 9,6 кбит/с, НПКППНиИТС, программа, тезисы докладов, ЗАО «Информсвязьиздат», Москва, 1997.

12. M. В. Назаров, Прохоров Ю. Н. Методы цифровой обработки и передачицифровых сигналов, — М.: Радио и связь, 1983.

13. Прохоров Ю. П. Статистические модели и рекуррентное предсказание речевых сигналов. — M.: Радио и связь, 1983.

14. Бонч-Бруевич А. М. Брауде-Золотарев М. Ю. О современных тенденциях в низкоскоростном кодировании речи, НПКПГШиИТС, программа, тезисы докладов. ЗАО «Информсвязьиздат», Москва. 1997.

15. Бонч-Бруевич А. М. Крауде-Золотарев M Ю. Малоразрядное представление речевых сигналов. Международный форум информатизации. «Коммуникационные технологии и сети». ЗАО «Информсвязьиздат». Москва,1998.

16. Braude-Zoioiarev M. Yu. Braude-Zoloiarev Yu. M. Recurrenl mulliband pitch eslimalion. Speconr99. Inlernational workshop. Speech and Computer. Proceedings, Moscow. 1999.

17. Braude-Zolotarev M. Yu. Braude-Zoloiarev Yu. M. Recurrent linear prediction. Speconr99. International workshop. Speech and Computer. Proceedings Moscow.1999.

18. Златоустова Jl. В. Фонетическая структура слова в потоке речи. Казань. 1962.

19. Слуцкер Г. С. Автоматизированная система обучения ЭВМ фонетическому кодированию речи. Дисс. канд. техн. наук. Москва. 1970.

20. Шеннон К. Работы по теории информации и кибернетике. (Пер. с англ.): — М.: ИЛ. 1963.

21. Колмогоров А.Н. Теория передачи информации — в кн.: М., Сессия АН СССР по научным проблемам автоматизации производства, 1956 г., Пленарные заседания — М: Изд. АН СССР, 1957 г.

22. Дж. Фланаган, Анализ, синтез и восприятие речи.: М., Связь, 1968.

23. Itakura F., Saito S. Speech Analysis-Synthesis system Based on Partial Autocorrelation Coefficient. — Acoust. Soc. Jap. Meeting, 1969.

24. Брауде-Золотарев M. Ю. Брауде-Золотарев Ю. M. Инерционное линейное компандирование сигнала речи. Труды НИИР: сб. статей.—• М, 1999 г.

25. Stachurski J. A Pitch Pulse Evolution Model for Linear Predictive Coding of Speech. Ph.D. Thesis. Department of Electrical Engineering, McGill University, Montreal,1. Canada, 1998.

26. W. B. Kleijn, Continuous representations in linear predictive coding, Proc. IEEE Int. Conf. on Acoustics. Speech. Signal Processing (Toronto), pp. 201-204. Ma}' 1991.

27. W. B. Kleijn and J. Haagen, Л general Wavcform-lnlerpolaiion structure, Proc. European Signal Processing Conf. (Edinburg), pp. 1665-1668. Sept. 1994.

28. W. B. Kleijn and J. Haaucn. Specch coder based on decomposition of characteristic waveforms, Proc. IEEE Int. Conf. on Acoustics, Speech, Signal Processing (Detroit), pp. 508-511, May 1995.

29. W. B. Kleijn. Y. Shoham, D. Sen. and R. Hagen. A low-comlexity Waveform Interpolation coder. Proc. IEEE Int. Conf. on Acoustics. Speech. Signal Processing (Atlanta), pp. 212-215. May 1996.

30. С ho у E. L. T. Waveform Interpolation Speech Coder at 4 kb/s, A ME Thesis. Department of Electrical and Computer Engineering. McGill University. Montreal. Canada. 1998.

31. Waveform Interpolation Speech Coder at 4 kb/s. M.D. Thesis. Department of Electrical and Computer Engineering. McGill University. Montreal, Canada. 1998.

32. Брауде-Золотарев M. 10. Брауде-Золотарев IO. M. Линейное предсказание нормализованной речи. Труды НИИР: сб. статей. — М. 1999 г.

33. А. МсСгее, К. Tinong. Е. В. George, Th. P. Barnwell, V. Viswanathan, A 2.4 kbit/s MEEP Coder Candidate for the New US Federal Standard, International Conference on Acoustics, Speech and Signal Processing 1996, Proceedings of ICASSP, 1996.

34. Брауде-Золотарев M. Ю., Брауде-Золотарев Ю. M. Рекуррентный анализатор основного тона, Конференция «Теория и практика речевых исследований» (АРСО-99), Филологический факультет МГУ. — М., 1999 г.

35. Itakura F., Saito S. On the Optimum Quantization of Feature Parameters in the PARCOR Speech Sinthesizer — Conf. Record IEEE 1972, Conf. Speech Commun, and Process, New York, Paper L4.

36. Dunn J. G., Cowan J. R., Russo A. J. Progress in the Development of a Digital Vocoder Empoying an Itakura Adaptive Predictor. Telecommunications Conference Record, IEEE Publ. No. 73, CHO 805-2,29B, 1973.

37. В. S. Atal, "Predictive coding of speech at low bit rates", IEEE Transaction

38. Communications, vol. COM-30, pp. 600-614, April 1982.

39. F. Itakura, "Line spectrum representation of linear prediction coefficients of speech signals" Journal Acoustic Soc. America (abstract), vol. 57, p. 535; 1975.

40. Ерауде--Золотарей V. 10. Брауде-Золо-к.рсг. Ю. M. Рекуррентный коррс.шui■ Oii 1 iь!ь aiki.';i;'i форлшшпы.ч !uic'iо";. хчонфсренцпя <• i сорпя и нрикшки реченых исследований:- ¡0> РСО-г>9Г Филоло; юкч'кнП факультет МГУ. У!. 1999 г.

41. В. Yegnanarayana. P. Satyanarayana Mueihv. Sourcc-System Windowing for Specch Analysis and Synthesis. IEEli Transaction on Spccch and Audio Processing, vol. 4. No.2. March 1996.

42. R. Salami. С. РаПатте. В. Bessetc. .LP. Adoul. Description os ITU-T Recommendation G.729 Annex A: Reduced Complexity 8 kbit/s CS-ACELP Coder. International Conference on Acoustics. Speech and Signal Processing 1997, Proceedings of ICASSP. 1997.

43. H. Li, G. B. Lockhart, Non-Linear Techniques For Pitch and Waveform Enhancement in PWI Coders. International Conference on Acoustics. Speech and Signal Processing 1997. Proceedings of ICASSP. 1997.

44. Y. Fliwasaki. K. Mano, A New 2 kbit/s Speech Coder Bared On Normalized Speech Waveform. International Conference on Acoustics. Speech and Signal Processing 1997, Proceedings of ICASSP. 1997.

45. W. Ding. N. Campble. N. Higuchi, N. Kasuya, Fast and Robust Joint Estimation of Vocal Tract and Voice Source Parameters, International Conference on Acoustics, Speech and Signal Processing 1997, Proceedings of ICASSP, 1997.

46. J. Cai, Zh. Liu, Robust Pitch Detection of Speech Signals Using Steerable Filters, International Conference on Acoustics, Speech and Signal Processing 1997, Proceedings of ICASSP, 1997.

47. H. K. Kim, Y. D. Cho, M. Y. Kim, S. R. Kim, A 4 kbit/s Renewal Code Excited Linear Prediction Speech Coder, International Conference on Acoustics, Speech and

48. Signal Processing 1997. Proceedings of ICASSP, 1997.

49. R. P. Cohn, J. S. Collura, Incorporating Perception Into LSF Quantization — Some pyncî"! nv^HÎ ^ Ip t rrP .'m 1OPP1 (^o r "fc mn rp on A 0P1 ! 10e Spp^1.^.^ Pîld ^l'Tfïî P Î'O C 0c-' ( 1 1997. Proceedings of ICASSP. 1997.

50. J. Skogland. J. Linden. Predictive VQ For Noisy Channel Spectrum Coding: AR MA?. Iniernntionnl Conference on Acoustic«. Speech and Signal Processing 1 997. Proceedings oi'lCASSP. 199".

51. T. Wang. K. lang. Ch. Feng. A High Quality MBE-LPC-FE Speech Coder at 2.4 kbps and 1.2 kbps. International Conference on Acoustics, Speech and Signal Processing 1 996. Proceedings of ICASSP. 1996.

52. Suat Ycldener. A 4 kb's Toll Quality Harmonic Excitation Linear Predictive Speech Coder. International Conference on Acoustics. Speech and Signal Processing 1997. Proceedings of ICASSP. 1997.

53. W. Kleijn. .1. Haagen. A Speech Coder Based on Decomposition of Characteristic Waveforms. International Conference on Acoustics, Speech and Signal Processing 1995. Proceedings of ICASSP, 1995.

54. H. Kang. D. Sen, Phase Adjustment in Waveform Interpolation. International Conference on Acoustics, Speech and Signal Processing 1999. Proceedings of ICASSP. 1999.

55. T. Ericsson, H. G. Kang, Pitch Quantization in Low Bit-Rate Speech Coding, International Conference on Acoustics, Speech and Signal Processing 1999, Proceedings of ICASSP, 1999.59

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.