Разработка методики использования широких фонетических категорий в задачах верификации диктора тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат технических наук Милошенко, Алексей Анатольевич

  • Милошенко, Алексей Анатольевич
  • кандидат технических науккандидат технических наук
  • 2010, Москва
  • Специальность ВАК РФ05.13.17
  • Количество страниц 94
Милошенко, Алексей Анатольевич. Разработка методики использования широких фонетических категорий в задачах верификации диктора: дис. кандидат технических наук: 05.13.17 - Теоретические основы информатики. Москва. 2010. 94 с.

Оглавление диссертации кандидат технических наук Милошенко, Алексей Анатольевич

ВВЕДЕНИЕ.

ГЛАВА 1. ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ РАСПОЗНАВАНИЯ ДИКТОРОВ.

1.1 Информативные параметры речевого сообщения.

1.1.1 Акустические признаки.

1.1.2 Лингвистические признаки.

1.2 GMM модель.1.

1.3 SVM модель.

1.3.1 Нелинейная SVMмодель.

1.3.2 Многоклассовый классификатор.

1.3.3 Двоичное кодирование.

1.3.4 Каждый против всех.'.!:.'Л!.;.

1.3.5 Као/сдый против каэюдого.:::::::;.;;::::.:::.::.::::::.:

1.3.6 Алгоритм голосования (Max Wins).:.'л.-.»л.ч(.

1.3.7 Направленный нециклический граф принятия решения (Decision Directed Acyclic Graph (DDAG)).

1.4 Распознавание с использованием искусственных нейронных сетей

1.5 СММ модель.:.

1.6 Метод векторного квантования.

1.6.1 Алгоритм Ллойда (алгоритм К-средних).

1.6.2 Алгоритм Linde, Buzo, Gray (LBG).

1.7 Тестовое распознавание.:.:.:.:.:.

1.8 Метод текстонезависимой системы идентификации на основе индивидуальности произношения гласных звуков.

1.9 Выводы по главе.

ГЛАВА 2. МЕТОДИКА ИСПОЛЬЗОВАНИЯ ШИРОКИХ ФОНЕТИЧЕСКИХ КАТЕГОРИЙ В ЗАДАЧАХ ВЕРИФИКАЦИИ ДИКТОРА.

2.1 Широкие фонетические категории.:'.

2.2 Модель математической интерпретации математической интерпретации лингвистических признаков в задачах верификации диктора.

2.3 Методика использования широких фонетических категорий в задачах распознавания диктора.

2.5 Выводы по главе.

ГЛАВА 3. ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ МОДЕЛИ РАСПОЗНАВАНИЯ ДИКТОРА НА ОСНОВЕ ШИРОКИХ ФОНЕТИЧЕСКИХ КАТЕГОРИЙ.

3.1 Описание эксперимента

3.2 Построение модели распознавания диктора на основе искусственной нейронной сети.

3.2.1 ЬУдсеть.

3.2.2 Многослойный персептрон.

3.3 Оценка качества работы сети в зависимости от выбранного правила обучения на реализациях тестовой фразы.

3.4 Оценка репрезентативности полученных результатов.

3.5 Влияние шума на качество распознавания диктора.

3.5.1 Влияние «коричневого» шума.

3.5.2 Влияние «белого» шума.

3.6 Выводы по главе.

Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка методики использования широких фонетических категорий в задачах верификации диктора»

Актуальность темы. Возможность общения с ЭВМ на естественном языке давно интересовала исследователей. С развитием уровня техники потребности современного общества диктуют новые требования к эргономичности систем и их безопасности. Таким образом, возникает необходимость в распознавании речевых сигналов. Это касается и вопросов пограничного контроля, криминалистической экспертизы, контроля и управления банковскими операциями, контроля доступа к охраняемым объектам и информационным системам, обслуживания и регистрации пассажиров, проведения оперативно-розыскных мероприятий.

Верификация, речи диктора, являясь одной из разновидностей задачи распознавания, устной: речи, используется в> системах контроля доступа; В общем случае, распознавание речи может состоять из нескольких задач: распознавание текста, распознавание диктора, определение его эмоционального состояния, возраста . и пола; распознание языка произношения говорящего и др. Все они относятся-к статистической теории распознавания; образов [25; 83; 29;. 82; 38; 46] и могут быть решены с: помощью соответствующего математического аппарата. Однако стоит отметить, что в системах распознавания речи: нашли применение и такие: модели, как: модель гауссовых смесей; (ОММ модель); модель опорных векторов (8УМ модель), распознавание с использованием искусственных нейронных сетей; скрытая Марковская модель (НММ модель), метод векторного квантования, тестовое распознавание (на основе аппарата' логических тестов), метод нечеткого сопоставления образов, 'метод! текстонезависимой системы идентификации диктора на основе; индивидуальности - произношения гласных звуков и- др. Все перечисленные; модели используют в. качестве, априорного словаря признаков некие? параметры речевого' сигнала, вычисленные- на> его отдельных достаточно! коротких фрагментах, характеризующихся стационарнарностыо. Признаки,,' связанные с анатомическими особенностями голосового тракта принято называть акустическими. Возможности систем распознавания с использованием акустических параметров достигли своего предела. Признаки, отражающие индивидуальные особенности речевой активности, обусловленные работой центральной нервной системы человека - называют лингвистическими. Трудность их использования в задачах распознавания заключается в том, что они характеризуются значительной вариативностью, и множества значений для различных дикторов имеют существенное пересечение. Возможности систем распознавания с использованием физических параметров достигли своего предела [44], и дальнейшее их усовершенствование представляется в совместном использовании лингвистических и спектрально-временных признаков.

Рассматривая речевое сообщение как последовательность сменяющихся звуков и пауз можно определить понятие широких фонетических категорий. В отечественной и зарубежной литературе выделяют следующие категории: гласные, носовые (назальные), плавные, шипящие, аффрикаты, взрывные, паузы [13; 54; 73].

Таким образом, использование широких фонетических категорий, в частности изменение во времени признака тон/шум, а также пауз речевого сообщения, для задач распознавания диктора является актуальным.

Цель работы заключается в разработке методики использования широких фонетических категорий речевого сообщения (распределения признаков тон/шум и пауз на фрагментах речи) в задачах верификации диктора.

Задачи исследования. Для достижения поставленной цели в работе решены следующие задачи:

1. Анализ характеристик речевых сообщений, используемых при распознавании речи;

2. Анализ моделей и методов, используемых при распознавании;

3. Построение модели математической интерпретации лингвистических признаков в задачах верификации диктора;

4. Исследование возможности применения различных идентификационных параметров для верификации диктора в разработанной модели;

5. Разработка методики использования широких фонетических категорий в задачах верификации диктора;

6. Исследование влияния шума на надежность верификации диктора с использованием широких фонетических категорий;

7. Оценка репрезентативности полученных результатов распознавания диктора;

8. Обобщение и оценка результатов исследований по проблеме верификации диктора с использованием широких фонетических категорий.

Объект исследования. Процессы формирования и обработки устной речи.

Предмет исследования. Принципы, способы, методы, модели, алгоритмы, методики распознавания речи дикторов.

Исходная основа диссертации. Диссертация основывается на результатах:

- работ теории распознавания образов Ю. JL Барабаша, В.Н. Вапника, К. Фукунаги, А. JI. Горелика.

- теоретических и прикладных исследований по цифровой обработке речевых сообщений В.М. Величко, Т.К. Винцюка, Н.Г Загоруйко, Г.С. Слуцкера, A.A. Пирогова, М.А. Сапожкова, , Г.Е. Кедровой, JI.A. Чистовича , Ю.А. Косарева, В.Н. Сорокина, В.И. Галунова,

A.B. Аграновского, В.П. Бондаренко, A.A. Харламова , Р.К. Потаповой,

B.Я. Чу чу пал а, В.Н. Сорокина, П. А. Скрелина, В. Г. Михайлова, Б.М. Лобанова, Н.К. Обжеляна, В.Н. Трунина-Донского, Г. С. Рамишвили, JI.P. Рабинера, Г.М. Фанта, Р.В. Шафера, Р. Якобсона, Г. Чедда,

Г.Р. Доддингтона, С. Фуруи, Л. Фланагана, Г.В. Горелова, А.Ф. Фомина, Л.А. Баранова, И.А. Шалимова.

Методы исследования. В работе использовались метод структурного системного анализа, методы цифровой обработки сигналов, математического и компьютерного моделирования, методы обработки экспериментальных данных, методы распознавания образов, статистического анализа, методы спектрального и корреляционного анализа.

Научная новизна и основные положения, выносимые на защиту состоят в следующем:

1) Предложена математическая интерпретация идентификационной информативности лингвистических признаков посредством последовательности изменяющихся во времени акустических параметров речи диктора.

2) На основе результатов исследования существующих моделей и методов распознавания дикторов, разработана модель математической интерпретации лингвистических признаков в задачах верификации диктора.

3) Создана методика использования широких фонетических категорий в задачах верификации диктора.

4) Получена экспериментальная оценка надежности распознавания диктора, с использованием разработанных модели и методики.

Основные положения, выносимые на защиту состоят в следующем:

1) Модель математической интерпретации лингвистических признаков в задачах верификации диктора.

2) Методика использования широких фонетических категорий в задачах верификации диктора.

Практическая ценность работы.

1) Обеспечение возможности верификации диктора по каналу связи с вокодерной передачей без восстановления исходной формы речевого сигнала.

2) Верификация диктора на основе широких фонетических категорий инвариантна к сигналам, подвергнутым вокодерным преобразованиям, что позволяет повысить надежность системы верификации при использовании предложенной методики.

3) Реализованная в пакете прикладных программ Ма^аЬ модель математической интерпретации лингвистических признаков в задачах верификации диктора, и методика использования широких фонетических категорий в задачах верификации диктора используется при проведении лабораторных работ по исследованию систем распознавания в рамках дисциплины «Цифровая телефония».

Реализация результатов работы.

1. В компании ООО «Стэл — КС»: в научно-техническом отчете по СЧ НИР «Проба2К» (Госконтракт с ФГУП «НИИ Квант» № 028/23-К2 от 01.07.2008г.), в научно-техническом отчете по НИР «Шпала» (Госконтракт с государственным учреждением «Войсковая часть 35533» Ы70/2009-6200к от 10 апреля 2009г.) использован проведенный анализ информативных параметров речевого сообщения, используемых для формирования априорного словаря признаков, а также показана возможность идентификации диктора посредством широких фонетических категорий.

2. В учебном процессе на кафедре 723 ИКСИ в курсе лекционных, лабораторных и практических занятий по дисциплине «Цифровая телефония» используются результаты анализа информативных параметров речевого сообщения, существующих методов и моделей, используемых при распознавании дикторов и реализованная в пакете прикладных программ MatLab модель математической интерпретации лингвистических признаков в задачах верификации диктора.

Апробация результатов работы. Результаты диссертационного исследования были апробированы на IX Международной научно-технической конференции «Физика и радиоэлектроника в медицине и экологии» (ФРЭМЭ'2010) (29 июня - 2 июля 2010 года, ВлГУ, г. Владимир), VIII Межведомственной научно-технической конференции (3-5 февраля 2010, в/ч 33965, г. Москва), Юбилейной научно-технической конференции специалистов и молодых ученых (27-28 мая 2009, в/ч 35533, г. Москва), 6-ой Всероссийской научной конференции «Проблемы развития технологических систем государственной охраны, специальной связи и информации» (5-6 февраля 2009, Академия ФСО России, г. Орел), а также в ходе проведения научных семинаров на базе Института криптографии связи и информатики Академии ФСБ России и в/ч 35533.

Публикации. По материалам диссертации опубликовано 9 работ, три из которых в изданиях, входящих в Перечень ведущих рецензируемых научных журналов и изданий, формируемый Высшей аттестационной комиссией.

Содержание работы

Во введении обоснована актуальность диссертационного исследования, сформулированы цель и основные задачи, решение которых необходимо для достижения поставленной цели. Кратко изложены основное содержание работы.

В первой главе проведен обзор, анализ и систематизация используемых для распознавания дикторов информативных параметров речевого сообщения, существующих методов и моделей, используемых при распознавании дикторов.

Во второй главе строится модель математической интерпретации лингвистических признаков и разрабатывается методика использования широких фонетических категорий в задачах верификации диктора.

В третьей главе приводится описание исследований структуры искусственной нейронной сети для реализации предложенной методики и условий ее применимости. Исследуется влияние шума на надежность распознавания диктора. Дается оценка репрезентативности полученных результатов.

Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Заключение диссертации по теме «Теоретические основы информатики», Милошенко, Алексей Анатольевич

3.6 Выводы по главе

Представленная во второй главе модель математической интерпретации лингвистических признаков в задачах верификации диктора распознавания диктора на основе широких фонетических категорий получила свою практическую реализацию. Для принятия решения о принадлежности диктора тому или иному классу построен классификатор на основе аппарата искусственных нейронных сетей [53], который был апробирован на реальных данных и уточнен соответствующим образом. Проведенная оценка репрезентативности полученных данных показала, что использование многослойного персептрона в качестве решающего правила для верификации диктора на основе широких фонетических категорий является применимым. При этом с вероятностью 0,95 среднее процентное соотношение верно распознанных дикторов в каждой серии испытаний к их общему числу составляет 86 ±4,7%, при усреднении полученных результатов в каждой серии испытаний и 86 ± 7,6% при усреднении значений по каждому диктору по результатам всех испытаний.

Влияние шума оказало существенное воздействие на качество распознавания, что является ограничением используемых алгоритмов выделения пауз и определения вокализованности фрагментов. Однако стоит отметить, что величина шумовой составляющей являлась критической, когда исходное речевое сообщение при использовании «белого» шума оказалось на границе порога слышимости.

ЗАКЛЮЧЕНИЕ

В ходе проведения исследований в работе решены следующие задачи:

1. Проведен анализ систем распознавания речи, отмечена ограниченность современных подходов, не использующих лингвистическую информацию.

2. Построена модель математической интерпретации лингвистических признаков в задачах верификации диктора.

3. Произведена оценка информативности различных параметров устной речи применительно к разработанной модели.

4. Определена структура и параметры модели распознавания диктора на основе искусственной нейронной сети.

5. Разработана методика использования широких фонетических категорий в задачах верификации диктора.

6. Разработанная модель математической интерпретации лингвистических признаков в задачах верификации диктора реализована в пакете прикладных программ Ма^аЬ.

7. Исследовано влияние шума на надежность верификации диктора с использованием широких фонетических категорий.

8. Разработанная модель математической интерпретации лингвистических признаков обеспечивает возможность верификации диктора по каналу связи с вокодерной передачей без восстановления исходной формы речевого сигнала.

9. Получена экспериментальная оценка надежности распознавания диктора с использованием разработанных модели и методики. Проведена оценка репрезентативности полученных результатов. При этом с вероятностью 0,95 среднее процентное соотношение верно распознанных дикторов в каждой серии испытаний к их общему числу составляет 86 ± 5%.

Решение поставленных задач привело к следующим новым научным результатам:

1) Разработана модель распознавания диктора на основе широких фонетических категорий;

2) Разработана методика использования широких фонетических категорий в задачах верификации диктора;

3) Интерпретация информационной информативности фонетических категорий посредством последовательности изменяющихся во времени акустических параметров диктора.

Применение акустических параметров речевого сообщения для задач распознавания дикторов достигло своего предела, и дальнейшее повышение эффективности представляется в совместном использовании спектрально-временных и акустических признаков. Проведенное исследование показало, что, в частности, для этих целей возможно использование широких фонетических категорий. Применение в качестве решающего правила нейронной сети, несмотря на недоказанную сходимость к глобальному оптимуму, имеет право на существование, поскольку полученные результаты являются удовлетворительными для проверки выдвинутой гипотезы.

Главным итогом проведенной работы является решение задачи использования лингвистических признаков в задачах верификации диктора, что является, имеющей существенное значение для соответствующей отрасли знаний.

Используемые признаки в вокодерной передаче непосредственно передаются по каналу связи, в связи с чем возможна верификация диктора по каналу связи без восстановления исходной формы речевого сообщения. Кроме того, надежность распознавания в данном случае зависит от качества канала связи опосредованно.

Список литературы диссертационного исследования кандидат технических наук Милошенко, Алексей Анатольевич, 2010 год

1. Advances in Speech Signal Processing / ed. by Sadaoki Furui, M. Mohan Sondhi. New York : Marcel Dekker, Inc, 1991. - 871 p.

2. Bernard Widrow, Michael A. Lehr, 30 Years of Adaptive NeuralNetworks: Perceptron, Madaline, and Backpropagation //Artificial Neural Networks: Concepts and Theory, IEEE Computer Society Press, 1992, pp.327-354.

3. C.Cortes, V.Vapnik, Support Vector Networks // Machine Learning 20(3): 273297, 1995.

4. C.-W. Hsu and C.-J. Lin. A comparison of methods for multi-class support vector machines // IEEE Transactions on Neural Networks, 13(2):415-425, March 2002.

5. Christopher J.C. Burges, A Tutorial on Support Vector Machines for Pattern Recognition // Data Mining and Knowledge Discovery, 2(2): 121-167, 1998.

6. Christopher M.Bishop, Neural Networks for Pattern Recognition, Oxford University Press, 1995.

7. D.K.Burten Text Independent Speaker Verification Using Vector Quantization Source Coding // IEEE Trans. ASSP-35.

8. Doddington G.R., Flanagan G.L., Lummis R.C. Automatic speaker verification by non-linear time alignment of acoustic parameters. Патент США № 3700815. 1972

9. Doddington G.R., Przybocki M.A., Martin A.F., Reynolds D.A. The NIST speaker recognition evaluation: Overview, methodology, systems, results, perspective // Speech Communication. 2001. V. 31. P. 225-254.

10. Furui S. Cepstral analysis technique for automatic speaker verification // IEEE Trans. Acoust., Speech, Signal Process. Apr. 1987. V. ASSP-29. P. 254-272.

11. Furui Sadaoki Digital speech processing, synthesis and recognition / Sadaoki Furui. 2nd ed., rev. and expanded. - New York : Marcel Dekker, Inc, 2001. -452 p.

12. He J., Liu L., Palm G. A new codebook training algorithm for VQ-based speaker recognition // IEEE Proc. of International Conference on Acoustics, Speech and Signal Processing. Munich, 1997. V. 2. P. 1091-1094.

13. L.R. Rabiner, B.H. Juang Fundamentals of speech recognition. Englewood Cliffs, New Jersey : Prentice-Hall, Inc, 1993. - 507 p.

14. Lawrence R. Rabiner, A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition, Proceedings of IEEE, vol.77, no.2, p.257-285, 1989.

15. Ming-Shin Chen, Pie-Hwa Lin, Hsiao-Chuan Wang. Speaker Identification Based on a Matrix Quantization Method // IEEE Trans. On Signal Proc. Jan. 1993. V. 41. № 1.

16. N. Cristianini, J. Shawe-Taylor, An Introduction To Support Vector Machines (and other kernel-based learning methods), Cambridge University Press, 2000

17. Nuttakorn Thubthong, Boonserm Kijsirikul Support vector machines for Thai phoneme recognition // International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems. October, 2001.

18. Roman Jakobson, C.Gunnar, M.Fant, Morris Halle, Preliminaries to speech analysis. The distinctive features and their correltes, "Technical Report", № 13, June 1955, chap. II, p. 16—55.

19. Rosenberg A E., Soong F.K. "Evalution of a Vector Quntization Talker Recognition System in Text Independent and Text Dependet Modes". Computer Speech and Language, v.2, pp. 143-157, 1987.

20. V.Vapnik, An Overview of Statistical Learning Theory, IEEE Transactions on Neural Networks, 10(5):988-999, September 1999.

21. V.Vapnik, Statistical Learning Theory, Wiley, 1998

22. Xuedong H., Acero A., Hon H. Spoken language processing: a guide to theory, algorithm, and system development. New Jersey : Printice Hall PTR, 2001, 472 p.

23. Аграновский A.B., Леднов Д.А. Теоретические аспекты алгоритмов обработки и классификации речевых сигналов. Москва: Изд-во «Радио и связь», 2004. 164 с.

24. Аграновский А.В., Леднов Д.А., Репалов С.А. Метод текстонезависимой идентификации диктора на основе индивидуальности произношения гласных звуков // Акустика и прикладная лингвистика : Ежегодник РАО. Вып. 3. М., 2002. С. 103-115.

25. Барабаш Ю.Л., Варский Б.В., Зиновьев В. Т., Кириченко B.C., Сапегин В.Ф. Вопросы статистической теории распознавания / Под ред. Б. В. Барского. М. : Советское радио, 1967. -399 с.

26. Бондарко Л.В.Звуковой отрой современного русского языка. М., 1976.

27. Бочаров И.В., Акатьев Д.Ю. «Распознавание речевых сигналов на основе корреляционного метода». Электронный журнал «Исследовано в России».

28. Быков С.Ф., Журавлев В.И., Шалимов И.А. Цифровая телефония: Учеб. пособие для вузов. М.: Радио и связь, 2003. - 144 с.

29. Вапник В. Н., Червоненкис А .Я. Теория распознавания образов. Статистические проблемы обучения (статистические проблемы обучения). -М.: Наука, Гл. ред. физ.-мат. лит., 1974. -416 с.

30. Вапник В.Н., Червоненкис А.Я., Теория распознавания образов, М., Наука, 1974.

31. Винцюк Т.К. Сравнение ИКДП- и НММ методов распознавания речи // Методы и средства информ. речи. Киев, 1991.

32. Галушкин А.И. Теория нейронных сетей. Кн. 1.: Учеб. пособие для вузов -М.: ИПРЖР, 2000.-416 с.

33. Галяшина Е. Речь под микроскопом // "Компьютерра" №15 от 12 апреля 1999 года.

34. Горелик А. Л., Скрипкин В. А. Методы распознавания: Учеб. пособие. -2-е изд., перераб. и доп. —М.: Высш. шк., 1984. -208с.

35. Гудонавичюс Р. В., Кемешис П. П., Читавичюс А. Б. Распознавание речевых сигналов по их структурным свойствам. // Б-ка по автоматике. Вып. 578. Л.: Энергия, 1977. 64 с.

36. Д.А. Лузин алгоритм начальной оценки основного тона речи для выделителя основного тона речи по методу gs. // Сборник трудов XVIII сессии Российского акустического общества. Т. 3. М.: ГЕОС, 2006.

37. Дьяконов В.П., Круглов B.B. Matlab 6.5 SP1/7/7 SP1/7 SP2 + Simulink 5/6: Инструменты искусственного интеллекта и биоинформатики. -М.: Солон-пресс, 2006. -456 с.

38. Журавлев Ю.И., Рязанов В.В., Сенько О.В. Распознавание. Математические методы. Программная система. Практические применения. -М. : Фазис, 2005. 159с.

39. Идентификация- лиц по фонограммам русской речи на автоматизированной системе «Диалект» : Пособие для экспертов / Н.Ф. Попов, А.Н. Линьков, Н.Б. Кураченкова, Н.В. Байчаров; Под ред. A.B. Фесенко. -М.: Войсковая часть 34435, 1996:- 102 с.

40. Кей А. «Искусственные нейронные сети», Открытые системы, 9, 2006.

41. Кудрявцев В. Б., Андреев А. Е., Гасанов Э.Э. Теория тестового распознавания. М.: ФИЗМАТЛИТ, 2007. - 320с. - ISBN 978-5-92210872-0.

42. Кучеров В. Я., Лобанов Б. М. Синтезированная.речь в,системах массового обслуживания. М.: Радио и связь, 1983. - 132 с.

43. Лобанов Б.М. Анализ и синтез речи. Сборник научных трудов /АН БССР Институт технической кибернетики. Науч. Ред. Лобанов Б:М'. Минск, 1991,-86 с.

44. Максимов Е.М., Ромашкин Ю.Н., Лопатина С.А. Актуальные задачи речевой акустики // Речевые технологии. № 2. М!, 2008. С. 66-70.

45. Макул Д. Векторное квантование при кодировании речи. // ТИИЭР. -1985. Т. 73, №11.-С. 19-61.46: Математические методы распознавания образов. // 13-я Всероссийская конференция: Сборник докладов. М.: МАКС Пресс, 2007. - 668 с.

46. Медведев B.C., Потемкин В.Г. Нейронные сети. MATLAB 6 / Под общ. ред. к.т.н. В.Г. Потемкина. -М.: ДИАЛОГ-МИФИ, 2002. 496с.

47. Милошенко A.A. Особенности анализа лингвистических параметров речевых сигналов // Тезисы докладов научно-технической конференции в/ч 33965, 3-5 февраля 2010, г. Москва.

48. Милошенко A.A., Чапак A.C., Шалимов И.А. Просодический облик говорящего из оценки частоты основного тона // Тезисы докладов научно-технической конференции в/ч 33965, 3-5 февраля 2010, г. Москва.

49. Милошенко A.A., Шалимов И.А. Нейросетевой критерий распознавания диктора на основе широких фонетических категорий // Труды НИИР № 2, М: МТУСИ, 2010. С. 5-12.

50. Михайлов В.Г., Златоустова JI.B. Измерение параметров речи / Под ред. М.А. Сапожкова. -М.: Радио и связь, 1987. 168 с.

51. Нейронные сети. Statistica neural networks. Методология и технология современного анализа данных. -2-е изд., перераб! и доп. / Под ред. В. П. Боровикова -М.: Горячая линия Телеком, 2008. - 392 с.

52. Обжелян Н.К., Трунин-Донской В.Н. Машины, которые говорят и слушают. / Под. ред. Ю.И. Журавлева. -Кишинев : Штиинца, 1987. -175 с.

53. Оппенгейм А. В., Шафер Р. В. Цифровая обработка сигналов: Пер. с англ ./Под ред. С.Я. Шаца.-М.: Связь, 1979.-416с., ил.

54. Осовский С. Нейронные сети для обработки информации / Пер. с польского И. Д. Рудинского. М.: Финансы и статистика, 2002. - 344 с.

55. Панов М.В. Современный русский язык. Фонетика. М., 1979.

56. Пилипенко В.В. Распознавание ключевых слов в потоке речи при помощи фонетического стенографа// Речевые технологии. №1 2009. с. 75-79

57. Попов Э.В. Общение с ЭВМ на естественном языке. М., 1989.

58. Прикладные нечеткие системы: Пер. с япон. / К. Асаи, Д. Ватада, С. Иваи и др.; под редакцией Т. Тэрано, К. Асаи, М. Сугэно. М.: Мир, 1993. - 368 е., ил.

59. Р.К. Потапова, В.В.Потапов О дальнейшем развитии систем идентификации говорящего по голосу и речи // Сборник трудов XVIII сессии Российского акустического общества. Т. 3. М.: ГЕОС, 2006.

60. P.J1. Григорян, С.А. Репалов Исследование влияния динамических характеристик на точность идентификации дикторов для методов, основанных на векторном кантовании // Сборник трудов XVIII сессии Российского акустического общества. Т. 3. М.: ГЕОС, 2006.

61. Рабинер JI. Р. Скрытые марковские модели и их применение в избранных приложениях при распознавании речи: Обзор // ТИИЭР, Т. 77, № 2, февраль 1989.-С. 86-120

62. Рабинер JT. Р., Шафер Р. В. Цифровая обработка речевых сигналов: Пер. с англ./Под ред. М. В. Назарова и Ю. Н. Прохорова. -М.: Радио и связь, 1981.-496 е., ил.

63. Рабинер Л., Гоулд Л. Теория и применение цифровой обработки сигналов. Пер. с англ. А.Л. Зайцева, Э.Г, Назаренко, H.H. Тетёкина /Под ред. Ю.Н. Александрова -М.: Мир, 1978. -848 е., ил.

64. Рамишвили Г. С. "Речевой сигнал и индивидуальность голоса". Изд-во "МЕЦНИЕРЕБА", Тбилиси, 1976, стр. 1-183

65. Рамишвили Г. С., Чикоидзе Г. Б. Криминалистическое исследование фонограмм речи и идентификация личности говорящего. Тбилиси: "Мецниереба", 1991. 265 с

66. Рамишвили, Г. С. Автоматическое опознавание говорящего по голосу / Г. С. Рамишвили М. : Радио и связь , 1981 224 с.ил.

67. Садыхов Р.Х., Ракуш В.В. Модели гауссовых смесей для верификации диктора по произвольной речи // Доклады БГУИР. № 4. октябрь-декабрь 2003 / Белорусский государственный университет информатики и радиоэлектроники. Минск, 2003. С. 95-103

68. Сапожков М. А., Михайлов В. Г. Вокодерная связь. —М.: Радио и связь, 1983.-248 с.

69. Сапожков М.А. Речевой сигнал в кибернетике и связи. -М.: Связьиздат, 1963.-453 с.

70. Секунов Н. Ю. Обработка звука на PC. СПб.:БХВ-Петербург, 2001. -1248 е.: ил.

71. Соболев В.Н. Информационные технологии в синтетической телефонии. -М.: Ириас, 2007.-360 с.

72. Сорокин В.Н. Синтез речи. -М.: Наука Гл. ред. физ.-мат. лит., 1992. 392 с.

73. Сорокин В.Н. Теория речеобразования. -М.: Радио и связь., 1985. -312 с.

74. Справочная система пакета прикладных программ MatLab. Версия 7.6.0.324

75. Фант Г. Акустическая теория речеобразования. Пер. с англ. Л.А. Варшавского, В.И. Медведева / Под ред. B.C. Григорьева. -М.: Наука Гл. ред. физ.-мат. лит., 1964. 284 с.

76. Финк Л. М. Сигналы, помехи, ошибки . Заметки о некоторых неожиданностях, парадоксах и заблуждениях в теории связи.-2-e изд., перераб. и доп.-М.: радио и связь, 1984.-256 е., ил.

77. Фланаган Д. Л. Анализ, синтез и восприятие речи: Пер. с англ./Под ред. А. А. Пирогова. -М.: Связь, 1968.-396 с.

78. Фомин Я. А., Тарловский Г. Р. Статистическая теория распознавания образов : научное издание. М. : Радио и связь, 1986. - 264 с.

79. Фукунага К. Введение в статистическую теорию распознавания. М.: Наука, 1979

80. Хайкин С. Нейронные сети: полный курс, 2-е издание. : Пер. с англ. М. : Издательский дом «Вильяме», 2006. - 1104 с.о

81. Харкевич A.A. Спектры и анализ. .-4-е изд. -М.: Физ.-мат. лит., 1962. 236 с.

82. Харламов A.A., Кнеллер Э.Г. Распознавание ключевых слов в потоке' слитной речи на основе нейросетевых технологий. Нейрокомпьютеры разработка применение. Интегральный робот, 2005; 8-9: 88-97.

83. Харламов A.A., Самаев Е.С., Джураев Э.Ш., Сухоносенко К.В. Фильтрация текстовой информации с помощью нейросетевых алгоритмов. Информационные технологии, 2003, 3:9-13

84. Худсон Д. Статистика для физиков: Пер. с англ. —2-е изд., перераб. и доп.— М.: Мир, 1970.-297 с.

85. Цифровая обработка сигналов / А. Б. Сергиенко СПб.:Питер, 2002.-608 е.: ил.

86. Чедд Г. Звук. Пер. с англ. Г. И. Кузнецова. Ред. и предисл. С. Б. Гуревича. М.: «Мир», 1975. 206 с. с илл. (В мире науки и техники)

87. Шалимов И. А., Милошенко А. А. Исследование возможности применения лингвистических параметров речи в системах идентификации по голосу // «Вестник ИКСИ», М., 2010.

88. Шалимов И. А., Милошенко А. А. Обзор моделей идентификации и информативные параметры речевого сигнала // Специальная техника №5 2009. С. 37-46.

89. Шелухин О. И., Лукьянцев Н. Ф. Цифровая обработка и передача речи. -М.: Радио и связь, 2000. 456 с.

90. Шемакин Ю. И. Начала компьютерной лингвистики: Учеб. пособие. М.: Изд-во МГОУ, А/О «Росвузнаука», 1992. - 81 с.

91. Шемакин Ю.И. Основы информатики и вычислительной лингвистики. — М., 1983.

92. Шмелева А. «Правда о распознавании речи», Компьютер-пресс, 1, 1998.

93. Якобсон Р., Фант Г. М. и Хале М. Введение в анализ речи. Различительные признаки и их корреляты // Новое в лингвистике. Выпуск II.-М.: 1962, с. 173 -231.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.