Математическое обеспечение систем и устройств с речевым вводом информации

Орлова, Маргарита Изикиельевна

Математическое обеспечение систем и устройств с речевым вводом информации тема диссертации и автореферата по ВАК РФ 01.01.10, кандидат технических наук Орлова, Маргарита Изикиельевна

Орлова, Маргарита Изикиельевна
кандидат технических наук
1984

Специальность ВАК РФ01.01.10

Количество страниц 207

Орлова, Маргарита Изикиельевна. Математическое обеспечение систем и устройств с речевым вводом информации: дис. кандидат технических наук: 01.01.10 - Математическое обеспечение вычислительных машин и систем. Москва. 1984. 207 с.

Оглавление диссертации кандидат технических наук Орлова, Маргарита Изикиельевна

ВВЕДЕНИЕ

ГЛАВА I. Проблема организации речевого ввода в диалоговых системах.

1.1. Общее состояние проблемы

1.2. Современные системы автоматического распознавания речи и особенности их эксплуатации.

1.3. Основные принципы построения систем автоматического распознавания речи.

1.4. Анализ известных методов построения матобеспечения распознающих систем

1.5. Принципы построения тестов для проверки и диагностики систем и устройств распознавания речи

Введение диссертации (часть автореферата) на тему «Математическое обеспечение систем и устройств с речевым вводом информации»

Разработка систем автоматического распознавания и синтеза речи является в настоящее время одним из основных направлений развития средств автоматизации. Такие системы позволяют повысить эффективность технического обслуживания различных систем в народном хозяйстве и допустить широкий круг пользователей, не обладающих специальной подготовкой, к эксплуатации сложных технических комплексов, в частности, вычислительных машин.

Диапазон потенциального практического использования устройств, воспринимающих речевые команды и выдающих информацию или управляющие сигналы голосом, необычайно широк [бЗ, 59, 66, 74, 105, 130] .

Широта возможных практических применений таких устройств определяется рядом специфических свойств речевого способа передачи информации Ы :

- речь является для человека естественным способом обмена информацией, не требует специального обучения, относительно устойчива к изменению психофизиологического состояния оператора ;

- речевой обмен информацией и речевое управление оставляют свободными глаза и руки, которые зачастую оказываются перегруженными в процессе практической деятельности ;

- речевой обмен информацией и речевое управление возможны в условиях пониженной (или нулевой) освещенности и при физических перегрузках ;

- для речевого управления и обмена информацией возможно использование стандартных каналов связи и стандартного периферийного оборудования.

Кроме того, системы распознавания речи могут работать от голоса конкретного пользователя ("санкционированный" доступ к органам управления), а также от речи, генерируемой в условиях искусственнои дыхательной среды (например, "гелиевая речь").

С перечисленных выше позиций разработка практических устройств распознавания речевых сигналов, включающая в себя математическое и программное обеспечение всех блоков этих устройств, является актуальной задачей, важной как с научной, так и с прикладной точек зрения.

Несмотря на очевидные преимущества систем автоматического распознавания речи и многолетние исследования в этой области, достигнутые успехи пока недостаточны. Связано это с чрезвычайной сложностью структуры речевого сигнала. Во-первых, элементы речевого потока весьма изменчивы, что определяется индивидуальными особенностями говорящего, его психофизиологическим состоянием, контекстом и просто мгновенно сложившейся артикуляторно-акустической ситуацией. Во-вторых, при общении человека с человеком речь включена в широкий неречевой контекст и чаще всего предполагает контрольный ответ (диалог). Система же автоматического распознавания речи имеет дело только с этим сообщением и редуцированность сигнала становится труднопреодолимой [24] .

Наиболее широкое развитие и применение нашли способы автоматического распознавания речи, основанные на использовании точных математических методов при сравнении входных и эталонных реализаций, которые рассматривают речевой сигнал, ке учитывая его биологическую природу, выражающуюся в неопределенности описания и многовариантности сигнала, отражающего не только смысл сказанного, но и эмоции говорящего, его индивидуальность и т.д. Это делает системы, основанные на отношении к речевому сигналу, несущему одно смысловое содержание, очень зависящими от диктора и условий, в которых он находится при произнесении высказывания. Большинство современных реальных промышленных систем не учитывают природу речи из-за трудностей ее моделирования. В отличие от более общего математического направления исследований в настоящей работе предлагается бионический подход, базирующийся на изучении основных закономерностей речевосприятия. Такой подход позволяет создавать системы, наиболее полно учитывающие способности человеческого мышления к восприятию реальных речевых сигналов.

Системы автоматического распознавания речи - это в первую очередь программные системы, которые должны работать в реальных условиях (в акустических шумах помещения, с множеством дикторов, не являющихся профессиональными пользователями вычислительных машин и т.д.). Реальные условия накладывают свои требования на системы речевого ввода и на их математическое обеспечение. Кроме того, современные системы распознавания должны быть экономичными с точки зрения памяти и вычислительных ресурсов. Вследствие этого актуальной проблемой построения таких систем является выбор модели распознавания, для которой развивается матобеспечение, связанной с выбором алгоритмов отдельных этапов дешифрации речи.

Цель данной работы - разработать специализированное программное обеспечение для систем и устройств с речевым вводом информации, обеспечивающим работу этих устройств в условиях акустических помех и искажений, характерных для практических задач. Ставилась задача совместить достоинства бионической модели процесса восприятия речи человеком и модели, на которой основываются большинство современных практических систем распознавания речи, не обладающих достаточной для применения в реальной практике устойчивостью.

Для решения этих задач было необходимо:

- определить архитектуру системы распознавания речевого сигнала, реализующей бионический подход к распознаванию речевого сообщения ;

- проанализировать старые и разработать новые методики и алгоритмы анализа и распознавания речи (включая оптимизацию признаков первичного описания) ;

- разработать математическое и программное обеспечение систем и устройств, работающих в реальных условиях ;

- экспериментально проверить работу предложенных алгоритмов и программ.

В диссертации, посвященной разработке специализированного матобеспечения речевого ввода информации, рассматриваются следующие вопросы:

- исследуется общая структура блоков речевого ввода в диалоговых системах ;

- анализируются методы и алгоритмы первичной обработки речи и методики автоматического распознавания речевых сигналов ;

- формулируются принципы построения тестов для проверки и диагностики систем и устройств распознавания речи ;

- предлагается бионический подход к организации процесса распознавания в системах автоматического распознавания речи, который наряду с традиционными статистическими методами обработки речевого сигнала учитывает основные принципы восприятия речи человеком ;

- разрабатывается матобеспечение для систем автоматического распознавания речи, основанной на бионическом принципе ;

- оптимизируется система различительных признаков речевого сигнала ;

- выбираются оптимальные параметры алгоритма нелинейного сравнения входной речевой реализации и эталонных произнесений ;

- разрабатывается специализированное матобеспечение для систем распознавания речевых образов, ориентированных на произвольного диктора ;

- предлагается модель системы автоматического распознавания изолированных слов на ЭВМ типа ЕС, основанная на бионическом принципе, позволяющая проводить сквозные эксперименты по выбору оптимальных параметров распознающей системы;

- проведена проверка работы системы в шумах ;

- предлагается матобеспечение для автоматического телефонного номеронабирателя, работающего с голоса произвольного диктора ;

- разрабатывается специализированное матобеспечение для обработки искаженных гелиевой средой сигналов для осуществления связи с акванавтами ;

- разрабатывается матобеспечение для диалоговой системы анализа речевых сигналов.

Общая методика проведения исследований в данной работе направлена на поиск оптимальных алгоритмов отдельных блоков матобеспечения речевого ввода и предусматривает:

- использование результатов биологических, психологических, психолингвистических исследований процесса восприятия речи человеком ;

- использование статистических методов обработки информации ;

- использование спектральных методов для анализа речевого сигнала ;

- использование метода динамического программирования для решения задач распознавания речевых образов;

- применение методов кластерного анализа для формирования эталонных реализаций речевых сигналов ;

- использование методов теории алгоритмов и организации банков данных для представления знаний в памяти ЭВМ.

Научная новизна работы заключается:

- в разработке и программной реализации новых алгоритмов анализа и распознавания речевых сигналов для систем, работающих в сложных условиях ;

- в оптимизации параметрического представления речевых сигналов для систем с речевым вводом информации ;

- в выборе оптимального варианта процедуры нелинейной деформации масштаба времени при сравнении распознаваемого и эталонного речевых сигналов методом динамического программирования ;

- в разработке специализированного математического и программного обеспечения для систем автоматического телефонного номеронабирателя, работающего от голоса произвольного диктора;

- в разработке матобеспечения для системы связи с акванавтами, находящимися в гелиево-кислородной дыхательной среде ;

- в разработке математического и программного обеспечения диалоговой системы анализа акустических сигналов с речевым запросом информации ;

- в формировании тестов для проверки и диагностики систем автоматического распознавания речи с целью исследования их применимости в сложных условиях.

Практическая ценность работы, подтвержденная актами использования результатов диссертации, определяется тем, что разработанные методики, алгоритмы и программы используются в конкретных системах и устройствах автоматического распознавания речи и в отдельных узлах таких систем, работающих, как правило, в сложных условиях (в шумах производственного помещения, в гелиевой среде, в телефонном канале).

Диссертация состоит из введения, четырех глав и заключения.

Заключение диссертации по теме «Математическое обеспечение вычислительных машин и систем», Орлова, Маргарита Изикиельевна

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

В работе получены следующие основные результаты:

- предложен подход к организации процесса распознавания в системах автоматического распознавания речи, который наряду с традиционными методами анализа речевого сигнала учитывает некоторые принципы восприятия речи человеком;

- разработана структура системы автоматического распознавания речи, основанная на бионическом принципе и использующая сегментно-целостный анализ произнесения с учетом просодических характеристик. Система учитывает: наличие параллельных путей анализа речевого сообщения; взаимодействие этих путей на любом этапе распознавания ; обработку речевого сообщения не только "снизу- вверх", но и "сверху - вниз", т.е. возможность генерации системой гипотезы о классе входного сигнала и сравнении гипотезы с входным сигналом ;

- разработано математическое и программное обеспечение для основных блоков этой системы ;

- сформулированы основные принципы построения тестов для проверки и диагностики систем автоматического распознавания речи и разработан вариант конкретного теста ;

- исследованы и выбраны оптимальные параметры анализа и обработки речевого сигнала в системах распознавания речи ;

- разработано специализированное матобеспечение для системы распознавания, ориентированное на голосовой набор номера телефона и работающей с произвольным диктором, которое при тестировании на 30 дикторах обеспечило надежность распознавания семизначного номера телефона>96$;

- разработано матобеспечение для автоматического распознавания слов, произносимых в нестандартных атмосферах с надежностыо»-92$ ;

- разработано матобеспечение автоматического речевого ввода информации для использования в диалоговой системе анализа сигналов: словарный запас рабочего языка - 176 слов, максимальный коэффициент ветвления - 37. Акустический анализ речевого сообщения в системе обеспечивает 97$ правильно распознанных слов в предложении. Использование высших уровней позволило воспринимать команды-фразы практически без ошибок.

Полученные в работе результаты позволяют сделать следующие выводы:

1. Использование речевого ввода в системах и устройствах - одно из эффективных средств развития автоматизации производственных процессов.

2. Предложенная в работе архитектура системы автоматического распознавания речевого сообщения позволяет решать задачи речевого ввода информации в системы и устройства более эффективно: с большей надежностью и с минимальными затратами по времени принятия решения.

3. Сформулированные принципы построения тестового материала и требования к тестам для систем APP. позволят разработать целую систему тестов для проверки и диагностики рече-распознающих систем. Предложенный конкретный вариант теста используется в настоящее время во многих организациях.

Предложенная архитектура системы АРР и разработанное матобеспечение отдельных блоков могут использоваться при решении разнообразных практических задач.

5. Проведенная оптимизация информативных признаков речевого сигнала позволила выделить надежную и удобную в практическом использовании и аппаратурной реализации систему параметров, обеспечивающую точность распознавания изолированных слов на словаре из 80 слов, близкую к 100$.

6. Выбранный алгоритм нелинейного по времени сравнения эталонной и входной реализаций речевого сигнала обеспечивает на выбранном первичном описании высокую надежность распознающей системы.

7. Разработанная модель системы АРР на ЭВМ ЕС 1033, основанная на бионическом подходе к процессу распознавания речевого сообщения и использующая сегментно-целостный анализ произнесения с включением просодических характеристик, позволяет проводить сквозные эксперименты со сменными блоками выделения признаков и сменными блоками принятия решения и обучения системы и используется для дальнейших речевых исследований.

Заключение

1. Разработанное матобеспечение для модели неадаптивного микропроцессорного устройства распознавания, ориентированное на голосовой набор номера телефона, обеспечивает надежность распознавания семизначного номера телефона > 96$.

2. Разработано матобеспечение для распознавания слов, произносимых в нестандартных атмосферах. Точность распознавания для 15 слов составила в среднем 92$, в то время как слуховая разборчивость <30$.

3. Разработано матобеспечение автоматического речевого запроса для использования в диалоговой системе анализа сигналов. Словарь - 176 слов,максимальный коэффициент ветвления -37. Акустический анализ речевого сообщения в системе обеспечивает 97$ правильно распознанных слов в предложении. Использование высших уровней позволило воспринимать команды-фразы практически без ошибок.

- 157 -

Список литературы диссертационного исследования кандидат технических наук Орлова, Маргарита Изикиельевна, 1984 год

1. Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП.- Киев-Одесса, 1982, с.556.

2. Альдефельд Б., Рабинер Л.Р., Розенберг Э.Э., Уилтон Д.Г. Автоматическая справочно-поисковая система, основанная на распознавании изолированных слов. В сб.: ТИИЭР, 1980, т.68, № II, с.7-25.

3. Амирезашвили Н.З., Чикоидзе Г.Б. Анализ данных в речевых командах. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.500-502.

4. Беллман Р. Динамическое программирование. М., ИЛ, i960 , 400 с.

5. Беллман Р., Калаба Р. Динамическое программирование и современная теория управления. М., Наука, 1969, 183 с.

6. Бондарко Л.В., Загоруйко Н.Г., Кожевников В.А., Молчанов А.П., Чистович Л.А. Модель восприятия речи человеком.- Новосибирск, 1968, 48 с.

7. Брановицкий В.И., Довгялло A.B. Диалог человека и ЭВМ: основные понятия и определения. В сб.: Управляющие системы и машины. - Киевт 1978, К 4, с.28-35.

8. Васильев A.B., Кринов С.Н., Савельев В.П., Цемель Г.И., Чижков В.М. Распознавание чисел от нуля до 100. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений II-го Всесоюзного семинара APC0-XI.- Ереван, 1980, с.269-273.'

9. Великовский А.Е. Современные устройства распознавания речи. Обзор В сб.: Радиоэлектроника за рубежом, 1983, № 23, с.1-31.

10. Величко Б.М., Загоруйко Н.Г. Автоматическое распознавание ограниченного набора устных команд. В сб.: Вычислительные системы. - Новосибирск, 1969, вып.36, с.101-110.

11. Величко В.М., Загоруйко Н.Г. Распознавание больших словарей. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 8-го Всесоюзного семинара АРСО-УШ. -Львов, 1974, с.9-13.

12. Величко В.М., Загоруйко Н.Г. Система распознавания речевых команд. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 10-го Всесоюзного семинара АРСО-Х. -Тбилиси, 1978, с.173-176.

13. Винцюк Т.К. О математических моделях речевого сигнала, используемых в распознавании речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.34-38.

14. Винцюк Т.К. Перспективы практического использования систем речевого диалога. 'Гам же, с.38-40.

15. Винцюк Т.К., Гринчук В.М., Калмыков В.Г. Автоматизированное рабочее место (АРМ) конструктора, использующее систему речевого диалога СРД "Речь-Г1. Там же,с.512-516.

16. Винцюк Т.К., Куляс А.И., Людовик Е.К., Шинкаж А.Г. Эксперименты с кооперативной системой распознавания речи. -Там же, с.298-300.

17. Винцюк Т.К., Лобанов Б.М., Шинкаж А.Г. Система распознавания речи и система устного диалога СРД "Речь-I" на основе микро-ЭВМ. Там же, с.516-521.

18. Винцюк Т.К., Шинкаж А.Г. Распознавание 1000 слов. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений Ю-го Всесоюзного семинара АРСО-Х. -Тбилиси, 1978, с.180.

19. Галунов В.И., Акустическая коммуникация, речь и передача смысловой информации. В сб.: Звуковая коммуникация, эхолокация и слух. - Д., ЛГУ, 1980, с.22-37.

20. Галунов В.И. Бионическая модель системы распознавания речи. В сб.: Исследование моделей речеобразования и речевосприятия. - Л., 1981, с.36-52.

21. Галунов В.И. Язык и системы автоматического понимания речи. В сб.: Восприятие языкового значения. - Калининград, Калининградский государственный университет, 1980, с.10-21.

22. Галунов В.И., Гарбарук В.И. Факторный анализ спектрального представления речевого сигнала. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 13-го Всесоюзного семинара АРС0-ХШ. - Новосибирск, 1984, с.66-67.

23. Галунов В.И., Орлова М.И. Архитектура диалоговой системы, построенной на основе модели восприятия речи человеком. -Там же, с.16-18.

24. Галунов В.И., Орлова 14.И., Шнейдер В.К1. Экспериментальные исследования системы автоматического распознавания слитной речи. Тезисы докладов IX Всесоюзной акустической конференции. М., 1977, с.65-66.

25. Галунов В.И., Коваль С.Л., Тампель И.Б., Проблемы акустической теории речеобразования. В кн.: Вопросы кибернетики. Анализ и синтез речи в системах управления. - М., АН СССР, 1981, с.60-75.

26. Галунов В.И., Орлова М.И., Ягунова H.H. Использование метода динамического программирования при распознавании речевых образов. В сб.: Техника средств связи, серия ТПС,вып,3(2). М., 1981, с.114-122.

27. Галунов В.К., Сомин Н.В., Тарасов А.И., Трунин-Донской Б.Н., Якушенков Г.Л. Спектральные методы выделения основного тона. В сб.: Вопросы кибернетики. - М., Наука, 1976,с.28-38.

28. Галунов В.И., Орлова М.И., Щукин В.Г. Разработка тестов для систем автоматического распознавания речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. -Киев-Одесса, 1982, с.305-307.

29. Гельфанд С.А. Слух. Введение в психологическую и физиологическую акустику. М., Медицина, 1984, 350 с.

30. Григорян П.А., Григорян H.A., Лазарян Л.М. Сегментация речевых сигналов. В кн.: Автоматическое распознавание речевых образов. Тезисы докладов и сообщений II-го Всесоюзного семинара APC0-XI. - Ереван, 1980, с.95-101.

31. Демков М.Г. Об унификации методики испытаний устройств распознавания речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.472-474.

32. Дженкинс Г., Ватте Д. Спектральный анализ и его приложения. М., Мир, 1972, 288 с.

33. Дюран Б., Оделл П. Кластерный анализ. Пер.с англ. Деми-денко. М., Статистика, 1977, 128 с.

34. Емельянов В.Н., Трунин-Донекой В.Н. Современное состояние отечественных разработок в области автоматического распознавания и синтеза речи. В кн.: Вопросы кибернетики. Анализ и синтез речи в системах управления. - М-,1. АН СССР, 1981, с.3-17.

35. Занченко Ю.А. Система распознавания ограниченного набора слов в условиях сильного внешнего шума. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 10-го Всесоюзного семинара АРСО-Х. - Тбилиси, 1978, с.205-207.

36. Зиновьева Н.В., Захаров J1.M., Ампилова Б.В. Методика чтения "слепых" сонограмм. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.351-354.

37. Кельманов A.B. Экспериментальное исследование 18 систем первичного описания речевого сигнала. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений II-го Всесоюзного семинара APC0-XI. - Ереван, 1980, с.112-113.

38. Кельманов A.B. О выборе числа и границ спектральных полос при распознавании речевых сигналов. Там же, с.313-315.

39. Кельманов A.B. Сравнительное исследование двух алгоритмов динамического программирования. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. Киев-Одесса, 1982, с.474-476.

40. Коваль С Л - Речевая связь при глубоководных погружениях. -В сб.: Техника средств связи, серия ТИС. - М., вып.9, 1976, с.88-112.

41. Кольцова A.A. Расширение библиотеки процедур системы ГРАФ*. В сб.: Техническая кибернетика, № 5. - М., 1978.

42. Копейкин А.Б. Исследование структур и вычислительных процессов в системе ввода устных команд, построенных с использованием микро-ЭВМ. Автореферат. . кандидата технических наук. М., 1980, 22 с.

43. Кринов С.Н., Цемель Г.И. Сегментация речевых сигналов.

44. В сб.: Речевое общение в автоматизированных системах. М., Наука, 1975.

45. Кулагин М.В., Пажитнов А.Л. Ввод и обработка акустического сигнала на микро-ЭВМ "Электроника-бО". В кн.: Автоматическое распознавание слуховых образов. Тезисы докладови сообщений 12-го Всесоюзного семинара АРСО-ХП. Киев1. Одесса, 1982, с.180-181.

46. Лебедев Б.Г. Кривые маскировки в распознавании речевых сигналов. 3 кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений Ц-го Всесоюзного семинара АРС0-Х1. - Ереван, 1980, с.381-382.

47. Лебосс Б. Промышленность осваивает системы синтеза и распознавания речи. Электроника, 1980, № 12, с.79-89.

48. Мазур В.Н., Марчук Д.С., Сапелюк Б.М. Элементы речевого управления в подсистеме АСУП на базе мини-ЗВМ. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 11-го Всесоюзного семинара АРС0-Х1. -Ереван, 1980, с.336-332.

49. Макхол Дж. Линейное предсказание. Обзор. В сб.: ТИИЭР, № 4, т.63, 1975, с.20-44.

50. Маркел Дж.Д., Грей А.Х. Линейное предсказание речи. Пер. с англ. М., Связь, 1980, 308 с.

51. Мартин Т. Практическое применение речевого ввода в вычислительную машину. В сб.: ТИИЭР, № 4, т.64, 1976, с.80-95.

52. Методы автоматического распознавания речи. В 2-х книгах, под редакцией У.Ли. Пер.с англ. М., Мир, 1983, 716 с.

53. Мясников Л.Л. Объективное распознавание звуков речи. дТг, 1943, К 3, с.12-25.

54. Нефф р. Внедрение систем распознавания речи в Японии. -Электроника. ;,ь, Мир, 1982, т.5, № 3, с.89-91.

55. Орлова М.И. Бионическая модель системы автоматического распознавания речи. В сб.: Техника средств связи, серия ТПС, вып.12(45 ), - М., 1979, с.108-112.

56. Орлова М.И. Модель распознавания речевых образов, построенная на бионическом принципе. В кн.: Модели речевого процесса в норме и патологии. Тезисы докладов Всесоюзного симпозиума. Гродно, 1979, с.24.

57. Паташюс Ю.В. Система распознавания слов на базе ЭВМ "Злект-роника-60". В кн.: "Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.324-326.

58. Петров Г.М., Аврин С.Б., Копейкин А.Б., Малыгина Т.М., Москаленко Г.В. Система ввода речевых сигналов для ЭВМ. -Там же, с.280-283.

59. Плотников В.Н., Суханов В.А., Кузнецов C.B., Белинский A.B. Индивидуальный канал речевого диалогового управления.

60. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. -Киев-Одесса, 1982, с.539-542.

61. Проблемы практического использования систем автоматического распознавания и синтеза речи. Тезисы докладов симпозиума. -Ji., 1983, 43 с.

62. Рабинер JI., Гоулд Б. Теория и применение цифровой обработки сигналов. Пер. с англ. т., Мир, 1978, 848 с.

63. Рабинер Ji., Шафер Р. Цифровая обработка речевых сигналов. Пер.с англ. М., Радио и связь, 1981, 496 с.

64. Редди Д.Р. Машинное распознавание речи. Обзор. В сб.: ТИИЭР, I 4, т.64, 1976, с.95-130.

65. Речевая связь с машинами. Тематический выпуск. Сб. ТИИЭР, № 4, т.64, 1976, 182 с.

66. Рамишвили Г.С., Сердюков В.Д. Комплексная система автоматического распознавания речевых сигналов. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений Ю-го Всесоюзного семинара АРСО-Х. - Тбилиси, 1978, с.229-231.

67. Сапожков М.А., Михайлов В.Г. Бокодерная связь. Ц., Радио и связь, 1983, 248 с.

68. Серединский А., Ванде-Кирков В.А., Буздалина И.А., Окунев И.В., Орлова М.И., Солонина А.И. Применение рекурентных сплайнов для обработки видео- и речевых сигналов. -Электросвязь. 1982, № с, с.60-64.

69. Система распознавания связной речи фирмы NEC . Зарубежная радиоэлектроника, № 4, 1980, с.108-120.

70. Слуцкер Г.С. Нелинейный метод анализа речевых сигналов. -В кн.: Труды НИИРадио, 1968, № 2, с.28-34.

71. Спрингер С., Дейч Г. Левый мозг, правый мозг. М., Мир, 1983, 256 с.

72. СомиН Н.В. Пакет прикладных программ для исследованияречевых сигналов. В кн.: Анализ и распознавание речевых сигналов на ЭВМ. - М., ВЦ АН СССР, 1975, с. 3-19.

73. Сомин Н.В. Разработка пакета прикладных программ для анализа акустических сигналов и его применение к задачам исследования речи. Диссертация. . кандидата физико-математических наук. М., ВЦ АН СССР, 1973, 154 с.

74. Сомин Н.В., Трунин-Донской В.Н. Применение логических методов для выделения основного тона в условиях помех. Отчет лаборатории технической кибернетики ВЦ АН СССР. М., 1973, с.27.

75. Трунин-Донской В.Н. Дискретная обработка речевых сигналов. М., ВЦ АН СССР, 1978, 52 с.

76. Трунин-Донской В.Н. Современное состояние проблемы автоматического распознавания и синтеза речи. В сб.: Проблемы практического использования систем автоматического распознавания и синтеза речи. Тезисы докладов. - JI., 1983, с.5-9.

77. Форш Б.Н. Разработка метода автоматического выделения основного тона с повышенной разрешающей способностью. -В сб.: Техника средств связи, серия ТПС, вып.1(34). -М., 1979, с.91-94.

78. Фланаган Д.Л. Анализ, синтез и восприятие речи. М., Связь, 1968, 392 с.

79. Фролов Г.Д. Эксперимент по распознаванию речевых образов.-Программирование. М., 1976, К 2, с.94.

80. Фу К.С. Лингвистический подход к распознаванию образов. -В кн.: Классификация и кластер. Пер.с англ. под ред. Журавлева К.И. М., Мир, 1980, 389 с.

81. Цемель Г.И. Опознавание речевых сигналов. М., Наука, 1971, 148 с.

82. Чабан М.Е. О динамике основных фонемных тембров гласных, содержащихся в спектральных описаниях слогов типа ГСГ. -В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 11-го Всесоюзного семинара АРС0-Х1. Ереван, 1980, с.7-9.

83. Чучупал В.Я. Реализация метода вычитания спектров для повышения качества и разборчивости речи. В кн.: Автоматическое распознавание слуховых образов. Тезисы докладов и сообщений 12-го Всесоюзного семинара АРСО-ХП. - Киев-Одесса, 1982, с.155-158.

84. Чымбаев А.Ж. Предварительная сегментация и маркировка слитной речи. М., ВЦ АН СССР, 1979, 23 с.

85. Шафер Р., Рабинер Р. Цифровое представление речевых сигналов. В сб.: ТИИЭР, 1975, т.63, }Ь 4, с.141-159.

86. Ackroyd M.H. Isolated Word Recognition Using the Weighted Levenshtein Distance.-IEEE Trans. ASSP, 1980,v.28,N2,pp.243-244.

87. Baker J.K. The Dragon System. An Overview.-IEEE Trans. ASSP,1975,v.23,pp.24-29.

88. Beek B.,Neuberg E.P.,Hodge D.C, An Assessment of the Technology of Automatic Speech Recognition for Military Applications.-IEEE Trans. ASSP,1977, v.24,N4, pp.310-322. . .

89. Bell O.G.,Fujisaki H.,Heinz J.M.,Stevens K.N.,House A.S. Reduction of Speech Spectra by Analysis by Synthesis Techniques.-JASA,1961,v.33,N12,pp.1725-1736.

90. Brown M.K.,Rabiner L.R. An Adaptive »Ordered,Graph Search Technique for Dynamic Time Warping for Isolated Word Recognition.-IEEE Trans. ASSP,1982,v.30,N4,1. PP.535-544.

91. Chiba S.,Watari M. and Watanabe. A Speaker-independent Word Recognition System.-Speech Acoustics Society of Japan,S 76-25,1976,pp.995-999.

92. Cohen J.R.»Segmenting Speech Using Dynamic Programming.-JASA,1981,v.69,N5,pp.1430-1438.

93. Cose Earl E.,Wu F.B. An Evaluation of Some Feature Selection Techniques.-Joint "Workshop Pattern Recognition and Artif.Intell. ,New Iork,1976,pp.58-65.

94. Das S.K. Some Experiments in Discrete Utterance Recognition. -Pro c. IEEE ICASSP,1980,pp.178-181.

95. Dautrich B.A.,Rabiner L.R. On the Erfects of Varying Filter Bank Parameters on Isolated Word Recognition.-IEEE Trans. ASSP,1983,v.31,N4,pp.793-806.

96. De Delara Gertrudis Kurz, Guzman Justino. Perceived Probabilities.-Progr.Cybern.and Syst.Res.Vd.L., Washington,1975,PP.253-263.

97. Ganvain J.L.,Mariani I.,Li J.S. On the Use of Time Compression FOr Word Based Recognition.-Proc. IEEE ICASSP,Boston,1983,v.3,pp.1029-1032.

98. Grady M.W. Advances Speech Technology the Natural Man/Machine Interface.-Proc.Int.Conf.Cybern, and Soc. San Francisco,Calif.,1975,pp.296-299.

99. ICASSP-83 (Proceedings).-IEEE International Conference on Acoustics, Speech and Signal Proccesing, Boston, 1983, vol.1,2,3.,1459p.

100. Itakura F. Minimum P^ecication Residual Principle Applied to Speech Recognition.-IEEE Trans. ASSP, 1975, v. 23,N1,pp.67-72.

101. Jelinek F. Continuous Speech Recognition by Statistical Methods.-Proc. IEEE,1976,N4,pp.532-556.

102. Klatt D.H. Review of the ARPA. Speech Understanding Project.-JASA,1977,v.62,N6,pp.1345-1366.

103. Kuhn M.H., Tomaschewski H., Nev H, East Nonlinear Time Alignment for Isolated Word Recognition.-Proc. IEEE ICASSP,1981,pp.736-740.

104. Lea VV.A. ,Medress M.E.,Skinner T.E. A Prosodically Guided Speech Understanding System.-IEEE Trans. ASSP, 1975,V.23,pp.30-38.

105. Lea W.A. What Cause Speech Recognizers to Make

106. Mi stakes?-Proc. IEEE ICASSP,1982, Paris, pLo .1023-1041.123» Lesser V.R. et all. Organization of the Hearsay-II Speech Understanding System,-IEEE Trans. ASSP, 1975, v.23,PP.11-24.

107. Levinson S.E.,Rabiner L.R.Rosenberg A.E. and Wilpon J.G, Interactive Clustering Techniques for Selecting Speaker Independent Reference Templates for Isolated Word Recognition.-IEEE Trans. ASSP, 1979,v.27,N2,pp.82-89.

108. Lowerre B.T. The Harpy Speech Recognition System.-SIGART Newslett, 1976,N60,p.23.

109. Mayers C.S.»Levinson S.E. Connected Word Recognition Using a Syntax-Directed Dynamic Programming Temporal Alignment Procedure.-Proc. IEEE ICASSP,1981,pp.956-959.

110. Mayers C.S.,Rabiner L.R. A Level Building Dynamic Time Warping Algorithm for Connected Word Recognition.- IEEE Trans. ASSP, 1981,v.29,N2,pp.284-301.

111. Moore R.K.,Russel M.J.»Tolinson M.J. The Discriminative Network : A Mechanism for Focusing Recognition in Whole-Word Pattern Mathing,-Proc. IEEE ICASSP,Boston,1983,v.3,pp.1041-1044.

112. Noll A.M. Short-time Spectrum and "cepstrum". Techniques for Vocal-Pitch Detection.-JASA,1964, v.36,N2,pp.238-243.

113. Rabiner L.R.,Levinson S.E.,Rosenberg A.E. and Wilpon J.G. Speaker Independent Recognition of Isolated Word Using Clustering Techniques.-IEEE Trans. ASSP,1979,v.27,pp.336-349.

114. Rabiner L.R.,Wilpon J.G. A Two-Pass Pattern-Recognition Approach to Isolated Word Recognition.-The Bell System Technical Journal,May-June,1981,pp.739-765.

115. Rabiner L.R.,WilPon J.G. Considerations in Applying Clustering Techniques to Speaker Independent Word Recognition.-Proc.IEEE ICASSP,Washington,1979,PP.578-582.

116. Rabiner L.R.,Wilpon J.G. Isolated Word Recognition Using A Two-Pass Pattern Recognition Approach.-Proc. IEEE ICASSP,1981,pp.724-727.

117. Rabiner L.R.,Wilpon J.G. Speaker Independent Isolated Word Recognition for a Moderated Size (54 word) Vocabulary.- Proc. IEEE ASSP,1979,v.27,pp.583-587.

118. Reddy D.R.,Vicens P.S. A Procedure for the Segmentation of Connected Speech.-J.Audio Eng.Soc.,1968,v.16, N4,pp.38-46.

119. Rosenberg A.E. and Schmidt C.E. Automatic Recognition of Spoken Spelled Names for Obtaining Directory listing.-Bell Syst.Tech.J.,1979,v.58,N8,pp.1797-1823.

120. Russel M.J., Moore R.K. ,Tomltnson M.J. Some Techniques Incorporating Local Timescale Variability Information into a Dynamic Time-Warping Algorithm for Automatic Speech Recognition,-Proc. IEEE IGASSP,1983,pp.10J7-1040.

121. Sakai T.,Nakagawa S. Continuous Speech Understanding System LITHA.N.-Tech .Report. »Dept.Information Science, Kyoto Univ.,Kyoto,Japan,1975.

122. Sakoe H. and Chiba S.A Dynamic Programming Approach to Continuous Speech Recognition.- 7 International Congress on Acoustics,Budapest,1971,pp.65-68.

123. Sakoe H.,Chiba S. Dynamic Programming Algorithm Optimization for Spoken Word Recognition.-IEEE Trans.1. ASSP,1978,v.36,pp.43-49.

124. Schmidt-Neelsen A. Indelligibility of VCV Segments Excized from connected Speech.-JASA,1983,v.74,N3, pp.726-738.

125. Segalowitz S.,Gruber F. Lauguage Development and Neurological Theory.-NV Academic Press,1977.

126. Seneff S.,Klatt D.,Zue V. Design Consideration.for Optimizing the Intelligibility of DFT-based. Piched-excited,Critical band Spectrum Speech. Analisis/resynthesis System.-JASA ,1981 ,v.69,N1 ,pp.17 .

127. Sumbur M.R.,Rabiner L.R. A Speaker Independent Digit-Recognition System.-BSTJ,1975,54,1,pp.81-102.

128. Soudhi M. New Methods of Pitch Extraction.-IEEE Trans, of Audio and Electroacoustics,1968,v.16,N2.

129. Stevens K.N. Constrains Imposed by the Auditory System on the Properties Used to Classify Speech Sounds s Data From Phonoligy»Acoustics and Psychoa-coustics."The Cognituve Representation of Speech", ed Mayers,e.a.,Amsterdam,1981,pp.61-74.

130. Kawaguchi Eyi. A Simulation of a Recognition System for Connected Speech Sounds Using Linguistic Information. -Trans. Inst .Electron and Commun.Eng.Jap., 1973,N9,513-520.

131. Tappert C.C.,Das S.K. Memory and Time Inprovements in a Dynamic Programming Algoritm for Matching Speech Patt erns.-Proc.IEEE ICASSP,1978,pp.583-586.

132. Velichko V.M. ,Zagoruilco N.G. Automatic Recognition of 200-words.-Int.J.Man-Machine Studies,1970,v.2, pp.223-234.

133. Walker Donald E. Speech Understanding Through Syntacsis and Semantic Analysis.-IEEE Trans.Comput., 1976,v.25,N4,pp.432-439.

134. Walker D.E. The SRI Speech Understanding System.-IEEE Trans.ASSP,1975,N5,pp.387-416.

135. Watanade Akira,Sakai Hisao J.Inst.Telev.Eng.Jap., 1975,v.29,N11,pp.850-859.

136. Wolf Z. Speech Recognition and Understanding.- In Commun. and Cybern.,1976,v.10.pp.167-203.

137. White G.M., Dynamic Programming, the Viterbi Algorithm and Low Cost Speech Recognition.-Proc. IilEE ICASSP, 1978,Oklahoma, v.r.pp.729-731.

138. White G.M., Neely R.B. Speech Recognition Experiments with Linear Predication, Band Pass Filtering and Dynamic Programming . -IEEE Trans .ASSP, 1976, v.24 ,pp .183-188.

139. J.G,Wilpon,L.R.Rabiner and A.Bergh Speaker-Independent Isolated Word Recognition Using a 129-Word Airline Vocabulary.-JASA,1982,v.72pp.390-396.

140. Yau S.S.,Chang S.C. A Direct Method for Cluster Analysis.-Pattern Recogn.,1975,v.7,N4,pp.215-224.

141. Zelinski R.,Class E. A Learning Procedure for Speaker-Dependen Word Recognition Systems Based on Sequental Processing of Inpu Tokens.-Proc.IEEE ICASSP,1983,Boston,pp.1053 -10^6.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.

Оглавление диссертации кандидат технических наук Орлова, Маргарита Изикиельевна

Рекомендованный список диссертаций по специальности «Математическое обеспечение вычислительных машин и систем», 01.01.10 шифр ВАК

Исследование и разработка методов автоматического синтеза речи по фонемному тексту1984 год, доктор технических наук Лобанов, Борис Мефодьевич

Автоматизация процесса верификации абонентов АСУ с речевым управлением2008 год, кандидат технических наук Катков, Олег Николаевич

Введение диссертации (часть автореферата) на тему «Математическое обеспечение систем и устройств с речевым вводом информации»

Похожие диссертационные работы по специальности «Математическое обеспечение вычислительных машин и систем», 01.01.10 шифр ВАК

Инкорпорирование речевых компонентов в лингвистические обучающие системы2005 год, кандидат филологических наук Ордин, Михаил Юрьевич

Разработка алгоритмов для распознавания речи1999 год, кандидат технических наук У Вэньцань

Методы и модели распознавания русской речи в информационных системах2014 год, кандидат наук Гусев, Михаил Николаевич

Заключение диссертации по теме «Математическое обеспечение вычислительных машин и систем», Орлова, Маргарита Изикиельевна

Список литературы диссертационного исследования кандидат технических наук Орлова, Маргарита Изикиельевна, 1984 год