Биометрическая голосовая идентификация человека по парольной голосовой фразе в условиях повышенного шума тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат наук Калашников, Дмитрий Михайлович

  • Калашников, Дмитрий Михайлович
  • кандидат науккандидат наук
  • 2017, г Пенза
  • Специальность ВАК РФ05.13.01
  • Количество страниц 196
Калашников, Дмитрий Михайлович. Биометрическая голосовая идентификация человека по парольной голосовой фразе в условиях повышенного шума: дис. кандидат наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). г Пенза. 2017. 196 с.

Оглавление диссертации кандидат наук Калашников, Дмитрий Михайлович

ОГЛАВЛЕНИЕ

Введение

глава 1. ОБЗОР МЕТОДОВ И УСТРОЙСТВ ЗАЩИТЫ ПЕРСОНАЛЬНЫХ ДАННЫХ НА ОСНОВЕ БИОМЕТРИЧЕСКОЙ ГОЛОСОВОЙ ИНФОРМАЦИИ И ПРЕДВАРИТЕЛЬНОЙ ЦИФРОВОЙ ОБРАБОТКИ СИГНАЛОВ

1.1. Общее состояние защиты персональных информационных данных

1.2. Оценка стойкости нейросетевого распознавания биометрия-код

1.3. Информационная мера качества исходных данных

1.4. Функциональная модель преобразователя биометрия-код

1.5. Классическая мера Хэмминга

1.6. Практическое применение преобразователей биометрия-код

для защиты исполняемого кода в системе голосовой идентификации

1.7. Необходимость классификации звуковых фрагментов речи

на тональные и шумовые

1.8. Обзор методов измерения периода основного тона

тональных звуков

1.9. Использование линейных предсказателей

1.10. Нелинейный алгоритм выявления периодичности сигнала

1.11. Линейное предсказание ожидаемого периода основного тона

1.12. Оценка длины речевого фрагмента, используемого нейросетевым вокодером нового поколения, для автоматического обучения биометрической системы голосовым параметрам диктора «Свой»

1.13. Оценка длины речевого фрагмента, необходимого

для обучения вокодера, распознающего одиночные звуки речи

1.14. Оценка длины речевого фрагмента распознавания

пар звуков

1.15. Мел-кепстральные коэффициенты

1.16. Сегментация речи на отдельные биометрические элементы

1.17. Марковская модель распознавания речи

Выводы по главе

глава 2. МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ИДЕНТИФИКАЦИИ СВЯЗНОЙ РЕЧИ

2.1. Фрагментатор однородных звуков и пар звуков речи

диктора «Свой» в нейронных сетях

2.2. Предсказатель периода основного тона диктора по текущим

и предшествующим значениям

2.3. Вычисление среднего значения периода основного тона

и допустимых границ отклонений

2.4. Классификатор тон/шум

2.5. Методы обращения матриц в алгоритме линейного предсказателя

2.6. Дискретное статистическое описание длительности интервалов

между шумовыми звуками речи и между тональными звуками

2.7. Определение детерминированных участков речи и вариации

частоты основного тона

2.8. Преобразователь голосового пароля в код доступа

на фоне шумов, превышающих сигнал

Выводы по главе

глава 3. ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЕЙСТВУЮЩЕГО МАКЕТА ГОЛОСОВОЙ АУТЕНТИФИКАЦИИ

3.1. Этап предобработки голосовых данных

3.2. Обучение готовых биометрических параметров на нейронной сети

3.3. Кластеризация звуковых фрагментов речи

3.4. Аутентификация по парольному слову

3.5. Инструкция по использованию макета голосовой

аутентификации

Выводы по главе

глава 4. ТЕСТИРОВАНИЕ АЛГОРИТМА БИОМЕТРИЧЕСКОЙ ГОЛОСОВОЙ АУТЕНТИФИКАЦИИ ПРИ РАЗЛИЧНЫХ

УСЛОВИЯХ ВНЕШНЕГО ВОЗДЕЙСТВИЯ

4.1. Экспериментальное тестирование программы на вероятность появления ошибок первого рода

4.2. Экспериментальное тестирование программы на вероятность появления ошибок второго рода при условии незнания парольного

слова посторонним человеком

4.3. Экспериментальное тестирование программы на вероятность появления ошибок второго рода при условии знания парольного слова посторонним человеком

Заключение

Список литературы

ПРИЛОЖЕНИЕ А. Листинг программы

ПРИЛОЖЕНИЕ Б. Акт о внедрении работы

ПРИЛОЖЕНИЕ В. Свидетельство о регистрации программ для ЭВМ и акты о внедрении

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Биометрическая голосовая идентификация человека по парольной голосовой фразе в условиях повышенного шума»

Введение

Актуальность темы. В настоящее время происходит насыщенная информатизация практически всех сфер жизни человека: от средств личного общения, таких как социальные сети, электронная почта и интернет-телефония, до систем, позволяющих гражданину принимать участие в управлении государством, - «электронного правительства» и «электронного голосования». Одной из важнейших задач при построении подобных открытых гражданских информационных систем является аутентификация пользователей.

Общепринятой на сегодня считается криптографическая аутентификация, основанная на том, что знает или чем владеет субъект. Криптографические методы позволяют обеспечить максимальную надежность и безопасность процедуры аутентификации, однако перекладывают ответственность за хранение ключей (секретной информации либо материального носителя) на пользователя, который, кроме очевидного нежелания принимать на себя подобные обязательства, зачастую не обладает необходимыми навыками правильного использования и безопасного хранения секретов.

Проблему хранения секретов можно решить при использовании биометрической аутентификации, основанной на персональных данных субъекта. Однако биометрия традиционно применяется лишь для идентификации пользователей в системах паспортно-визового контроля граждан. Использование классических биометрических технологий сравнения биометрического образа пользователя с шаблоном не позволяет обеспечить конфиденциальность персональных данных пользователя в открытых гражданских информационных системах.

Число утечек возрастает с каждым годом, и для их устранения требуется внедрение различной вариации биометрических аппаратов, осуществляющих подтверждение личности человека. Метод аутентификации, с использованием биометрических голосовых параметров, достаточно прост в применении. А для

его использования необходим микрофон и встроенная либо внешняя звуковая карта.

Голосовая идентификация личности пока не вошла в обиход пользования из-за ряда важнейших проблем, одной из которых является качество голосовой идентификации. В настоящее время вероятность ошибки распознавания персоны по голосу достаточно высока. Требуется разработка новых алгоритмов для более четкого выявления биометрических параметров из голосового сигнала. Второй важнейшей проблемой является нестабильная работа существующих устройств в условиях шума. Также одна из причин - проблема вариации голосовых биометрических данных. Голосовые параметры аутентифицирующегося диктора могут быть изменены под влиянием атмосферного давления, болезни горловых связок либо по истечению нескольких лет. Следовательно, построение алгоритмов голосовой идентификации и соответствующих устройств является актуальной задачей, имеющей научное, техническое и социальное значения.

В диссертации предлагаются алгоритмы и методики, позволяющие решить перечисленные проблемы, которые и определяют ее актуальность.

Для осуществления идентификации диктора по произносимой парольной/произвольной фразе необходимо в первую очередь выполнить преобразование речи человека в цифровой код. Эту операцию выполняют вокодеры, имеющие различные варианты реализации.

В речевых элементных синтезаторах речи при преобразовании сигнала в цифру выявляются слышимые фрагменты речи. Одним из таких фрагментов может быть фонема с присвоенным номером на выходном сигнале. В подобных вокодерах не выявляются параметры речи, что в свою очередь ведет к потере индивидуальных параметров тестируемого диктора.

Для увеличения достоверности результатов биометрической идентификации диктора по произносимой парольной/произвольной фразе необходимо повышать узнаваемость речи говорящего за счет учета дополнительных параметров, соответственно, увеличивая размерность решаемой задачи.

Современные вокодеры не способны решать задачи высокой размерности. В настоящее время, при наличии больших вычислительных мощностей, ограничения связаны с алгоритмами линейной алгебры, заложенными в вокодерах. В связи с этим необходимо отказаться от вокодеров старого образца, которые перестают справляться с поставленными перед ними задачами, и перейти к реализации вокодеров нового поколения - биометрических вокодеров, в которых будут сняты ограничения на размерность решаемых задач. Необходимость построения вокодеров нового поколения также определяет актуальность темы диссертационного исследования. В диссертации предполагается применить нейросетевой подход к решению этой проблемы.

Применение биометрических вокодеров на нейросетевых функционалах позволяет увеличивать размерность решаемой задачи до нужных величин. Приведем краткое описание работы.

Процесс обучения нейронной сети должен сводиться к низкой вероятности принятия постороннего человека за «Своего» и к хорошему распознаванию тестируемого диктора. Следовательно, должна быть сформирована база биометрических образов для обучения. Также следует сразу принять во внимание, что наряду с огласованными фонемами в ней должны содержаться примеры всех шипящих звуков, так как недавние исследования в этой области показали, что одинаковые шипящие звуки, воспроизводимые разными людьми, обладают существенными спектральными отличиями.

В связи с этим возникает проблема реализации некоего речевого фрагментатора, в задачу которого входит разбиение непрерывного речевого сигнала на отдельные звуки (фонемы) для последующего формирования из них базы биометрических образов, применяемых в обучении биометрического вокодера. На рисунке 1 представлен пример различных вариантов фрагментации заданного парольного слова. Все описанные ниже эксперименты проводились с привлечением двух дикторов, мужского и женского пола, произносящих конкретное парольное слово. Практика показала, что аутентификация оказывается

достаточно надежной, если длина фиксированной голосовой фразы составляет три слова длиной от 4 до 9 букв, притом что для обучения автомата потребуется предъявить порядка 20 примеров заданной голосовой фразы.

а) фрагментация по отдельным звукам б) фрагментация по фонемам

Рисунок 1 - Варианты фрагментации заданного парольного слова

При средней длине слова (7 букв) получается, что для успешного обучения искусственного подсознания биометрического вокодера требуется произнесение диктором «Свой» текста, состоящего примерно из 420 букв (звуков) или имеющего примерно 10 строк текста.

Если идентифицировать диктора необходимо на произвольном тексте, то придется использовать пары наиболее часто встречающихся в языке звуков. По данным, приведенным в работе, вероятность наиболее часто встречающихся пар букв русскоязычного текста составляет величину, близкую к 0,01. То есть для получения от 10 до 20 примеров часто встречающихся пар звуков (букв) потребуется использовать произвольный обучающий текст длиной от 1000 до 2000 букв (звуков). При темпе речи 10 звуко-букв в секунду необходимо будет иметь образ голоса пользователя, чья длина составляет 100-200 с.

В идентифицирующей системе, представленной в диссертации, используется покадровая обработка речевого сигнала, причем кадры должны быть плавающие, кратные периоду основного тона выделяемого звука.

Очевидно, чтобы определить момент начала следующего звука в речевом сигнале, фрагментатор должен отслеживать изменение периода основного тона в сигнале. Здесь следует отметить, что, как правило, величина периода основного тона человека незначительно, но колеблется во времени. Его изменения обычно укладываются в интервал 20 % от среднего его значения. Данный интервал учитывает речевой фрагментатор, чтобы не спутать начало следующего звука в речевом сигнале с обычным незначительным изменением периода основного тона текущего звука. Это же учитывается и при выборке, сравнении и записи речевых фрагментов в базу образов.

Цель диссертационной работы состоит в разработке алгоритмов и реализации программного обеспечения, осуществляющего биометрическую аутентификацию личности по голосу в условиях высокого постороннего шума. Для достижения поставленной цели необходимо решить следующие задачи:

1) повысить точность определения частоты основного тона на любых промежутках звукового сигнала;

2) сделать частоту основного тона определяющим параметром во время аутентификации пользователя;

3) разработать методику подавления шумовой компоненты сигнала при одинаковом соотношении сигнал/шум;

4) реализовать однослойную нейронную сеть стандарта ГОСТ Р 52633.5 для преобразования голосовых биометрических параметров в код доступа;

5) построить узкополосный фильтр, принимающий на вход частоту основного тона диктора. Использовать формулу фильтра на различных гармониках сигнала для получения биометрических параметров и преобразования их в биометрический код;

6) построить новые алгоритмы фрагментации звукового сигнала и использовать получившиеся отдельные тональные фрагменты речи в качестве биометрических параметров, преобразованных в биометрический код;

7) реализовать макет обучения и аутентификации пользователя по парольной голосовой фразе. Провести тестирование вероятностных характеристик (вероятность ошибки первого и второго рода - ошибки в опровержении тестируемого пользователя и ошибки в принятии постороннего пользователя соответственно).

Методы исследований. В работе использованы методы математической статистики, теории вероятностей, теории искусственных нейронных сетей и цифровой обработки сигналов. Для реализации экспериментов использовался объектно-ориентированный язык С++, библиотеки и среда разработки

(^Сгеа1;ог и среда математического моделирования МаШСАО.

Соответствие паспорту специальности. Диссертация выполнена в соответствии с требованиями специальности 05.13.01 «Системный анализ, управление и обработка информации».

Области исследования:

1. Разработка новых математических методов анализа и обработки сигналов.

2. Разработка, обоснование и тестирование эффективных вычислительных методов с применением современных компьютерных технологий.

3. Комплексные исследования научных и технических проблем с применением современной технологии защиты информационной безопасности.

Научная новизна работы заключается в следующем:

1. Разработаны алгоритмы выделения речевых звуковых статистических параметров. На основе дискретно-континуального описания длительности звуков потока осмысленной речи выделен такой параметр, как средняя длина звука. Обобщены методы оценивания значений математического ожидания и дисперсии периода основного тона. Предложены формулы для построения узкополосного фильтра звукового сигнала.

2. Обобщен численный метод построения линейного предсказателя по выделению периода основного тона.

3. Разработаны нелинейные математические модели фильтрации звукового сигнала для более точного выделения периода основного тона на любом отрезке звукового сигнала. Построенная процедура фильтрации позволила улучшить существующий классификатор тон/шум и выделять все тональные участки речи на звуковом файле. Отличительной особенностью разработанного алгоритма является переход к непокадровой обработке данных, что в свою очередь значительно снизило вероятность ложного определения тона на участке звукового сигнала в функции линейного предсказателя.

4. Разработан алгоритм нейросетевого преобразования голосовых параметров в биометрический код доступа. На вход нейронной сети подаются векторы биометрических параметров голосовых сигналов, которые затем преобразуются в биометрический код. Последние используются для построения таблиц весовых коэффициентов. В результате применения предложенного алгоритма каждому голосовому сигналу ставится в соответствие индивидуальный код.

5. Разработан численный алгоритм выделения векторов биометрических данных, основанный на использовании тональных звуковых участков речи, отделенных от внешних шумов и пауз. Данные вектора получены на нескольких гармониках звукового сигнала и участвуют в процедуре обучения нейронной сети.

6. Построен и программно реализован алгоритм фрагментации звукового сигнала. Научная новизна заключается в использовании построенного в диссертации метода нейросетевой сегментации звукового сигнала. Получены векторы всевозможных тональных звуков, содержащиеся в парольной голосовой фразе диктора. Данные векторы преобразованы в параметры биометрия-код и поданы на обучение нейронной сети. Использование данных параметров позволило улучшить качество распознавания диктора в системе голосовой аутентификации.

Практическая значимость работы. Построен автомат, позволяющий определять диктора по произносимой парольной фразе. Разработан программный комплекс, в рамках которого реализованы адаптивные цифровые алгоритмы обработки речевых сигналов. Предложен алгоритм распознавания биометрических образов в сигнале. Алгоритм реализован в виде нейронной сети. Разработанный в диссертации метод, по сравнению с известными методами обработки цифровых сигналов, обладает существенными преимуществами, важнейшим из которых является способность автомата, реализующего данный метод, настраиваться на частоту диктора при аутентификации пользователя. Шумоподавление ведется даже при соотношении сигнал/шум равном единице. Внедрены нейронные сети стандарта ГОСТ Р 52633 для преобразования голосовых биометрических параметров в код доступа, что позволяет получить устойчивый длинный пароль на этапе аутентификации. Минимизирована до

_п

10 вероятность ошибки аутентификации пользователя в случае незнания

пользователем парольной фразы и до 10 в случае, если пользователю известно данное парольное слово/слова.

Программный комплекс направлен на обеспечение защиты информации и на устранение ее утечки. Для обеспечения защиты и обезличивания человека, имеющего доступ к информации, предлагается внедрение технологии голосовой аутентификации в состав системной проверки доступа. В качестве систем проверки предлагаются «интернет-кабинеты» с глобальными или локальными выходами. Данные системы обычно используются государственными и муниципальными учреждениями, а также некоторыми учебными заведениями. В результате действующий терминал позволит определять человека по произносимой парольной фразе с достаточно низкой вероятностью ошибки

_п

второго рода (по предварительным прогнозам она должна быть не выше 10 ), а также обеспечит пользователю быстрый, защищенный и удобный вход в личный кабинет.

Достоверность и обоснованность результатов, сформулированных в диссертации, обеспечена корректным использованием математических методов и сопоставлением теоретических утверждений с результатами тестовых и натурных экспериментов.

Основные положения, выносимые на защиту:

1. Алгоритм получения речевых статистических параметров на основе дискретно-континуального описания длительности звуков потока осмысленной речи.

2. Численный метод построения алгоритма линейного предсказателя по выделению периода основного тона при непокадровой обработке данных с использованием речевых статистических параметров диктора.

3. Нелинейная математическая модель фильтрации звукового сигнала, осуществляющая шумоподавление сигнала при одинаковом соотношении сигнал/шум.

4. Алгоритм построения векторов, характеризующих биометрические данные голоса диктора. Алгоритм основан на применении классификатора тон/шум.

5. Алгоритм фрагментации и классификации звуковых биометрических «фонем».

6. Нейросетевой алгоритм распознавания биометрических фраз человеческой речи.

7. Макет обучения и аутентификации пользователя по парольной голосовой фразе.

Реализация результатов работы. Полученные результаты исследований реализованы организацией АО «ПНИЭИ» (г. Пенза) при разработке макета программного обеспечения «Аутентификация пользователя по голосовой фразе».

Апробация результатов исследования. Основные положения диссертации докладывались и обсуждались на следующих международных конференциях: шестой и седьмой Международной научно-технической конференции

«Математическое и компьютерное моделирование естественнонаучных и социальных проблем» (Пенза, 2013, 2014); Международной научно-технической конференции «Аналитические и численные методы моделирования естественнонаучных и социальных проблем» (Пенза, 2014); научно-практической конференции «Вклад молодых ученых в развитие экономики Поволжья» (осенняя сессия) (Пенза, 2016); научной конференции конкурса «Ректорские гранты» (Пенза, 2015).

Публикации. В ходе работы над диссертацией было опубликовано восемь работ, три из которых - в журналах из перечня ВАК.

Личный вклад автора. Все основные результаты, представленные в диссертационной работе, сформулированы и получены автором самостоятельно. Работы [2, 3, 7] опубликованы в соавторстве с научным руководителем, которому принадлежит формулировка решаемой проблемы и концепция ее решения. В исследовании [1] описан разработанный автором алгоритм получения речевых статистических параметров на основе дискретно-континуального описания длительности звуков потока осмысленной речи. В работе [6] автор самостоятельно разработал новый алгоритм шумоподавления, а в исследовании [8] построил метод обезличивания персональных данных по голосовому парольному слову, полученный в цикле работ [4-7], усовершенствовал известные линейные алгоритмы по обработке звуковых сигналов. В программном комплексе автором разработаны основные алгоритмы и составлены программные коды, а также проведены численные эксперименты, которые подтверждают возможность практического использования результатов.

Структура и объем работы. Диссертация состоит из введения, четырех глав с выводами, заключения, списка использованных источников и трех приложений. Общий объем работы составляет 196 страниц, из них 170 страниц - основной текст, включающий 87 рисунков. Список источников содержит 83 наименования.

Глава 1. ОБЗОР МЕТОДОВ И УСТРОЙСТВ ЗАЩИТЫ ПЕРСОНАЛЬНЫХ ДАННЫХ НА ОСНОВЕ БИОМЕТРИЧЕСКОЙ ГОЛОСОВОЙ ИНФОРМАЦИИ И ПРЕДВАРИТЕЛЬНОЙ ЦИФРОВОЙ ОБРАБОТКИ СИГНАЛОВ

1.1. Общее состояние защиты персональных

информационных данных

В настоящее время широко распространены процессы информатизации современного общества. Использование биометрических технологий идентификации и аутентификации человека - одно из таких направлений. Биометрические технологии идентификации личности дают возможность искусственному нейросетевому интеллекту с высокой степенью надежности распознавать конкретного человека [12, 13]. Биоидентификация личности стала необходима в связи с введением в недалеком будущем визовых документов и заграничных паспортов нового поколения. Создан специальный подкомитет ISO/IEC JTC1 SC37 (Biometrics), задача которого - подготовить в ближайшее время международные биометрические стандарты [11], где определены правила снятия, хранения, обработки отпечатков пальцев, рисунков вен ладони, изображения лица, образов рукописи, голосовых и других биометрических данных.

Пакет ISO/IEC JTC1 SC37 международных биометрических стандартов небезопасен в применении в случае удаленной биометрической идентификации человека, например через Интернет или в качестве автономной системы пропуска на предприятиях. Для того чтобы пользователю был обеспечен безопасный вход в личный кабинет, необходимы биометрические технологии, способные взаимодействовать с криптографическими алгоритмами.

Ученые США, используя нечеткую математику [14], предлагают интегрировать некие «fuzzy» обогатители (экстракторы), которые превращают неоднозначную нечеткую биометрическую информацию в надежный битовый

ключ пользователя. Россия предлагает использование математической модели искусственной нейронной сети на высоком уровне. Данные сети должны проходить процесс обучения и преобразовывать биометрические параметры в секретный криптографический ключ, принадлежащий конкретному пользователю. Гипотеза реализации данных преобразователей биометрия-код позволяет надеяться на их высоконадежную устойчивость по отношению к попыткам взлома сети [12]. Одно из главных достоинств, присущих нейросетевому преобразователю биометрия-код, - способность перемешивать входные биометрические параметры. Нейронная сеть, выпускающая 256-битовый

криптографический код, обеспечивает стойкость к случайному подбору данного

??

кода, приблизительно начиная от 10 попыток.

Электронный документооборот получит в ближайшем будущем широкое распространение. Поэтому использование электронной цифровой подписи (ЭЦП) станет повсеместным.

Главным требованием ГОСТа [15] является обязательная проверка вероятностей ошибок к случайному подбору. Как и карточный рт-код, биометрический пароль (рукописный или голосовой) пользователь обязан хранить в тайне, поскольку пользователь не может доверять рекомендованным производителем вариациям кодов, необходимо самому придумать удобную для него комбинацию цифр, фраз, слов. Использование постороннего кода уже говорит о потере конфиденциальности информации.

Есть вероятность, что тайный биометрический образ может не обеспечивать высокую защиту к атакам подбора. Поэтому, чтобы убедиться в надежности и устойчивости построенной нейронной сети, необходимо провести тестирование стойкости преобразователя на различных образах. Также используются уже созданные методы, позволяющие ускорить процесс тестирования на стойкость [10].

1.2. Оценка стойкости нейросетевого

распознавания биометрия-код

Оценкой стойкости средств аутентификации к атакам подбора (далее -оценкой стойкости) называют процедуру, позволяющую определить следующие характеристики системы:

- вероятность ошибки первого рода (false reject rate, FRR) - вероятность ошибочного определения подлинности, при котором субъект доступа определяется системой как нарушитель правил разграничения доступа;

- вероятности ошибки второго рода (false accept rate, FAR) - вероятность ошибочного определения подлинности, при котором нарушитель правил разграничения доступа определяется системой как субъект доступа [1].

Оценка стойкости к атакам подбора, как составная часть процедуры тестирования, является обязательным этапом жизненного цикла любого средства аутентификации, в том числе средства высоконадежной биометрико-криптографической аутентификации. При этом оценка стойкости средств высоконадежной биометрико-криптографической аутентификации имеет ряд особенностей, связанных со спецификой использования нечетких биометрических образов, а также с высокими показателями защищенности системы (в частности, с низкими вероятностями ошибок второго рода). В данной диссертационной работе проанализированы сложности и проблемы, возникающие при оценке стойкости средств высоконадежной биометрико-криптографической аутентификации классическими методами, а также разработаны алгоритмы, позволяющие решить эти проблемы.

1.3. Информационная мера качества исходных данных

Оперируя собственной интуицией, человек имеет возможность оценить данные различного качества. Один из формальных приемов оценки свойств

данных - вычисление их энтропии по Шеннону [17]. Шеннон исследовал речь человека, воспроизведенную на натуральном языке и уже оцифрованную на некотором алфавите из Б букв, представленную в виде текста. Человек, понимающий язык и знающий алфавит, с легкостью читает текст и понимает его содержание. Машины во времена Шеннона, да и в современное время, видят только оболочку знаний в виде последовательности букв текста. Машинам доступна операция по оценке энтропии появления одиночных символов алфавита в тексте [9]:

£ £ Н{хх) = - I Р(х1|.)-1оё2(Р(х1|.)) = 1Р(х1|.)-/(х1|.), (1.3.1)

1/ = 1 1/

где Р(ху) - вероятность появления одиночного /-го символа в тексте, представленного в алфавите из £ символов; /(х^) =-к^СРС^)) - информация,

получаемая при появлении /-го символа.

Рассматривая каждую из букв текста независимо от других букв, понять смысла текста нельзя. В связи с этим энтропия первого порядка (1.3.1) должна быть заменена энтропиями более высоких порядков. Формулы для расчета энтропий более высокого порядка строятся по индукции:

5 5

Н(хьх2) = - I I р{х\рх21)Ло%2{Р(х\рх2^) = 1/ = 11/ = 1

= 11 РЫХ2&1ЫХ2& 1/ = 12/ = 1

Н(х1,х2,...,хп) = - I I ... I (13-3)

1/ = 11/ = 1 т = 1

где Р(ху,х21,...,хп1) - вероятность появления некоторой /7-граммы

из п символов в исследуемом тексте, представленном в алфавите из £ символов; 1(ху,х21,...,хп1) - информация при получении сочетания символов.

Следует отметить, что многомерная энтропия Н(хрх2,...,х ) и

многомерная информация /(ху,.*^,...,.*^) - это результат некоторых

теоретических построений, воспользоваться которыми на практике достаточно сложно. При попытках осуществления прямых вычислений вида (1.3.3) требуются огромные затраты вычислительных ресурсов и очень большие объемы исходных текстов. Прямое вычисление многомерной энтропии нецелесообразно, однако косвенное (неявное) вычисление оценок энтропии того или иного порядка - это очень эффективный подход к решению множества задач.

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Список литературы диссертационного исследования кандидат наук Калашников, Дмитрий Михайлович, 2017 год

список литературы

[1] Калашников, Д. М. Речевой фрагментатор для нейросетевого биометрического вокодера / Д. М. Калашников, В. М. Гришин // Безопасность информационных технологий. - 2012. - № 8. - С. 73-76.

[2] Калашников, Д. М. Оценка периода основного тона речи, выделение звуковых фрагментов при автоматическом обучении нейросетевого биометрического вокодера / Д. М. Калашников, А. И. Иванов, Т. В. Черушева // Математическое и компьютерное моделирование естественно-научных и социальных проблем : сб. ст. VII Междунар. науч.-техн. конф. молодых специалистов, аспирантов и студентов. - Пенза : Изд-во ПТУ, 2013. - С. 256-263.

[3] Калашников, Д. М. Предсказание длительности тональных звуков русскоязычной речи / Д. М. Калашников, А. И. Иванов, Т. В. Черушева // Математическое и компьютерное моделирование естественно-научных и социальных проблем : сб. ст. VIII Междунар. науч.-техн. конф. молодых специалистов, аспирантов и студентов. - Пенза : Изд-во ПТУ, 2014. - С. 162-166.

[4] Калашников, Д. М. Континуально-дискретная модель распределения значений ожидаемой длины последовательностей тональных звуков слитной речи / Д. М. Калашников, А. И. Иванов, И. В. Бойков // Безопасность информационных технологий. - 2014. - № 9. - С. 5-6.

[5] Калашников, Д. М. Биометрия: предсказание длительности тональных звуков слитной речи / Д. М. Калашников // Инфокоммуникационные технологии. - 2014. - № 3. - С. 72-76.

[6] Калашников, Д. М. Шумоподавление при обработке речевых сигналов за счет выделения тональных фрагментов / Д. М. Калашников // Аналитические и численные методы моделирования естественнонаучных и социальных проблем : сб. ст. Междунар. науч.-техн. конф. молодых специалистов, аспирантов и студентов. - Пенза : Изд-во ПГУ, 2014. - № 8. - С. 190-194.

[7] Бойков, И. В. Алгоритм построения статистического дискретно-континуального описания длительности звуков потока осмысленной речи

диктора / И. В. Бойков, А. И. Иванов, Д. М. Калашников // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2015. - № 4 (24). -С. 64-78.

[8] Бойков, И. В. Алгоритм построения звукового фрагментатора речи для распознавания голосовых образов, с учетом биометрических особенностей диктора / И. В. Бойков, Д. М. Калашников // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2016. - № 1. - С. 78-91.

[9] Иванов, А. И. Подсознание искусственного интеллекта: программирование автоматов нейросетевой биометрии языком их обучения [Электронный ресурс] / А. И. Иванов. - Пенза : Изд-во ОАО «ПНИЭИ», 2012.

[10] ГОСТ Р 52633.0-2006 «Защита информации. Техника защиты информации. Требования к средствам высоконадежной биометрической аутентификации». Введен в действие с 01.01.2007.

[11] Алгоритмы тестирования биометрико-нейросетевых механизмов защиты информации / Б. С. Ахметов, В. И. Волчихин, А. И. Иванов,

A. Ю. Малыгин. - Алматы : КазНТУ имени К. И. Сатпаева, 2013. - 152 с.

[12] Волчихин, В. И. Быстрые алгоритмы обучения нейросетевых механизмов биометрико-криптографической защиты информации /

B. И. Волчихин, А. И. Иванов, В. А. Фунтиков. - Пенза : Изд-во Пенз. гос. ун-та, 2005.-276 с.

[13] Biometric technology in securing the Internet nsing large neural network technology / B. Aklnnetov, T. Kartbayev, A. Doszhanova, A. Ivanov, A. Malygin // World Academy of science, Engineering and technology. - Singapore, 2013. - Iss. 79. -P. 129-138.

[14] Dodis, Y. Extractors: How to Generate Strong Keys from Biometrics and Other Noisy Data / Yevgeni Dodis, Leonid Reyzin, Adam Smith // International Conference on the Theory and Applications of Cryptographic Techniques. - 2004. -

C.523-540.

[15] Иванов, А. И. Противодействие «цифровому неравенству» граждан: тестирование стойкости программных средств безопасного хранения ключа ЭЦП /

А. И. Иванов, А. Ю. Малыгин, О. С. Захаров // Современные технологии безопасности. - 2006. - № 1 (16). - С. 33-35.

[16] Бриллюэн, JI. Наука и теория информации / JI. Бриллюэн. - М. : Физматлит, 1960.

[17] Райе, Дж. Матричные вычисления и математическое обеспечение / Дж. Райе. - М. : Мир, 1984. - 412 с.

[18] Скворцов, В. А. Примеры метрических пространств / В. А. Скворцов. -М. : Изд-во Моск. центра непрерывного математического образования, 2001. -(Библиотека «Математическое просвещение»),

[19] Кульбак, С. Теория информации и статистика / С. Кульбак. - М. : Наука, 1967.-408 с.

[20] Майоров, А. В. Защита от попыток исследования исполняемых биометрических программ при захвате их противником / А. В. Майоров, Б. Д. Шашков // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2007. - Спецвыпуск. - С. 152-158.

[21] Агашин, О. С. Методы цифровой обработки речевого сигнала в задаче распознавания изолированных слов с применением сигнальных процессоров / О. С. Агашин, О. Н. Корелин // Труды Нижегородского государственного технического университета им. Р. Е. Алексеева. - 2002. - № 4 (97). - С. 18-27.

[22] Fletcher, Н. Auditory patterns / Н. Fletcher // Reviews of modern physics. -1940. - Vol. 12, № 1. - P. 47.

[23] Stevens, S. A scale for the measurement of the psychological magnitude pitch / S. Stevens, J. Volkmann, E. Newman // The Journal of the Acoustical Society of America. - 1937. - Vol. 8. - P. 185.

[24] Грей, M. Линейное предсказание речи / M. Грей. - М. : Связь, 1980. -

154 с.

[25] Люстерник, Л. А. Элементы функционального анализа / Л. А. Люстерник, В. И. Соболев. - М. : Наука, 1965. - 540 с.

[26] Канторович, JI. В. Функциональный анализ / Л. В. Канторович, Г. П. Акилов. - М. : Наука, 1977. - 750 с.

[27] Обломская, Л. Я. О методах последовательных приближений для линейных уравнений в банаховых пространствах / Л. Я. Обломская // Журнал вычислительной математики и математической физики. - 1968. - Т. 8, № 2. -С.417-426.

[28] Данфорд, Н. Линейные операторы. Т. 1. Общая теория / Н. Данфорд, Дж. Шварц. - М. : ИЛ, 1962.

[29] Основы цифровой обработки сигналов / А. И. Соломина, Д. А. Улахович, С. М. Арбузов, Е. Б. Соловьева. - СПб. : БХВ-Петербург, 2005. -746 с.

[30] Бакушинский, А. Б. О решении некоторых интегральных уравнений 1 рода методом последовательных приближений / А. Б. Бакушинский, В. Н. Страхов // Журнал вычислительной математики и математической физики. -1968.-Т. 8, № 1.-С. 181-185.

[31] Mermelstem, P. Automatic segmentation of speech into syllable units / P. Mermelstem // J. Acoust. Soc. Amer. - 1975. - V. 58, № 4. - P. 880-883.

[32] Сорокин, В. H. Сегментация и распознавание гласных / В. Н. Сорокин, А. И. Цыплихин // Информационные процессы. - 2004. - Т. 4, № 2. - С. 202-220.

[33] Jackson, L. В. Digital Filters and Signal Processing / L. B. Jackson. -Second Edition. - Kluwer Academic Publishers, 1989.

[34] Yu, S. Hidden semi-Markov models / S. Yu // Artificial Intelligence. -2010. - Vol. 174, № 2. - P. 215-243.

[35] Моттль, В. Скрытые марковские модели в структурном анализе сигналов / В. Моттль, И. Мучник. - М. : Физматлит, 1999. - 352 с.

[36] De Fonzol, V. Hidden Markov Models m Biomformatics / V. de Fonzol, F. Aluffi-Pentini, V. Parisi // Current Biomformatics. - 2007. - № 2. - P. 49-61.

[37] Smith, K. Hidden Markov Models m Biomformatics with Application to Gene Finding m Human DNA. - Machine Learning Project, 2002. -9 c.

[38] Сорокин, В. Н. Первичный анализ речевых сигналов / В. Н. Сорокин, Д. Н. Чепелев // Акустический журнал. - 2005. - Т. 51, № 4. - С. 536-542.

[39] Газин, А. И. Особенности голосовой аутентификации личности /

A. И. Газин // Труды Международного симпозиума Надежность и качество. -2010.-Т. 2.

[40] Васильев, Р. А. Исследование особенностей фонетического строя речи и идентификация дикторов по голосу / Р. А. Васильев // Информация и безопасность. -2004. - Т.15,№4.-С. 487-494.

[41] Искусственный интеллект : справочник. Кн. 1. Системы общения и экспертные системы. - М. : Радио и связь, 1990.

[42] Рабинер, JI. Р. Цифровая обработка речевых сигналов / JI. Р. Рабинер, Р. В. Шафер. - М. : Радио и связь, 1981. - 593 с.

[43] Федосов, В. П. Цифровая обработка сигналов в Lab VIEW /

B. П. Федосов, А. К. Нестеренко. - М., 2007.

[45] Борискевич, А. А. Цифровая обработка речи и изображений / А. А. Борискевич. - Минск : БГУИР, 2007.

[46] Глинченко, А. С. Цифровая обработка сигналов / А. С. Глинченко -Красноярск : Изд-во КГТУ, 2001.

[47] Использование разложения автокорреляционной матрицы сигнала по собственным векторам в задаче устойчивого акустического кодирования вокализованных речевых сигналов / А. В. Герасимов, О. А. Морозов, Е. А. Солдатов, В. Р. Фидельман // Известия вузов. Радиофизика. - 2004. - № 2. -

C.195-200.

[48] Optimum Signal Processing. An Introduction. Second Edition Sophocles J. Orfamdis Rutgers University, 2007. - C. 377. - URL: www.ece.rutgers.edu/~orfanidi/osp2e/osp2e.pdf/

[49] ГОСТ P 51061-97 «Системы низкоскоростной передачи речи по цифровым каналам. Параметры качества речи и методы измерений».

[50] Первушин, Е. А. Обзор основных методов распознавания дикторов / Е. А. Первушин // Математические структуры и моделирование. - 2011. -Вып. 24.-С. 41-54.

[51] Станкевич, Ф. В. Использование мел-кепстральных коэффициентов для нейросетового распознавания тембра музыкального инструмента / Ф. В. Станкевич // Современные информационные технологии : сб. тр. конф. «Ключевые аспекты научной деятельности - 2014»ю Том 18. Математика. Физика. Современные информационные технологии. - Пшемысль : Наука и образование, 2014.

[52] Вишнякова, О. А. Автоматическая сегментация речевого сигнала на базе дискретного вейвлет-преобразования / О. А. Вишнякова, Д. Н. Лавров // Математические структуры и моделирование. - 2011. - Вып. 23. - С. 43-48.

[53] Сегментация речевого сигнала / О. А. Дорохин, Д. Г. Старушко, Е. Е. Федоров, В. Ю. Шелепов. - Донецк : Институт проблем искусственного интеллекта, 2005.

[54] Сегментация речевых сигналов на основе анализа особенностей распределения долей энергии по частотным интервалам / Е. Г. Жиляков, Е. И. Прохоренко, А. В. Болдишев, А. А. Фирсова, М. В. Фатова // Вестник НТУ «ХПИ». Тематический выпуск: Информатика и моделирование. -2011. -№ 17. -С. 44-50.

[55] Королюк, В. С. Полумарковские процессы и их приложение / В. С. Королюк, А. Ф. Турбин. - Киев : Наукова думка, 1975. - 182 с.

[56] Hidden Markov Model Toolkit Book. - Cambridge University Engineering Department, 2001.

[57] Vaseghi, S. V. Advanced digital signal processing / Saeed V. Vaseghi // The Theory of Linear Prediction and noise reduction. - 3ed. - California, 2008. - C. 514

[58] Тананаев, Д. Д. Метод математического моделирования системы определения состояния технического объекта на основе скрытых марковских

моделей и алгоритм распознавания акустического сигнала / Д. Д. Тананаев // Наука и современность. - 2013. -№ 26-2.

[59] Bmot, J.-L. A Set-oriented semantic network formalism for the representation of sentence meaning / J.-L. Bmot // Proc. ECAI84. - Pisa, 1984. -September.

[60] Boguraev, В. K. Automatic resolution of linguistic ambi-guities / В. K. Boguraev. - Ph.D. thesis, University of Cambridge, England, 1979.

[61] Lytinen, S. L. Dynamically combining syntax and semantics in natural language processing / S. L. Lytinen // Proc. of AAAI86. - Philadelphia, 1986. - August.

[62] Gasdar, G. Generalized Phrase Structure Grammar / G. Gasdar, E. Klein,

G. Pullum, and I. Sag. - Oxford, England : Basil Blackwell, 1985.

[63] Weir, D. J. File re-lationship between Tree adjoining grammars and head gram-mars / D. J. Weir, K. Vijay-Shanker, A. K. Joshi // Proc. о f the 24th meeting of the ACL. - New-York, 1986. - June.

[64] Wilks, Y. An intelligent analyser and understander of English / Y. Wilks // CACM. - 1975. - V. 18, № 5. - May.

[65] Шелухин, О. И. Цифровая обработка и передача речи / О. И. Шелухин,

H. Ф. Лукьянцев. - М. : Радио и связь, 2000. - 454 с.

[66] Дегтяров, Н. П. Параметрические и информационное описание речевых сигналов / Н. П. Дегтяров. - Минск, 2003. - 216 с.

[67] Фант, Г. Анализ и синтез речи : пер. с англ. / Г. Фант ; под ред. Н. Г. Загоруйко. - Новосибирск : Наука, 1970. - 167 с.

[68] Noda, Н. A MRF-based parallel processing algorithm for speech recognition using linear predictive HMM / H. Noda, M. Shirazi // Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 94). - 1994. -V. 1. -P. 597.

[69] Kuhn, H. Nonlinear programming / H. Kuhn, A. Tucker // Proceedings of the 2nd Berkeley symposium on mathematical statistics and probability. - 1951. - V. 5. -P. 481-492.

[70] Прокис, Дж. Цифровая связь / Дж. Прокис. - М. : Радио и связь, 2000.

[71] Сапожков, М. А. Вокодерная связь / М. А. Сапожков, В. Г. Михайлов. -М. : Радио и связь, 1983.

[72] Литвиицева, А. В. Использование линейного предсказателя речи в программной модели низкоскоростного вокодера для передачи речи по гидроакустическому каналу связи / А. В. Литвинцева, М. А. Оболонин // Современные проблемы науки и образования. - 2013. - № 3.

[73] Gelfand, A. Sampling-based approaches to calculating marginal densities / A. Gelfand, A. Smith // Journal of the American Statistical Association. - 1990. -V. 85, №410. - P. 398-409.

[74] Трубецкой, H. С. Основы фонологии / H. С. Трубецкой. - М. : Аспект Пресс, 2000. - 352 с.

[75] Фонетика спонтанной речи / отв. ред. Н. Д. Светозарова. - Л. : Изд-во ЛГУ, 1988.-245 с.

[76] Тропченко, А. Ю. Цифровая обработка сигналов. Методы предварительной обработки : учеб. пособие по дисциплине «Теоретическая информатика» / А. Ю. Тропченко, А. А. Тропченко. - СПб. : СПбГУ ИТМО, 2009. - 88 с.

[77] Сергиенко, А. Б. Цифровая обработка сигналов / А. Б. Сергиенко. -СПб. : Питер, 2007.

[78] Попов, О. Б. Цифровая обработка сигналов в трактах звукового вещания : учеб. пособие / О. Б. Попов, С. Г. Рихтер. - М. : Горячая линия -Телеком, 2007.-492 с.

[79] А.с. № 1690206 Способ изменения скорости передачи цифрового звукового сигнала / М. В. Гитлиц, О. Б. Попов и др. // Опубл. БИ № 41, 1991.

[80] Ляхов, А. Л. Нейросетевая модификация текущего пространства признаков к целевому множеству классов / А. Л. Ляхов, С. П. Алёшин, Е. А. Бородина // Нейроспъов1 технологи i ïx застосування : зб. наук, праць

11 МЪкнар. наук.-практ. конф. / под ред. проф. С. В. Ковалевского. - Краматорск : ДДМА, 2012.-С. 93-99.

[81] Терехов, В. А. Нейросетевые системы управления : учеб. пособие для вузов / В. А. Терехов, Д. В. Ефимов, И. Ю. Тюкин. - М. : Высш. школа, 2002. -183 с.

[82] Хургин, Я. И. Финитные функции в физике и технике / Я. И. Хургин, В. П. Яковлев. - М. : Наука, 1971. - 408 с.

[83] Stenger, F. Numerical Methods Based on Sine and Analytic Functions / F. Stenger / Springer Series m Computational Mathematics. - Springer Verlag, 1993. -565 p.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.