Разработка алгоритмов распознавания рукописных символов на основе аналитических свойств изображения тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат физико-математических наук Сорокин, Андрей Игоревич

  • Сорокин, Андрей Игоревич
  • кандидат физико-математических науккандидат физико-математических наук
  • 2010, Воронеж
  • Специальность ВАК РФ05.13.17
  • Количество страниц 184
Сорокин, Андрей Игоревич. Разработка алгоритмов распознавания рукописных символов на основе аналитических свойств изображения: дис. кандидат физико-математических наук: 05.13.17 - Теоретические основы информатики. Воронеж. 2010. 184 с.

Оглавление диссертации кандидат физико-математических наук Сорокин, Андрей Игоревич

Введение.

Глава 1. Обзор существующих методов распознавания.

Глава 2. Предварительная обработка изображения.

§2.1. Пороговая классификация.

§2.2. Бинарная морфология в предварительной обработке изображения.

§2.3. Построение скелета изображения.

§2.4. Обработка «скелета» изображения.

§2.5. Выделение границ объектов. Способы задания границ.

Глава 3. Распознавание простейших объектов на изображении.

§3.1. Преобразование Радона.

§3.2. Поиск прямых на изображении.54 j

§3.3. Нахождение параметров окружностей на основе обобщённого преобразования i

Радона

§3.4. Метод инверсий для обнаружения окружностей.

§3.5. Моделирование символов примитивами.

Глава Распознавание сложных объектов.

§4.1. Метод алгебраических кривых.

§4.2. Моделирование рукописных символов алгебраическими кривыми.

§4.3. Инвариантные дескрипторы Фурье.

§4.4. Представление плоской кривой эллиптическими дескрипторами Фурье.

§4.5. Функция длины хорды для построения характерных признаков объекта.

§4.6. Признаки распознавания объекта.

Глава 5. Сегментация изображения.

§5.1. Диаграммы Вороного.v.

§5.2. Сегментация текста на основе обобщённых диаграмм Вороного .Л.

§5.3. Алгоритм обнаружения угла наклона текста.

§5.4. Алгоритм сегментации простых арифметических выражений.

§5.5. Алгоритм деления текста на строки и слова.

Глава 6. Программная оболочка распознавания рукописных и печатных текстов

§6.1. Блок предварительной обработки изображения.

§6.2. Блок сегментации текста.

§6.3. Блок распознавания символов.

§6.4. Блок окончательной обработки результатов распознавания.

Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка алгоритмов распознавания рукописных символов на основе аналитических свойств изображения»

Актуальность исследования

Цифровая обработка изображений является современным разделом IT-технологий по ряду причин, связанных как с фундаментальными и научными исследованиями, так и с непрерывно растущим спектром её практических приложений. Хорошо известными примерами возникновения такой задачи в сфере фундаментальной науки являются астрономия, физика элементарных частиц, фотография. Соответствующее практическое, технологическое применение данная задача нашла в радиолокации, медицине, географии, в широком спектре задач учёта и систематизации данных и информации и т.п. Можно с уверенностью констатировать, что развитие средств вычислительной, техники привело к состоянию, когда цифровая обработка изображений проникла во все области человеческой деятельности.

Общая задача обработки изображений распадается в связи с её широким применением на весьма широкий класс задач. Одной из таких задач является задача распознавания текста. За последние 10 лет достигнут существенный прогресс в распознавании стандартизированного (машинописного) текста. Разработаны технологии и программные продукты, позволяющие достаточно уверенно (с высокой степенью точности) распознавать машинописный текст., наиболее известными из которых являются ABBYY FineReader OCR [1], OmniPage [2], Readlris [3], CuneiForm [4]. Иначе обстоит дело с методами, технологиями и программными комплексами для распознавания рукописного текста. Так, существующие программные продукты (например, ABBYY FormReader [5]) предназначены, в основном, для ввода специальных форм или анкет, заполненных от руки.

Рукописный текст является наиболее естественным для человека способом сохранения и дальнейшего использования информации. С использованием вычислительной техники, глобальных сетей и средств обмена сообщениями роль рукописного текста в повседневной коммуникации является значительной. Простейшими примерами являются почтовые адреса на конвертах, школьные задания, медицинские справки и заключения, заполненные от руки анкеты и формы, подписи на документах и банковских чеках, человеческое общение посредством письма — лишь малая часть современных примеров использования рукописных текстов. Однако перевод рукописных документов в электронную форму путём набора текста оператором с бумажного носителя сложен и подразумевает использование значительных человеческих ресурсов.

В настоящее время достаточно сложно оценить общее количество существующих рукописных документов, которые уже сейчас необходимо перевести в цифровой формат и распознать. Например, на начало 2009 года в Государственном архиве Российской Федерации насчитывалось более 1 миллиона дел по истории Российской империи и истории России только периода Временного правительства. При этом подавляющей частью документов являются именно письменные источники [6]. Кроме архивов существует современная активная деятельность человека, производящая чрезвычайно большой объём рукописной информации, подлежащей обработке, хранению и систематизации. По этой причине существует реальная потребность в создании автоматизированных систем распознавания рукописных документов, не требующих больших трудозатрат со стороны оператора.

Кроме того, в ряде случаев рукописный ввод представляет собой более удобный способ передачи информации между человеком и компьютером. Так, некоторые системы распознавания рукописного ввода нашли широкое применение в мобильных устройствах, в том числе, карманных персональных и планшетных компьютерах, где применение клавиатуры нецелесообразно с точки зрения эргономики или размеров устройств.

Весь спектр перечисленных проблем и масса новых технологических задач определяют актуальность исследования и разработку методов обработки именно рукописных текстов.

Цели и задачи диссертации

Письменный текст - это графическая знаковая система представления информации. В качестве графических знаков в алфавитных системах письма используются буквы, цифры, специальные знаки, в неалфавитных — слоговые знаки, иероглифы и др. [7]. Можно ввести условное деление письменных текстов по способу их создания на два типа: рукописный и машинописный. В этом случае возникают следующие различия между соответствующими типами символов и знаков текста.

1. Машинописный текст обладает свойством стандартизации. Графическое изображение символа текста фиксированного размера, принадлежащее некоторому шрифту, может быть «напечатано» без значительных искажений произвольное число раз. В свою очередь, ввиду физиологических особенностей процесса написания текста, Рукописный текст не стандартизован, подвергается определённым искажениям, существенно индивидуален, не является тождественным предыдущему.

2. В машинописном тексте символы отделены друг от друга некоторым технологическим интервалом. В рукописных же текстах преимущественно имеет место слитное написание отдельных символов при изображении слова.

3. Геометрическое расположение знаков1 печатного текста представляет собой фиксированную структуру с набором «параллельных» строк или столбцов символов. Рукописный текст чаще хаотичен, чем структурирован.

Учитывая изложенные выше отличия между рукописным и машинописным текстом, , можно сделать вывод о - существенно большей сложности решения задачи распознавания рукописных текстов по сравнению с печатными текстами. Проблемами в этом случае являются сложность применения фиксированного набора шаблонов для распознавания рукописных символов, неоднозначность выделения букв в слове, а также сложность выделения логической структуры текста (строк, абзацев и т.п.).

Цели и задачи исследования

Так как задача распознавания рукописного текста до настоящего времени не решена, целью диссертационного исследования является разработка и теоретическое обоснование алгоритмов, предназначенных для распознавания рукописных текстов на основе развития методов распознавания печатных текстов и развитие новых алгоритмов решения такой задачи. Для достижения поставленной цели в диссертации решаются следующие задачи.

1. Разработка общей схемы распознавания рукописных и машинописных текстов на изображении.

2. Анализ методов обработки изображения, полученного оптическим сканированием.

3. Развитие и разработка методов распознавания изображения простейших геометрических объектов (прямых, окружностей и, т.п.).

4. Развитие методов распознавания рукописных символов и текстов на основе обобщения и интегрирования методов, развитых для машинописных текстов и символов.

5. Разработка теоретических основ и алгоритмов сегментации рукописных текстов.

6. Создание программной оболочки распознавания рукописных и печатных текстов.

Методы исследования

Выполненные теоретические и экспериментальные исследования основаны на использовании теории^ интегральных преобразований, теории вероятностей и математической статистики, методов вычислительной геометрии, теории множеств, теории размерности, теории кривых, обобщённых функций.

Научная новизна и значимость работы

Научная новизна работы заключается в разработке алгоритмов и и программного комплекса для распознавания рукописных текстов. 1 В работе впервые разработаны:

1.1 алгоритмы распознавания прямых и окружностей без использования пространства «аккумулятора» для хранения параметров двойственного исходному изображению;

1.2 быстрый алгоритм поиска окружностей на изображении на основе метода инверсий;

1.3 алгоритм моделирования и распознавания рукописных символов алгебраическими кривыми;

1.4 алгоритм выделения и классификации алгебраических кривых на изображении;

1.5 алгоритм распознавания рукописных и печатных символов на основе дескрипторов функций длины хорды

1.6 алгоритм сегментации рукописных и печатных текстов на основе анализа диаграмм Вороного;

1.7 алгоритм определения угла наклона рукописных и печатных текстов на основе анализа диаграмм Вороного.

2 Для разработанных алгоритмов приведены теоретические обоснования.

3 Доказана лемма о структуре обобщённой диаграммы Вороного.

4 Разработанные алгоритмы объединены в пакет прикладных программ для распознавания рукописных и печатных текстов.

Практическая ценность работы заключается в разработанном пакете прикладных программ для распознавания рукописных и печатных текстов. Результаты работы могут быть применены в программно-аппаратных комплексах распознавания текстов на оптически сканированных изображениях, в том числе, для автоматизированного распознавания архивных документов и индивидуальных пакетов рукописного ввода информации.

Получены свидетельства об официальной регистрации программ: «распознавание примитивов на изображении» [8], «определение параметров центральных кривых второго порядка на изображении» [9].

Публикации

- По .результатам проведённых исследований и- практических разработок опубликовано 10 работ.

Апробация работы

Результаты исследований докладывались на: УП-й Международной научно-методической конференции «Информатика: проблемы, методология, технологии» (г. Воронеж, 8-9 февраля 2007 г.), УШ-й Международной научно-методической конференции «Информатика: проблемы, методология, технологии» (г. Воронеж, 7-8 февраля 2008 г.), ХУ1-Й Международной конференции «Математика. Компьютер. Образование — 2009» (г. Пущино, 1924 января 2009), ЕХ-й Международной научно-методической конференции «Информатика: проблемы, методология, технологии» (г. Воронеж, 12-13 февраля 2009 г.), Х-й Международной научно-методической конференции «Информатика: проблемы, методология, технологии» (г. Воронеж, 11-12 февраля 2010 г.)

Личный вклад автора

Все основные работы, выносимые на защиту, получены автором самостоятельно.

Структура и объём диссертации

Основное содержание работы изложено в шести главах. Работа содержит 153 страницы машинописного текста, 58 рисунков и 4 таблицы. Список цитируемой литературы включает в себя 92 наименования.

В главе 1 проведён анализ существующих методов распознавания рукописных и машинописных текстов являющихся частным случаем общей проблемы цифровой обработки изображений. Представлена классификация методов распознавания рукописного ввода, выделены online, offline и комбинированные методы распознавания. Результаты, полученные в диссертационной работе, отнесены к классу методов offline-распознавания текстовой информации. Сформулирована общая схема разрабатываемой системы распознавания рукописных текстов.

В главе 2 описаны методы подготовки обработки изображений, полученных оптическим сканированием, которые включают в себя пороговую классификацию, удаление шумов на изображении методами бинарной морфологии, способы выделения и кодирования границ распознаваемых объектов, а также получение и обработку «скелета» изображения.

В -главе- - 3 развиты методы распознавания простейших- объектов (примитивов) на изображении: прямых и окружностей на основе интегрального преобразования Радона. На основе алгоритмов распознавания примитивов на изображении в настоящей работе разработаны алгоритмы, обладающие меньшими требованиями к используемой памяти при сохранении производительности распознавания. На основе метода инверсий развит новый быстрый алгоритм распознавания окружностей на изображении.

В главе 4 развиты методы распознавания сложных объектов на изображении, включая рукописные символы русского языка. Предложены новые алгоритмы моделирования и распознавания рукописных символов русского языка на основе метода приближения границ объектов алгебраическими кривыми. На основе методов представления замкнутой границы объекта векторами признаков, инвариантными к аффинным преобразованиям изображения, разработаны алгоритмы представления и распознавания рукописных и печатных символов. Предложено использование методы^ главных компонент и дискриминантного анализа для уменьшения размерности вектора признаков объекта.

В главе 5 разработаны алгоритмы выделения строк, слов и символов рукописных и печатных текстов, использующие диаграмму Вороного. Развит новый алгоритм определения угла наклона рукописных и печатных текстов. Доказана лемма о связи точечной и обобщённой диаграмм Вороного.

В главе 6 описан интерфейс и внутренняя структура программной оболочки для распознавания рукописных и печатных текстов. Разработан алгоритм проверки и коррекции результатов распознавания по словарю.

Положёния, выносимые на защиту

1. Разработаны теоретические основы алгоритмов распознавания прямых и окружностей без использования пространства «аккумулятора», двойственного исходному изображению.

2. Разработаны теоретические основы быстрого алгоритма поиска окружностей на изображении методом инверсий.

3. Разработана теория алгоритма и реализован алгоритм моделирования и распознавания рукописных символов алгебраическими кривыми.

4. Реализован алгоритм выделения и классификации алгебраических кривых на изображении.

5. Исследовано прменение дескрипторов функций длины хорды к распознаванию рукописных символов русского языка.

6. Разработан алгоритм сегментации рукописных и печатных текстов на основе анализа диаграмм Вороного.

7. Развита теория и разработан алгоритм определения угла наклона рукописных и печатных текстов на основе анализа диаграмм Вороного.

8. Алгоритмы объединены в пакет программных оболочек

Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Заключение диссертации по теме «Теоретические основы информатики», Сорокин, Андрей Игоревич

Выводы

1. Разработан программный комплекс распознавания машинописных и рукописных текстов, который состоит из следующих функциональных блоков: предварительной обработки изображения, сегментации текста, распознавания символов и окончательной обработки результатов распознавания.

2. В §6.4 предложен алгоритм коррекции результатов распознавания изображения по словарю на основе оценки величины ошибки распознавания символов слова.

Заключение

Распознавание рукописных текстов на изображении представляет собой проблему, требующую решения ряда неоднородных подзадач, в числе которых:

1) предварительная обработка изображения;

2) выделение строк, слов и символов текста;

3) распознавание символов;

5) коррекция результатов распознавания.

Изображение текста, подлежащее распознаванию, как правило, получают путём оптического сканирования некоторого носителя. Результатом данной операции является полутоновое или цветное изображение. Применяемые в настоящей работе алгоритмы распознавания текста используют чёрно-белое изображение, где чёрным цветом кодируются объекты, а белым — фон изображения, что делает необходимым этап предварительной обработки изображения. Для решения данной проблемы используются методы Киттлера и Сауволы пороговой классификации, описанные в разделе §2.1, позволяющие преобразовать полутоновое изображение в чёрно-белое. Метод локальной пороговой классификации Сауволы неявно использует так называемую «медианную фильтрацию», заключающуюся в усреднении значений ••яркости^' соседних точек, что позволяет устранить с изображения помехи, связанные с дискретизацией сигнала в устройствах оптического сканирования. Чёрно-белое изображение, полученное методом пороговой классификации, может содержать специфические помехи типа «соль-перец», характеризуещиеся появлением изолированных белых или чёрных точек. Устранение шума «соль-перец» на изображении осуществляется посредством последовательного применения операций бинарной морфологии.

Важным этапом процесса распознавания текста является сегментация, заключающаяся в выделении на изображении отдельных строк, слов и символов текста. В настоящей работе сегментация текста осуществляется на основе анализа диаграммы Вороного центров масс связных компонентов чёрно-белого изображения, соответствующих символам текста. Диаграмма Вороного используется для осуществления быстрого поиска «смежных» символов. Так, сложность алгоритма построения данной диаграммы составляет 0(NlogN), а для произвольного компонента вычислительная сложность алгоритма поиска смежных с ним компонентов - 0(1). В разделе §5.5 предложен собственный алгоритм сегментации текста, основанный на анализе диаграмм Вороного. Выделение строк, символов и слов текста позволяет решить задачу форматирования результатов распознавания, т.е. добавления переноса строк и пробелов в выходном тексте. Кроме того, информация о структуре слов используется для коррекции результатов распознавания по словарю.

Распознавание символов осуществляется путём анализа их внешних и внутренних замкнутых границ, способы выделения и кодирования которых описаны в разделе §2.5. Полученные границы символа используются для построения вектора признаков, инвариантных к аффинным преобразованиям. В качестве векторов признаков используются дескрипторы Фурье и дескрипторы функций длины хорды, описание которых дано соответственно в разделах §4.3 и §4.4. С целью уменьшения размерности векторов признаков символов и повышения надёжности распознавания текста, в настоящей работе применяются метод главных компонент и метод линейного дискриминантного анализа (раздел §4.5), позволяющие получить проекцию вектора признаков на пространство меньшей размерности, причём линейный' оператор проектирования задаётся на основе данных обучающего-набора: Применение,,^ данных методов позволяет классифицировать символ поиском минимального евклидова расстояния между проекциями вектора признаков распознаваемого символа и проекцией вектора признаков символа из обучающего набора.

Распознанный текст подвергается процедуре коррекции, заключающейся в проверке слов текста по словарю. Так, если распознаваемое слово не найдено в словаре, осуществляется поиск словарного слова той же длины, символы которого обеспечивают минимальное суммарное отклонение от символов распознаваемого слова. Описание метода коррекции результатов распознавания приведено в разделе §6.4.

На основе описанных выше методов в настоящей работе реализована программная оболочка, предназначенная для распознавания рукописных и печатных символов русского языка. В главе 5 содержится описание интерфейса и программной структуры данной оболочки.

В настоящей работе получены смежные результаты, непосредственно связанные с проблемой распознавания рукописных текстов. Так, раздел §4.2 содержит описание метода моделирования и распознавания символов русского языка на основе их представления алгебраическими кривыми высоких порядков. В главе 2 исследуются методы распознавания примитивов (прямых и окружностей) на изображении на основе интегральных преобразований Радона и формулируются собственные алгоритмы распознавания примитивов без использования аккумулятора. В разделе §3.4 получен быстрый алгоритм распознавания окружностей на основе инверсных преобразований пространства изображения.

Потенциальная область применения полученных в настоящей работе алгоритмов и программной оболочки достаточно широка, вследствие применения методов распознавания символов на основе выделения векторов признаков, устойчивых к аффинным преобразованиям изображения, что является шагом вперёд по сравнению с существующими программными продуктам распознавания текстов, использующих методы распознавания на основе шаблонов. Стоит отметить, что на момент написания настоящей работы существует единственная коммерческая система с закрытым кодом распознавания изолированных рукописных символов и печатных текстов на основе выделения признаков - Kadmos OCR/ICR [92].

Положения, выносимые на защиту

1. Разработаны теоретические основы алгоритмов распознавания прямых и окружностей без использования пространства «аккумулятора», двойственного исходному изображению.

2. Разработаны теоретические основы быстрого алгоритма поиска окружностей на изображении методом инверсий.

3. Разработана теория алгоритма и реализован алгоритм моделирования и распознавания рукописных символов алгебраическими кривыми.

4. Реализован алгоритм выделения и классификации алгебраических кривых на изображении.

5. Исследовано прменение дескрипторов функций длины хорды к распознаванию рукописных символов русского языка.

6. Разработан алгоритм сегментации рукописных и печатных текстов на основе анализа диаграмм Вороного.

7. Развита теория и разработан алгоритм определения угла наклона рукописных и печатных текстов на основе анализа диаграмм Вороного. ч

8. Алгоритмы объединены в пакет программных оболочек

Список литературы диссертационного исследования кандидат физико-математических наук Сорокин, Андрей Игоревич, 2010 год

1. Электронный ресурс. ABBYY FineReader — URL: http://finereader.abbyy.com. Дата обращения: 01.11.2009

2. Электронный ресурс. OmniPage OCR Software — URL: http://www.nuance.com/omnipage/. Дата обращения: 01.11.2009

3. Электронный ресурс. I.R.I.S. OCR software and Document Management solutions - URL: http://www.irislink.com/ Дата обращения: 01.11.2009

4. Электронный ресурс. OCR CuneiForm. Система оптического распознавания текстов. URL: http://www.cuneiform:ru/. Дата обращения: 01.01.2009

5. Электронный ресурс. ABBYY FormReader 6.5 Enterprise Edition — URL: http://www.abbyy.ru/formreader/enterprise. Дата обращения: 01.01.2009

6. Электронный ресурс. Государственный архив РФ URL: http://garf.ru. Дата обращения: 01.01.2009.

7. Дьяконов И. М. Письмо / И. М. Дьяконов // БСЭ. 3-е изд. - М., 1975. -Т. 19.-С. 571-577.

8. Распознавание примитивов на изображении : Св-во о государственной регистрации программы для ЭВМ № 2008612938 / А. И. Сорокин, С. А. Запрягаев. М., 2008. - 57 с. - (Заявка № 2008611720; Заявлено 21.04.08; Зарегистрировано 18.06.08).

9. Прэтт У. Цифровая обработка изображений : в 2 т. / У. Прэтт. — М. : Мир, 1982.-Т. 1.-312 с.

10. Яне Б. Цифровая обработка изображений / Б. Яне. — М. : Техносфера, 2007. 584 с.

11. Patent US 1117184. Handwriting Récognition User Interface with a Stylus / H. E. Goldberg. US Patent ,1915.

12. Plamondon R. Online and off-Line Handwriting Recognition: a Comprehensive Survey / R. Plamondon, S. Srihari // Pattern Analysis and Machine Intelligence, IEEE Transactions. 2000. - Vol. 22, No. 1. - P. 6384.

13. Guerfali W. Normalizing And Restoring On-line Handwriting / W. Guerfali, R. Plamondon //Pattern Recognition. 1993.- Vol. 26, No. 3.-P. 419-431.

14. Tapia E. Understanding Mathematics: A System for the Recognition of Online Handwritten Mathematical Expressions : Dissertation / E. Tapia. — Berlin, 2004. 109 p.

15. Sezgin M. Survey Over Image Thresholding Techniques and Quantitative Performance Evaluation / M. Sezgin, B. Sankur // Journal of Electronic Imaging.-2004.-Vol. 13,No. l.-P. 146-168.

16. Shafait F. Efficient Implementation of Local Adaptive Thresholding Techniques Using Integral Images / F. Shafait, D. Keysers, T. Breuel // Proc. SPIE. -2008. Vol. 6815. - P. 10-15.

17. Shapiro L. Computer Vision / L. Shapiro, G. Stockman // Filtering and Enchancing Images. Prentice Hall, 2002. - P. 145-205

18. Jansen M. Empirical Bayes Approach to-Improve Wavelet.Thresholding.;^ for Image Noise Reduction / M. Jansen, A. Bultheel // Journal of the American Statistical Association. 2001. - Vol. 91, No. 454. - P. 629-639

19. Shafait F. Performance Comparison of Six Algorithms for Page Segmentation / F. Shafait, D. Keysers, T. Breuel // 7th IAPR Workshop on Document Analysis Systems. 2006. - Vol. 3872. - P. 368-379.

20. Kise K. Segmentation of page images using the area voronoi diagram / K. Kise, A. Sato, M. Iwata // Computer Vision and Image Understanding. — 1998. Vol. 3, No. 70. - P. 370-382.

21. Nandini N. Estimation of Skew Angle in Binary Document Images Using Hough Transform / N. Nandini, M. K. Srikanta, G. H. Kumar // PWASET. 2008. - Vol. 32, Issue 2070-3740.

22. Duda R. O. Use of the Hough Transformation to Detect Lines and Curves in Pictures / R. O. Duda, P. E. Hart // ACM. 1972. - Vol.15, No.l. - P. 1115.

23. Huang C. Word Segmentation of Off-Line Handwritten Documents / C. Huang, S. Srihari // CEDAR. Buffalo, NY (USA ), 2008. - 5 p|

24. Cole Luke. Visual Object Recognition using Template Matching Robotic / Luke Cole, Austin D., Lance Cole // Systems Lab, RSISE National ICT, Australia, Australian National University. 2004.

25. Gavrila D. M. Fast Correlation Matching in Large (Edge) Image Databases / D. M. Gavrila, L. S. Davis // Computer Vision Laboratory Center for Automation Research University of Maryland College Park. 1994.

26. Nixon M. Region Descriptors / M. Nixon, A. Aguado // Feature Extraction and Image Processing. Oxford; N.Y., 2002. - P. 278-280.

27. Аминов Ю. А. Дифференциальная геометрия и топология кривых / Ю. А. Аминов. -М. : Наука, 1987. 160 с.

28. Hu М. К. Visual Pattern Recognition by Moment Invariants / M. K. Hu // IRE Trans. Information Theory. 1962. - P. 179-187.

29. Teague M. R. Image Analysis by the General Theory of Moments / M. R. Teague // J. Opt. Soc. Am. 1980. - Vol. 70. - P. 920-930.

30. Cosgriff R. L. Identification of Shape / R. L. Cosgriff; Ohio State University Research Foundation. Columbus, Ohio (USA), 1960. - Report 820-11.

31. Zahn С. Т. .Fourier Descriptors.for-Plane Closed Curves / С. ,T- Zahn, R. Z. -Roskies // IEEE Transactions on Computers. 1972. - Vol. C21. - P. 269- ' ' 281.

32. Jain A.K. Image Transforms / A. K. Jain // Fundamentals of Digital Image Processing. Upper Saddle River; N.J. : Prentice-Hall, 1989. - P. 132-163.

33. Theodoridis S. Feature Generation: Linear Transform / S. Theodoridis, K. Koutroumbas // Pattern Recognition. San-Diego;CA, 2003. - P. 230-239.

34. A Hidden Markov Models combination framework for handwriting recognition / T. Artieres, L. Gauthier, P. Gallinari, B. Dorizzi // IJDAR -2002. Vol. 5. - P. 233-243.

35. Lallican P. M. From off-line to On-Line Handwriting Recognition / P. M. Lallican, C. Viard-Gaudin, S. Knerr // Proceedings of the Seventh International Workshop on Frontiers in Handwriting Recognition. — Amsterdam, 2000; P. 303-312.

36. Kittler J. Minimum Error Thresholding / J. Kittler, J. Illingworth // Pattern Recognition. 1986. - Vol. 19. - P. 41-47.

37. Niblack W. An Introduction to Digital Image Processing / W. Niblack. — Prentice Hall.- 1986.-P. 115-116.

38. Shapiro L. Computer Vision / L. Shapiro, G. Stockman // Binary Image Analysis. Prentice Hall, 2002. - P. 75-86.

39. Ritter G. X. Image Algebra / G. X. Ritter, J. N. Wilson // Handbook of Computer Vision Algorithms in Image Algebra CRC Press, 2001. — P. 450.

40. Павлидис Т. Алгоритмы машинной графики и обработки изображений /Т. Павлидис; пер. с англ. — М.: Радио и связь, 1986. 400 с.

41. Couprie М. Note on Fifteen 2D Parallel Thinning Algorithms / M. Couprie; Institut Gaspard-Monge. Paris, France, 2006. - Technical Report IGM 2006-01.-21 P.

42. Гонсалес,Р.-Цифровая обработка изображении /.Р. Гонсалес, Р. Вудс //. Морфологическая обработка изображений. М., 2006. - С. 747-811.

43. Freeman Н. On the encoding of arbitrary geometric configurations / H. Freeman // IRE Trans. Electron. Comput. EC-10. 1961. - P. 260-268.

44. Ritter G. X. Image Features and Descriptors / G. X. Ritter, J. N. Wilson // Handbook of Computer Vision Algorithms in Image Algebra. CRC Press, 2001.-P. 278-283.

45. Хелгасон С. Преобразование Радона / С. Хелгасон. М. : Мир, 1983 — 152 с.

46. Patent US 3069654. Method and Means for Recognizing Complex Patterns / P.V.C. Hough. US Patent, 1962.50.3ap P. Теория углового момента :0 пространственных.эффектах в* физике и химии / Р. Зар. М.: Мир, 1993. - 351 с.

47. Котляр В. В. Кольцевое преобразование Радона / В. В. Котляр, А. А. Ковалев / Компьютерная оптика. 2003. — Вып. 25. - С. 126-133.

48. Баранов В. Г. Кольцевое преобразование Радона / В. Г. Баранов, А. Г. Храмов // Компьютерная оптика. 2002. — Вып. 23. - С. 44-47.

49. Ginkel M. A Short Introduction to the Radon and Hough Transforms and How They Relate to Each Other / M. Ginkel, C. L. Hendriks, L. J. Vliet // QI-2004-01.-2004.-llp.

50. Toft P. The Radon Transform Theory and Implementation : — PhD Thesis / P. Toft. - Denmark, 1996. - 192 p.

51. Ballard D. The Hough Method for Curve Detection / D. Ballard // Computer Vision. -Englewood Cliffs; N.J.: Prentice-Hall.-1982. P. 123-126.

52. Tarel J.-P. Covariant Conies Decomposition of Quartics for 2d Object Recognition and Affine Alignment / J.-P. Tarel, W. F. Wolovich, D. B. Cooper // ICIP'98. Chicago, 1998. - P. 818-822.

53. Lei Z. 3L Fitting of Higher Degree Implicit Polynomials / Z. Lei, M. M. Blane, D. B. Cooper // Proceeding 3rd IEEE Workshop on Applications of Computer Vision. Sarasota, 1996. - P. 148-153.

54. Tasdizen T. Improving the Stability of Algebraic Curves for Applications / T. Tasdizen, J.-P. Tarel , D. B. Cooper // Image Processing : IEEE Transactions. 2000. - Vol. 9, No. 3. - P. 405-416.

55. Новейшие методы обработки изображений / А. А. Потапов, А. А. Пахомов, С. А. Никитин, Ю. В. Гуляев // Линия с точки зрения математика. М., 2008. - С. 41-53.

56. Doncel V. R. An Optimal Detector Structure for the Fourier Descriptors Domain Watermarking of 2D Vector Graphics / V. R. Doncel, N. Nikolaidis, I. Pitas // IEEE Transactions on Visualization and Computer Graphics. 2007. - Vol. 13, No. 5. - P. 851-863.

57. Nixon M. Feature Extraction by Shape Matching / M. Nixon, A. Aguado // Feature Extraction and Image Processing. Oxford; N.Y., 2002. - P. 247277.

58. Широкополосные беспроводные сети передачи информации / В. М Вишневский, А. И. Ляхов, С. Л. Портной, И. В. Шахнович. — М. : Техносфера, 2005. 592 с.

59. Wang В. Shape Matching Using Chord-Length Function / В. Wang, С. Shi // IDEAL. 2006. - P. 746-753

60. Wang B. A Novel Fourier Descriptor for Shape Retrieval / B. Wang, C. Shi // FSKD. 2006. - P. 822-825

61. Прикладная статистика / С. А. Айвазян, В. М. Бухштабер, И. С. Енюков, Л. Д. Мешалкин. М., 1989. - Т. 3 : Классификация и снижение размерности. - С. 334-344.

62. Lay D. Linear Algebra and Its Applications / D. Lay. 3rd Updated Edition. - Redwood, 2005. - P. 426-445.x

63. Shlens J. A Tutorial on Principal Component Analysis / J. A. Shlens; Systems Neurobiology Laboratory, Salk Insitute for Biological Studies. -La Jolla, CA(USA), 2007. 13 p.

64. Fukunaga K. Introduction to Statistical Pattern Recognition / K. Fukunaga.- San Diego, 1990. P. 445-466.

65. Препарата Ф. Вычислительная геометрия: Введение / Ф. Препарата, М. Шеймос. М.: Мир, 1989. - 295 с.

66. Fortune S. A Sweepline Algorithm for Voronoi Diagrams / S. Fortune // Proceedings of the Second Annual Symposium on Computational Geometry. Yorktown Heights, N. Y., 1986. - P. 313-322.

67. Berg M. Computational Geometry Algorithms and Applications / M. Berg, O. Cheong, M. Kreveld, M. Overmars. 3rd Edition. — Berlin : SpringerVerlag, 2008.-386 p.

68. Kise K. On the Application of Voronoi Diagrams to Page Segmentation / K. Kise, M. Iwata., M. Keinosuke // Department of Computer and Systems Sciences, Osaka Prefecture University . Osaka, Japan, 1998. — 4 p.

69. Wang Z. Word Extraction Using Area Voronoi Diagram / Z. Wang, Y. Lu, C. Lim С. // CVPRW '03. Madison, 2003. - P. 31-36.

70. Сорокин А. И. Определение ориентации текста на основе диаграмм Вороного / А. И. Сорокин // Информатика : проблемы, методология, технологии : материалы X междунар. науч.-метод. конф., Воронеж, 1112 февр. 2010 г. Воронеж, 2010. - Т. 2. - С. 232-236.

71. Электронный ресурс. Лебедев А. И. Словарь русского языка для ,. ■■ ispell - URL: http://sconl55.phys.msu.su/~swan/orthography.html /. Дата обращения: 01.11.2009

72. Электронный ресурс. International Ispell URL: http://fmg-www.cs.ucla.edu/geoff/ispell.html/. Дата обращения: 01.11.2009

73. Электронный ресурс. KADMOS ICR / OCR Engine URL: http://fmg-www.cs.ucla.edu/geoff/ispell.html /. Дата обращения: 01.11.2009. -http://rerecognition.com/wwwre/htm/english.htm

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.