Методы и алгоритмы обнаружения наложенных текстовых символов в системах распознавания изображений со сложной фоновой структурой тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Зотин, Александр Геннадьевич

  • Зотин, Александр Геннадьевич
  • кандидат технических науккандидат технических наук
  • 2007, Красноярск
  • Специальность ВАК РФ05.13.01
  • Количество страниц 135
Зотин, Александр Геннадьевич. Методы и алгоритмы обнаружения наложенных текстовых символов в системах распознавания изображений со сложной фоновой структурой: дис. кандидат технических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Красноярск. 2007. 135 с.

Оглавление диссертации кандидат технических наук Зотин, Александр Геннадьевич

ВВЕДЕНИЕ.

ГЛАВА 1. ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ И СИСТЕМ РАСПОЗНАВАНИЯ ПЕЧАТНЫХ ТЕКСТОВЫХ СИМВОЛОВ.

1.1 Общая характеристика подходов к распознаванию печатных текстовых символов.

1.1.1 Сравнение шрифтовых и шрифтонезависимых подходов.

1.1.2 Анализ структуры кириллического и латинского алфавитов.

1.1.3 Классификация шумов при распознавании текстовой информации.

1.2 Технологии обработки и распознавания печатных текстовых символов.

1.2.1 Анализ цветовых моделей.

1.2.2 Улучшение качества изображений.

1.2.3 Сегментация изображений.

1.2.4 Применение нейронных сетей для распознавания текстовой информации.

1.3 Анализ существующего программного обеспечения распознавания печатных символов.

1.4 Выводы.

ГЛАВА 2 РАЗРАБОТКА МЕТОДОВ И АЛГОРИТМОВ ОБНАРУЖЕНИЯ НАЛОЖЕННЫХ ТЕКСТОВЫХ СИМВОЛОВ.

2.1 Предварительная обработка изображения.

2.1.1 Обработка изображения во временной области.

2.1.2 Адаптивная пространственная обработка изображения.

2.2 Сегментация изображений.

2.2.1 Цветовое адаптивное преобразование изображения.

2.2.2 Формирование контурного представления изображения.

2.2.3 Выделение объектов представления изображения.

2.3 Пост-обработка масочного представления изображений.

2.3.1 Первичная обработка масочного представления изображения.

2.3.2 Вторичная обработка масочного представления изображения.

2.4 Формирование образов текстовых символов.

2.4.1 Формирование контурного представления с реконструкцией.

2.4.2 Формирование образов текстовых символов.

2.5 Выводы.

ГЛАВА 3 ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ.

3.1 Функционирование системы распознавания наложенных текстовых символов на изображениях со сложной фоновой структурой.

3.2 Экспериментальное исследование алгоритмов обработки изображения.

3.3 Экспериментальное исследование алгоритмов формирования текстовых зон.

3.4 Исследование качества распознавания образов текстовых символов.

3.5 Выводы.

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Методы и алгоритмы обнаружения наложенных текстовых символов в системах распознавания изображений со сложной фоновой структурой»

Актуальность работы. Современная вычислительная техника достигла такого уровня развития, что в большинстве своём участвует в различных аспектах жизни человека. Машинные методы распознавания — технология, нашедшая применение в целом классе прикладных решений. Наиболее удачной с коммерческой точки зрения и массово востребованной технологией является технология оптического распознавания текстовых символов. Распознавание текстовых символов применимо для обыденного использования (распознавание текста со сканированного материала), использования в профессиональной видео-корректорской сфере (обработка и распознавание субтитров в видеопоследовательностях) [93, 117, 146], специализированного применения в охранной сфере (распознавание номерных знаков транспортных средств, пересекающих контрольно-пропускные пункты, учет подвижного состава при транспортных перевозках), в мультимедийных библиотеках (индексация и поиск цифрового видео) [86, 90, 96, 98-100, 125] и других различных сферах деятельности [111, 120,130, 131,133, 134,144].

Эффективная индексация и поиск цифрового видео является наиболее важной функцией видео базы данных и мультимедийных библиотек [126, 131]. Ключевым элементом для поиска необходимой записи является текст, появляющийся в видеопоследовательности. Существуют два вида текста в видеопоследовательностях: текст сцены (фона) и искусственный (наложенный) текст. Наложенный текст зачастую является носителем важной информации [112, 115]. Поэтому возникает необходимость определения местонахождения, а также извлечение с последующим распознаванием наложенного текста в видеопоследовательности со сложной фоновой структурой изображений. Такие видеопоследовательности, а также статические изображения со сложной структурой фона могут содержать наложенный текст различного вида (несколько вариаций шрифта и цветового оформления). Особое значение для качества распознавания текстовых символов имеет четкое выделение образа текстового символа.

Целью диссертационной работы является разработка методов и алгоритмов для создания системы распознавания наложенных текстовых символов в статических и динамических изображениях со сложной фоновой структурой.

Поставленная цель предопределила необходимость решения следующего комплекса задач:

- Провести анализ подходов для построения систем оптического распознавания текстовых символов, а также методов обнаружения текстовых символов на изображениях со сложной фоновой структурой.

- Провести анализ методов улучшения качества изображения.

- Разработать адаптивный алгоритм сглаживания фонового изображения с одновременным устранением цветовых искажений в предполагаемых текстовых областях.

- Разработать методы и алгоритмы обнаружения наложенных текстовых символов в изображениях со сложной фоновой структурой.

- Разработать методы и алгоритмы выделения образа наложенного текстового символа в статических и динамических изображениях.

- На основе разработанных алгоритмов создать компоненты (модули) для проектирования систем распознавания наложенных текстовых символов в статических изображениях и видеопоследовательностях со сложной фоновой структурой.

- Разработать тестовое программное обеспечение и провести анализ свойств разработанных алгоритмов, а также исследование их эффективности при решении поставленных задач на тестовых выборках.

Методы исследования. При выполнении диссертационной работы использовались методы теории информации, теория обработки сигналов, теория математической морфологии, методы объектно-ориентированного - программирования.

Научная новизна диссертационной работы состоит в следующем:

1. Разработан гибридный метод обнаружения наложенных текстовых зон произвольной ориентации на статических и динамических изображениях со сложной фоновой структурой, использующий цветовое и контурное представления изображения, подвергнутого пространственной и структурной обработке.

2. Разработан метод выделения образов предполагаемых текстовых символов, имеющих сложную многоуровневую цветовую организацию, в обнаруженных текстовых зонах, который основан на реконструированном контурном представлении, а также цветовом и яркостном распределениях.

3. Разработан адаптивный алгоритм фильтрации изображения, в котором подбор размера и формы окна фильтрации, а также самого фильтра происходит на основе карт яркостной разницы, предложена модификация медианного фильтра для повышения степени сглаживания изображения.

4. Разработаны алгоритмы для проведения морфологической обработки, где действия зависят от маски обработки и выполняемой операции (позволяющие значительно сократить количество элементных проверок), также однопроходный алгоритм формирования окаймляющего прямоугольника для фрагмента изображения с расчетом плотности распределения элементов фрагмента.

Реализация результатов работы. Разработанный программный комплекс распознавания номерных знаков транспортных средств (GateKeeper) Версия 1.3 зарегистрирован в Российском реестре программ для ЭВМ г. Москва, 22 апреля 2004 г. (свидетельство №2004610994). Программа фильтрации и морфологической обработки двумерных изображений {FNX Image Processor). Версия 1.9.2 зарегистрирована в Российском реестре программ для ЭВМ г. Москва 11 июля 2007 (свидетельство №2007613017).

Разработанные алгоритмы и программное обеспечение используются в учебном процессе при проведении занятий по дисциплинам «Интеллектуальная обработка данных» и «Компьютерные технологии в науке и образовании» в Сибирском государственном аэрокосмическом университете.

Основные положения, выносимые на защиту:

1. Метод обнаружения текстовых зон произвольной ориентации на изображениях и видеопоследовательностях со сложной фоновой структурой на основе гибридного подхода.

2. Метод выделения образов текстовых символов, имеющих сложную многоуровневую цветовую организацию, с применением контурной реконструкции и анализа цветового и яркостного распределений.

3. Адаптивный алгоритм предварительной обработки изображений на основе карт яркостной разницы.

Апробация работы. Основные положения и результаты диссертации докладывались и обсуждались на 41-й научно-практической конференции студентов, аспирантов и молодых учёных, посвященной Всемирному дню авиации и космонавтики (Красноярск 2003г.), Всероссийской научно-практической конференции «Решетневские чтения» (Красноярск 2003, 2004, 2005, 2006 гг.), Всероссийской научной конференции студентов, аспирантов и молодых учёных «Наука. Технологии. Инновации» (Новосибирск 2003, 2006 гг.), конференции-конкурсе работ студентов, аспирантов и молодых ученых «Технологии Microsoft в информатике и программировании» (Новосибирск 2004 г.), Второй Всероссийской научно-практической конференции студентов «Молодёжь и современные информационные технологии» (Томск 2004 г), Региональном смотре-конкурсе программных проектов «50//-Парад - 2004» (Красноярск 2004 г.), Третьей Всероссийской конференции творческой молодежи, посвященной дню космонавтики «Актуальные проблемы авиации и космонавтики» (Красноярск 2007 г.).

Публикации. По результатам диссертационного исследования опубликовано 20 печатных работ, из них 7 статей, 11 тезисов докладов, 2 свидетельства, зарегистрированных в Российском реестре программ для ЭВМ.

Структура работы. Работа состоит из введения, трех глав, заключения, списка литературы и приложения.

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Зотин, Александр Геннадьевич

3.5 Выводы

Предложена модульная организация построения системы распознавания наложенных текстовых символов на изображения со сложной фоновой структурой. В соответствии с модульной организацией были разработаны библиотеки специальных компонент, на основе которых было создано тестовое программное обеспечение.

Были проведено исследование предлагаемого временного фильтра, в результате выяснено, что установку коэффициентов для коррекции изображения целесообразно назначать в зависимости от динамического диапазона яркости. Значение коэффициента коррекции для темных изображений (яркость в диапазоне 1-84) можно принять равным 4,0-6,5%, для изображений средней яркости (диапазон значения от 85 до 170) - 2,5-3,5% и для изображений, обладающих высокой яркостью (диапазон значений от 171 до 255)- 1,0-2.2%.

В ходе проведенного исследования пространственных фильтров на степень сглаживания изображений, относящихся к различным категориям (мультипликация, живое видео, компьютерная 3£)-анимация), было установлено, что наибольшее сглаживание дает модифицированный медианный фильтр.

При анализе методов формирования контурного представления было установлено, что для поиска текста на изображении целесообразно использование метода Собела (по четырем направлениям) с заданием следующих коэффициентов для каждой категории обработки: для декартовой категории - 5,8 для диагональной категории - 4,2. В свою очередь для выделения символов в текстовой зоне наилучшие показатели были у фильтра Лапласа с отрицательным центральным ядром.

Проанализировав результаты формирования цветового представления можно прийти к выводу о том, что в большинстве случаев для формирования представления для каждого пикселя достаточно проводить анализ цветового влияния в малой области (размер 1-4 пикселя). Для обнаружения же достаточно крупных символов (толщина линий которых более 10 ед.) необходимо проводить масштабирование области.

Метод обнаружения показал лучшие результаты по сравнению со сравниваемыми алгоритмами: при поиске символов размером менее 10 пикселей степень обнаружения составила 92,1 %, а для символов размером более 10 пикселей - 97,3%. Степень ложного срабатывания (обнаружение фрагментов изображения как образов текстовых символов) составила 4,2%.

При проведении тестирования системы распознавания, построенной на основе сети Хемминга, было установлено, что точность распознавания снижается при смещении от идеального положения и искажения образов. В связи с этим было решено применять алгоритм псевдо-трёхмерного анализа, который даёт максимальное увеличение качества распознавания на 9% при коэффициенте смещения до 10 ед.

ЗАКЛЮЧЕНИЕ

В диссертационной работе исследовалась задача обнаружения и выделения наложенных текстовых символов на изображениях со сложной фоновой структурой при построении системы распознавания.

В ходе исследования выполнен сравнительный анализ подходов построения систем распознавания печатных текстовых символов, а также методов распознавания. Выяснено, что для поиска текста на изображениях с произвольной фоновой структурой существуют два основных подхода: использование контурной информации и использовании цветовой информации. В результате проведенного анализа двух алфавитов (русского и английского) были сформированы категории символов, с помощью которых можно добиться повышения качества образов. При обработке изображений также необходимо учитывать возникновение различных дефектов, связанных с сжатием, а также возможным появлением шумов, что в свою очередь снижает качество обнаружения текстовых символов.

Для предварительной обработки изображения были разработаны алгоритмы фильтрации во временной (пороговая стабилизация цветов) и пространственной (адаптивный алгоритм фильтрации на основе карт яркостной разницы) областях. Предложенный алгоритм на основе карт яркостной разницы позволяет осуществлять подбор фильтра и корректировать зону обработки путём изменения ядра фильтра. Также предложен метод обнаружения гибридного типа, использующий цветовое и контурное представления изображения. Для получения цветового представления применяется цветовое адаптивное преобразование. Для формирования контурного представления используется метод Собела по четырём направлениям с изменёнными коэффициентами. Для выделения символов в текстовой зоне наилучшие показатели наблюдались при применении фильтра Лапласа с отрицательным центральным ядром.

Для выделения областей в полученных представлениях был разработан однопроходный алгоритм. Выбор областей, с наибольшей вероятностью содержащих фрагменты текстовых символов, основан на получении блоков распределения, из которых формируются проекции. Анализ проекций позволяет разделять изображения на участки с предполагаемыми символами. Формирование образов текстовых символов происходит с учетом их различных категорий и возможным наклоном.

Для сокращения ложных срабатываний в предложенном методе обнаружения представления подвергаются пост-обработке, которая состоит из первичной обработки, основанной на модифицированной морфологической фильтрации, и вторичной обработки в виде структурно-пространственной проверки областей.

Предложена модульная организация системы распознавания наложенных текстовых символов на изображения со сложной фоновой структурой. В соответствии с модульной организацией были разработаны библиотеки специальных компонентов, на основе которых было создано тестовое программное обеспечение.

Проведены исследования предложенного временного и пространственных фильтров. В результате выяснено, что установку коэффициентов коррекции для временного фильтра целесообразно назначать в зависимости от динамического диапазона яркости изображения. Экспериментальные исследования пространственных фильтров по степени сглаживания изображений (мультипликация, живое видео, компьютерная 3D-анимация) показали, что наибольшее сглаживание дает модифицированный медианный фильтр.

Метод обнаружения показал следующие результаты: при поиске символов менее 10 пикселей степень обнаружения составила 92,1 %, а для символов более 10 пикселей - 97,3%. Степень ложного срабатывания составила 4.2%. В ходе тестирования системы распознавания, построенной на основе сети Хемминга, было установлено, что применение алгоритма псевдо-трёхмерного анализа даёт максимальное увеличение качества распознавания на 9% при коэффициенте смещения до 10 ед.

Полученные результаты позволяют сделать вывод о том, что предложенные методы и алгоритмы обнаружения наложенных текстовых символов на изображениях со сложной фоновой структурой повышают точность обнаружения и увеличивают быстродействия системы распознавания.

Список литературы диссертационного исследования кандидат технических наук Зотин, Александр Геннадьевич, 2007 год

1. Амамия М., Танака Ю. Архитектура ЭВМ и искусственный интеллект. -М Мир, 1993.-400 с.

2. Анцыферов С.С., Евтихиев Н.Н. Адаптивные системы распознавания образов пространственно-временных полей. // Искусственный интеллект. -2004.-№3.-с. 405-416

3. Бакут П, А-, Колмогоров Г, С, Вороновицкий И, Э, Сегментация изображений: методы пороговой обработки //Зарубежная радиоэлектроника 1987, -№10,-С, 6-24,

4. Белан С. М., Моторнюк Р. Л. Сегментация изображений в однородных клеточных автоматах // Вторая Международная научно-методическая конференция «ИНТЕРНЕТ ОБРАЗОВАНИЕ - НАУКА - 2000», Винницкий гос. техн. ун-т, Винницк, 2000 -с. 307-310

5. Богуславский А.А., Соколов С.М Программно-аппаратные средства ввода зрительных данных в память персонального компьютера ИПМ им. М.В.Келдыша РАН Москва, 2002

6. Богуславский Ан. С++ и компьютерная графика. М.: КомпьютерПресс, 2003. - 352 с.

7. Борисов В. В., КругловВ. В. Искусственные нейронные сети. Теория и практика. -М.: Горячая линия-Телеком, 2001. 382с

8. Браверман Э. М„ Мучник И. Б. Структурные методы обработки эмпирических данных. М.: Наука, ГРФМЛ, 1983. - 368 с.

9. Буковецкая О.А. Видео на вашем компьютере. ТВ тюнеры, захват кадра, видеомонтаж, DVD. М.: ДМК Пресс, 2001. - 240 с. ил.

10. Бутаков Е, А„ Островский В. И., Фадеев И. Л, Обработка изображений на ЭВМ, -М: Радио и связь, 1987.-238 с,

11. Бутаков Е.А., Островский В.И., Фадеев И.Л, Обработка изображений на ЭВМ, -М: Радио и связь, 1987.-238 с,

12. Васильев В.Е., Морозов А.В. Компьютерная графика: Учеб. пособие -СПб.: СЗТУб 2005.-101с.

13. Васильев В.И Распознающие системы: Справочник. М.: Радио и связь, 1983. -422с.

14. Ватолин Д., Гришин С. Алгоритм преобразования частоты кадров на основе интерполяции скомпенсированных кадров // Материалы девятого научно-практического семинара "Новые информационные технологии в автоматизированных системах", Москва, 2006. -с. 32-46

15. Вежневец В.П., Андреева А.А., Дегтярева А.А. Сравнительный анализ методов сегментации кожи на цветных изображениях // Доклады 11-й Всероссийской конференции "Математические методы распознавания образов", Москва, 2003 -с.264-265

16. Гайдашев А.Э. Спекл-шум и повышение качества УЗ изображений // MEDCOM 2007

17. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2005. - 1072 с.

18. Горелик А, Л„ Скрипкин В- А. Методы распознавания: Учеб, пособие, 3-е изд, М.: Высшая школа, 1989. - 350 с.

19. Горелик А. Л., Гуревич И, Б„ Скрипкин В, А, Современное состояние проблемы распознавания: Некоторые аспекты. Сер, Кибернетика, М,: Радио и связь, 1985,-160 с,

20. Гуле А. Захват, обработка и хранение видео с использованием ПК.// IXBT 17 октября 2004

21. Заенцев И.В., Нейронные сети: основные модели, Воронеж 1999. -76с

22. Зотин А.Г. Модульный подход к обнаружению «наложенных» текстовых символов из видео-потока // Наука. Технологии. Инновации // Материалы всероссийской научной конференции молодых учёных в 7-ми частях изд-во НГТУ часть 2- Новосибирск 2006 с 72-74

23. Зотин А.Г. Модульный подход к обнаружению текстовых символов в видео-потоке на компонентной основе // материалы X Междунар. науч. конф. «Решетневские чтения» / СибГАУ. Красноярск, 2006. с 298-299

24. Зотин, А.Г. Алгоритмы идентификации и распознавания номеров автомобильных транспортных средств, тезисы / А.Г. Зотин, М.В. Дамов// Технологии Microsoft в информатике и программировании: Тезисы докладов / НГУ. Новосибирск, 2004. -с. 100-102

25. Зотин, А.Г. Анализ использования нейронных сетей для распознавания текстовой информации // Решетнёвские чтения: Тез. докл. VII Всерос. науч. конв. / СибГАУ. Красноярск, 2003. -с. 239

26. Зотин, А.Г. программа фильтрации и морфологической обработки двумерных изображений (FNX Image Processor). Версия 1.9.2

27. Свидетельство №2007613017 Зарегистрировано в Реестре программ для ЭВМ г. Москва, 11 июля 2007 г

28. Зотин, А.Г. Система распознавания регистрационных знаков автомобильных транспортных средств / А.Г. Зотин, М.В. Дамов// Решетнёвские чтения: Материалы. VIII Всерос. науч. конв. с междунар. участием / СибГАУ. Красноярск, 2004. -с. 216-217

29. Зотин, А.Г. Адаптивный метод обнаружения текстовых зон в видеопотоке на основе яркостных карт / А.Г. Зотин // Вестник

30. Сибирского государственного аэрокосмического университета имени академика М.Ф. Решетнёва / Под ред. Проф. Г.П. Белякова; СибГАУ. -Вып. 1(14). Красноярск, 2007. -с. 34-38.

31. Зотин, А.Г. Выделение и распознавание текстовых символов из видеопотока / А. Г. Зотин // материалы Третьей Всерос. Конф. творческой молодежи, посвященной дню космонавтики «Актуальные проблемы авиации и космонавтики» Красноярск 2007г.

32. Зотин, А.Г. Обнаружение текстовых символов в видеопотоке /А.Г. Зотин // материалы IX Междунар. науч. конф. «Решетневские чтения» / СибГАУ. Красноярск, 2005. -с. 308-309

33. Казаков Ф. Видеозапись без видеомагнитофона // "Компьютерра" №25 от 08 августа 2003 года

34. Калинкина Д., Ватолин Д. Проблема подавления шума на изображениях и видео и различные подходы к ее решению // Научно-образовательный сетевой журнал Графика и мультимедиа 2005

35. Каллан Р. Основные концепции нейронных сетей М.:Изд. Дом "Вильяме", 2001

36. Короткий А.С., Нейронные сети: основные положения http://www.orc.ru/~stasson/neurox.html

37. Короткин А.А. Математические модели искусственных нейронных сетей. Уч. пособие, Ярославль, 2000. 168 с.

38. Котович Н. В., Славин О. А. Распознавание скелетных образов. -http://ocraLnarod.ru/skeletrecognize.html.

39. Кузин Алгоритмы и методы предварительной обработки изображений. Методическое руководство лабораторного практикума. // Сост., С.Г. Кузин, А.Ф. Смирнов. Н. Новгород ННГУ, 2001.

40. Куртев Н.Д., Анцыферов С.С. Структурно-стохастический метод обработки и распознавания информации тепловых изображений. // Оптический журнал,№2. Т.64. 1997. -с. 35-37.

41. Кутовенко А. Интернет-поиск изображений: технологии контентного поиска // Компьютерная газета A-Z №48 2006

42. Лисин С. Системы оптического распознавания текста // КОМПЬЮТЕР-ИНФОРМ №16 (132) 23 сентября 6 октября 2002 г.

43. Лукашенко Г, Применение волнового алгоритма для нахождения растрового изображения. — http://ocrai.narod.ru/vectory.html.

44. Маркаров Г. Оцифровка видеокассет: главное — удаление помех журнал "Мир ПК", №12, 2004

45. Миронов Д.Ф. Компьютерная графика в дизайне: Учебник для вузов. -СПб.: Питер, 2003. 224 е.: ил.

46. Мисюрев А. В. Использование искусственных нейронных сетей для распознавания рукопечатных символов. http://ocrai.narod.ru/hp.html.

47. Насакин P. OCR как предмет первой необходимости //КомпьютерПресс №7 2004

48. Никулин Е. Компьютерная геометрия и алгоритмы машинной графики. Серия "Учебное пособие". СПб.: БХВ-Петербург, 2003. - 560 е.: ил.

49. Павлидис Т. Алгоритмы машинной графики и обработки изображений. Пер. с англ. М.: Радио и связь, 1986.

50. Петров М.Н., Молочков В.П. Компьютерная графика: Учебник для вузов. СПб.: Питер, 2002. - 736 е.: ил.

51. Поляков А. Методы и алгоритмы компьютерной графики в примерах на Visual С++. Серия "Мастер". СПб.: БХВ-Петербург, 2002. - 416 е.: ил.

52. Порев В. Компьютерная графика. Серия "Учебное пособие". СПб.: БХВ-Петербург, 2002. - 432 е.: ил.

53. Прэтт У.К. Цифровая обработка изображений: Кн. 1. М.: Мир, 1982. - 792с.

54. Путилин С. Ю. Пространственно-временное подавление шума в видео последовательностях // Международная конференция студентов и аспирантов по фундаментальным наукам "Ломоносов 2005", секция "Вычислительная математика и кибернетика", Москва 2005. с 53

55. Путилин С., Лукин А. Модификация метода нелокального усреднения для подавления шума в видео // Труды конференции Graphicon-2007, -с. 257-259.

56. Рейнбоу В. Компьютерная графика. Энциклопедия. СПб.: Питер, 2003. - 768 е.: ил.

57. Русый Б. П. Структурно-лингвистические методы распознавания изображений в реальном времени. Киев: Наукова думка, 1986, - 127 с.

58. Себастиан Г. Процессы принятия решения при распознавании образов. Киев, 1965.-151 с.

59. Сойфер В.А. Методы компьютерной обработки изображений. М.: "Физматлит", 2004. - 784 с.

60. Соколов Е. Н., Вейткявичус Г. Г. Нейроинтеллекг. От нейрона к нейрокомпьютеру. М.: Наука, 1989. - 240 с.

61. Соловьёв А. Грани документооборота // Бугалтер и Компьютер №9 2005

62. Сэломон Д. Сжатие данных, изображений и звука. М.: Техносфера, 2004. - 339 с.

63. Тимохин В, И. Применение ЭВМ для решения задач распознавания образов: Учеб, пособие, Л.; ЛГУ, 1983 - 215 с.

64. Титаренко А., Ватолин Д. Удаление шума и царапин в старых видеозаписях // Материалы XIII Международной конференции студентов, аспирантов и молодых учёных "Ломоносов", секция "Вычислительная математика и кибернетика", Москва, 2006, -с.52-53

65. Ту Д. Т., Гонсалес Р. К. Принципы распознавания образов: Пер. с англ--М.:Мир 1978,-411 с.

66. Уоссермен Ф. Нейрокомпьютерная техника. Теория и практика. -М: Мир, 1992. -240 с.

67. Фомин Я. И., Савин А, В. Оптимизация распознающих систем. М.: Машиностроение, 1993. 288 с.

68. Форсайт Д.А., Понс Дж. Компьютерное зрение. Современный подход. М.: Издательский дом "Вильяме", 2004. - 928 с.

69. Фу К.С. Структурные методы в распознавании образов: Пер. с англ. -М.: Мир, 1977. -320 с.

70. Шикин Е.В., Боресков А.В. Компьютерная графика. -М.: "Мир" 1995. 220 с.

71. Щепин Е. В., Непомнящий Г. М. К топологическому подходу в анализе изображений. Геометрия, топология и приложения // Межвуз. сб. научн. труд. -М.: Мин. высшего и среди, спец, образ. РСФСР, Московский институт приборостроения, 1990.-е, 13-25.

72. Ян Д.Е., Анисимович К.В., Шамис A.JI. Новая технология распознавания символов. Теория, практическая реализация, перспективы. // М.: Препринт, 1995

73. Abryliuk D., Starovoitov V. Application of Recirculation Neural Network and Principal Component Analysis for Face Recognition // The 2nd International Conference on Neural Networks and Artificial Intelligence, -Minsk, 2001. pp. 136-142,

74. Adams W. H., Iyengar G., Lin C. Y., Naphade M., Neti C., Nock H., Smith J. Semantic indexing of multimedia content using visual, audio, and text cues. II EURASIP J. Appl. Signal Process. 2003, vol. 2, pp. 170-185.

75. Belongie S., Malik J., Puzicha J. Shape matching and object recognition using shape contexts. И IEEE Trans, on Pattern Analysis and Machine Intelligence 2002 vol. 24, no. 4, pp. 509-522.

76. Blake A., IsardM. Active Contours.// Springer-Verlag. 1998

77. Cai M., Song J., Lyu M. R., A new approach for video text detection // Int. Conf. on Image Processing, 2002.

78. Chang S. F., Chen W., Meng H. J., Sundaram H., Zhong D. VideoQ: An Automated Content Based Video Search System Using Visual Cues II ACM Multimedia Conf. Seattle, WA, Nov, 1997.

79. Chen J., Paris S., Durand F. Real-time edge-aware image processing with the bilateral grid И ACM Transactions on Graphics (TOG), ACMSIGGRAPH 2007 vol. 26 no 3

80. Comparison of Demising Filters CS MSU GRAPHICS&MEDIA LAB MOSCOW, 05 APR 2003

81. DeMenthon D., Doermann D, Video retrieval using spatio-tempoal descriptors II ACM Multimedia, 2003.

82. Dementhon D., Megret R. Spatio-temporal segmentation of video by hierarchical mean shift analysis. IIUniversity of Maryland Technical Report LAMP-TR-090, CAR-TR-m, CS-TR-43&&, UMIACS-TR-2002-6S. 2002

83. Dimitrova N., Agnihotri L., Wei G. Video classification based on HMM using text and faces II ACM Multimedia, 2000.

84. Faloutsos C. Searching Multimedia Databases By Content И Kluwer Academic Publishers, Boston, USA, 1996.

85. Fan j„ Luo H., Elmagarmid A. K. Concept-Oriented indexing of video databases: towards more effective retrieval and browsing II IEEE Trans, on Image Processing, 2004 vol. 13, no. 6, pp. 256-263

86. Geveres Т., Smeulders A. W. M. PieToSeek: Combining color and shape invariant features for image retrieval II IEEE Trans. Image Processing, 2000. vol. 9, pp. 102-119

87. Hall J., Greenhill D., Jones G. Segmenting in sequences using active surfaces.// In International Conference on Image Processing 1997. pp. 751-754.

88. Hanjalic A., Lagendijk R., Biemond J. Automated high-level movie segmentation for advanced video-retrieval systems. II IEEE Trans. Circuits Syst. Video Technol. 1999 vol. 9, no. 4, pp. 580-588.104. http://neuron2.net/knrc/knrc.html

89. Hughes A., Wilkens Т., Wildemuth В., Marchionini G. Text or pictures? An eyetracking study of how people view digital video surrogates IICIVR 2003, pp. 271-280.

90. Jain А. К., Yu B. Automatic text location in images and video frames II Pattern Recognition, 1998 vol. 31, no. 12, pp. 2055-2076

91. Kass M., Witkin A., Terzopoulos D. Snakes:Active contour models. II International Journal of Computer Vision 1987 vol. 1, no 4, pp.321-331.

92. Korn A. F. Toward a Symbolic Representation of Intensity Changes in Images II IEEE Transactions on pattern analysis and machine intelligence. 1988. vol. 10, no. 5. pp. 914-919.

93. Lam L., Suen C. Y. An Evaluation of Parallel Thinning Algorithms for Character Recognition II IEEE Transactions on Pattern Analysis and Machine Intelligence. 1995.vol. 17, no. 9. pp.724-737

94. Lam L. M., Lee S. W., Suen C. Y. Thinning Methodologies'. A Comprehensive Survey II IEEE Transactions on Pattern Analysis and Machine Intelligence. 1992. vol. 14. pp. 869-885.

95. Li В., Goh K., Chang E. Confidence-based dynamic ensamble for image annotation and semantic discovery II ACM Multimedia, 2003.

96. Li Н., Doermann D., Automatic Identification of Text in Digital Video Key Frames 11 Proceedings of IEEE International Conference of Pattern Recognition, 1998 pp. 129-132.

97. Luo H., Eleftheriadis A. Spatial temporal active contour interpolation for semi-automatic video object generation. И International Conference on Image Processing (ICIP) 1999 pp. 944-948.

98. Mang H. J., Smith M. A. Kanade Т., Video skiming for quick browsing based on audio and image characterization II Carnegie Mellon Univ., Pittsburgh, PA, Tech. Rep. CMU-CS-95-186, July, 1995.

99. Manjunath B. S., Ma W. Y. Texture Features for Browsing and Retrieval of Large Image Data II IEEE Trans. On Pattern Anal, and Mach. Intell. 1996 vol.18, no. 8, pp.837-842.

100. Mao J., Jain A. Texture classification and segmentation using multiresolution simultaneous autoregressive models И Pattern Recognition 1992 vol. 25 no. 2. pp. 173-188

101. Nack F., Putz W. Saying what it means: Semi-Automated (news) media annotation. II Multimedia Tools Appl. 2004. vol. 22, no. 3, pp. 263-302.

102. Nigam K., McCallum A., Thrun S., Mitchell T. Text classification from labeled and unlabeled documents using EMU Machine Learning, 2000 vol.39, no.2, pp. 195-203

103. Oria V, Ozsu M. Т., Iglinski P., Lin S., Ya B. DISIMA-.A distributed and interoperable image database system ПАСМ SIGMOD International Conference of Management of Data, Dallas, Texas, USA, May 2000 p.600.

104. Pfeiffer S., Lienhart R., Fischer S., Effelsberg W. Abstracting digital movies automatically II Journal of Visual Communication and Image Representation, 1996 vol. 7, no. 4 , pp.345-353

105. Plamondon R., Srinari S, On-Line and Off-Line Handwriting Recognition: A Comprehensive Survey II IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000. vol. 22, no. 1. pp. 914-919.

106. Plamondon R., Suen C. Y., Bourdeau M., Barriere C. Methodologies for Evaluating Thinning Algorithms for Character Recognition II Pattern Recognition and Artificial Intelligence, special issue thinning algorithms. 1993. vol. 7, no. 5. pp. 1247-1270.

107. Qi Y., Liu Т., Hauptmann A. Supervised classification of video shot segmentation IIICME, 2003.

108. Richard Alan Peters II A New Algorithm for Image Noise Reduction using Mathematical Morphology II IEEE Transactions on Image Processing, 1995, vol. 4, no. 3, pp. 554-568

109. Rui Y., Hyang T. S. Mehrota S. Content-based image retrieval with relevance feedback in MARS И IEEE Int. Conf. Image Processing, Santa Barbara, CA, 1997, pp. 815-818.

110. Sato Т., Kanade Т., Hughes E., Smith M., Satoh S. Video OCR: Indexing digital news libraries by recognition of superimposed caption. И Multimedia Syst. 1999 vol. 7, no.5, pp.385-395.

111. Sato Т., Kanade Т., Hughes E. K., Smith M. A. Video OCR for digital news archives II IEEE Int. Workshop on Content-Based Access of Image and Video Database, 1998.

112. Schneiderman H., Kanade T. Object detection using the statistics of parts. II Int. J. Comput. Vision 2004 vol. 56, no.3, pp. 151-177.

113. Schutten R. J. , deHaan G., A. H. M. van Roermund Noise filtering for television receivers with reduced memory II Proc. of the Int. Workshop on HDTV and the Evolution of Television, Taipei, Taiwan, Nov. 1995, pp. 6A15-6A22

114. Sciascio E., Mongiello Di. DrawSearch: A tool for interactive content-based image retrieval over the net И Proc. SPIE, 1999. vol. 3656, pp. 561-572,

115. Smith J. R., Chang S. F. Visualseek: A fully automated content based image query system. II Proc. ACM Multimedia, Boston, MA, Nov, 1996.

116. Smith S. JM Bourgoin M. CX, Sims K., Voorhees H. L. Handwritten character classification using nearest neighbor in large databases HIEEE

117. Transactions on Pattern Analysis and Machine Intelligence. 1994. vol. 22, no. 9. pp. 915-919.

118. Snoek C., Worring M. Multimedia event-based video indexing using time intervals. II IEEE Trans.Multimedia 2005 vol. 7, no. 4, pp.638-647.

119. Snoek C., Worring M. Multimodal video indexing: A review of the state-of-the-art. И Multimedia Tools Appl. 2005 vol. 25, no. 1, pp.5-35.

120. Starovoitov V. V, Samal D. I., Briliuk D. V. Image enhancement for face recognition 11 International conference on iconics. Russia, StPetersburg, 2003.

121. Starovoitov V. V, Samal D. L., Briliuk D. V, Free approaches for face recognition IIThe 6-th International conference on pattern recognition and image analysis. Russia, Velikiy Novgorod, 2002. pp.707-711.

122. Toshio S., Kanade Т., Hughes E. K., Smith M. A., Satoh S. Video OCR: Indexing Digital News Libraries by Recognition of Superimposed Captions. // Yanagi-cho, Multimedia Systems, 1999 vol 7, no 5, pp.385-395

123. Wakahara T. Shape machine using LAT and its application to hand-written character recognition // IEEE Transactions on Pattern Analysis and Machine Intelligence, 1994. vol. 16, no, 6. pp.618-629.

124. Wang W. Q., Gao W., Li J. Т., Lin S. X., News content highlight via fast caption text detection on compressed Video II Int. Conf. on Intelligent Data Engineering and Automated Learning, HongKong, December, 2000.

125. Wu V. , Manmatha R., Riseman E., Finding text in images II 20th Int. ACM Conf. Research and Development in Information Retrieval, 1997 pp. 3-12.

126. Wu V., Manmatha R. Document image clean-up and binarization II In Proc. SPIE Symposium on Electronic Imaging, 1998.

127. Wu V., Manmatha R., Riseman E. M. Textfmder. an automatic system to detect and recognize text in images II IEEE Transactions on Pattern Analysis and Machine Intelligence, 1999 vol. 21, no. 11, pp. 1224-1229

128. Wu V., Manmatha R., Riseman E. M., Finding Text In Images 11 in Proc. of the 2nd Intl. Conf on Digital Libraries. Philadaphia. PA. 1997 pp. 1-10.

129. Wu Y., Tian Q., Huang T. S. Discriminant-EMalgorithm with application to image retrieval II Proc. CVPR, 2000. pp. 222-227

130. Xie L., Xu P., Chang S. F., Divakaran A., Sun H. Structure analysis of soccer video with domain knowledge and hidden Markov models II Pattern Recogn. Lett. 2004 vol. 25, no. 7, pp.767-775.

131. Yang J., Gao J., Zhang Y., Chen X., Waibel A. An automatic sign recognition and translation system II Proceedings of Perceptual User Interface Workshop 2001.

132. Zhang H. J., Wu J., Zhong D., Smoliar S. An integrated system for content-based video retrieval and browsing. II Pattern Recognition. 1997 vol. 30, no. 4, pp. 643-658.

133. Zhong J., Ни J., Bagga A. Combined-Media Video Tracking for Summarization // Proceedings of the ninth ACM international conference on Multimedia 2001 pp 502-505.

134. Zhong Y., Karu K., Jain A. K. Locating text in complex color images II Pattern Recognition. 1995 Vol. 28, pp.1523-1535.

135. Zlokolica V, Pizurica A., Philips W. Recursive temporal demising and motion estimation of video II International Conference on Image Processing, Singapore October 2004

136. Zlokolica V., Pizurica A., Philips W. Video demising using multiple class averaging with Multiresolution II International Workshop VLBV03, Madrid, Spain September 2003

137. ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования

138. Декан факультета, профессор, к.т.н.

139. Зав кафедрой ИВТ, профессор, д.т.н.

140. Доцент кафедры ИВТ, к.т.н.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.