Модели и технологии поверхностного понимания текста

Королев, Алексей Николаевич

Модели и технологии поверхностного понимания текста тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат технических наук Королев, Алексей Николаевич

Королев, Алексей Николаевич
кандидат технических наук
2002

Специальность ВАК РФ05.13.18

Количество страниц 104

Королев, Алексей Николаевич. Модели и технологии поверхностного понимания текста: дис. кандидат технических наук: 05.13.18 - Математическое моделирование, численные методы и комплексы программ. Москва. 2002. 104 с.

Оглавление диссертации кандидат технических наук Королев, Алексей Николаевич

Введение.

Глава 1. Существующие подходы к пониманию текста.

1.1. Проблемы разработки Ь-процессоров.

1.2. Формально-лингвистический подход.

1.3. Глубинное понимание уэ. Поверхностное понимание.

1.4. Психологические аспекты понимания.

Глава 2. Модель поверхностного понимания текста.

2.1. О вводимой терминологии.

2.2. Определение поверхностного понимания текста.

2.3. Представление понятого текста.

2.4. Единицы анализа.

2.5. Роль морфологического анализа в поверхностном понимании

2.5.1. «Псевдоморфология» на основе нечеткого поиска.

2.5.2. Упрощенный морфологический анализ (лемматизация).

2.5.3. Детальный морфологический анализ.

2.6. Окно анализа.

2.7. Шаблоны устойчивых конструкций.

2.8. Фонетический аспект понимания текста.

2.9. Графический аспект понимания текста.

Глава 3. Линейный синтаксический анализ.

3.1. Однопроходный линейный синтаксический анализ.

3.1.1. Вычленение предложения из текста.

3.1.2. Вычленение слова из предложения.

3.1.3. Применение синтаксических правил к единице анализа.

3.2. Структура правила синтаксического анализа.

3.2.1. Каузальная часть правила.

3.2.2. Актуальная часть правила.

3.3. Синтаксические отношения.

3.3.1. Актантные синтаксические отношения.

3.3.2. Атрибутивные синтаксические отношения.

3.3.3. Сочинительные синтаксические отношения.

3.3.4. Служебные синтаксические отношения.

3.4. База правил.

3.4.1. Структура базы правил.

3.4.2. Требования к базе правил.

Глава 4. Применимость поверхностного понимания текста.

4.1. Критерии оценки результатов поверхностного понимания текста.

4.1.1. Связность.

4.1.2. Полнота.

4.2. Применимость поверхностного понимания текста к текстам на различных естественных языках.

4.3. Зависимость качества результатов поверхностного понимания текста от размеров окна анализа.

Глава 5. Обучение и настройка Z-процессора в модели поверхностного понимания текста

5.1. Предморфологические знания.

5.2. Морфологические знания.

5.2.1. Морфологические знания, необходимые для реализации псевдоморфологического анализа средствами нечеткого поиска.

5.2.2. Морфологические знания, необходимые для лемматизации.

5.2.3. Морфологические знания, необходимые для реализации полномасштабного морфологического анализа.

5.3. Фразеологические знания.

5.4. База шаблонов устойчивых языковых конструкций.

5.5. База правил линейного однопроходного анализа текста.

5.6. Знания о семантических связях между словами и/или семантическими объектами.

5.7. Обучение в модели поверхностного понимания текста.

Глава 6. Реализация поверхностного понимания текста.

6.1. Общие вопросы программной реализации поверхностного понимания текста в виде L-процессора.

6.2. Модули L-процессора.

6.2.1. Базовый модуль ¿-процессора IprcO 1 ru.dll/lprcOlen.dll.

6.2.2. Модуль предморфологического анализа (токенизации) ltok01ru.dll/ Itok01en.dll

6.2.3. Модуль морфологического анализа lmor*.dll.

6.2.4. Модуль синтакто-семантического анализа lrulO 1 ru.dll/lrulOlen.dll.

6.2.5. Модуль оптимизации семантического представления Isem01ru.dll/lsem01en.dll

6.3. Представление данных в L-процессоре.

6.3.1. Представление текста.

6.3.2. Представление токенизированого текста.

6.3.3. Представление морфологической информации.

6.3.4. Семантическое представление текста.

6.3.5. Формат файла таблицы перекодировки.

6.3.6. Формат файла с системой регулярных выражений токенизации.

6.3.7. Формат файла с системой регулярных выражений определения границ предложения.

6.3.8. Формат файла морфологического словника.

6.3.9. Формат файла правил отсечения.

6.3.10. Формат файла базы правил анализа.,.

6.3.11. Формат файла «семантической сети» тезауруса .Error! Bookmark not

6.3.12. Формат файла описания связей тезауруса.Error! Bookmark not

Глава 7. Поверхностный синтез текста.

7.1. Поверхностный синтез текста.

7.2. Поверхностный перевод текста.

Введение диссертации (часть автореферата) на тему «Модели и технологии поверхностного понимания текста»

Актуальность работы:

Одним из наиболее важных направлений искусственного интеллекта является работа с текстами на естественном языке. К этому направлению можно отнести целый ряд задач: машинный перевод, классификация текстов, построение систем с интерфейсом на естественном языке, интеллектуальный полнотекстовый поиск и многое другое.

Принято называть программные системы, решающие такого рода задачи, лингвистическими процессорами или ¿-процессорами. Z-процессор по сути своей ориентирован на решение двух прямо противоположных задач: лингвистического анализа (т.е. преобразования текста на естественном языке в его внутреннее семантическое представление) и обратного ему лингвистического синтеза.

Начало работ по разработке Z-процессоров относится к концу 1940-х - началу 1950-х годов и связано, прежде всего, с машинным (или автоматическим) переводом. Идея машинного перевода во многом, хотя и не во всем обязана своим происхождением практическим нуждам. В указанный период существенно возрос поток научно-технической информации, а отслеживание этого потока в условиях напряженного и дорогостоящего научно-технического соперничества стало весьма насущной задачей. В полной мере решить ее средствами традиционного, «человеческого» перевода не представлялось возможным.

Теоретической основой начального периода работ по машинному переводу был взгляд на язык как кодовую систему. Пионерами машинного перевода были математики и инженеры. Описания их первых опытов, связанных с использованием только что появившихся ЭВМ для решения криптографических задач, были опубликованы в США в конце 1940-х годов. Датой рождения машинного перевода как исследовательской области обычно считают март 1947; именно тогда Уоррен Уивер в своем письме Норберту Винеру впервые поставил задачу машинного перевода, сравнив ее с задачей дешифровки, а после ряда дискуссий составил в 1949 меморандум, в котором теоретически обосновал принципиальную возможность создания систем машинного перевода. Вскоре началось финансирование исследований.

Помимо очевидных практических нужд важную роль в становлении машинного перевода сыграло то обстоятельство, что предложенный в 1950 английским математиком А.Тьюрингом знаменитый тест на разумность («тест Тьюринга») фактически заменил вопрос о том, может ли машина мыслить, на вопрос о том, может ли машина общаться с человеком на естественном языке таким образом, что тот не в состоянии будет отличить ее от собеседника-человека. Тем самым вопросы компьютерной обработки естественно-языковых сообщений на десятилетия оказались в центре исследований по кибернетике (а впоследствии по искусственному интеллекту), а между математиками, программистами и инженерами-компьютерщиками, с одной стороны, и лингвистами - с другой установилось продуктивное сотрудничество.

В 1954 общественности были предъявлены первые результаты: фирма IBM совместно с Джорджтаунским университетом (США) успешно осуществили первый эксперимент (вошедший в историю под названием Джорджтаунского), в ходе которого система, использовавшая словарь из 250 слов и грамматику из 6 синтаксических правил, осуществила перевод 49 заранее отобранных предложений. В том же 1954 первый эксперимент по машинному переводу был осуществлен в СССР И.К. Вельской и Д.Ю. Пановым в Институте точной механики и вычислительной техники Академии наук СССР, а первый промышленно пригодный алгоритм машинного перевода и система машинного перевода с английского языка на русский на универсальной вычислительной машине были разработаны коллективом под руководством Ю.А. Моторина. После этого работы начались во многих информационных институтах, научных и учебных организациях страны.

В начале 1960-х годов первоначальный эйфорический этап в развитии систем компьютерной обработки текстов на естественном языке завершился, чему в сильнейшей степени способствовала публикация так называемой «Черной книги машинного перевода» - доклада Специального комитета по прикладной лингвистике (ALPАС) Национальной академии наук США, в котором была констатирована невозможность создания в обозримом будущем универсальных систем высококачественного машинного перевода. Следствием этой публикации было сокращение финансирования и общее снижение интереса к проблематике машинного перевода, однако полного сворачивания исследований, в особенности теоретических, не произошло.

В основу дальнейших исследований легли методы прикладной лингвистики. Важной чертой этих исследований стал растущий разрыв между теоретическим и практическим подходом, который хорошо иллюстрируется примером машинного перевода: В настоящее время в Российской Федерации продолжаются исследовательские работы по системам машинного перевода, основанным на подходе «текст-смысл-текст», не всегда явно проговариваемым лозунгом которого в момент обоснования этого подхода в 1960-х годах был «машинный перевод без перевода, без машин, без алгоритмов». Идея подхода заключается в том, что от лингвиста требуется только декларативное описание фактов языка (т.е. лингвистическая теория, претендующая на особую точность и формализованность), а алгоритмы перевода составят программист и математик. В рамках этих исследований были получены значительные теоретико-лингвистические результаты (в частности, создана теория так называемых лексических функций, нашедшая применение в лексикографии), однако для создания практических систем подобного рода подход оказался недостаточно эффективным. Все практические системы без исключения используют идею переводных соответствий, т.е. в их основе лежит модель «текст-текст» и они реализуют краткую схему перевода.

Сходная ситуация наблюдается и в других областях работы с естественным языком. Формально лингвистический подход, лежащий в основе большого числа академических разработок, обладает рядом свойств, затрудняющих его практическое использование в коммерческих прикладных программных системах. К их числу относится, прежде всего, необходимость в подробном формализованном описании естественного языка - то есть в основе разрабатываемого ¿-процессора должна лежать база лингвистических знаний столь большого объема, чтобы обеспечить исчерпывающее описание языка. Опыт практической реализации этой задачи (например, в рамках модели «Смысл-Текст») не внушает особого оптимизма по этому поводу.

Потребность в исчерпывающем описании языка создает и еще одну проблему - для формально-лингвистических методов важна корректность текста с точки зрения языка: поскольку алгоритмы такого рода предполагают генерацию всех допустимых интерпретаций анализируемого текста с последующим отсечением ошибочных гипотез и/или выбором в пользу наиболее вероятной из них.

Еще один недостаток формально-лингвистических ¿-процессоров - относительно низкая (по отношению к упрощенным коммерческим реализациям) скорость работы, являющаяся прямым следствием высокой сложности используемых алгоритмов.

Перечисленные недостатки формально лингвистических методов компенсируются в долгосрочной перспективе их применения одним несомненным достоинством: в общем случае только формально-лингвистические методы могут гарантировать максимальную точность лингвистического анализа и синтеза.

Психология восприятия говорит нам, что в случае понимания текста человеком механизм, аналогичный формально-лингвистическому ¿-процессору, используется только в тех случаях, когда существует потребность в высокой точности его понимания - то есть тогда, когда человек сталкивается с трудным для понимания текстом или с текстом, который ему по каким-то внешним причинам очень важно понять. Во всех остальных случаях механизм понимания текста носит более простой, более приближенный характер. Ярким образцом такого приближенного понимания текста является так называемое быстрочтение.

Целями диссертационной работы является:

Разработка на основе модели понимания текста человеком при помощи оперативной памяти модели поверхностного понимания текста, основанной на использовании скользящего окна анализа ограниченного размера и линейного однопроходного анализа, ее дальнейшее исследование и программная реализация.

В процессе выполнения работы были решены следующие задачи:

1) Формулирование модели поверхностного понимания текста.

2) Разработка алгоритмов, реализующих отдельные аспекты поверхностного понимания текста.

3) Определение границ применимости модели поверхностного понимания текста.

4) Разработка алгоритмов обучения ¿-процессора, реализующего модель поверхностного понимания текста.

5) Формулирование критериев правильности понимания текста ¿-процессором, реализующим модель поверхностного понимания текста.

6) Постановка задачи поверхностного синтеза и определение возможных путей ее решения.

7) Постановка задачи поверхностного перевода и определение возможных путей ее решения.

8) Определение способов приложения модели поверхностного понимания текста к основным задачам компьютерной лингвистики.

Научная новизна работы:

В противоположность традиционному формально-лингвистическому подходу, предлагаемая модель поверхностного понимания текста основана на моделировании не языка, но процесса понимания текста человеком. По мнению автора, новым является реализация лингвистического анализа текста посредством его линейного однопроходного анализа, использующего окно анализа ограниченного размера для хранения промежуточной контекстной информации.

Практическая ценность работы:

Как уже говорилось выше, в современных программных системах обработки текстов на естественном языке существует значительный разрыв между академическими ¿-процессорами, реализующими, как правило, формально-лингвистический подход, и коммерческими программными продуктами, практически не использующими достижений прикладной лингвистики. Программная реализация предлагаемой в настоящей работе модели поверхностного понимания текста способна занять место между академическими формально-лингвистическими ¿-процессорами и коммерческим программным обеспечением: в силу отказа от формально-лингвистического подхода трудоемкость разработки Z-процессора на базе модели поверхностного понимания относительно невелиа и сравнима с трудоемкостью разработки существующих в настоящее время коммерческих программных систем, решающих аналогичные задачи.

В числе основных приложений, эффективность работы которых может повысить использование Z-процессоров, реализующих модель поверхностного понимания текста, следует прежде всего упомянуть системы машинного перевода, полнотекстовые поисковые системы, вопросно-ответные системы и системы автореферирования.

Основные положения, выносимые на защиту:

1) Модель поверхностного понимания текста.

2) Программная реализация поверхностного понимания текста на основе базы правил.

3) Модель поверхностного перевода текста.

4) Модель поверхностного синтеза текста. Апробация работы:

Результаты работы докладывались и были обсуждены на:

- XLIV научной конференции Московского физико-технического института «Современные проблемы фундаментальных и прикладных наук» (Долгопрудный, 2001);

- V Российской научно-практической конференции «Реинжиниринг бизнес-процессов на основе современных информационных технологий» (Москва, 2001);

- VIII национальной конференции по искусственному интеллекту с международным участием КИИ-2002 (Коломна, 2002);

- конференции «Математические модели сложных систем и междисциплинарные исследования» (Москва, 2002).

Элементы программной реализации модели поверхностного понимания текста были использованы при разработке программного комплекса лингвистического обеспечения полнотекстового поиска «Русский Семантический Сервер» в компании «Весть-МетаТехнология».

Работа имеет следующую структуру:

Работа состоит из введения и восьми глав, каждая из которых разбивается на пункты. Ведется сквозная нумерация таблиц и рисунков. В конце работы представлен список используемой литературы. Нумерация литературы указана в порядке цитирования. При ссылке на литературу порядковый номер статьи или книги указывается в квадратных скобках.

Во введении сформулирована актуальность темы диссертационной работы, сформулированы цели и задачи, научная новизна, практическое значение, а также описана структура работы.

В первой главе дается обзор существующих подходов к проблеме понимания текста. Глава 1 состоит из четырех пунктов.

В первом пункте первой главы рассматривается понятие лингвистического процессора (¿-процессора) и дается краткий обзор истории разработки ¿-процессоров и ставившиеся перед ней задачи.

Во втором пункте первой главы более подробное внимание уделяется формально-лингвистическому подходу к разработке ¿-процессоров. В качестве характерного представителя такого подхода рассматривается модель «Смысл-Текст», формулируются ее сильные и слабые стороны.

В третьем пункте первой главы сопоставляются глубинное (основанное на формально-лингвистическом подходе) и поверхностное понимание. Пример из области разработки вопросно-ответных систем и диалоговых интерфейсных систем - система «Элиза» -позволяет заключить, что ограниченность формально-лингвистического подхода во многом устраняется, если при разработке программной системы вместо модели языка мы берем за основу модель понимания (и/или генерации) текста.

В четвертом пункте первой главы рассматривается психологический аспект проблемы понимания текста на естественном языке человеком. В арсенале психологии восприятия выделяется модель понимания текста, предложенная А.В.Гидлевским и основанная на концепции оперативной памяти - одновременного хранения не более заданного числа (число Ингве-Миллера) слов или иных фрагментов анализируемого текста.

Во второй главе вводится в рассмотрение собственно модель поверхностного понимания текста. Глава 2 состоит из девяти пунктов.

В первом пункте второй главы вводится ряд соглашений об используемой в дальнейшем терминологии и, в частности, объясняются причины выбора термина "поверхностное понимании текста" для описания явления, рассматриваемого в настоящей работе.

Во втором пункте второй главы формулируется модель поверхностного понимания текста как класс алгоритмов построения семантического представления связного текста на естественном языке, основанных на линейном однопроходном анализе текста с использованием для хранения промежуточной информации скользящего окна анализа ограниченного размера.

В третьем пункте второй главы рассматривается семантическое представление текста, порождаемое при его поверхностном понимании. Принимается, что в дальнейшем будет использоваться сетевое семантическое представление текста в виде графа с типизированными связями, в узлах которого помещаются семантические объекты, представленные фреймами.

В четвертом пункте второй главы рассматриваются единицы анализа - элементарные объекты, на которые разбивается анализируемый текст.

В пятом пункте второй главы рассматривается морфологические анализ как важный этап предварительной обработки единиц анализа. Выделяются и сопоставляются три уровня глубины морфологического анализа - псевдоморфологический анализ на базе нечеткого поиска, лемматизация и собственно морфологический анализ.

В шестом пункте второй главы рассматривается окно анализа, служащее основой всей модели поверхностного понимания текста. Уделяется внимание хранению в окне анализа общей для нескольких идущих подряд предложений контекстной информации, служащей для разрешения референций.

В седьмом пункте второй главы дается общее представление о феномене устойчивых языковых конструкций и рассматривается процедура их выделения в тексте при помощи шаблонов устойчивых языковых конструкций.

В восьмом пункте второй главы рассматривается фонетический аспект понимания текста. Основное внимание уделяется поддержке в ¿-процессоре, реализующем поверхностное понимание, «незнакомого» системе естественного языка на основе описания другого языка, родственного первому. Также в этом пункте признается структурообразующая роль ритмо-фонетической составляющей текста при его анализе (понимании).

В девятом пункте второй главы рассматривается графический аспект понимания текста, включающий в себя пространственное расположение фрагментов текста на странице, элементы форматирования текста и типографские выделения, а также нетекстовые и внетекстовые элементы текста.

В третьей главе рассматривается однопроходный линейный анализ текста и его реализация на основе скользящего окна анализа посредством базы правил. Глава 3 состоит из четырех пунктов.

В первом пункте третьей главы рассматривается общая структура алгоритма однопроходного линейного синтаксического анализа и составляющие его модули выделения предложения из текста, выделения слова из предложения и, собственно, применения синтаксических правил к единице анализа.

Во втором пункте третьей главы рассматривается структура правила синтаксического анализа. В каузальной части правила выделяются условия, налагаемые на текущую единицу анализа, на связываемую с ней единицу хранения и на состояние анализатора, а в актуальную его часть - действия над окном анализа, над семантическим представлением текста и над состоянием анализатора.

В третьем пункте третьей главы рассматривается пример синтаксических отношений, могущих использоваться при построении семантического представления текста.

В четвертом пункте третьей главы рассматривается структура базы правил синтаксического анализа и требования, при выполнении которых база правил может считаться корректно построенной.

В четвертой главе рассматриваются критерии оценки результатов поверхностного понимания текста и оценивается зависимость эффективности работы алгоритма поверхностного понимания текста от свойств естественного языка и от характеристик анализируемого текста, от размеров скользящего окна анализа и базы шаблонов устойчивых языковых конструкций. Глава 4 состоит из трех пунктов.

В первом пункте четвертой главы формулируются два критерия оценки семантического представления текста, возникшего вследствие акта его поверхностного понимания -связность и полнота.

Во втором пункте четвертой главы рассматриваются различные характеристики естественных языков и их влияние на качество поверхностного понимания текста. Основное внимание уделяется такой характеристике естественного языка как порядок следования слов.

В третьем пункте четвертой главы оценивается верхняя граница допустимого размера окна анализа в модели поверхностного понимания. Основное внимание при этом уделяется разрешению анафорических и катафорических референций.

В пятой главе рассматривается обучение и настройка ¿-процессора, реализующего модель поверхностного понимания текста. Глава 5 состоит из семи пунктов, соответствующих разбиению базы общей базы лингвистических знаний ¿-процессора на блоки в соответствии с их функциональным назначением.

В первом пункте пятой главы рассматривается блок предморфологических лингвистических знаний, используемых при разбиении текста на предложения и предложения на слова и постулируется, что такие знания могут быть представлены в виде регулярных выражений и/или чувствительно. Как основной метод обучения и настройки блока предморфологических лингвистических знаний предлагается алгоритм их итеративного обучения. В силу общего характера этого алгоритма ссылки на него присутствуют и в последующих пунктах пятой главы.

Во втором пункте пятой главы рассматривается блок морфологических лингвистических знаний. В зависимости от уровня глубины морфологического анализа этот блок служит для поддержки нечеткого поиска, лемматизации и/или собственно морфологического анализа. При нечетком поиске основным фактором обучения является относительный размер и положение аффикса в словоформе, а также, возможно, эталонные нормальные формы слов для сопоставления с ними анализируемой словоформы; в основе более глубинных уровней морфологического анализа лежит база правил отсечения и словник.

В третьем пункте пятой главы рассматривается блок фразеологических лингвистических знаний, сводимых к правилам, аналогичным правилам синтаксического анализа.

В четвертом пункте пятой главы рассматривается база шаблонов устойчивых языковых конструкций. Во многих отношениях этот блок лингвистических знаний ¿-процессора сходен с блоком фразеологических лингвистических знаний.

В пятом пункте пятой главы рассматривается база правил линейного однопроходного анализа текста в контексте ее обучения и настройки.

В шестом пункте пятой главы рассматривается блок знаний о семантических связях между словами и/или семантическими объектами.

В седьмом пункте пятой главы делаются общие выводы о роли и способах обучения и настройки в модели поверхностного понимания текста.

В шестой главе рассматривается программная реализация модели поверхностного понимания текста. Глава 6 состоит из трех пунктов.

В первом пункте шестой главы рассматриваются общие вопросы программной реализации модели поверхностного понимания текста - архитектура, операционная среда, выбор языка программирования и т.п.

Во втором пункте шестой главы рассматриваются отдельные модули разрабатываемого ¿-процессора.

В третьем пункте шестой главы рассматриваются форматы представления анализируемого текста и блоков лингвистических знаний.

В седьмой главе рассматриваются поверхностный синтез и поверхностный перевод текста -два подхода к генерации текста на естественном языке в рамках модели поверхностного понимания текста. Глава 7 состоит из двух пунктов.

В первом пункте седьмой главы рассматривается поверхностный синтез текста - процесс, обратный его поверхностному пониманию и ориентированный в основном на генерацию текста на естественном языке на основе его семантического представления, полученного ранее при его поверхностном понимании. В основе поверхностного синтеза текста лежат шаблоны предложений и общие шаблоны генерируемого текста, а также стилевая коррекция результирующего текста, поэтому такой способ генерации текста более эффективен для узких предметных областей.

Во втором пункте седьмой главы рассматривается процесс поверхностного перевода текста -вариации поверхностного понимания текста, результатом которой служит семантическое представление текста в виде текста на естественном языке. В рамках решения задачи машинного перевода поверхностный перевод сопоставляется с поверхностным пересказом -последовательным поверхностным пониманием и поверхностным синтезом текста.

В восьмой главе рассматриваются приложения поверхностного понимания текста к ряду задач, связанных с анализом текстов на естественном языке. Глава 8 состоит из семи пунктов.

В первом пункте восьмой главы подробно рассматривается задача полнотекстового поиска и приложение к ней поверхностного понимания текста. В рамках общей задачи полнотекстового поиска выделяется ряд подзадач лингвистического характера (поиск слова в любой словоформе, снятие омонимии, учет сочетаемости слов, поиск по фразеологизмам и устойчивым языковым конструкциям, отсечение шумовой составляющей текста, поиск нетекстовой информации и учет семантики при поиске), которые и рассматриваются более подробно.

Во втором пункте восьмой главы рассматривается применение поверхностного понимания текста при построении приложений Интернет - прежде всего, поисковых. Отдельно рассматривается применение поверхностного понимания текста в распределенных (реег4о-реег) программных системах.

В третьем пункте восьмой главы рассматривается приложение поверхностного понимания текста к двум типам систем машинного перевода - автоматическим и автоматизированным.

В четвертом пункте восьмой главы рассматривается приложение поверхностного понимания текста к диалоговым системам. Отдельно рассматриваются диалоговые системы без целеполагания и диалоговые системы с целеполаганием.

В пятом пункте восьмой главы рассматривается приложение поверхностного понимания текста к задачам классификации.

В шестом пункте восьмой главы рассматривается приложение поверхностного понимания текста к задачам автореферирования.

В седьмом пункте восьмой главы рассматривается приложение поверхностного понимания текста к задачам визуализации.

Список литературы диссертационного исследования кандидат технических наук Королев, Алексей Николаевич, 2002 год

1. Апресян Ю.Д., Богуславский И.М., Иомдин Л.Л. и др. Лингвистическоеобеспечение в системе автоматического перевода третьего поколения. - М.: Научный Совет по комплексной проблеме "Кибернетика" при Президиуме АН СССР, 1978.

2. Поспелов Д.А. История искусственного интеллекта до середины 80-хгодов. // Новости искусственного интеллекта - 1994 - №4, 70-90 с.

3. Апресян Ю.Д., Богуславский И.М. и др. Лингвистическое обеспечениесистемы ЭТАП-2. - М.: Наука, 1989.

4. Попов Э.В. Обп.;ение с ЭВМ на естественном языке. - М.: Наука, 1982.

5. Гидлевский A.B. Разработка концептуальных основ и методовпсиходидактического проектирования для систем дистанционного образования //http://pages.omspu.omsk.ru/gid/

6. Ингве В. Гипотеза глубины//Новое в лингвстике. Вьш.4. - М. 1965. 126-138.

7. Миллер Дж.А. Магическое число семь плюс или минус два//Психологияпамяти. - М.: Че Ро. 2000. 564 - 582.

8. Ван Дейк Т., Кинч В. Стратегии понимания связного текста. // Новое взарубежной лингвистике. Вып. 23. М., 1998. 158-159.

9. Ашманов И.С. Назиональные особенности поисковых систем // Компьютер вшколе - 2000 - №1. 27-34.

10. Басе Э.М. Научная и деловая корреспонденция. Английский язык. // Каф.Иностранных языков АН СССР; Отв. Редактор Н.И. Гуро. - М.:Наука, 1991.176 с.

11. Валдисоо М.Н., Вуут Э.В., Койт М.Э. Об одном подходе к разработкеинтеллектуальной диалоговой системы // Труды конференции КИИ-2002. М.гФизматлит, 2002. 389-397.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.

Модели и технологии поверхностного понимания текста тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат технических наук Королев, Алексей Николаевич

Оглавление диссертации кандидат технических наук Королев, Алексей Николаевич

Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Семантические словари в автоматической обработке текста: По материалам системы ДИАЛИНГ2001 год, кандидат технических наук Сокирко, Алексей Викторович

Введение диссертации (часть автореферата) на тему «Модели и технологии поверхностного понимания текста»

Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Автоматическая рубрикация новостных сообщений средствами синтаксической семантики2014 год, кандидат наук Добров, Алексей Владимирович

Построение модели извлечения информации из технических текстов2006 год, кандидат филологических наук Бабина, Ольга Ивановна

Список литературы диссертационного исследования кандидат технических наук Королев, Алексей Николаевич, 2002 год