Исследование и разработка теории и методики построения тезаурусов для информационного поиска в полнотекстовых базах данных: На примере тезауруса по безопасности инженерных систем тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат технических наук Жмайло, Светлана Васильевна

  • Жмайло, Светлана Васильевна
  • кандидат технических науккандидат технических наук
  • 2005, Москва
  • Специальность ВАК РФ05.13.17
  • Количество страниц 217
Жмайло, Светлана Васильевна. Исследование и разработка теории и методики построения тезаурусов для информационного поиска в полнотекстовых базах данных: На примере тезауруса по безопасности инженерных систем: дис. кандидат технических наук: 05.13.17 - Теоретические основы информатики. Москва. 2005. 217 с.

Оглавление диссертации кандидат технических наук Жмайло, Светлана Васильевна

ОСНОВНЫЕ СОКРАЩЕНИЯ.

1. Проблема точности н полноты информационного поиска. Определение информационно-поискового тезауруса.

1.1. Проблема точности и полноты информационного поиска в современных базах данных с неограниченным объемом.

1.1.1. Некоторые основные определения информатики.

1.1.2. Задача повышения эффективности поиска научно-технической информации в сети Интернет.

1.13. Опыт исследования эффективности поиска научно-технической информации в сети Интернет.

1.1.4. Возможности повышения эффективности поиска научно-технической информации в сети Интернет с помощью информационно-поискового тезауруса.

1.2. Понятие информационно-поискового тезауруса.

1.3. Динамика публикаций по теме «Информационно-поисковый тезаурус».

1.4. Обзор некоторых современных информационно-поисковых тезаурусов.

2. Информационный поиск как психолннгвистический процесс. Тезаурус как логико-психолингвистическаи модель области знаний.

2.1 .Тезаурус как логико-лингвистическая модель предметной области, или база знаний.

2.2.Информационно-поисковый тезаурус как психологическая модель репрезентации знаний.

2.3. Понятия парадигматики и синтагматики. Парадигматика в ИПТ.

2.4. Лексическое значение.

2.5. Информационный поиск как психолингвистический процесс.

3. Парадигматические отношении как тип ассоциативных отношений. HI

3.1. Понятие ассоциации. Языковая ассоциация.

3.2. Лексические единицы ИПТ и методика их выделения и отбора.

3.3. Ассоциативные и парадигматические отношения между лексическими единицами в языке и тезаурусе. Инвариант смысла в парадигме и прототип категории.

3.4. Типы ассоциативных отношений в текстах и моделирование их в информационно-поисковых тезаурусах.

3.5. Типы лексико-ссмантических ассоциативных отношений с точки зрения типов взаимодействующих лексических значений.

3.5.1. Лекеико-семантические ассоциативные (парадигматические) отношения условной эквивалентности с точки зрения связи типов лексических значений.

3.5.2. Иерархические лексико-семантические ассоциативные (парадигматические) отношения с точки зрения связи типов лексических значений.

3.5.3. Другие типы лексико-семантических ассоциативных (парадигматических) отношений с точки зрения связи типов лексических значений.

3.5.4. Краткие выводы.

4. Опыт построения фрагмента информацнонно-понскового тезауруса по безопасности инженерных систем.

Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Введение диссертации (часть автореферата) на тему «Исследование и разработка теории и методики построения тезаурусов для информационного поиска в полнотекстовых базах данных: На примере тезауруса по безопасности инженерных систем»

Актуальность исследования. В последние годы проблема поискового «шума» и, соответственно, точности информационного поиска перестала быть проблемой профессионалов, превратившись в предмет дискуссий в самых разных сферах общественной жизни. Интернет и современные средства коммуникации, наряду с неоспоримыми преимуществами прямого обращения пользователя к искомой информации, породили массу сложных вопросов и явлений. Ученые заговорили об информационной экологии [73, 82]. «Информационный смог» непрерывно влияет на наш сон, внимание и даже на иммунную систему. Приведем некоторые данные, опубликованные американскими исследователями [82, 47].

• За последние 30 лет в мире произведено больше информации, чем за предшествующие 5000 лет.

• В мире ежедневно записывается около 20 миллионов слов технической информации.

• Средний менеджер прочитывает за неделю до 1 млн. слов.

• В мире ежедневно выходят в свет около 1000 наименований новых книг.

• Ежегодно в США публикуется более 9000 периодических изданий.

• Ежегодно в американских почтовых ящиках оказывается более 60 миллиардов рекламных листков.

• Еженедельное издание New York Times содержит больше информации, чем прочитывал за всю свою жизнь средний англичанин в 17 веке. Преимущества «эры информации» не бесспорны. Появился целый ряд новых терминов, связанных с современным состоянием системы «информация - коммуникационная среда - человек»: информационная перегрузка (information overload), информационное ожирение (information obesity), перепроизводство информации (information overproduction), инфобиологическая неадекватность (info-biological inadequacy) [44].

Последний термин означает несоответствие объема поступающей извне информации тому объему, который может воспринять центральная нервная система человека. Новейшим явлением представляется так называемый «синдром информационной усталости» (information fatigue syndrome) [44, 80], связанный с невозможностью человека справиться с непрерывно возрастающим объемом информации.

Несмотря на появление новых способов создания, обработки, хранения и поиска информации для потребителя проблема доступа к информационным ресурсам и получения релевантных документов обострилась. Это связано как с неограниченным ростом информационных массивов и распространением полнотекстовых баз и банков данных, так и с отходом от лексико-семантического принципа при информационном поиске. В условиях работы с банками данных неопределенных, фактически неограниченных, размеров проблема полноты информационного поиска практически снимается с повестки дня. Зато все острее встает вопрос о точности информации, ее ценности, адекватности потребностям. Исследование возможностей разных поисковых систем и разработка новых методик поиска информации в больших массивах данных - тематика ежегодных международных конференций TREC (Text REtrieval Conference), проводимых Национальным институтом стандартов и технологии (National Institute of Standards and Technology) США. Основное место на конференции TREC занимают доклады по методам автоматического ранжирования найденных документов, разработке критериев эффективности информационного поиска в разных системах, способам достижения наилучшего соотношения полноты и точности информационного поиска [72]. По нашему мнению, для решения последней задачи эффективным может оказаться семантический фильтр — информационно-поисковый тезаурус (ИПТ), или его современный вариант -семантическая сеть.

Поиск по неконтролируемому словарю приводит к гигантским размерам выдачи, колоссальному информационному шуму и потерям релевантных документов. На основании проведенных нами исследований [14] можно утверждать, что точность словарного информационного поиска в разных машинах составляет в среднем 10%. При этом поиск научно-технической информации по ключевым словам в ресурсах Интернет без выявления и использования парадигматических (иерархических и синонимических) отношений между терминами дает в 3,3 раза меньше пертинентных результатов, чем информационный поиск по тем же ресурсам с использованием выявленных парадигматических отношений, то есть для повышения качества поиска необходимо создание тематических тезаурусов, которые помогали бы пользователю при формулировке поискового предписания. В то же время поиск по логическим категориям в ресурсах Интернет ведет к потере значительной части релевантной информации, что объясняется ошибками автоматического индексирования и рубрицирования из-за несовершенства соответствующих классификаторов и каталогов, которые должны представлять собой модели областей знания, то есть являться, по сути, информационно-поисковыми тезаурусами. Таким образом, ИПТ актуальны как для словарного, так и для логического поиска в Интернет как средство формирования поисковой потребности, формулирования поисковых предписаний и адекватного автоматического индексирования и классифицирования.

Цель исследования: разработка теории и методики создания современных информационно-поисковых тезаурусов как средств повышения эффективности информационного поиска в Интернет. В качестве объекта анализа выступают тексты научно-технических публикаций в сфере безопасности инженерных систем.

Общая цель исследования конкретизируется в виде следующих задач:

1. Обоснование проблемы точности и полноты информационного поиска в полнотекстовых базах данных неограниченного объема.

2. Определение функции ИПТ в современных полнотекстовых базах данных.

3. Уточнение понятия информационно-поискового тезауруса применительно к поиску в полнотекстовых базах данных неограниченного объема.

4. Анализ существующих ИПТ и программ их составления и ведения.

5. Представление информационного поиска как психолингвистического процесса.

6. Представление информационно-поискового тезауруса как логико-психолингвистической модели области знаний.

7. Анализ парадигматических отношений между лексическими единицами в текстах и ИПТ различных тематических областей.

8. Типизация парадигматических ассоциативных отношений и определение набора парадигматических отношений для практического информационно-поискового тезауруса.

9. Разработка фрагментов ИПТ по безопасности инженерных систем.

10.Разработка методических рекомендаций для составителей локальных ИПТ — пользователей Интернет.

Научная новизна исследования заключается в следующем:

1. Впервые информационный поиск представлен как психолингвистических процесс.

2. Впервые информационно-поисковый тезаурус рассматривается как логико-психолингвистическая модель области знаний.

3. Уточнено понятие информационно-поискового тезауруса применительно к поиску в полнотекстовых базах данных неограниченного объема.

4. Определены функции ИПТ в современных полнотекстовых базах данных.

5. Впервые проведен подробный семантико-прагматический1 анализ системы парадигматических отношений применительно к текстам и практическому информационно-поисковому тезаурусу.

6. Предложена типизация ассоциативных (парадигматических) отношений в зависимости от типов взаимодействующих лексических значений.

7. Разработаны методические рекомендации для составителей практических локальных ИПТ - пользователей Интернет.

1 Под семантико-прагматическим анализом понимается анализ парадигматических отношений между дескрипторами ИПТ с точки зрения ассоциативной связанности их лексических значений, с одной стороны, и ценности того или иного типа отношений для информационного поиска, с другой стороны.

10

Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Заключение диссертации по теме «Теоретические основы информатики», Жмайло, Светлана Васильевна

Основные результаты исследования заключаются в разработке теории и методики создания современных информационно-поисковых тезаурусов как средств повышения эффективности информационного поиска в Интернет. Поставленные в начале исследования задачи выполнены:

Теоретически и экспериментально доказано, что информационно-поисковый тезаурус может служить средством повышения точности поиска в полнотекстовых базах данных неограниченного объема.

На основе анализа существующих информационно-поисковых тезаурусов определены функции ИПТ в современных полнотекстовых базах данных.

Уточнено понятие информационно-поискового тезауруса применительно к поиску в полнотекстовых базах данных неограниченного объема.

Показано, что представление информационного поиска как психолингвистического процесса, а информационно-поискового тезауруса в виде логико-психолингвистической модели области знаний является теоретическим основанием использования ИПТ в качестве средства формирования, уточнения и выражения информационной потребности в процессе поиска.

На основе разработанного автором метода семантико-прагматического анализа проведен анализ парадигматических отношений между лексическими единицами в текстах различных тематических областей.

Предложена типизация парадигматических ассоциативных отношений, определен набор парадигматических отношений для практического информационно-поискового тезауруса.

Разработаны опытные иллюстративные фрагменты ИПТ по безопасности инженерных систем. Разработаны методические рекомендации для составителей локальных ИПТ — пользователей Интернет.

Подведем некоторые итоги. 1. При поиске в базах данных объемом в миллионы документов вопрос о качестве информационного поиска зачастую сводится к проблеме его полноты [68, с.421; 72; 79]. Но в этих условиях именно проблема точности должна выходить на первых план. Причем, необходимым средством повышения точности поиска в полнотекстовых базах данных неограниченного объема является информационно-поисковый тезаурус.

Информационно-поисковый тезаурус, используемый в полнотекстовых базах данных с неограниченным объемом, можно определить как идеологический словарь, с эксплицитно выраженными парадигматическими отношениями между лексическими единицами, который может рассматриваться как логико-психолингвистическая модель определенной области знания, или база знаний, и который служит для автоматического индексирования документов, а также для формирования, уточнения и выражения информационной потребности и формулирования информационного запроса (предписания) с целью повышения эффективности поиска.

В проведенном нами эксперименте [14] поиск научно-технической информации по ключевым словам в ресурсах Интернет без выявления и использования парадигматических (иерархических и синонимических) отношений между терминами дал в 3,3 раза меньше пертинентных результатов, чем информационный поиск по тем же ресурсам с использованием выявленных парадигматических отношений. С другой стороны, квалифицированный автоматизированный поиск по логическим категориям оказался невозможен без точного определения предметной области и был затруднен некорректным рубрицированием документов в поисковых массивах Интернет. Данные нашего эксперимента согласуются с результатами других исследований [48, с.84; 71, с. 13]. Следовательно, необходимо создание подробных логическо-семантических моделей областей знаний, то есть информационно-поисковых тезаурусов, или семантических сетей, предназначенных для помощи в формулировке информационной потребности, составления и коррекции информационных предписаний, автоматического индексирования (реферирования) документов в процессе поиска с целью сужения области поиска, автоматического рубрицирования документов при отнесении их к той или иной логической категории поискового массива (предметной области).

Информационно-поисковый тезаурус — это то средство, которое может повысить эффективность как словарного, так и логического поиска в полнотекстовых базах данных неограниченного объема.

2. Информационно-поисковые тезаурусы предоставляют пользователю информационно-поисковой системы структурированные фрагменты экстралингвистических знаний через экспликацию парадигматических отношений между лексическими единицами и, соответственно, между обозначаемыми ими понятиями. Информационно-поисковый тезаурус можно с достаточным основанием считать как моделью фрагмента лексико-семантической системы естественного языка, так и моделью предметной области знаний, или базой знаний - как общей, распределенной, так и индивидуальной. Эта модель может рассматриваться в качестве логико-лингвистической основы процесса информационного поиска, причем, таких моделей можно, в принципе, построить сколь угодно много для одной и той же тематической области.

В то же время, множество психологических моделей семантической организации памяти [7, с.80, с.93-94, с. 123-130] принципиально сводимы к модели (семантической карте) тезауруса. Таким образом, можно утверждать, что информационно-поисковый тезаурус является не только логико-лингвистической, но и психологической моделью репрезентации знаний. В этом смысле вполне обосновано использование ИПТ как средства формирования и выражения информационной потребности в процессе поиска информации. Причем, в терминах кластерного представления тезауруса и индивидуальной базы знаний информационную потребность можно интерпретировать как некое ощущение незаполненной ячейки в структуре знаний.

Каждый полнотекстовый документ можно представить как минимальную индивидуальную базу знаний автора. Информационный поиск увенчается успехом тогда, когда потребность, сформированная на основе индивидуальной базы знаний пользователя, будет удовлетворена средствами индивидуальной базы знаний автора. Посредником в процессе информационного поиска может выступить достаточно полный и подробный конкретный тезаурус, который позволит пользователю сформулировать свою информационную потребность в терминах данной предметной области.

3. Как показывает практика [14; 46; 48; 71], чем сложнее языковая среда, в которой работает информационно-поисковая система, тем совершеннее должен быть лингвистический аппарат поддержки информационного поиска, тем полнее и точнее должна быть сконструирована логико-психолингвистическая модель соответствующей области знаний. То есть, для обеспечения качества информационного поиска в полнотекстовых базах данных необходимо создание ИПТ, как можно точнее моделирующих ассоциативные (парадигматические) отношения между лексическими единицами. Современные тезаурусы, предназначенные для автоматического индексирования, должны гораздо конкретнее эксплицировать предметную область, чем соответствующие тезаурусы для ручного индексирования, поскольку при автоматическом индексировании исключаются логико-лингвистические и предметные (экстралингвистические) знания человека.

Обобщая представление о системе парадигматических отношений, подлежащих экспликации в информационно-поисковых тезаурусах разных областей науки, отметим, что из класса условной эквивалентности обязательно должны присутствовать в ИПТ независимо от его тематики собственно синонимы, квазисинонимы с общими денотатами и пересекающимися понятиями, а также синтаксические, орфографические и часть деривационных условных эквивалентов - все с общими денотатами, объединенные объектно-субъектными отношениями. Независимо от тематики ИПТ в него обязательно включаются дескрипторы, находящиеся в родо-видовых и меронимических (партитивных) отношениях, также основанных на объектно-субъектных лексико-семантических связях. То же можно сказать о других концептуальных и дефинициальных отношениях и связях типа «причина — следствие», «действие - цель», «объект — объект», «свойство — свойство».

Корреляции типов парадигматических отношений между терминами в зависимости от предметной области имеют тенденцию к преобладанию более строгих и менее разнообразных отношений в области точных и естественных наук по сравнению с гуманитарными. В то же время, безусловно, самыми важными для любой предметной области оказываются синонимические и родо-видовые отношения; это подтверждает вывод специалистов Американской библиотечной ассоциации о том, что 60% словарных пар в тезаурусах строятся на концептуальных отношениях [52].

Для практического информационно-поискового тезауруса избыточными могут оказаться не только 215 типов парадигматических отношений (согласно списку Американской библиотечной ассоциации [52]), но и выделенные нами первоначально с помощью метода семантико-прагматического анализа 43 типа. Слабо мотивированные логико-семантические связи квалифицируются экспертами как один - два распространенных типа. Поэтому, по всей видимости, нет необходимости включать их в перечень парадигматических отношений, рекомендованных к отображению в тезаурусе. Однако окончательный вывод о наборе парадигматических отношений для практического ИПТ возможен только после дополнительных исследований.

4. Использование тезауруса в полнотекстовых базах данных наиболее эффективно при постоянной модернизации тезауруса, его интеграции в базу данных и соответствующем уровне тематической специализации. Именно эти условия обеспечивают функционирование информационно-поискового тезауруса как модели области знаний и средства повышения качества поиска. Причем, более детально разработанная модель, то есть более специализированный тезаурус, позволяет добиться более высокой точности поиска [58, с.112]. Отметим, что снижение при этом полноты поиска для современных баз данных с неограниченным объемом не является чем-то существенным при условии, что информационный поиск имеет своей целью подбор информации по определенному запросу, а не поиск аналогов, например, патентов или полезных моделей. В последнем случае полнота информационного поиска становится непреложным условием.

Задача разработки ИПТ как специального информационно-поискового средства предусматривает отображение содержания конкретного массива документов в конкретном тезаурусе. Такой подход к построению ИПТ позволяет применять тематический тезаурус в поиске научно-технической информации в полнотекстовых базах данных неограниченного объема. Информационно-поисковый тезаурус, представляющий собой базу знаний конкретной предметной области, будет способствовать повышению точности поиска по данной тематике в информационных ресурсах Интернет.

5. Типизация ассоциативных отношений способствует решению общенаучной гносеологической задачи - репрезентации знаний в больших банках данных путем каталогизации информационного массива на основе ИПТ.

ЗАКЛЮЧЕНИЕ

Список литературы диссертационного исследования кандидат технических наук Жмайло, Светлана Васильевна, 2005 год

1. Азарова И. В., Митрофанова О. А., Синопальникова А. А. Компьютерный тезаурус русского языка типа WordNet http://www.dialog-21.ru/dialog.asp?page=26362&parentmenuid=711-60 kb.

2. Архангельская В. А., Базарнова С. В. Информационно-поисковый тезаурус по экономике и демографии. // НТИ. Сер. 1. - 2001. - №7. - С.24-32.

3. Бахнарь В. И. Система в лексике и словаре. // Сочетание лингвистической и внелингвистической информации в автоматическом словаре: Материалы Всесоюзной школы-семинара. Ереван: Изд-во АН АССР. — 1987.

4. Белоозеров В. Н., Косарская Ю. П. Опыт разработки словаря с разветвленной системой тезаурусных связей. // НТИ. Сер.2. - 2001. - №8. - С.28-31.

5. Березин Ф. М., Головин Б. Н. Общее языкознание. М: Просвещение, 1979.

6. Бэн А. Психология. // Сб. Основные направления психологии в классических трудах: Ассоциативная психология. М.: АСТ-ЛТД, 1998.

7. Гейвин, Хелен. Когнитивная психология. М.: Питер, 2003.

8. Городецкий Б. Ю. Теоретические основы прикладной семантики: Автореферат диссертации на соискание научной степени доктора филологических наук. — М., 1978.

9. ГОСТ 7.25-2001. Система стандартов по информации, библиотечному и издательскому делу: Тезаурус информационно-поисковый одноязычный: Правила разработки, структура, состав и форма представления. М.: Издательство стандартов. - 2001.

10. Даниленко В. П. Русская терминология: Опыт лингвистического описания. — М.: Наука, 1977.

11. П.Жмайло С. В. Анализ массива публикаций по теме «Тезаурус» в базе данных «Информатика» ВИНИТИ. // НТИ. Сер. 1. - 2004. - №3. - С.24-26.

12. Жмайло С. В. К вопросу об определении тезауруса. // НТИ. Сер.1. - 2003. - №12. -С. 20-25.

13. Жмайло С. В. К разработке современных информационно-поисковых тезаурусов. // НТИ. Сер. 1. - 2004. - №1. - С.23-31.

14. Жмайло С. В. Опыт исследования эффективности поиска научно-технической информации в сети Интернет. ВИНИТИ. - М., 200- Деп. в ВИНИТИ РАН ~

15. Информационно-поисковый тезаурус ИНИОН по экономике и демографии. М.: ИНИОН РАН, 2001.

16. Капустин В. Поиск информации в Интернете. // Мир Internet. 1998. -№9. - С.54-59.

17. Кобрин Р. Ю. Лингвистическое описание терминологии как база концептуального моделирования в информационных системах: Автореферат диссертации на соискание ученой степени доктора филологических наук. — Л., 1989.

18. Ладенко И. С. Интеллектуальные системы и логика. Новосибирск: Наука, 1973.

19. Лапшин П. Б. Новости в сфере поисковых систем Интернета. // НТИ. Сер.1. - 2003. -№12. - С.1-8.

20. Леонтьев А. А. Основы психолингвистики. — М.: Смысл, 2003.

21. Лукашевич Н. В., Добров Б. В. Тезаурус для автоматического концептуального индексирования как особый вид лингвистического ресурса. http://www.dialog-21.ru/Archive/2001/volume2/238.htm.

22. Мартинович Г. А. Типы вербальных связей и отношений в ассоциативном поле -http://www.voppsyl.ni/4y/ISSUES/l 990/902/902143. php.

23. Михайлов А. И., Черный А. И., Гиляревский Р. С. Основы информатики. М.: Наука, 1968.

24. Московии В. А. Лексико-семантическая система естественного языка и информационные языки: Автореферат диссертации на соискание ученой степени доктора филологических наук. Л., 1971.

25. Назе А., Мдивани Р. Р., Базарнова С. В., Зуккер Д., Магай Е. В., Шотт X. Многоязычный тезаурус как интегрированный инструмент поиска в базах данных. // Теория и практика общественно-научной информации. 1997- Вып.13.

26. Немов Р. С. Психология. Книга 1. Общие основы психологии. М.: Владос, 2001.

27. Семиотика. Ред. Степанов Ю.С. http//lib.wsu.ru/books.

28. Скороходько Э. Ф. Лингвистические основы автоматизации информационного поиска: Автореферат диссертации на соискание ученой степени доктора филологических наук. Киев, 1972.

29. Солсо, Роберт. Когнитивная психология. С.-Петербург: Питер, 2002.

30. Спенсер Г. Основания психологии. // Сб. Основные направления психологии в классических трудах: Ассоциативная психология. М.: АСТ-ЛТД, 1998.

31. Станиславская Э. В. Парадигматические отношения в отраслевых дескрипторных информационно-поисковых тезаурусах (на базе строительства и архитектуры): Автореферат диссертации на соискание ученой степени кандидата педагогических наук.-Л., 1975.

32. Табанакова В. Д. Семантизация термина в одноязычных терминологических словарях: Автореферат диссертации на соискание ученой степени кандидата филологических наук. Л., 1981.

33. Терминологический словарь по информатике. М., 1975.

34. Финн В. К. Логические проблемы информационного поиска. М.: Наука, 1976.

35. Фреге Г. О смысле и значении // В сб. Логика и логическая семантика. М., 2000.

36. Фреге Г. Размышления о смысле и значении // В сб. Логика и логическая семантика. М„ 2000.

37. Фрумкина Р. М. Психолингвистика. М.: ACADEMA, 2001.

38. Фрумкина Р. М. Статистические методы изучения лексики. М.: Наука, 1964.

39. Циген Т. Физиологическая психология в 14 лекциях. // Сб. Основные направления психологии в классических трудах: Ассоциативная психология. М.: АСТ-ЛТД, 1998.

40. Черный А. И. Введение в теорию информационного поиска. М.: Наука, 1975.

41. Черный А. И. О логических принципах построения УДК и информационно-поисковых языках дескрипторного типа // НТИ. Сер. 2. - 2004. — №1. - С. 1-9.

42. Черный А. И. Общая методика построения тезаурусов // НТИ. Сер.2. - 1968. — №5. -С.9-33.

43. Эббингауз Г. Очерк психологии. // Сб. Основные направления психологии в классических трудах: Ассоциативная психология. М.: АСТ-ЛТД, 1998.

44. Akin, Lynn. Information Fatigue Syndrome. Malady? Or Marketing? -http://www.org. 1 st.com/research/6.htm-1 Okb

45. American National Standard ANSI/NISO Z39.19-1993 Bethesda, Maryland, U.S.A.: NISO-Press, 1993.

46. Batty, David. Controlled vocabulary and thesauri in support of online information access. // D-Lib Magazine. 1998. - November.

47. Bird, Maryann. Information Fatigue Syndrome,System Overload. http://www.serv-inf.deusto.es/abaitua/konzeptu/fatiga.htm - 15kb

48. Clarke, Sarah J. Search Engines for the World Wide Web: An Evaluation of Recent Developments. // Journal of Internet Cataloging. 2000 - Vol.20 -№3/4. — Pp. 81-93.

49. Doerr M. Semantic Problems of Thesaurus Mapping. — http://jodi.esc.soton.ac.uk/Articles/v01/

50. Edmonds, Philip; Hirst, Graeme. Near-synonymy and Lexical Choice. -http://acl.ldc.upenn.edU/J/J02/J02-2001.pdf ISO 2788:1986 Documentation: Guidelines for the establishment and development of monolingual thesauri.

51. Enciclopedia of Library and Information Science. Vol.2. Associat. To Book World. Eds. Allen Kent and Lancour. New-York - London: Marcel Dckker, 1969. - 707pp.

52. Final Report to the ALCTS/CCS Subject Analysis Committee -http://www.ala.org/ala/alctscontent/catalogingsection/catcommittees/subjectanalysis/subje ctrelations/finalreport

53. Hirst, Graeme. Near-synonymy and the structure of lexical knowledge. -http://www.cs.toronto.edu/pub/gh/Hirst-NearSynonyms-95.pdf

54. Hunter, Eric. Do we still need classification? // В сборнике "The future of classification" / Edited by Rita Marcella and Arthur Maltby. U.S.A. Vermont: Published by Gower. -2000.-Pp. 1-17.

55. ISO 2788:1986 Documentation: Guidelines for the establishment and development of monolingual thesauri. http//www.nlc-bnc.ca/iso/tc46sc9/standard/2788e.htm

56. ISO 5964:1985 Documentation: Guidelines for the establishment and development of multilingual thesauri. http//www.nlc-bnc.ca/iso/tc46sc9/standard/5964e.htm

57. Kosovac, Branca. Internet/Intranet and Thesauri. — http://sunsite.berkeley.edu/~path/.

58. Lancaster F. W. Vocabulary Control for Information Retrieval. Washington, D.C.: Information Resources Press, 1972.

59. Lancaster, F. W.; Warner, A. J. Information Retrieval Today. — Washington, D.C.: Information Resources Press, 1993.

60. Legislative Indexing Vocabulary (LIV). http://thomas.loc.gov/liv/livtoc.html.

61. Luhn H. P. Pioneer of Information Science: Selected Works. Ed. Claire K. Schultz. -New York: Spartan Books, London: Macmillan & Co, 1968.

62. Meadow, С. Т., Boyce, B. R., Kraft D. H. Text Information Retrieval Systems. U.S.A.: Academic Press, 2000.

63. Meadow, С. T. Online Searching. U.S.A.: John Wiley & Sons, 1981.

64. Meadow, С. T. The Analisys of Information Systems. U.S.A., L. Angeles: Melvelle Published Company, 1973.

65. Milstead, Jessica L. NISO Z39.19: Standard for Structure and Organization of Information Retrieval Thesauri. http://dataserver.calacademy.org/taf7proceedings/milsteadtaf.html.

66. Milstead, Jessica L. Use of Thesauri in the Full-Text Environment.// Proc.of the 34th Annual Clinic on Library Applications of Data Processing. March 2-4, 1997. — http://www.angelfire.com/ks/KA/Thesaurus.html

67. Moukdad H., Large A. Users' perceptions of the Web as revealed by transaction log analysis. // Online Information Review. 2001. - Vol.25. - №6. - Pp.349-358.

68. Rockland R. H. Reducing the Information Overload: A Method on Helping Students Research Engineering Topics Using the Internet. // IEEE Transactions on Education. -November 2000. Vol.43. - №4. - Pp.420-425.

69. Salton G., McGill M. Introduction to Modern Information Retrieval. U.S.A.: McGraw-Hill Book Company, 1983.

70. Soergel, Dagobert. Indexing Languages and Thesauri: Construction and Maintenance. -U.S.A., L. Angeles: Melville Company, 1974.

71. Text Retrieval Conference (TREC): Публикации Ежегодной международной конференции TREC. http://www.itl.nist.gov/iaui/894.02/works/presentations.html

72. The Smart Media Institute a centre for advanced research in the Department of Computer Science at University College Dublin. - http://www.cs.ucd.ie

73. Thesaurus Guide: Analytical directory of selected vocabularies for information retrieval. -Luxembourg: Office for official Publications of the European Communities, 1985.

74. Thesaurus Information. American Society of Indexers. -http://www.asindexing.org/site/thesauri.shtml.

75. Tudhope D., Alani H., Jones C. Augmenting Thesaurus Relationships: Possibilities for Retrieval. // Journal of Digital Information Vol.1. - Issue 8. - 2001-02-05 -http://jodi.esc.soton.ac.uk/Articles/v01/i08/Tudhope

76. Vickery В. C. Classification and Indexing in Science. London: Butterworth, 1975.

77. Vickery, В. C., Vickery, A. Information Science in Theory and Practice. U.S.: Butterworths, 2000.

78. Voorbij, Henk J. Searching Scientific Information on the Internet: A Dutch Academic User Survey. // Journal of the American Society for Information Science. 1999. - Vol.50. - №7. - Pp.606-607.

79. Waddington, Paul. Dying for information? A Report of the Effects of Information Overload in the UK and Worldwide. http://www.cni.org/regconts/1997/ukonl-content/report~l 3.html -15 kb

80. Willliamson, Nancy J. Knowledge structures and the Internet. // Knowledge organization for information retrieval: Proc. Of the Sixth international study conference on classification research. London. - June 16-18,1997.

81. Winquist-Galbe, Nina. When less is more. Data Smog: Info as Pollutant, not Currency. -http://www.valt.helsinki.fi/comm/argo/anetOO/data.htm 16 kb

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.