Модели многозначности русской предметной лексики: глобальные и локальные правила разрешения омонимии тема диссертации и автореферата по ВАК РФ 10.02.19, кандидат филологических наук Кобрицов, Борис Павлович

  • Кобрицов, Борис Павлович
  • кандидат филологических науккандидат филологических наук
  • 2004, Москва
  • Специальность ВАК РФ10.02.19
  • Количество страниц 188
Кобрицов, Борис Павлович. Модели многозначности русской предметной лексики: глобальные и локальные правила разрешения омонимии: дис. кандидат филологических наук: 10.02.19 - Теория языка. Москва. 2004. 188 с.

Оглавление диссертации кандидат филологических наук Кобрицов, Борис Павлович

Введение.

Глава 1. Проблема лексической многозначности.

1. Лексическая многозначность.

2.1. Методы описания многозначности.

2.2 Метафора и метонимия.

3. Грамматика конструкций. Другой взгляд на многозначность.

4. Конструкции с предметными именами. Разрешение многозначности.

Глава 2. Методы снятия семантической неоднозначности.

2.1 О методах снятия семантической неоднозначности.

2.2 Снятие неоднозначности с помощью правил, построенных вручную.

2.3 Снятие семантической неоднозначности на основе данных электронного корпуса.

2.3.1 Словари и снятие семантической неоднозначности.

2.3.2 Выбор значения более одного слова одновременно.

2.3.3 Разметка корпуса вручную. щ 2.3.4 Переводные словари и параллельные корпуса.

2.3.5 Параллельные корпуса.

2.3.6 Тезаурусы.

2.4 Тестирование системы.

2.5 Итоги.

Глава 3. Классификация предметных имен.

3.1 Основные понятия.

3.1.1 Естественность классификации.

3.1.2 Иерархия.

3.1.3 Фасетная классификация.

3.1.4 Наследование признаков.

3.2 Примеры лексических классификаций.

3.2.1 Тезаурус Питера Марка Роже.;.

3.2.2 База данных WordNet.

3.2.3 EuroWordNet.

3.2.4 Русский WordNet.

3.2.5 Русский семантический словарь (РСС).

3.3 Классификация предметных имен в нашей работе.

3.3.1 Работа над исходным материалом.

3.3.2 Структура классификации.

Глава 4. Конструкции с предметными именами как основа для глобальных и локальных правил выбора значения.

4.1 Типы синтаксических зависимостей.

4.1.1 Адъективное определение.

4.1.2 Генитивная конструкция.

4.1.3 Предложное управление.

4.1.4 Глагольное управление.

4.2 Конструкции с предметными именами.

4.2.1 Семантическая разметка.

4.2.2 Правила снятия семантической неоднозначности.

4.3 Типы правил.

4.3.1 Глобальные правила.

4.3.1 Локальные правила. Модели многозначности.

4.4 Итоги. щ

Глава 5. Имена веществ и растений: правила разрешения многозначности

5.1 Предметные имена класса ВЕЩЕСТВ.

Глобальные правила.

Локальные правила.

Модель ВЕЩЕСТВО - ПРОСТРАНСТВО / МЕСТО.

Модель ВЕЩЕСТВО - НАПИТОК.

Модель ВЕЩЕСТВО - ЧЕЛОВЕК.

Модель ВЕЩЕСТВО-ПРИСПОСОБЛЕНИЕ.

Модель ВЕЩЕСТВО-РАСТЕНИЕ.

Модель ВЕЩЕСТВО-ИЗОБРАЖЕНИЕ.

5.2 Предметные имена класса РАСТЕНИИ.

Глобальные правила.

Локальные правила.

Модель РАСТЕНИЕ-ПЛОД.

Модели РАСТЕНИЕ-ЕДА и РАСТЕНИЕ-НАПИТОК.

Рекомендованный список диссертаций по специальности «Теория языка», 10.02.19 шифр ВАК

Введение диссертации (часть автореферата) на тему «Модели многозначности русской предметной лексики: глобальные и локальные правила разрешения омонимии»

Реферируемая диссертация посвящена изучению многозначных предметных имен в русском языке. На базе подробной таксономической классификации предметной лексики, созданной для Национального корпуса русского языка (НКРЯ) при участии автора диссертации, в работе строятся и описываются модели многозначности покрывающие предметные слова для словаря объемом около 120 тыс. лексем. Исследуются особенности сочетаемости лексем, входящих в эти модели, и конструируются правила выбора значения, работающие с опорой на сочетаемостные ограничения. На размеченном корпусе объемом около 20 млн. словоупотреблений была опробована их работа и оценена точность и эффективность.

Таким образом объектом исследования являются предметные имена, представляющие регулярные модели многозначности.

Целью работы является подробное описание таких моделей, а также описание сочетаемости многозначных предметных имен в рамках определенных языковых конструкций, которое позволило сформулировать ряд лингвистических правил разрешения многозначности предметных имен при их употреблении в корпусе текстов с морфосемантической разметкой.

В соответствии с поставленной целью необходимо было решить ряд конкретных задач: создание полной таксономической классификации предметных имен во всех значениях; выделение регулярных моделей многозначности; описание структуры правил сочетаемости предметных имен, способствующих разрешению многозначности, для продуктивных моделей создание комплексов пилотных правил для отдельных таксономических классов и проверка их точности и эффективности на представительном корпусе русских текстов.

Актуальность исследования определяется, тем, что в теоретическом плане регулярная многозначность предметных имен мало изучена. Если для глагольной лексики существует большое количество работ, посвященных исследованию моделей многозначности, то для предметных имен число таких работ чрезвычайно мало. Между тем, многозначность предметных имен представляет серьезную проблему, которая хорошо осознана в прикладной области (например задачи машинного перевода, см. отечественные исследования Апресян и др. 1989, Шаляпина и др. 1999).

В свою очередь, внимание прикладных специалистов к этим задачам должно стимулировать и теоретический анализ данной проблематики. Действительно, адекватное решение проблемы именной многозначности моделирует когнитивные механизмы выбора верного значения в тексте человеком. Такой выбор происходит, с одной стороны, с опорой на хорошо известные эффекты семантического согласования (см. Шмелев 2002, Апресян 1974/95), а с другой стороны, на базе синтаксических конструкций, различающих противопоставленные друг другу значения: каждому значению свойственен свой набор таких конструкций. Теоретические принципы грамматики конструкций отражены в работах Fillmore, Kay 1992; Goldebrg 1995, ср. также Шведова 2003, Апресян 1967. Именно эти принципы и стали предметом подробного теоретического исследования в настоящей работе.

Материалом исследования сочетаемости предметных имен стал Национальный корпус русского языка (www.ruscorpora.ru). На момент проведения эксперимента корпус имел объем 20 млн. словоупотреблений. Именно этот вариант корпуса использовался при работе на диссертацией. Базовый морфологический словарь корпуса (основан на словаре системы "Диалинг" объемом около 120 тыс. единиц, см. Сокирко 2001) был использован для выбора массива предметных имен (около 22 тыс. словозначений), который стал основой для таксономической разметки многозначной предметной лексики (около 10 тыс. словозначений).

Основой для создания таксономической классификации предметной лексики стала электронная база данных "Лексикограф", разрабатываемая под руководством Е.В.Падучевой в отделе лингвистических исследований ВИНИТИ с 1992 г.

Научная новизна исследования заключается прежде всего в том, что все теоретические построения были применены и проверены на реальном представительном корпусе русского языка. В работе впервые приводятся полные списки всех многозначных предметных имен в русском языке, а также выделяются все модели регулярной многозначности, существующие в данной лексике. Созданы и описаны механизмы создания правил сочетаемости предметных имен, на основе которых можно осуществлять выбор верного значения имени в тексте, а также приводятся конкретные группы правил для нескольких таксономических классов. Кроме того, данное исследование представляет собой эксперимент по формированию методов работы над корпусом с морфосемантической разметкой.

Теоретическая значимость. В диссертации исследуется связь отдельных значений многозначных имен с конкретными семантико-синтаксическими конструкциями русского языка и доказывается роль таких конструкций при выборе значений в тексте. В этом состоит теоретическая значимость работы. В работе изучается природа многозначности и ее отражение в сочетаемости лексики. Эти результаты важны для создания специальной грамматики конструкций для русского языка, а также могут быть использованы в других лексикографических исследованиях русского языка.

Практическая ценность работы заключается в том, что все ее результаты, начиная от таксономической классификации лексики, полных списков предметных имен русского языка, перечня моделей многозначности и, наконец, правил снятия семантической омонимии, базирующихся на анализе конструкций, могут быть использованы для 4 создания грамматических описаний (в том числе грамматики конструкций), а также при составлении словарей.

Кроме того, правила, предложенные в работе, позволяют снять часть лексической неоднозначности на любом корпусе с морфосемантической разметкой. Таким образом, результаты диссертационного исследования могут найти применение при разработке информационных систем нового поколения, в которые входит семантическая интерпретация текстов: описанные правила могут повысить точность и эффективность работы подобных систем.

Апробация работы. Основные положения диссертации и результаты исследования на его различных этапах обсуждались на семинарах отдела лингвистических исследований ВИНИТИ, а также семинарах по корпусной лингвистике Института русского языка им В.В.Виноградова; на конференции Диалог'2004; 2-м Международном конгрессе исследователей русского языка (Москва 2004). Правила разрешения многозначности, сформулированные в исследовании, использовались для обработки текстов в Национальном корпусе русского языка, и отражены в отчете по проекту создания Электронного корпуса русского языка.

Структура работы. Диссертация состоит из введения, пяти глав, заключения, двух приложений и списка литературы, включающего 128 названий.

Похожие диссертационные работы по специальности «Теория языка», 10.02.19 шифр ВАК

Заключение диссертации по теме «Теория языка», Кобрицов, Борис Павлович

Заключение

Настоящая работа посвящена изучению языковых конструкций с предметными именами русского языка. Мы предлагаем подход к описанию лексической многозначности, при котором основное внимание уделяется не правилам, лежащим в основе формирования новых значений слов, а принципам выбора верного значения в тексте. По результатам данного диссертационного исследования можно сделать несколько выводов:

1. Детальная таксономическая классификация предметных существительных является мощным инструментом в исследовании многозначности этого класса лексики.

2. Правила контекстной сочетаемости предметных имен в существенной степени предопределяются принадлежностью слова к определенному таксономическому классу.

3. Предметные имена в русском языке могут образовывать языковые конструкции, которые, в частности, регулируют выбор значения многозначного имени.

4. В подобных конструкциях многозначное имя получает единственную семантическую интерпретацию.

5. Следовательно, детальное описание таких конструкций позволит сформулировать лингвистические правила выбора значения для предметных имен в любом тексте с морфосемантической разметкой.

6. Правила сочетаемости могут формулироваться на разных уровнях дробности семантического описания: глобальные правила относятся к крупным классам таксономической классификации, локальные правила - определяют выбор значения для конкретной модели многозначности.

7. Изучение работающих правил (как глобальных так и локальных), и прежде всего, анализ случаев их нарушения позволяет не только совершенствовать саму систему фильтров для выбора верного значения многозначного имени, но и способствует уточнению таксономической классификации в целом.

7. Природа этих правил также может быть разной: с одной стороны, глобальные правила обычно носят рестриктивный характер (накладывают определенные запреты на контекст), а с другой — действуют селективные признаки (локальные правила), различающие семантически близкие слова.

8. Исследование контекстного поведения предметной лексики на базе корпуса с морфосемантической разметкой позволяет выявлять и описывать конструкции русского языка, релевантность которых для языковой системы (в том числе и для разрешения семантической многозначности) бесспорна.

Список литературы диссертационного исследования кандидат филологических наук Кобрицов, Борис Павлович, 2004 год

1. Азарова И.В. и др. Компьютерный тезаурус русского языка типа WordNet // Труды межд. конференции Диалог'2003. М.: Наука, 2003.

2. Азарова И.В. и др. Разработка компьютерного тезауруса русского языка типа WordNet // Доклады научной конференции "Корпусная лингвистика и лингвистические базы данных". Спб., 2002.

3. Апресян Ю. Д. Избранные труды, том I. Лексическая семантика: 2-е изд., испр. и доп. — М.: Школа "Языки русской культуры" РАН, 1995

4. Апресян Ю.Д. и др. Новый объяснительный словарь синонимов русского языка. М., 1997.

5. Апресян Ю.Д. Экспериментальное исследование семантики русского глагола. М.: "Наука", 1967.

6. Апресян Ю.Д., и др. Лингвистическое обеспечение системы ЭТАП-2. М.:Наука, 1989.

7. Арутюнова Н.Д. Предложение и его смысл. М.:Наука, 1976.

8. Арутюнова Н.Д. Языковая метафора: синтаксис и лексика // Лингвистика и поэтика. М., 1979.

9. Вейнрейх У. Опыт семантической теории. — В кн.: Новое в зарубежной лингвистике, вып. X. М., 1980

10. Гак В.Г. К проблеме семантической синтагматики // Проблемы структурной лингвистики 1971., 1972.

11. Ельмслев Л. Пролегомены к теории языка // Новое в лингвистике. М., 1960. Вып.1

12. Забродин В.Ю. О критериях естественности классификаций//НТИ, сер.2, М., 1981 №8

13. Зализняк А.А. Грамматический словарь русского языка. М.:Русский язык. 1977.

14. Зализняк А.А. Русское именное словоизменение. М. 1967.

15. Звонкин А.И., Фрумкина P.M. Свободная классификация: модели поведения. //НТИ сер.2, №6. М.:ВИНИТИ, 1980.

16. Золотова Г.А. Синтаксический словарь: Репертуар элементарных единиц русского синтаксиса. М.: Наука, 2001.

17. Кобрицов Б.П. Методы снятия семантической неоднозначности // Научно-техническая информация. Сер.2. 2004. — №1.

18. Кобрицов Б.П., Ляшевская О.Н., Рахилина Е.В. Именная классификация как лингвистическая проблема // Труды конференции Конгресс русского языка. — 2004. -МГУ.

19. Корпусная лингвистика в России (сост. Рахилина Е. В., Шаров С. А.) // Научно-техническая информация, сер. 2: Информационные процессы и системы, 2003, №№ 6 и 10.

20. Красильщик И.С., Рахилина Е.В. Предметные имена в системе "Лексикограф".// Научно-техническая информация. Сер.2, N 9, 1992.

21. Курилович 1962 — Курилович Е. Заметки о значении слова. // Курилович Е. Очерки по лингвистике. М., 1962.

22. Кустова Г.И., Падучева Е.В. Словарь как лексическая база данных. Вопросы языкознания, 1994, N3.

23. Леонтьева Н.Н. Русский общесемантический словарь (РОСС): структура, наполнение//НТИ. Сер.2. 1997.

24. Ляшевская О.Н. Нестандартное числовое поведение русских существительных. Дис. канд. филолог, наук. М. 1999.

25. Ляшевская О.Н. Семантика русского числа. М.:Языки славянской культуры, 2004.

26. Меграбова Э.Г. О взаимоотношении лексики и формальных средств языка при изучении лексики как системы//научно-методическая конференция преподавателей иностранных языков вузов Дальнего Востока. 1-я. 1971.

27. Морковкин В. В. Опыт идеографического описания лексики. М., 1977.

28. Мейен С.В., Шрейдер Ю.А. Методологические аспекты теории классификации.// Вопросы философии. М., 1976, № 12

29. Ожегов С. И. Шведова Н.Ю. Словарь русского языка. М., 1992.

30. Падучева Е.В. Два подхода к семантическому анализу категории числа // То honor Roman Jakobson, v.II. The Hague Paris, 1967.

31. Падучева E.B. О парадигме регулярной многозначности (на примере глаголов звука). -НТИ. Сер. 2. 1988, № 4

32. Падучева Е.В. Метонимические и метафорические переносы в парадигме глагола назначить // Типология и теория языка: от описания к объяснению. Сб. к 60-летию А.Е.Кибрика. М.:Языки русской культуры, 1999. с.488-502.

33. Падучева Е.В. Динамические модели в семантике лексики. М.:Языки славянской культуры, 2004.

34. Плунгян В.А., Сичинава Д.В. Морфологическая информация в национальном корпусе русского языка // Труды П-го Международного конгресса русистов-исследователей 2004,

35. Поляков В.Н. Использование технологий, ориентированных на лексическое значение, в задачах поиска и классификации // Проблемы прикладной лингвистики, 2004 (в печати)

36. Рахилина Е.В. О лексических базах данных // Научно-техническая информация. сер.2. N 9. М.:ВИНИТИ, 1992.

37. Розина Р.И. Таксономические отношения в лексике // НТИ сер. 2 № 10. 1984

38. Розина Р.И. О некоторых производных значениях глаголов перемещения в русском языке // Моск. лингв, журн. 1996. Т. 2. С. 352-360.

39. Словарь русского языка: в 4 т. 4-е изд. стер. М.: 1999 MAC.

40. Словарь современного русского языка: в 17 т. М.; Л., 1948-1965 БАС.

41. Смирницкий А.И. Лексикология английского языка. М.: Изд-во литературы на иностранных языках. 1956

42. Соболева П.А. Лексикализация множественного числа и словообразование // Лингвистика и поэтика. М.:Наука, 1979. с.47-85.

43. Сокирко А.В. Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ). Дис. канд. технич. наук. М.:2001.

44. Степанов Ю.С. Иерархия имен и ранги субъектов. //Известия АН СССР. Сер. лит. и яз., М., 1979 т.38, №4

45. Степанов Ю.С. Имена. Предикаты. Предложения. Семиологическая грамматика // Ин-т языкознания. М., 1981

46. Успенский Б.А. О вещных коннотациях абстрактных существительных // Семиотика и информатика, вып.11, 1979 (перепечатано в: Семиотика и информатика, вып.35. М.:"Языки русской культуры", 1997)

47. Филлмор Ч. Дело о падеже // НЗЛ, вып. X. М.:Прогресс, 1981.

48. Чардин И. 2004. Лингвистические корпусы с разметкой на основе грамматики зависимостей и их применение при автоматическом синтаксическом анализе. М. 2004.

49. Ченки А. Семантика в когнитивной лингвистике. // Фундаментальные направления современной американской лингвистики. Под ред. А.А.Кибрика, И.М.Кобозевой и И.А.Секериной. М, 1997

50. Шаляпина З.М. и др. Экспериментальный комплекс ЯРАП как инструмент сопоставительных лингвистических исследований. // Общее и восточное языкознание. М.: Современный писатель, 1999, с.64-79

51. Шведова Н. Ю. Русский семантический словарь. М., 2000

52. Шведова Н.Ю. Очерки по синтаксису русской разговорной речи. // РАН Институт русского языка. М.: Азбуковник, 2003.

53. Шмелев Д.Н. Избранные труды по русскому языку. М.: Языки славянской культуры. 2002. с. 30-72.

54. ALPAC (1966). Language and Machine: Computers // Translation and Linguistics, National Research Council Automatic Language Processing Advisory Committee, Washington, D.C.

55. Bar-Hillel, Yehoshua (1960). Automatic Translation of Languages. // Alt, Franz; Booth, A. Donald and Meagher, R. E. (Eds), Advances in Computers, Academic Press, New York. 247-261.

56. Black E. An experiment in computational discrimination of English word senses // ШМ Journal, 32(2), 1988, p. 185-194.

57. Boas F. Race, Language and Culture, Macmillan, New York, 1940.

58. Bryan R. Abstract thesauri and graph theory applications to thesaurus research. // Sedelow, Sally Yeates (Ed.), Automated Language Analysis. University of Kansas Press, Lawrence, Kansas, 1973. p.45-89.

59. Buitelaar, Paul (1997). A lexicon for underspecified semantic tagging. // ACL-SIGLEX Workshop "Tagging Text with Lexical Semantics: Why, What, and How?" April 4-5, 1997, Washington, D.C., 25-33.

60. Chomsky N. Syntactic structures. Mouton, The Hague, 1957.

61. Choueka Y., Dreizin F. Mechanical resolution of lexical ambiguity in a coherent text. // Proceedings of the International Conference on Computational Linguistics, COLING76, Canada, 1976.

62. Cowie J., Guthrie J., Guthrie L. Lexical disambiguation using simulated annealing // Proceedings of COLING Conference, 1992. p.359-365.

63. Dagan A., Schwall U. Two languages are more informative than one // Proceedings of the ACL, (29), 1991. p.130-137.

64. Demetriou G.C. Lexical disambiguation using constraint handling // Prolog (CHIP) // Proceedings of the European Chapter of the ACL, 1993. p.431-436.

65. Eaton H. Semantic frequency list for English, French, German and Spanish. Chicago University Press, Chicago, 1940.

66. Fillmore Ch.J. The case for case // Universals in Linguistic Theory. NY: Holt, Rinehart, and Winston. 1968. p. 1-88

67. Fillmore, Ch. J. Frame semantics // Linguistics in the Morning Calm, Seoul: Hanshin Publishing Co., 1982. p.l 11-137.

68. Fillmore, Ch. J., Kay P. Construction Grammar course book. Berkley, UC, 1992.

69. Gale W.A., Church K.W. A program for aligning sentences in bilingual corpora // Proceedings of the ACL, 29,1991. p. 177-184.

70. Gale W.A., Church K.W., Yarowsky D. A Method for Disambiguating Word Senses in a Large Corpus // Computers and the Humanities, 26,1992. p.415-439.

71. Garside R. The CLAWS word tagging system // The computational analysis of English: a corpus based approach, (ed.) R. Garside, G. Leech, G. Sampson, Longman, 1987. p.30-41.

72. Goldberg A. A Construction Grammar approach to argument structure. Chicago: Univ. of Chicago. 1995

73. Grolier Multimedia Encyclopedia CD-ROM. Grolier Interactive Inc., 90 Sherman Turnpike, Danbuiy, CT 06816, USA

74. Guthrie J.A., Guthrie L., Wilks Y., Aidinejad H. Subject-dependent co-occurrence and word sense disambiguation // Proceedings of the 29th Annual Meeting of the Association for Computational Linguistics, Berkeley, CA, 1991. p. 146-152.

75. Harris Z. Methods in structural linguistics. The University of Chicago Press, 1951.

76. Hearst M. Noun homograph disambiguation using local context in large text corpora // Proceedings of the 7th conference, UW Centre for the New OED & Text Research Using Corpora, 1991.

77. Hirst G. Semantic interpretation and the resolution of ambiguity. Cambridge: Cambridge University Press, 1986.

78. Ide N., Veronis J. Introduction to the Special Issue on Word Sense Disambiguation: The State of the Art. Computational Linguistics, 24(1), 1998.

79. Iker H. SELECT: A computer program to identify associationally rich words for content analysis. I. Statistical results. // Computers and the Humanities, 8,1974. p.313-19.

80. Imbs P. Tresor de la Langue Francaise. Dictionnaire de la langue du XIXe et du XXe siecles (1989-1960). // Editions du Centre National de la Recherche Scientifique, Paris, 1971.

81. Jackendoff R.S. Semantics and cognition. Cambr. (Mass.): MIT, 1983.

82. Johansson S. The LOB corpus of British English texts: presentation and comments. // ALLC Journal, 1(1), 1980. p.25-36.

83. Jorgensen J. The psychological reality of word senses // Journal of Psychological Research, 19,1990. p.167-190

84. Kelly E., Stone P. Computer recognition of english word senses. North-Holland Publishing Co., Amsterdam, 1975.

85. Kilgarriff A. Corpus word usages and dictionary word senses: What is the match? An empirical study // Proceedings of the 7th conference, UW Centre for the New OED & Text Research Using Corpora, 1991.

86. Kucera H., Kucera F., Winthrop N. Computational Analysis of Present-Day American English, Brown University Press, Providence, 1967.

87. LakofTG., Johnson M. Metaphors we live by. Chicago: Univ. of Chicago. 1980.

88. Lakoff G. Women, fire and dangerous things: What categories reveal about the mind. Chicago: Univ. of Chicago, 1987.

89. Lesk M. They said true things, but called them by wrong names — vocabulary problems in retrieval systems. // Proc. 4th Annual Conference of the University of Waterloo Centre for the New OED, 1988.

90. Lesk M. Automatic Sense Disambiguation Using Machine Readable Dictionaries: How to Tell a Pine Cone from an Ice Cream Cone. // Proc. of SIGDOC, Toronto, 1986. p. 1-9.

91. Longman dictionary of contemporary English, New edition, Longman

92. Lorge I. Semantic Content of the 570 Commonest English Words. Columbia University Press, New York, 1949.

93. Masterman M. The thesaurus in syntax and semantics. // Mechanical Translation, 4, 1957.

94. Michea, R. Les vocabulaires fondamentaux. // Recherche et techniques nouvelles au service de l'enseignement des langues vivantes, Universite de Strasbourg, Strasbourg, 1964. p.21-36.

95. Miller G., Beckwith R., Fellbaum Ch., Gross D., Miller KJ. WordNet: An on-line lexical database. //International Journal of Lexicography, 3(4), 1990. p.235-244.

96. Palmer H. Second Interim Report on English Collocations, Institute for Research in English Teaching, Tokyo, 1933.

97. Partee В. Lexical semantics and compositionality // L.Gleitman, M.Liberman (eds.), Invitation to cognitive science, part IrLanguage. Cambridge:MIT, 1995

98. Patrick A.B. An exploration of abstract thesaurus instantiation. M. Sc. thesis, University of Kansas, Lawrence, Kansas, 1985.

99. Pustejovsky J. Lexical Semantics: The Problem of Polysemy. Oxford: Clarendon, 1996.

100. Pustejovsky J. The Generative Lexicon. Cambridge: MIT Press, 1998.

101. Quirk R. Towards a description of English usage. // Transactions of the Philological Society, 1960. p.40-61.

102. Roget P.M. Thesaurus of English words and phrases classified so as to facilitate the expression of ideas and assist in literary composition Lnd., 1852.

103. Roget's thesaurus of English words and phrases. New ed. prepared by B. Kirkpatrick. Harmondsworth: Penguin, 1988.

104. Rosch E. et. al. Basic objects in natural categories. // Cognitive psycology 7, 1976. p.573-605.

105. Sedelow S., Sedelow W. Categories and procedures for content analysis in the humanities. // The Analysis of Communication Content, John Wiley & Sons, New York, 1969. p.487-499.

106. Simpson J., Weiner E. The Oxford English dictionary, 2nd ed. Oxford university press, 1989.

107. Small S., Rieger C. Parsing and comprehending with word experts (a theory and its realisation), // Strategies for Natural Language Processing, W.G. Lehnert & M. H. Ringle, Eds., LEA, 1982. p.89-148.

108. Sparck J. Synonymy and semantic classification. Ph. D. thesis, University of Cambridge, Cambridge, England, 1964.

109. Stone PhJ. Improved quality of content analysis categories: Computerizeddisambiguation rules for high-frequency English words. // The Analysis of Communication Content, John Wiley and Sons, New York, 1969. p.199-221.

110. Stone Ph.J. et. all. The General Inquirer: A Computer Approach to Content Analysis. MIT Press, Cambridge, Massachusetts, 1966.

111. Sussna M. Word sense disambiguation for free-text indexing using a massive semantic network // Proceedings of the International Conference on Information & Knowledge Management (CIKM), 2, 1993. p.67-74.

112. Thorndike Ed.L. On the frequency of semantic changes in modern English. // Journal of General Psychology, 66,1948. p.319-327.

113. TomaselloM. Constructing a Language: A Usage-Based Theory of Language Acquisition. London: Harvard University Press. 2003.

114. Weiss S. Learning to disambiguate // Information Storage and Retrieval, v.9,1973

115. Weiss S. Learning to disambiguate // Information Storage and Retrieval, 9, 1973.

116. Wierzbicka A. Lexicography and conceptual analysis. Ann Arbour: Karoma, 1985

117. Wilks Y. et. all. Providing Machine Tractable Dictionary Tools. // Machine Translation, 5,1990. p.99-154.

118. Yarowsky D. A comparison of corpus-based techniques for restoring accents in Spanish and French text. // Proceedings of the 2nd Annual Workshop on Very Large Text Corpora. Las Cruces, 1994. p. 19-32.

119. Yarowsky D. Decision lists for lexical ambiguity resolution: application to accent restoration in Spanish and French. // Proceedings of the 32nd Annual Meeting of the Association for Computational Linguistics, Las Cruces, New Mexico, 1994. p.88-95.

120. Yarowsky D. Word sense disambiguation using statistical models of Roget's categories trained on large corpora. // Proceedings of the 14th International Conference on Computationa, 1992.

121. Yarowsky D. Word sense disambiguation using statistical models of Roget's categories trained on large corpora. // Proceedings of the 14th International Conference on Computational Linguistics, COLING'92,23-28 August, Nantes, France, 1992. p.454-460.

122. Yarowsky D. Unsupervised word sense disambiguation rivalling supervised methods // Proceedings of the ACL, 33. 1995

123. Zipf G.K. "The meaning frequency relationship of words." // Journal of General Psychology, 33,1945. p.251-266.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.