Корпусно-ориентированное исследование референции: Принципы аннотации и анализ данных тема диссертации и автореферата по ВАК РФ 10.02.19, кандидат филологических наук Красавина, Ольга Николаевна

  • Красавина, Ольга Николаевна
  • кандидат филологических науккандидат филологических наук
  • 2006, Москва
  • Специальность ВАК РФ10.02.19
  • Количество страниц 259
Красавина, Ольга Николаевна. Корпусно-ориентированное исследование референции: Принципы аннотации и анализ данных: дис. кандидат филологических наук: 10.02.19 - Теория языка. Москва. 2006. 259 с.

Оглавление диссертации кандидат филологических наук Красавина, Ольга Николаевна

Глава 1 Введение.

1.1 Постановка задачи.

1.2 Материалы и метод.

1.3 Цели и задачи работы.

1.4 Научная новизна.

1.5 Теоретическое и практическое значение.

1.6 Апробация работы.

1.7 Структура работы.

Глава 2 Референция в дискурсе.

2.1 Теоретические рамки.

2.1.1 Мотивированность языка когнитивными структурами и процессами

2.1.2 Принцип иконического соответствия.

2.1.3 Понятие маркированности.

2.1.4 Вместо резюме.

2.2 Понятийный аппарат.

2.2.1 Когнитивный компонент.

2.2.2 Анафора и катафора, референция и кореферентность.

2.2.3 Анафора, ассоциативная анафора, дейксис.

2.2.4 Дискурсивная анафора.

2.2.5 Терминология (референциальные средства).

2.3 Когнитивная мотивация референциалыюго выбора.

2.3.1 Иерархия доступности.

2.3.2 Иерархия данности.

2.3.3 Ограничения теорий когнитивной доступности и возможности их дополнения.

2.4 Индикаторы доступности, выделенности, или активации.

2.4.1 Независимый способ определения степени активации.

2.4.2 Центральность, одушевленность и подлежащность.

2.4.3 Дискурсивный статус и форма антецедента.

2.4.4 Конфликт «противоречащих мотиваций».

2.5 Выводы главы 2.

Глава 3 Фактор дискурсивной структуры и расстояние.

3.1 Принципы организации дискурса.

3.1.1 Линейная структура.

3.1.2 Риторическая структура.

3.1.3 Влияние риторической структуры по сравнению с линейной.

3.2 Теории дискурсивно-структурной доступности.

3.2.1 Теория стэков.

3.2.2 Теория вен.

3.2.3 Попытки интегрирования модели стеков и Теории Риторической Структуры.

3.3 Репрезентация теории стеков и теории вен на общем основании.

3.3.1 Метод.

3.3.2 Репрезентация теорий.

3.4 Эмпирическая проверка предсказаний теории вен и теории стеков.

3.4.1 Вводные замечания.

3.4.2 Методологические аспекты имплементации иерархического расстояния.

3.4.3 Обсуждение результатов.

3.5 Понятие риторического расстояния.

3.5.1 Исходный метод.

3.5.2 Модифицированный метод риторического расстояния.

3.6 Проблема определения антецедента.

3.7 Эмпирическая проверка риторического расстояния и сравнение с теорией вен и теорией стэков.

3.7.1 Имплементация.

3.7.2 Обсуждение результатов.

3.7.3 Связь линейного и иерархического расстояния.

3.7.4 Другие аспекты риторической структуры.

3.8 Выводы Главы 3.

Глава 4 Аннотация крупного корпуса для изучения референциального выбора

4.1 Развитие корпусных методов исследования референции.

4.1.1 Требования к корпусной аннотации.

4.1.3 Существующие аннотационные схемы.

4.2 База данных: корпуса и их характеристики.

4.2.1 RST Discourse Treebank.

4.2.2 Potsdamer Commentary Corpus.

4.3 Осуществление референциальной аннотации корпусов RST Treebank и РСС.

4.3.1 Принципы разметки анафорических выражений.

4.3.2 Принципы разметки анафорических связей.

4.3.3 Стратегии по устранению двусмысленности при аннотации.

4.3.4 Принципы разметки дополнительных признаков.

4.4 Имплементация схемы.

4.4.1 Техническая имплементация.

4.4.2 Процедура аннотации.

4.5 Выводы Главы 4.

Глава 5 Корпусное исследование факторов референциального выбора.

5.1 Пилотные исследования.

5.1.1 Результаты английского исследования.

5.1.2 Результаты немецкого исследования.

5.1.3 Сравнение и обсуждение результатов.

5.2 Корпусное исследование: предварительные замечания.

5.2.1 Свойства референта.

5.2.2 Свойства антецедента.

5.2.3 Свойства пары анафора и антецедента.

5.2.4 Комплексные эффекты.

5.2.5 Другие факторы.

5.3 Выводы Главы 5.

Рекомендованный список диссертаций по специальности «Теория языка», 10.02.19 шифр ВАК

Введение диссертации (часть автореферата) на тему «Корпусно-ориентированное исследование референции: Принципы аннотации и анализ данных»

Для понимания того, что такое грачматика, и почему она устроена так, как она устроена, необходимо учитывать естественные параметры, которые определяют язык и грамматику: сознание и коммуникацию, устройство мозга и сознания, социально-обусловленные процессы и культуру, изменение и вариативность, усвоение языка и его эволюцию. (Givon 1995:xv) (перевод мой O.K.) Творческий характер это одно из фундаментальных свойств человеческого языка. Говорящий располагает богатым инвентарем возможностей вербализации одного и того же смысла. Называя объекты действительности, говорящий выбирает одну из них. Рассмотрим следующий пример из газеты Wall Street Journal: (1.1) Сержио Мартинез, паяльщик, содержащий свою семью, состоящую из семи человек, на сумму около семи долларов в день, откладывал каждое песо, когда (он/Сержио Мартинез/Мистер Мартинез) только мог, чтобы оплатить своей дочери, Гризельде, обучение в частной щколе. Как одна из единиц бедных учеников, имеющих среднее образование. Мисс Мартинез (Гризельда/она) мечтала стать художником-декоратором. Но в итоге она ({0/ эта} молодая женщина молодой специалист) смогла получить только секретарскую работу. В возрасте тридцати четрырех лет и незамужем, она (Мисс Мартинез эта окенщина его дочь) зарабатывает всего семьдесят долларов в неделю и спращивает себя, не непрасно ли была жертва ее отца (*Мистера Мартинез *его) [перевод мой ОК]). Мы видим, что в ряде случаев существует более одной возможности Sergio Martinez, а tinsmith who supported his family of seven on the equivalent of a few dollars a day, saved every peso he (*{Mr. /Sergio} Martinez) 1 could to pay for a private-school education for his daughter, Griselda. As one of the few poor students in town to finish high school, Ms. Martinez (Griselda /she) dreamed of becoming an interior designer. But all she ({the/this} young {woman/professional}) could land was a secretarial job. Now 34 old and unmarried, she (Ms. Martinez this woman his daughter) earns just $70 a week and wonders whether her fathers (Mr. Martinezs his) sacrifice was in vain (The WSJ, Vol. XXIII No. 117, July 18,2005).референции к протагонистам данного отрывка (отдельные возможности лексических альтернатив перечислены в скобках). Так, Griselda (см. второе предложение), по всей вероятности, ничего не меняет в интерпретации референта и, таким образом, является не менее приемлемой альтернативой, чем употребленное Ms. Martinez. Однако возможность лексического варьирования не безгранична. В приведенном выше примере некоторые употребления референциальных выражений совершенно незаменимы. Так, во второй строке полная именная группа невозможна на месте местоимения he, а именная группа Ms. Martinez в последнем предложении не может быть заменена на референциально эквивалентную дескрипцию his daughter, а her fathers нельзя заменить именной группой Mr. Martinezs. Процесс выбора говорящим одного из нескольких потенциально возможных средств референции во время порождения речи, результатом которого является связное, когерентное высказывание, мы будем называть реферет{иальным выбором вслед за Chafe (1980); Ariel (1990); Кибрик (1997). Референциальный выбор тесно связан с установлением когерентности механизмом, благодаря которому текст воспринимается как единое целое, а не как набор частей. Объектом исследования настоящей работы является именная референция, то есть референциальный выбор именных групп. Именные группы (далее, ИГ) могут составлять от 55 до 80 процентов текста (в зависимости от жанра), ср. Biber et al. 1999:231,, и, по мнению данных авторов, являются основными носителями смысла в дискурсе. Употребление исследовательской референциальных средств является популярной в темой в последние десятилетия и представлено литературе по теории языка (например, Givon 1983; Chafe 1976, 1994; Ariel 1990, 2001; Gundel et al. 1993; Stevenson et al. 1995; Кибрик 1996, в связи с проблематикой копштивной доступпости, или выделепности референта; Fox 1987; Asher 1993; Cristea et al. 2000 о связи дискурсивной структуры и Подсчеты были произведены для английских текстов для всех ИГ, в том числе для ИГ без определенной референции.референциальной доступности) и в прикладных исследованиях (например, Ge et al. 1998; Wolters 2001; Mitkov 2002; Gardent 2003, в связи с проблематикой разрешения и генерирования анафоры), В российской традиции об анафоре и референции в целом писали В,В. Иванов (1979), А.С. Чехов (1981), Н.Д, Арутюнова (1982), М.А. Кронгауз (1983) Е.В. Падучева (1985.), Л.И. Куликов (1985), А.А. Кибрик (1987; 1997 и т.д.), О. Богуславская и И. Муравьева (1987); Г.Е. Крейдлин и А.С. Чехов (1989), В.И. Подлесская (1990), В. Гладров (1992), А.Д. Шмелев (1992), Ю. Толдова (1994) и другие. Мы исходим из распространенной гипотезы, что референциальный выбор тесно связан с процессом активирования информации в кратковременной памяти (working memory) (Chafe 1994; Tomlin and Pu 1991; Givon 1995; Kibrik 1999). Этот когнитивный процесс регулируется с помощью ряда синтаксических, лексико-семантических и прагматических факторов, как, например, информационный статус, синтаксическая и семантическая роль референта и т.д. Поскольку референциальный выбор в каждом конкретном случае зависит от совместного влияния различных факторов, мы говорим о референциалыюм выборе как о многофакторном процессе, ср. Givon (1980), Кибрик (1997), Strube and Wolters (2000). Исследование природы этих факторов на представительном эмпирическом материале является в данный момент актуальной задачей, которую, ввиду количества накопленного опыта в области анафоры, можно по праву считать своевременной и назревшей, а также значимой для лингвистики в целом, ср. Кибрик (1997): Многие языковые явления и процессы не могут быть объяснены элементарным образом, так как их реализация зависит от множества факторов одновременно... Одна из насущных задач лингвистики научиться описывать многофакторные процессы, то есть моделировать взаимодействие релевантных факторов..1 Постановка задачи Каждый день человек сталкивается с новой информацией. Для того, чтобы адекватно реагировать на нее, он нуждается в специфических когнитивных механизмах. При встрече с неизвестным человек ищет «ключи» признаки, на основании которых он может активировать тот или иной механизм. Эта способность человека позволяет отождествить объект на основании всего лишь нескольких признаков, как, например, при распознавании объектов на расстоянии. Эта способность, с другой стороны, является причиной стереотипов и клише: мы смотрим на вещи, на людей и на события через призму известного и знакомого. Как в жизни, так и в науке, это может являться источником систематических искажений реальности, В настоящее время накоплена огромная база знаний в области исследования принципов и условий употребления средств референции. Но степень влияния различных факторов на референциальный выбор по сей день не ясна. Очевидно, причина стагнации не в том, что анафору недостаточно исследовали. Логично подозревать причину в том, «как». Во-первых, поколения лингвистов занимались изучением анафоры исключительно методом интроспекции, причем на лично изобретенных примерах. Во-вторых, из-за технической и методологической сложности работы с крупными корпусами текстов, большипство эмпирических исследований до сих пор часто проводилось всего лишь на нескольких десятках естественно-языковых примеров. Но как, не имея перед собой предсавительных эмпирических данных, можем мы понять, где истина, а где мы переступаем границы разумного? Не начинаем ли мы вместо того, чтобы создавать модели, объясняющие язык, строить наще воснриятие языковой действительности па основании наших же моделей? Проблемой чисто теоретических дискуссий, основывающихся на ограниченных эмпирических или вообще искусственных данных, является отсутствие объективной возможности разрешить конфликты между их предсказаниями. Рассмотрим несколько примеров таких конфликтов. Исходя из допущения когнитивно-ориентированных теорий, что позиция субъекта используется для кодировапия самого активированпого референта в предыдущем предложении, в следующей клаузе ожидается местоименная референция к этому объекту, ср. (Grosz et al. 1995). На основании этого допущения можно объяснитъ примеры (1.2а) и (1.2Ь), но не (1.2с). С другой стороны, существует гипотеза синтаксического параллелизма, сутъ которой состоит в том, что синтаксическая позиция местоимения имеет тенденцию совпадать с синтаксической позицией антецедента (Stevenson et al. 1995). Это объясняет местоименную референцию в (1.2с), но не в (1.2а) и (1.2а) (1.2b) (1.2c) John kicked Bill. Mary told him to go home. [=John] Bill was kicked by John. Mary told him to go home. [=Bill] John kicked Bill. Mary punched him. f=Billf Случаи конфликта часто представляют собой тупиковые ситуации для систем разрешения анафоры, которые строятся на имплементации предпочтений преимуществ одних факторов перед другими (ср. Orasan et al. 2000). Рассмотрим еще ряд примеров: (1.3а) George removed the disc from the computer and then disconnected it. (1.3b) George removed the disc from the computer and then copied it. (1.3c) The Chinese have been copying American computers and producing them at less than a quarter of the cost\ В (1.3 a) разрешение анафоры происходит неправильно, если алгоритм строится на имплементации преимуществ одних грамматических ролей перед другими. Ближайшим антецедентом, совпадающим с анафором по роду и имеющим более приоритетную роль, является the disc (прямой объект), тогда как правильпый антецедент, the computer, имеет менее престижную роль. Однако в (1.3b) эта стратегия работает: the computer и являются прямыми объектами. В (1.3с) стратегия предпочтений вообще не работает, так как референция производится к некоторому имплицитному объекту, а не (КеЫег 2002 с. 143). Идентификация референта (в квадратных скобках) проводилась в рамках эксперимента. (Mitkov 2002:46) 10 непосредственно к американским компьютерам. В российской лингвистике основополагающие работы по референции принадлежат Е.В. Падучевой (Падучева 1980; 1982; 1983; 1985). В работах Е.В. Падучевой рассматривается широкий спектр употреблений референциальных средств, и описываются семантические различия между этими употреблениями. В работе В.Н. Полякова денотативные статусы Е.В. Падучевой расшифровываются в логико-семантических терминах в виде лингво-семантических графов (Поляков 1997). Принимая во внимание выдающиеся заслуги Е.В. Падучевой в изучении референции, необходимо отметить, что остаются области, требующие донолнительных исследований. Так, например, в работе (Падучева 1985) охвачено большое количество случаев употребления группы этот X. И все же остается неясным, какие факторы предопределяют употребление именно указательной группы с местоимением этот, а не простой ИГ или местоимения, так как вышеперечисленные условия могут также выполняться и для простых ИГ, и для местоимений. Классификация личных местоимений предлагается лишь с точки зрения денотативных статусов их антецедентов и логической структуры нредложения. В настоящем исследовании установки, мы будем придерживаться модель другой методологической некоторого согласно средства которой должна употребления описывать референциального не только некоторые случаи употребления, но и подтверждать или опровергать гипотезы о влиянии тех или иных факторов. Мы покажем, что объяснительная модель референциального выбора должна быть многоуровневой, в том смысле, что эти факторы принадлежат различным описательным уровням языка, а не только одному уровню семантике или синтаксису. Единственный способ проверить влияние факторов на различных уровнях это исследовать природу этих факторов на представительном корпусном материале. В настоящем исследовании мы выбрали именно этот путь. 11 .2 Материалы и метод Анафора сложный механизм и усваивается полностью относительно поздно, ср. (de Week 1991; Childers and Tomasello 2001, Millogo 2005). Сложность функционирования анафорического механизма в дискурсе отчасти является причиной того, что, несмотря на пристальное внимание исследователей, многие методологические и теоретические вопросы в области анафоры остаются открытыми. Другая причина историческая: долгое время занятие лингвиста состояло буквально в том, чтобы размышлять над отдельными примерами, в лучшем случае, вырванными из контекста, а чаще просто придуманными. Результатом этого процесса стало появление системы абстрактных, независимых от коммуникативных функций правил, пригодных для объяснения того или иного языкового употребления в этих примерах (ср. Chomsky 1981, 1995; Reihnart 1983). Такой способ формально- синтаксического изыскания известен также под несколько саркастичным именем armchair linguistics, поскольку, грубо говоря, все, что нужно для исследования это кресло и собственная языковая компетенция. Подробнее мы остановимся на этом подходе в

Похожие диссертационные работы по специальности «Теория языка», 10.02.19 шифр ВАК

Заключение диссертации по теме «Теория языка», Красавина, Ольга Николаевна

5.3 Выводы Главы 5

В примерах (1.4) и (1.5) было показано наличие конфликта между правилами, постулируемыми в различных моделях (см. Введение). Автоматические системы, в которых имплементированы стратегии предпочтений одних правил перед другими, становятся настолько громоздкими и сложными, что остается только задуматься над тем, неужели языковая реальность действительно настолько сложна, и сколько селекционных операций должно произойти в считанные доли миллисекунды в мозгу, когда адресат интерпретирует данный аспект высказывания. Утверждая в обзоре последних достижений в области разрешения анафоры (Mitkov 2002), что целью моделей разрешения анафоры является составить исчерпывающий список всех правил и исключений, автор невольно демонстрирует, что терапия на самом деле мало чем отличается от диагноза.

Мы рассматриваем конфликт различных правил, или, в терминах функциональной традиции, различных мотиваций как подтверждение того, что существует не одна абсолютная теория, объясняющая все случаи употребления, а множество стратегий, применимых только в определенных ситуациях и неприменимых в других.

Референциальные средства располагаются на шкале доступности, место их расположения соответствует области доступности, при которой наиболее вероятно их употребление (ср. Ariel 1990; Ariel 2001). На (условных) границах этих областей возможна диффузия, так что области доступности различных референциальных средств могут пересекаться. На левом полюсе шкалы, который соответствует максимальной доступности, расположены местоимения, на правом - простые ИГ, а посередине - указательные местоимения. С уменьшением доступности увеличивается эксплицитность -количество лексического материала, используемого для кодирования информации. Однако, помимо этого процесса, происходит еще и обратный процесс: с ростом эксплицитности уменьшается роль когнитивных факторов, таких как степень доступности в референциалыюм выборе, и возрастает вероятность, что дополнительные, независимые от доступности факторы вступят в силу (ср. Рис. 52).

Релевантность степени доступности

Манифестаций в дискурсе: ■ престижная позиция ■ близость к антецеденту

Статус информации данное/новое:

Эхстралингвистичесхие, speakerprivate", прагматические факторы

Свойства референта: Одушевленность протагонизм

Рис. 52: Степень влияния доступности и дополнительных факторов в зависимости от референциального средства

Действительно, есть функции, более приоритетные для одних референциальных средств и менее приоритетные для других и наоборот. Для местоимений, например, мы предлагаем следующую иерархию функций референциальных выражений по приоритетности:

Идентификация/доступность > добавление новой информации и т.д.

Идентификация референта на основании степени его доступности является основной функцией референциальных выражений в письменном дискурсе. Чтобы слушающий мог идентифицировать референт правильно, говорящий должен адекватно подобрать референциальное средство. В отличие от устного дискурса, где участники дискурса могут координировать процесс «он-лайн», в письменном дискурсе говорящий редко получает второй шанс уточнить референцию.

Надо иметь в виду, что с точки зрения теории языка крайне неправильно предсказывать употребление референциальных средств только на основании их наиболее приоритетных функций. Разумеется, в алгоритмах разрешения анафоры таким образом повышается вероятность правильного результата. Однако меньшинство случаев, для которого приоритетная стратегия не работает, игнорируется. Важно отметить, что для теоретического описания эти случаи не менее важны, чем все остальные. Ключ к пониманию процесса референции заложен в том, как взаимодействуют между собой различные и, возможно, конкурирующие механизмы. В настоящем исследовании и, в особенности, в Главе 5, на представительном эмпирическом материале были изучено и выявлено взаимодействие следующих механизмов:

• линейное и иерархическое расстояние

• преимущество первого упоминания и преимущество недавности упоминания

• подлежащность антецедента и параллелизм грамматических ролей

• одушевленность и расстояние (а также другие факторы активации и их зависимость от расстояния).

В данной главе мы показали, что линейное и иерархическое расстояние действительно взаимодействуют, как и преимущество первого упоминания с преимуществом недавности, причем в обоих случаях играет роль, на каком уровне происходит референция - более локальном или более глобальном. Мы показали, что как подлежащность антецедента, так и фактор параллелизма значимы для употребления местоимений, с тем отличием, что во втором случае когнитивная выделенность, или доступность, или активация имеет место на уровне текстовой структуры (группы предложений, связанных специальным отношением когерентности), а не референциальной цепочки. Мы также показали, что такие факторы, как одушевленность, релевантность референта для последующего дискурса компенсируют потерю активации референта при увеличении расстояния в дискурсе до антецедента местоимения.

Глава 6 Заключение

В настоящей работе были представлены теоретические и прикладные аспекты референциального выбора, исследованные на репрезентативном корпусном материале. В качестве эмпирической базы были использованы корпуса, для референциальной аннотации и анализа которых была применена теоретически нейтральная методология, специально разработанная в рамках настоящего исследования для данных целей. Кроме синтаксических и семантических свойств дискурсивных объектов, были изучены факторы, связанные с дискурсивной структурой, причем как с теоретико-методологической перспективы, так и эмпирически. При этом, благодаря размеру использовавашихся корпусов, было достигнуто качество исследовательской работы, до сих пор не представлявшееся возможным.

Мы рассмотрели две важнейшие теории референциальной доступности, Иерархию Данности и Иерархию Доступности, утверждающие, что доступность, или активация в памяти является главным детерминантом референциального выбора, и показали, что они имеют потенциал для уточнения. Так, для указательных местоимений диапазон возможного уровня активации шире, чем им приписывается, а для описания их употребления необходимо учитывать другие, прагматические факторы.

Важным выводом является прояснение влияния линейной и риторической структуры дискурса на референциальный выбор. Линейное расстояние показало преимущество над теорией вен (Cristea 2000) и моделью стеков (Grosz and Sidner 1986), а также над понятием риторического расстояния, разработанного A.A. Кибриком (1997) и уточненного в рамках данной работы. С одной стороны, это опровергает центральную гипотезу этих подходов о том, что иерархическая структура дискурса является более сильным фактором, чем линейная структура. С другой стороны, оказывается, что риторическое расстояние является индикатором глобальной структуры дискурса и локальные стратегии имеют соответственно разные зоны действия.

Этот результат соответствует сформулированному в настоящей работе предположению, что глобальная структура дискурса соответствует иерархической организации дискурса, а локальная - линейной.

Анафорическая разметка является по сей день одним из самых сложных видов аннотации, и для нее по-прежнему не существует единого стандарта. Предложенная схема для аннотации является попыткой претворить в жизнь такой стандарт. Для этого был предложен компромисс между детализацией и реалистичностью выполнения, что являлось «камнем преткновения» в корпусной традиции до сих пор. Данная схема была использована для проведения описанного в Главе 5 исследования. Однако кроме непосредственных целей данной работы, она может быть полезна в целом для аннотации корпусов по референции. С помощью имплементации концепта основной и расширенной схем, исследователь с любым уровнем технических навыков получает возможность выбора необходимого уровня детализации.

В настоящей работе подвергнуты критическому анализу главные предположения известных теорий - теории центрирования (Grosz et al. 1995), теории вен (Cristea et al. 1998) и теории стеков (Grosz and Sidner 1986). Эмпирические результаты, полученные при квантитативном анализе корпусов, опровергли предположение, что достаточно только одного фактора, чтобы предсказать референциальный выбор. Необходимость учитывать факторы различной природы показывается на примере взаимодействия и взаимокомпенсации следующих факторов:

• линейное и риторическое расстояние;

• расстояние и одушевленность;

• расстояние и релевантность референта в последующем дискурсе.

Важную проблему представляет собой тот факт, что лингвисты до сих пор концентрировались на рассмотрении оппозиции местоимений и простых ИГ. В данной работе отдельному рассмотрению подверглись более детальные категории. Результаты исследования показали, что при изучении местоимений необходимо выделять как минимум две категории: актантные и посессивные местоимения. Далее, указательные местоимения, в связи с их низкой частотностью, часто рассматриваются как одна категория с личными местоимениями (в том числе и в рамках настоящей работы), тем не менее, важно отдавать себе отчет в том, что это отдельная категория с особенными свойствами. Последнее было также подтверждено описанными в данной работе эмпирическими результатами. Среди простых ИГ необходимо проводить разграничения по степени сложности. Для этого в данной работе были введены формальные критерии, по которым некоторая ИГ рассматривалась как простая и как составная. Как и в случае местоимений, полные указательные ИГ также подлежат отдельному рассмотрению.

Результаты данной работы уточняют результаты изысканий многих исследователей (Ariel 1990; Gundel et al. 1993, Кибрик 1997)

• с формальной точки зрения

• на репрезентативном корпусном материале.

Употребление указательных ИГ зависит от когнитивной активации референта, но не определяется ею. Это подтверждается, во-первых, тем, что одушевленность референта не так существенна для употребления указательных ИГ, как для зависящих в первую очередь от активации референциальных средств - местоимений. Во-вторых, прагматические факторы, как утверждение референта в дискурсе, играет более значимую роль в употреблении указательных ИГ, чем некоторый определенный уровень активации. Это подтверждается результатами анализа фактора «дискурсивный статус референта»: указательные ИГ имеют преимущественно дискурсивно-новые антецеденты. Далее, чаще, чем остальные референциальные средства, указательные ИГ имеют неопределенные ИГ в качестве антецедента.

Кроме того, на основании эмпирических данных мы предлагаем следующее разрешение «конфликта» первого упоминания и недавности. В немецком языке и у ближних, и у дальних местоимений наблюдается тенденция к употреблению с антецедентом в конце предложения. Этот результат можно интерпретировать в соответствии с утверждением Пражской школы о существовании фокальной области в предложении: даже дискурсивно-новые референты, употребленные в пределах этой области, становятся максимально доступными/выделенными (salient) (Hajicova and Vrbova, Hajicova et al. 1990), ср. также исследование на материале датского языка (Navaretta 2002). Возможно, в немецком языке фокальная область сконцентрирована именно в конце предложения.

Описанные в работе результаты были получены для английского и немецкого языков, однако общие механизмы взаимодействия рассмотренных факторов, в частности, расстояния, иерархической структуры дискурса и референциального выбора могут иметь универсальный характер.

Результаты данной работы имеют также практическое значение. Так, в системах автоматического перевода наличие адекватного алгоритма разрешения анафоры, в котором учитываются особенности референциальных средств в соответствующих языках, исключительно важно.

Понимание принципов, контролирующих и регулирующих употребление отдельных типов референциальных средств, является необходимым шагом на пути к пониманию общих механизмов референциального выбора.

Список литературы диссертационного исследования кандидат филологических наук Красавина, Ольга Николаевна, 2006 год

1. Армеева, А.Р. «Когнитивная категория выделенности и ее языковые корреляты», Диссертация , М., 2001.

2. Арутюнова, Н.Д. (1982). Лингвистические проблемы референции. В кн.: НЗЛ. М: Прогресс, вып. 13, с. 347-359.

3. Богуславская, О.Ю. и Муравьева, И.А. (1987). Механизм анафорической номинации. В кн.: Моделирование языковой деятельности в интеллектуальных системах (под ред. А.Е. Кибрика и A.C. Нариньяни). М: Наука, с. 78-127.

4. Бонч-Осмоловский, Ф. (2005). Проблема преобразования референциальной разметки в формат ММАХ-2. Курсовая работа. МГУ им. Ломоносова.

5. Гладров, В. (1992). Семантика и выражение определенности неопределенности // Теория функциональной грамматики. Субъектность. Объектность. Коммуникативная перспектива высказывания. Определенность/неопределенность. СПб: Наука. С. 232-266.

6. Евстигнеев В.А. (1985). Применение теории графов в программировании. — М.: Наука.

7. Ефимова, З.В. (2003). Факторы, влияющие на выбор референциальных выражений в японском нарративе. В кн.: Актуальные проблемы японского и общего языкознания. Ред. В.М. Алпатов. Москва, Восточная Литература.

8. Земская, Е.А., Китайгородская М.В., Ширяев E.H. (1981). Русская разговорная речь. М.

9. Иванов, В.В. (1979). Категория определенности-неопределенности и шифтеры. В кн.: Категория определенности-неопределенности вславянских и балканских языках. М: Наука, с. 90-118.

10. Кибрик A.A. (1983). Об анафоре, дейксисе, и их соотношении. В сб.: Разработка и применение лингвистических процессоров. Под ред. А.С.Нариньяни. Новосибирск.

11. Кибрик, A.A. (1987). Механизмы устранения референциального конфликта в русском языке. Моделирование языковой деятельности в интеллектуальных системах (под ред. А.Е. Кибрик, A.C. Нариньяни). Москва: Наука, 128-146.

12. Кибрик, A.A. (1997). Моделирование многофакторного процесса: выбор референциального средства в русском дискурсе, Вестник МГУ, 1997, №4.

13. Кибрик, A.A. и Плунгян, В.А. (1997). Функционализм. В сб.: Фундаментальные направления современной американской лингвистики. Под ред. A.A. Кибрика, И.М. Кобозевой и И.А. Секериной. Москва.

14. Кибрик, A.A., Кобозева, И.М. и Секерина, И. А. (ред.) (1997). Фундаментальные направления современной лингвистики. Москва.1. Кибрик, A.A. Дейксис.httD://www.krugosvet.ru/articles/76/l 007612/1007612al .htm (03.03.06)

15. Кибрик А.Е. 2006 (в печати). Когнитивный подход к языку.

16. Крейдлин, Г.Е. и Чехов, A.C. (1989). Соотношение семантики, актуального членения и прагматики в лексикографическом описании анафорических местоимений (на материале местоимений группы ТОТ). ВЯ.

17. Красавина, О. Н. (2002). Употребление указательной именной группы в русском письменном дискурсе. Дипломная работа. МГУ им. Ломоносова.

18. Красавина, О. Н. (2004). Употребление указательной именной группы в русском письменном нарративном дискурсе. М: ВЯ, Выпуск 3.

19. Кристофидес H.H. Теория графов. Алгоритмический подход. М.: Мир, 1978.

20. Кронгауз, М.А. (1983). Тип референции именных групп с кванторными местоимениями все, всякий и каждый. В кн.: Семиотические аспекты формализации интеллектуальной деятельности. Тезисы докладов. Москва: ВИНИТИ, с. 208-210.

21. Крылов, С.А. (1983). Морфосинтаксические механизмы выражения категориидетерминации в современном русском языке // Разработка и применение лингвистических процессоров. Новосибирск,, с. 148-170.

22. Куликов, JI.H. (1985). О взаимозаменяемости анафорических местоимений этот и такой. Вестник МГУ, серия 9. Филология, № 1.

23. Литвиненко, А.О. (2000). Теория Риторической структуры как универсальный инструмент описания дискурса. Дипломная работа, Глава 2. МГУ им. Ломоносова.

24. Падучева, Е.В. (1980). О денотативном статусе именных групп в предложении. Учен, запис. Тарт. университета, вып. 519, с. 48-81.

25. Падучева, Е.В. (1982). Значение и синтаксические функции слова это. В кн.: Проблемы структурной лингвистики 1980. М.: Наука, с. 76-90.

26. Падучева, Е.В. (1983). К теории референции: имена и дескрипции в неэкстенсиональных контекстах. НТИ: Сер. 2, №1, с. 24-29.

27. Падучева, Е.В. (1985). Высказывание и его соотнесенность с действительностью: (референциальные аспекты семантики местоимений). Москва. Наука.

28. Петрова, А. (2004). Автоматическое установление референции именных групп и притяжательных местоимений в английском тексте. Курсовая работа. МГУ им. Ломоносова.

29. Подлесская, В.И. (1990). Вопросы лексической и синтаксической семантики: анафора в современном японском языке. Москва.

30. Поляков, В. Н. (1997). Модели алгоритмического типа для распознавания семантических связей в системах машинной обработки естественного языка. Диссертация на соискание ученой степени кандидата технических наук. М.

31. Соколова, Е.Г. и М.В. Болдасов (2005). Планирование текстов в системах генерации на естественном языке. Труды конференции ДИАЛОГ Звенигород, 1-6 июня 2005 г.

32. Соссюр, Ф. де. (1998). Курс общей лингвистики. М.

33. Тестелец, Я.Г., (2000). Введение в общий синтаксис. Москва, Российский Государственный Гуманитарный Университет.

34. Толдова, С.Ю. (1994). Структура дискурса и механизм фокусирования как важные факторы выбора номинации объекта в тексте. Автореферат на соискание ученой степени кандидата филологических наук. Московский Государственный Университет.

35. Трубецкой, Н. (1939/1960). Основы фонологии. М.

36. Чехов, А.С. (1981). Отождествляющее анафорическое отношение как фактор внутренней организации высказывания. В кн.: МП и ПЛ, вып. 19, с. 3961.

37. Шмелев, А.Д. (1992). Определенность/неопределенность в аспекте теории референции. В кн.: Теория функциональной грамматики. Субъектность. Объектность. Коммуникативная перспектива высказывания. Определенность/Неопределенность. СПб.: Наука, С.266-278.

38. Abney, S. Р. (1991). Parsing by chunks. Principle-based parsing: Computation and psycholinguistics. R. C. Berwic, S. P. Abney and C. Tenny. Boston, Kluwer Academic Publishers: 257-278.

39. Anderson, A., M. Bader, E. Bard, E. Boyle, G. Doherty, S. Garrod, S. Isard, J. Kowtko, J. McAllister, J. Miller, C. Sotillo, H. Thompson and R. Weinert. (1991). The HCRC Map Task Corpus. Language and Speech 34:351-366.

40. Aone, C. and S. W. Bennett (1994). Evaluating Automated and Manual Acquisition of Anaphora Resolution Strategies. 33d Annual Meeting of the ACL, Santa Cruz, New Mexico.

41. Ariel, M. (1990). Accessing Noun-Phrase Antecedents, London: Routledge.

42. Ariel, M. (1991). "The function of accessibility in a theory of grammar." Journal of Pragmatics 6:443-463.

43. Ariel, M. (1994). "Interpreting anaphoric expressions: a cognitive versus a pragmatic approach." Journal of Linguistics 30: 3-42.

44. Ariel, M. (2001). Accessibility theory: an overview. Text representation: linguistic and psycholinguistic aspects. T. Sanders, Amsterdam u.a.: Benjamins. 8: 29-87.

45. Asher, N. (1993). Reference to abstract objects in discourse, Dordrecht: Kluwer.

46. Baddeley, A. (2003). Working Memory and language: an overview. Journal of communication disorders 36 (2003): 189-208.

47. Biber, D., S. Conrad and R. Reppen (1998). Corpus linguistics: investigating language structure and use. Cambridge; New York, Cambridge University Press.

48. Biber, D., S. Johansson, G. Leech, S. Conrad and E. Finegan (1999). Longman Grammar of Spoken and Written English.

49. Boas, F. (1940). Race, Language and Culture. New York, Macmillan.

50. Bongers, H. (1947). The History and Principles of Vocabulary Control. Worden, Wocopi.

51. Bosch, P. (1983). Agreement and Anaphora: A study of the Role of the Pronouns in Syntax and Discourse. London, Academic Press.

52. Bosch, P., Rozario, T,. and Y. Zhao (2003). Demonstrative pronouns and personal pronouns. German der vs. er. Proceedings of the EACL2003. Budapest. Workshop on the computational treatment of anaphora.

53. Bosch, P. (2005). Productivity, Polysemy, and Predicate Indexality. Presentation in "Semantikzirkel". Berlin, ZAS. 03.06.

54. Bosma, W. E. (2005). Query-based summarization using rhetorical structure theory. 15 th Meeting of CLIN, LOT, Leiden.

55. Botley, S. (1999). Corpora and discourse anaphora: using corpus evidence to test theoretical claims, University of Lancaster, UK.

56. Botley, S. and T. McEnery (2000). Discourse anaphora. Corpus-based and Computational Approaches to Discourse Anaphora.

57. Branco, A., T. McEnery and R. Mitkov, Eds. (2005). Anaphora Processing: linguistic, cognitive and computational modelling. Current issues in linguistic theory. Amterdam/Philadelphia, John Benjamins.

58. Brants, S., S. Dipper, S. Hansen, W. Lezius and G. Smith (2002). The TIGER Treebank. Proceedings of the Workshop on Treebanks and Linguistic Theories Sozopol.

59. Brants, S. and S. Hansen (2002). Developments in the TIGER Annotation Scheme and their Realization in the Corpus. Third Conference on Language Resources and Evaluation (LREC 2002).

60. Brants, T. (2000). TnT A statistical Part-of-Speech Tagger. Sixth Conference on Applied Natural Language Processing (ANLP), Seattle, WA.

61. Britton, B. K. et. al. (2001). Thinking about bodies of knowledge. Text Representation. Linguistic and psycholinguistic aspects, Amsterdam: Benjamins273-306.

62. Brown, C. (1983). Topic continuity in written English narrative. In: Givon, T. (ed.). (1983a), Topic continuity in discourse: a quantitative cross-language study, Amsterdam: Benjamins.

63. Bruneseaux, F. and L. Romary (1997). Codage des references et coreferences dans les dialogues homme-machine. ACH-ALLC'97, Ontario, Canada.

64. Carden, G. (1982). Backward anaphora in discourse context. Journal of linguistics, 18,361-387.

65. Carlson, L., D. Marcu and M. E. Okurowski (2003). Building a Discourse-Tagged Corpus in the Framework of Rhetorical Structure Theory. Current directions in discourse and dialogue, Kluwer Academic Publishers85-112.

66. Cathercole, S.E. and A. Baddeley (1993). Working memory and language. Hove, Sussex, Lawrence Erlbaum.

67. Chafe, W. (1976). Givenness, contrastiveness, definiteness, subjects, topics and point of view. Subject and topic. C. N. Li. New York, Academic Press: 2555.

68. Chafe, W. (1994). Discourse, Consciousness, and Time. The Flow and Displacement of Conscious Experience in Speaking and Writing. Chicago, University of Chicago Press.

69. Chambers, C. and R. Smyth (1998). Structural parallelism and attentional focus: a test of Centering Theory. Journal of Memory and Language, 39: 593-608.

70. Chiarcos, C. (2005). Mental salience and grammatical form: Generating referring expressions. Multidisciplinary Approaches to Discourse (MAD), Berlin-Chorin.

71. Chiarcos, C. and O. Krasavina (2005a). Rhetorical Distance revisited: A parametrized approach. Workshop in Constraints in Discourse, Dortmund.

72. Chiarcos, C. and O. Krasavina (2005b). Annotation Guidelines. POCOS Potsdam Coreference Scheme. http://amor.cms.huberlin.de/~krasavio/annorichtlinien.pdf (09.02.2006)

73. Chiarcos, C. and O. Krasavina (2005c). Rhetorical Distance Revisited: A pilot study. Proceedings of Corpus Linguistics 2005, Birmingham, UK.

74. Childers, J.B. and Tomasello, M. (2001). The role of pronouns in young children's acquisition of the english transitive construction. Developmental psychology. 37, 6,739-748.

75. Chomsky, N. (1981). Lectures on government and binding. Dordrecht, Holland ; Cinnaminson, N.J., Foris Publications.

76. Chomsky, N. (1995). The minimalist program. Cambridge, Mass., The MIT Press.

77. Chomsky, N. (2005)Three Factors in Language Design // Linguistic Inquiry, Vol. 36, Number 1:1-22.

78. Clark, H.H. and J.S. Begun (1971). The semantics of sentence subjects. Language and Speech, 14 (34-46).

79. Clark, H.H. (1977). Bridging. Thinking: Readings in Cognitive Science. P. Johnson-Laird and P. Wason. Cambridge, Cambridge University Press.

80. Clark, H.H. and C.R. Marshal (1981). Definite reference and mutual knowledge. In A.H. Joshi, B. Webber, and I.A. Sag, editors, Elements of Discourse Understanding. Cambridge University Press.

81. Comrie, B. (1997). Pragmatic Binding: Demonstratives as anaphors in Dutch. Berkley Linguistics Society 23:49-61.

82. Cornish, F. (1999). Anaphora, Discourse and Understanding. Evidence from English and French. Oxford, Clarendon.

83. Crawley, R.A. (1986). Some factors influencing the comprehension of pronouns in text. Proceedings of the Eighth Annual Conference of the Cognitive Society,pp. 613-620. Hillsdale, NJ. Erlbaum.

84. Cristea, D., N. Ide and N. Romary (1998). Veins Theory. A model of global discourse cohesion and coherence. 36th Ann. Meeting of the ACL.

85. Cristea, D., N. Ide, D. Marcu and M.-V. Tablan (2000). Discourse Structure and Co-Reference: An Empirical Study. 8th International Conference on Computational Linguistics COLING'2000, Luxembourg.

86. Curl, T. S. (1999). The Lakhota definite articles and topic marking, University of Kansas: Linguistics Graduate Student Association.

87. Dale, R. and C. Mellish (1998). Towards the Evaluation of Natural Language Generation. 1st International Conference on Language Resources and Evaluation (LREC), Granada.

88. Davies, S., M. Poesio, F. Bruneseaux and L. Romary (1998). Annotating coreference in dialogues: proposal for a scheme for MATE. First draft.

89. De Weck, G. (1991). La cohe'sion dans les textes d'enfants. Paris: Delachaux et Niestle

90. Dipper, S., M. Götze, M. Stede and T. Wegst (2004). Annis: A linguistic database for exploring information structure. Interdisciplinary Studies on Information Structure, Potsdam: Universitätsverlag.

91. Ehrlich, K. and K. Rayner (1983). "Pronoun assignment and semantic integration during reading: eye movements and immediacy of processing." Journal of verbal learning and verbal behavior 22(1): 75-87.

92. Fligelstone, S. (1992). Developing a scheme for annotating text to show anaphoric relations. New Directions in English language corpora. Methodology, results, software developements. G. Leitner. Berlin, Mouton de Gruyter: 153-70.

93. Fox, B.A. (1986). Local patterns and general principles in cognitive processes: Anaphora in written and conversational English. Text, 6,25-51.

94. Fox, B. A. (1987). Discourse Structure and Anaphora: written and conversational English.

95. Fox, B. A. (ed.) (1996). Studies in anaphora. Amsterdam, the Netherlands ; Philadelphia, J. Benjamins Pub.

96. Fraurud, K. (1996). Cognitive ontology and NP form. Reference and referent accessibility. T. Freitheim and J. Gundel. Amsterdam, Benjamins65-87.

97. Fries, C. and A. Traver (1940). English Word Lists: A Study of their Adaptability and Instruction. Washington, DC, American Council of 3J.,Ecation.

98. Gardent, C. and K. Striegnitz (2003). "Generating bridging definite descriptions." Computer meaning. Dordrecht: Kluwer Academic Publishers 3.

99. Garside, R., G. Leech and T. McEnery (1997). Corpus annotation: linguistic information from computer text corpora. Londan, Longman.

100. Ge, N., J. Hale and E. Charniak (1998). A statistical approach to anaphora resolution. Sixth Workshop on Very Large Corpora.

101. Gernsbacher, M. A. (1989). "Mechanisms that improve referential access." Cognition 32: 99-156.

102. Gernsbacher, M. A. (1990). Language comprehension as structure building., Hillsdale, NJ: Erlbaum.

103. Gernsbacher, M. A. (1991). Cognitive processes and mechanisms in language comprehension: The structure building framework. The psychology of learning and motivation. G. H. Bower. New York, Academic Press. 27: 217263.

104. Gibbs, R. W. (1994). The poetics of mind: Figurative Thought, Language, and Understanding. Cambridge:, Cambridge University Press.

105. Givon, T. (1979). From discourse to syntax: grammar as a processing strategy. In T. Givon(ed.).

106. Givön, T. (ed.). (1983a). Topic continuity in discourse: an introduction. In: Topic continuity in discourse: a quantitative cross-language study, Amsterdam: Benjamins. T. Givön (ed.)

107. Givön, T. (1983b). Topic continuity in discourse: a quantitative cross-language study, Amsterdam: Benjamins.

108. Givön, T. (1990). Syntax. A functional-typological introduction, Amsterdam: Benjamins.

109. Givön, T. (1995). Functionalism and Grammar. Amsterdam, Philadelphia, John Benjamins.

110. Givön, T. (2001). Syntax. Amsterdam / Philadelphia, John Benjamins.

111. Götze, M. (2003). Zur Annotation von Informationsstruktur. Institut of Linguistics, Universität Potsdam.

112. Graesser A., C., Gernsbacher M. A. and R. S. Goldman (2003). Handbook of discourse processes. Mahwah, N.J.; London, Lawrence Erlbaum.

113. Grimes, J. (1978). Papers in Discourse. Arlington: SIL.

114. Gross, J. (2003). Algorithmen zur Behandlung von Anaphora in Zeitungskommentaren, Technische Universität Berlin.

115. Grosz, B. (1977). The representation and use of focus in a system for understanding dialogs, Menlo Park: Stanford Research Insitute.

116. Grosz, B. and C. Sidner (1986). Attention, intentions, and the structure of discourse. Computational Linguistics 12(3): 175-204.

117. Grosz, B., S. Weinstein and A. Joshi (1995). Centering a framework for modeling the local coherence of discourse. Computational linguistics 21(2): 203-25.

118. Gundel, J., N. Hedberg and R. Zacharski (1993). Cognitive status and the form of referring expressions in discourse. Language 69(2): 274-307.

119. Gundel, J. (1996). Relevance theory meets the givenness hierarchy: an account of inferrables. T.Freitheim and J. Gundel (eds.): 141-53.

120. Gundel, J., Borthen, K. and T.Freitheim. (1999). Focus of attention and pronominal reference to "higher order entities' in English and Norwegian. CONTEXT'99.

121. Hajicova, E. and J. Vrbova. (1982). On the Role of the Hiararchy of Activation in the Process of Natural Language Understanding, in J. Horecky (ed.), Proceedings of the 9 International Conference on Computational Linguistics, Prague- Amsterdam: 107-113.

122. Hajicova, E., P. Kubon and V. Kubon. (1990). Hierarchy of Salience and Discourse Analysis and Production. In H. Karlgren (ed.), Proceedings of the 13 th International Conference on Computational Linguistics (COLING'90), Vol. Ill; Helsinki: 144-148.

123. Halmari, H. (1996). On accessibility and coreference. T.Freitheim and J. Gundel (eds.): 155-177

124. Hawkins, J.A. (1994). A Performance Theory of Order and Constituency. Cambridge: Cambridge University Press.

125. Heim, I. (1982). The Semantics of Definite and Indefinite Noun Phrases. University of Massachusetts.

126. Halliday, M. and R. Hasan (1976). Cohesion in English. London, Longman.

127. Helbig, G. and J. Buscha (2001). Deutsche Grammatikein Handbuch fiir den Auslanderunterricht. Berlin u.a., Langenscheidt.

128. Himmelmann, N. (1996). Demonstratives in Narrative Discourse: A taxonomy of unversal uses. In Fox (ed.): 205-254.

129. Hirschman, L. and N. Chinchor (1997). MUC-8: Coreference Task Definition.

130. Hirschman, L. (1998). MUC-7 Coreference Task Definition. MUC7/8.

131. Hirst, G. (1981). Anaphora in natural language understanding. Berlin, Springer Verlag.

132. Hitzeman, J. and M. Poesio (1998). Long-distance pronominalisation and global focus. ACL/COLING 98, Montreal.

133. Hobbs, J. R. (1976). Pronoun resolution. New York, City College.

134. Jacennik, B. and M. S. Diyer (1992). Verb-Subject Order in Polish. Pragmatics of Word Order flexibility. D. Payne, Amsterdam: Benjamins: 209-241.

135. Jakobson, R. (1985). N.S.Trubetzkoy's letters and notes. Berlin N.Y. -Amsterdam: Mouton.

136. Kadratoff, Y. (1999). Knowledge discovery in texts: a definition and applications.

137. Kaiser, E. (2005). Referential properties of different forms. In Branco et al. (eds.). Anaphora Processing: linguistic, cognitive and computational modelling. Selected papers from DAARC 2002.

138. Kameyama, M. (1999). "Stressed and unstressed pronouns: complementary preferences." P. Bosch and R. van der Sandt (eds.) Focus: Linguistic, cognitive and computational perspectives. Cambridge: CUP.

139. Kamp, H. and U. Reyle (1993). From Discourse to Logic. Introduction to Modeltheoretic Semantics of Natural Language, Formal Logic and Discourse Representation Theory. Dordrecht.

140. Karttunen, L. (1976). Discourse referents. Syntax and Semantics. J. McCawley, New York Academic Press 7.

141. Keenan, E. L. and B. Comrie. (1977). "Noun phrase accessibility and universal grammar." Linguistic Inquiry 8:63-99.

142. Kehler, A. (2002). Coherence, Reference, and the Theory of Grammar, CSLI Publications.

143. Kelleher, J. and J. Genabith (2004). Exploiting Visual Salience for the Generation of Referring Expressions. 17th Int. FLAIRS Conference, Miami, Florida.

144. Kennedy, G. (1998) An Introduction to Corpus Linguistics. Longman, London

145. Kibble, R. and R. Power (2000). An integrated framework for textplanning and pronominalisation. International Conference on Natural Language Generation (INLG)".

146. Kibrik, A. A. (1996). Anaphora in Russian narrative prose: A cognitive account. Studies in Anaphora. B. Fox. Amsterdam, John Benjamins.

147. Kibrik, A. A. (1999). Reference and working memory: Cognitive inferences from discourse observation. Discourse Studies in Cognitive Linguistics. K. van Hoek, A. A. Kibrik and A. Noordman. Amsterdam and Philadelphia, John Benjamins.

148. Kibrik, A. A. (2000). A cognitive calculative approach towards discourse anaphora. Discourse Anaphora and Anaphor Resolution Colloquium (DAARC'2000).

149. Kibrik, A. A. (2002). Discourse types, genre schemata, and rhetorical relations. 6th Conference on Conceptual Structure, Discourse, and Language, Rice University, Houston, Texas.

150. Kibrik, A. A. and O. Krasavina (2005). A corpus study of referential choice. The role of rhetorical structure. DIALOG'05, Zvenigorodsky, Russia.

151. Kibrik, A. A., V. I. Podlesskaya, T. M. Kalkova and A. O. Litvinenko (2002). Cognitive structure of narrative discourse: the analysis of children's night dream stories. DIALOG02.

152. Knott, A., J. Oberlander, M. O'Donnell and C. Mellish (2001). Beyond elaboration: the interaction of relations and focus in coherent text. T. Sanders, J. Schilperoord and W. Spooren. Amsterdam, Philadelphia, John Benjamins: 181-196.

153. Krasavina, O. (2004). The use of demonstratives in written Russian discourse. Unpublished manuscript. Berlin.

154. Kronrod, A. and O. Engel (2001). "Accessibility theory and referring expressions in newspaper headlines." Journal of Pragmatics 33: 683-689.

155. MacDonald, M. and MacWhinney, B. 1990. Measuring inhibition and facilitation from pronouns. Journal of memory and language, 29:469-492.

156. Mann, B. and S. A. Thompson (1987). Rhetorical Structure Theory: A Theory of Text Organization, USC.

157. Mann, W. C. and S. A. Thompson (1988). "Rhetorical Structure Theory: Toward a functional theory of text organisation." Text 8(3): 243-281.

158. Marcu, D. (1997). From local to global coherence: a bottom-up approach to text planning, the National Conference on Artificial Intelligence (AAAI'97).

159. Marcu, D. (1999). Instructions for manually annotating the discourse structure of texts.

160. Marcu, D. (2000). Extending a Formal and Computational Model of Rhetorical Structure Theory with Intentional Structures a la Grosz and Sidner. 18th International Conf. on Computitional Linguistics (COLING'2000).

161. Marcus, M., B. Santorini and M. A. Marcinkiewicz (1993). "Building a large annotated corpus of English: the Penn Treebank." Computational linguistics 19(2): 313-330.

162. Marslen-Wilson, W., Levy, E. and L. Tyler. (1982). Producing interpretable discourse: The establishment and maintenance of reference. In R.J. Jarvella and W.Klien (Eds.), Speech, place and action (pp. 339-328). New York: Wiley.

163. McCoy, K. F. and M. Strube (1999). Generating Anaphoric Expressions: Pronoun or Definite Description? Workshop on the Relation of Discourse/Dialogue Structure and Reference.

164. McEnery, T. and A. Wilson (1996). Corpus linguistics. Edinburgh, Edinburgh University Press.

165. McEnery, T., I. Tanaka and S. Botley (1997). Corpus annotation and reference resolution, the ACL Workshop on Operational Factors in Practical, Robust Anaphora Resolution for Unrestricted Text.

166. McEnery, T. and A. Wilson (2001). Corpus linguistics. Edinburgh, Edinburgh University Press.

167. Millogo, V. E. (2005). "The use of anaphoric pronouns by French children in narrative: evidence from constrained text production." Child language 32: 439-461.

168. Mitkov, R. (1998). Robust pronoun resolution with limited knowledge. Proc. of theth

169. International Conference on Computational Linguistics (COLING'98)/ACL'98 Conference: 869-875.

170. Mitkov, R. (2002). Anaphora resolution, Pearson Education Limited.

171. Modjeska, N. N. (2003). Resolving Other-Anaphora. School of Informatics, University of Edinburgh.

172. Morton, T. S. (2000). Coreference for NLP applications. 38th Annual Meeting of the Association for Computational Linguistics, Hong Kong.

173. Moser, M. and J. Moore (1996). "Toward a synthesis of two accounts of discourse structure." Computational Linguistics 22(3): 409-419.

174. Müller, C. and M. Strube (2001). Annotating Anaphoric and Bridging Relations with MMAX. Proceedings of the 2d SIGdial Workshop on Discourse and Dialogue, Aalborg, Denmark.

175. Murphy, G. L. (1985). "Processes of understanding anaphora." Journal of Memory and Language 24: 290-303.

176. Myhill, J. (1992). Typological Discourse Analysis: Quantitative Approaches to the Study of Linguistic Function. Oxford, Blackwell.

177. O'Donnell, M. (2000). RSTTool 2.4 a markup tool for Rhetorical Structure Theory. 1st International Natural Language Generation Conference, Mitzpe Ramon, Izrael.

178. Orasan, K, R. Evans and R. Mitkov. (2000). Enhancing preference-based anaphora resolution with genetic algorithms. NLP 2000. Berlin-Heidelberg, SpringerVerlag.

179. Orasan, K. (2003). PALinkA: A highly customisable tool for discourse annotation. Fourth SIGdial Workshop on Discourse and Dialogue, Sapporo, Japan.

180. Passoneau, R. (1996). Instructions for applying Discourse Reference Annotation for Multiple Applications (DRAMA).

181. Payne, T. E. (1985). Referential distance and discourse structure in Yagua. Work Papers of the Summer Institute of Linguistics. University of North Dakota: 1-67.

182. Pearson, J., R. Stevenson, and M. Poesio (2001). Effects of animacy, thematic role and sentence position on the production of referring expressions. M. Poesio (ed.), In Proceedings of SEMPRO-2001, University of Edinburgh.

183. Poesio, M. (2004a). Discourse Annotation and Semantic Annotation in the GNOME Corpus. ACL Workshop on Discourse Annotation, Barcelona.

184. Poesio, M. (2004b). The MATE/GNOME Scheme for Anaphoric Annotation Revisited. SIGDIAL, Boston.

185. Poesio, M. (2004c). An empirical investigation of definiteness. International Conference on Linguistic Evidence, Tuebingen.

186. Poesio, M., R. Delmonte, A. Bristot, L. Chiran, and S. Tonelli. (2004). The VENEX corpus of anaphora and deixis in spoken and written Italian", submitted.

187. Poesio, M., F. Bruneseaux and L. Romary (1999). The MATE meta-scheme for coreference in dialogues in multiple languages. ACL Workshop on Standards for Discourse Tagging, Maryland.

188. Poesio, M,, B. di Eugenio and G. Keohane (2002). Discourse Structure and Anaphora: An Empirical Study, University of Essex.

189. Polanyi, L. (1988). A formal model of the structure of discourse. Journal of Pragmatics 12:601-638.

190. Popescu, A. (2003). Evaluation-driven design of a robust coreference resolution system. Natural language engineering 9(3): 281-306.

191. Posner, M.I. and C.R. Snyder. (1974). Attention and cognitive control, in R.L. Solso (ed.) Information processing and cognition: the Loyola Symposium, Hillsdale, NJ: Erlbaum.

192. Prince, A. and P. Smolensky. (2004). Optimality theory: constraint interaction in generative grammar. Blackwell publishing.

193. Prince, E. (1981). Toward a taxonomy of given-new information. Radical Pragmatics. P. Cole. New York, Academic Press:223-256.

194. Prince, E. (1992). The ZPG Letter: Subjects, Definiteness, ,and Information-status.

195. Discourse Description: diverse analyses of a fund raising text. S. Thompson and W. Mann. Philadelphia/Amsterdam, John Benjamins B.V.:295-325.

196. Pustet, R. (1997). Diskursprominenz und Rollensemantik Eine funktionale Typologie von Partizipantensystemen, Lincom Europa.

197. Ravnholt, 0. (1996). Grammatical Cues and "Referential Distance" in the Retrieval of Antecedents in Discourses. Discourse Anaphora and Resolution Colloquium (DAARC'96).

198. Reboul, A. (1997). What (if anything) is accessibility? A relevance-oriented criticism of Ariel's Accessibility Theory of referring expressions. Discourse and pragmatics in functional grammar. J. H. e. a. Connolly. Berlin/NY, de Gruyter 91-108.

199. Reinhart, T. (1983). Anaphora and Semantic Interpretation. London, Croom Helm.

200. Reitter, D. and M. Stede (2003). Step by step: underspecified markup in incremental rhetorical analysis. Proceedings of the 4th International Workshop on Linguistically Interpreted Corpora (LINC-03) (at EACL 2003), Budapest.

201. Salton, G. and M.J. McGill (1983). Introduction to modern information retrieval. McGraw-Hill.

202. Sanders, T. J. M., Wilbert P.M. Spooren, and Leo G.M.Nordman (1992). Towards a taxonomy of coherence relations. Discourse Processes 15: 1-35.

203. Schauer, H. (2000). Referential Structure and Coherence Structure. 7e conference annuelle sur le traitement automatique des langues naturelles (TALN2000), Lausanne, Switzerland.

204. Schiller, A., S. Teufel and C. Stöckert (1999). Guidelines für das Tagging deutscher Textkorpora mit STTS., Institut für Maschinelle Sprachverarbeitung, University of Stuttgart and Seminar für Sprachwissenschaft, University of Tübingen.

205. Schmid, H. (1994). Probabalistic Part-of-Speech Tagging Using Decision Trees. International conference on new methods in language processing, Manchester, UK.

206. Sibun, P. (1992). Generating text without trees. Computational Intelligence 8(1): 102-122.

207. Siewierska, A. (1993a). Subject and object order in written Polish: some statistical data. Folia Lingüistica. XXVII.

208. Siewierska, A. (1993b). " Syntactic weightvs information structure and word order vari-ation in Polish." Journal of Linguistics 29.

209. Skut, W., B. Krenn, T. Brants and H. Uszkoreit (1997). An annotation scheme for free word order languages. In ANLP-97, Washington DC.

210. Snider, N. (2005). A Corpus Study of Left Dislocation and Topicalization, Stanford University.

211. Soon, W. M. and H. T. Ng (2001). "A machine learning approach to coreference resolution of noun phrases." Computational linguistics 25(3): 309-344.

212. Stede, M. (1999). Rhetorical structure and thematic structure in text generation. Levels of Representation in Discourse (LORID), Edinburgh.

213. Stede, M. (2002). DiMLex: A Lexical Approach to Discourse Markers. Alessandria (Italy): Edizioni dell'Orso.

214. Stede, M. (2004). The Potsdam Commentary Corpus. ACL-04 Workshop on Discourse Annotation, Barcelona, July.

215. Stede, M. and C. Chiarcos (2004). Salience Driven Text Planning. INLG04, Brockenhurst/UK.

216. Stede, M. and S. Heintze (2004). Machine-Assisted Rhetorical Structure Annotation. International Conference on Computational Linguistics, COLING-2004, Geneva.

217. Stevenson, R. et. al. (1995). "The role of parallelism in strategies of pronoun comprehension." Language and speech 38: 393-418.

218. Strube, M. and U. Hahn (1996). "Functional Centering". Proc. of ACL '96:270-277.

219. Strube, M. (1998). Never look back. An alternative to Centering. Proc. ACL.

220. Strube, M. and M. Wolters (2000). A probabilistic Genre-Independent Model of Pronominalization. 1st Meeting of the North American Chapter of the Association for Computational Linguistics, Seattle, WA, USA.

221. Strube, M., S. Rapp and C.Müller (2002). The influence of Minimum Edit Distance on Reference Resolution. EMNLP "02: 312-319

222. Taboada, M. (2004). Building coherence and cohesion: task-oriented dialogue in

223. English and Spanish. Amsterdam/Philadelphia, John Benjamins.

224. Tanaka, I. (2000). The value of annotated corpus in the investigation of anaphoric pronouns, with particular reference to backwards anaphora in English.

225. Tetreault, J. and J. Allen (2003). An empirical evaluation of pronoun resolution and clausal structure. Int. Symp. on Reference Resolution and its Applications to Question Answering and Summarization.

226. Tomlin, R. and M. Pu (1991). "The management of reference in Mandarin discourse." Cognitive Linguistics 2: 65-93.

227. Tomlin, R. S. (1987). Linguistic reflections of cognitive events. Coherence and Grounding in Discourse. R. S. Tomlin. Amsterdam, Benjamins: 455-480.

228. Tomlin, R. S. (1995). Focal attention, voice, and word order. An experimental, cross-linguistic study. Word order in discourse. Downing P. and M. Noonan: 517-554.

229. Vazquez Rozas, V. (2004). Some thoughts on the calculation of referential distance. DELTA online.: 27-47.

230. Walker, M. A. (1996). "The Cache Memory Model." Computational Linguistics 22(2): 255-264.

231. Walker, M.A: and Prince, E. (1996). A bilateal approach to givenness: a hearer status algorithm and a centering algorithm. Benjamin.

232. Walker, M. A. (1998). Centering, anaphora resolution, and discourse structure. Centering in Discourse. M. A. Walker, A. K. Joshi and E. F. Prince, Oxford: Oxford University Press: 401-435.

233. Walker, M. A., A. K. Joshi and E. F. Prince (1998). Centering, anaphora resolution, and discourse structure. Centering in Discourse. Oxford: Oxford University Press: 401-435.

234. Wanner, E. (1974). On remembering, forgetting, and Understanding Sentences: a study of the deep structure hypothesis, The Hague: Morton, 1974.

235. Webber, B. (1979). A formal approach to discourse anaphora. New York, Garland.

236. Webber, B. (1991). "Structure and ostension in the interpretation of discourse deixis." Natural Language and Cognitive Processes 2(6).

237. Webber, B., M. Stone, A. Joshi and A. Knott (2003). "Anaphora in discourse structure." Computational Linguistics 29(4): 545-587.

238. Wolters, M. (2001). Towards Entity Status. Institut für Kommunikationsforschung und Phonetik. Universität Bonn.

239. Zifonun, G. (1997). Grammatik der deutschen Sprache. New York, de Gruyter.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.