Анализ использования компьютерной лингвистики в текстах на персидском языке тема диссертации и автореферата по ВАК РФ 10.02.22, кандидат наук Мухсен Рахими

  • Мухсен Рахими
  • кандидат науккандидат наук
  • 2015, Душанбе
  • Специальность ВАК РФ10.02.22
  • Количество страниц 190
Мухсен Рахими. Анализ использования компьютерной лингвистики в текстах на персидском языке: дис. кандидат наук: 10.02.22 - Языки народов зарубежных стран Азии, Африки, аборигенов Америки и Австралии. Душанбе. 2015. 190 с.

Оглавление диссертации кандидат наук Мухсен Рахими

Содержание

Введение

ГЛАВА I. Основные понятия, относящиеся к использованию компьютерной лингвистики

1.1. Контроль и извлечение информации

1.2. Преобразование и перевод текстов

1.3. Использование компьютерной лингвистики в платформах системы электронного обучения

ГЛАВА II. Компьютерная лингвистика и платформы на персидском языке

2.1. Цифровые медиа и персидский язык

2.2. Система электронного обучения на персидском языке

2.3. Вопросы письма и грамматики персидского языка

в электронных платформах

2.4. Изучение переводов, сделанных машинными переводчиками слов и

текстов

Заключение

Список иллюстраций

Список использованной литературы

Рекомендованный список диссертаций по специальности «Языки народов зарубежных стран Азии, Африки, аборигенов Америки и Австралии», 10.02.22 шифр ВАК

Введение диссертации (часть автореферата) на тему «Анализ использования компьютерной лингвистики в текстах на персидском языке»

Введение

Всем известна важность коммуникации и информации в современном мире и, несомненно, то, что различные сферы жизни общества находятся сегодня под прямым воздействием информационного мира. В то же время компьютерная технология играет важнуГо роль в достижении целей новой эпохи и проникла во все сферы жизни. Имеются определенные трудности в условиях глобализации относительно различия машинного языка от человеческого, кроме того, имеющиеся характерные особенности языка человека, все больше обуславливают необходимость решения этой проблемы. В связи с этим компьютерная лингвистика становится наиболее значимой.

Компьютерная лингвистика (Computational Linguistics) является эффективным междисциплинарным звеном науки лингвистики, компьютерной технологии и математики. Она является ветвью прикладной лингвистики, занимающейся вычислительными аспектами обработки языка. Областью её изучения является двойственная сущность языка, выражающаяся речью и текстом. Другие её направления классифицируются следующим образом: языковая инженерия, искусственный интеллект, машинный перевод текстов с одного языка на другой, информационные технологии, коммуникационные технологии, дизайн поисковых систем, извлечение информации из большого объема текста, поиск в наибольшей языковой базе данных или в интернете для нахождения ответов на разные вопросы, обработка текста и речи, получение голосовых команд на машине и их детальная реализация, преобразование текста в речь и обратно, обзор содержания текстов, разработка базы данных и терминологических банков. На рисунке 1 показана её позиция среди других отраслей лингвистики (18,89).

Круг соответствующих дисциплин охватывает вопросы, связанные с человеческим языком в общем понятии, психологию человеческого разума и искусственного компьютерного интеллекта. В связи с этим в различных системах обучения эта дисциплина иногда включается в подгруппу лингвистики, а иногда в подгруппу науки компьютерных технологий.

В наше время, когда запись и транспортировка голоса стали возможны через различные электронные устройства, такие как телефон, радио и т.д., язык стал предметом исследования и других групп специалистов, в так называемой коммуникационной инженерии. Эти исследователи рассматривают характеристики и физические свойства звуков языка (12,84).

С развитием компьютерной технологии, исследования в области естественного языка претерпели огромные изменения. На сегодняшний день программа контроля орфографических ошибок и грамматической корректировки, извлечения информации из документов и баз данных, переводов с одного естественного языка на другой язык и т.д. реализуются миллионами экземпляров по всему миру. Тем не менее, программы, пока ещё не имеющие искусственного интеллекта, до сих пор применимы. Конечной целью машинного перевода, считающегося

4

одним из лучших подкатегорий компьютерной лингвистики, является производство программных средств для правильного распознания языка и разработки мощного инструмента с целью достижения совершенства в автоматическом переводе и обширной связи человека с машиной на естественном языке. Пока ещё эта задача, которой почти 50 лет, не решена в полной мере. Но и до этого, наблюдалась потребность в использовании методов идентификации языка большинства народов, с тем чтобы иметь доступ к знаниям друг друга, то есть речь идет об универсальном языке. В средние века, например, все значимые вопросы на международном уровне высказывались на латинском языке, и поэтому универсальный язык был мечтой многих людей. Для человечества, которое искало решение проблемы коммуникации, нынче предусматривается более 600 программ (97,123).

Актуальность темы. История показывает древность и оригинальность персидского языка среди языков мира. Согласно книги по истории доктора Мехри Багери, персидский язык относится к семейству индоевропейских языков, в том числе известных под другими названиями, такими как индо-хетская, индо-германская, а также арийская группы языков (11,33). В историческом языкознании распространение этого языка хорошо просматривается по всему старому континенту. Например, в период монгольского владычества и до того периода он был официальным языком государства Индостан. Этот язык благодаря богатству лексики и приятных словосочетаний, имел много поклонников среди знати и простого народа, и, хотя на первый взгляд он проник в Индостан как язык правителей, но на протяжении веков, благодаря своему красноречию, был душевно принят миллионами людей (5,61). Всем известно, что он распространен в Таджикистане, Афганистане и в некоторых других регионах Средней Азии.

С появлением современной наук и разработки электронных устройств, распространение персидского языка и его богатого ресурса в

вычислительных платформах претерпела ряд проблем при коммуникации с другими языковыми группами.

Значимость изучения применения компьютерной лингвистики в текстах на персидском языке, действительно, показывает необходимость расширения познавательной способности внутри сообщества говорящих на фарси, а также передаче знаний через другие языки на персидский. В настоящее время знания, полученные из исследований ученых в различных областях распространяются на разных языках. Основная научная информация зарегистрирована обычно на английском языке в научных базах данных, и её извлечение на других языках для пользователей связано со многими трудностями. Это исследование свидетельствует о том, как компьютерным устройством удается передать данные с других языков на персидский и наоборот, для перевода слова и текста, преобразования аудио и видео информации, а также о том насколько персидский язык удачен в этой области.

С другой стороны можем сказать, что все большее распространение электронных платформ образовало новую среду во всех направлениях жизнедеятельности нового поколения. Между тем, язык, как социальный институт, оказавшись под воздействием нового подхода и в цифровых средствах, таких как сотовые телефоны, веб-сайты или персональные компьютеры, стал основным инструментом, ориентированным на тексты.

Например, в области лингвистических компьютерных приложений в новых платформах можно отметить систему электронного обучения с применением новых инструментов, которая установилась как отрасль образования. Хотя, изучение персидского языка через электронные платформы из-за специфических особенностей, связанных с персидской вязью или необходимых платформ менее приемлема, но можно сказать, что большинство методов обучения языку в мире с момента создания магнитных аудио кассет до появления цифровой памяти и компакт

дисков, направлены на использование звуковых и визуальных учебных пособий для повышения эффективности преподавания изучаймого языка (19,16). Возможно, основной причиной заметной неудачи системы электронного обучения персидского языка являются особенности письменности и грамматики, которые оставили безрезультатными учебные уравнения персидского языка в цифровых платформах и препятствовали расширению данной отрасли по отношению к другим языкам. В данной работе также затрагивается тема, связанная с системой электронного обучения персидского языка, и рассматриваются связанные с ней вопросы.

Степень изученности темы. С начала 50-х. годов XX столетия, имели место серьезные усилия в применении компьютеров для обработки естественного языка. Эти усилия были больше сосредоточены на машинный перевод и в силу политической ситуации того времени, то есть эпохи противоборства сверхдержав, для разработки средств конфронтации в период холодной войны концентрировались на переводе с русского на английский.

В сфере компьютерной лингвистики основной языковедческий аспект связан с ростом и эволюцией математических и инженерных отраслей, машинного перевода с одного языка на другой язык, информационной теории, радиокоммуникаций и т.д. Эта отрасль в настоящее время развивается и совершенствуется, а также имеет весьма блестящее будущее. На этой основе, данный вопрос относится к новому аспекту компьютерной технологии, который во многих вопросах компьютеризации и автоматизации для решения своих проблем охватывает потребности приблизительного решения задач по языкознанию. За последние годы возникает многое новые научных и технических вопросов о языке, автоматическом переводе научной литературы, сохранении информации, кодировании и т.д.(83,200). Русский учёный Я.В. Лоя отмечает в своей работе: «Идею машинного

перевода с языка на язык первым выдвинул советский техник-изобретатель П.П.Смирнов-Троянский, который в 1933 г. создал первый механизированный словарь.

В 1946 г. идею машинного перевода сформулировал американский лингвист В.Вивер (A.Weaver).

Опыты машинного перевода проводятся с 1954г. С помощью электронной счетной машины IBM - 701 в США были проведены первые переводы текстов технического содержания с русского языка на английский на базе 250 слов.

Техника машинного перевода использует некоторые результаты структурного анализа и статистических исследований в частотности использования структурных элементов языка и их распределения» (83,201).

В 1946 году К.Бут (K.H.V Booth) и В.Вивер впервые сформулировали концепцию машинного перевода. В.Вивер поставил свою разработку на основе методов, которыми во Второй мировой войне расшифровывали вражеские сообщения. Бутом была создана машина, которая переводила слова с одного языка на другой (23,43). Но в работе Бута не придавалось значение ни грамматике, ни порядку слов. Машинный перевод Бута в действительности, переводил на другой язык важные слова текста или ключевые слова, а понимание и интерпретация текста возлагалась на пользователя. Англичанин Р.Риченс (Richard Richens) в 1948 году придумал автоматический синтаксический анализ слов, это был дословный перевод (25,43).

В.Вивер в 1949 году, развивая работу Бута и Риченса, подверг изучению сходство инфраструктуры языков между собой, и сделал вывод, что семантическое и логическое сходства языков касаются характеристик человеческого мозга и являются общими для всех людей. То, что В.Вивер наконец добавил в работу Бута и Риченса, было предложениями по устранению семантической неопределенности.

В 1950 году «Рифлер» (Reifler) исследовал перевод сделанный человеком с помощью машины. По его убеждению в начале переводился текст, затем его редактировала машина. То есть другими словами, перевод должен был иметь одно предредактирование' и одно постредактирование2 (53,90).

«Рокфеллеровский» фонд в 1952 году на первой ограниченной конференции языковедов и специалистов по машинному переводу, присуждает значительный капитал за машинный перевод "Массачусетскому технологическому институту" (МТИ). Члены этой конференции пришли к соглашению, что исследования будут проводится в два этапа: первый включает исследования относительно частоты слов, поиск их эквивалентов, способ использования памяти компьютера, и другие технические аспекты машинного словаря; второй этап был связан с методом синтаксических анализов.

С 1952 по 1955 гг. американские ученые исследовали объем памяти компьютера, автоматическое определение смысла слов и метод анализа слов. В 1954 году два учёных языковедов Университета «Джорджтаун»3 достигли успехов перевода с русского языка на английский. Они представили образец системы машинного перевода со словарем в 250 единиц и 6 грамматическими правилами. В тот же год «MIT» (МТИ) опубликовал журнал «Машинный перевод».

В 1956 году состоялось первое международное совещание по «системам машинного перевода» с участием английских, канадских, американских и русских экспертов. В то время Соединенные Штаты, Англия и Советский Союз были основным странами, где проводились исследования машинного перевода, но ими также занимались в Италии и Скандинавии.

1 Pre-editing

2 Post-editing

3 Jorge Town

Исследователи в эти годы больше не пытались доказать, что машинный перевод может быть достигнут полностью, а занимались регулированием и централизацией индивидуальных исследований, проводимых в разных регионах мира.

В 1958 году в США двенадцать групп работали в исследованиях, связанных с машинным переводом: в Гарвардском университете создавали русско-английский словарь машинного перевода; «Ноам Хомский» (N.Chomski) проводи^ исследования по синтаксическим структурам в «MIT» (МТИ). В Университете «Джорджтаун» были исследованы вопросы синтаксиса и семантики русского языка, а в Университете «Мичиган» пытались вывести правила грамматики русского языка и решить проблемы многозначности. В Университете

«Сиэтл» также разрабатывалась система машинного перевода с русского »

на немецкий. В Лос-Анджелесе и Калифорнии учеными проводились научные исследования относительно вопросов когнитивного метода машинного перевода, причем придавалось большее значение машинному

переводу с английского на русский язык.

В Англии было проведено подробное исследование по вопросам когнитивного метода машинного перевода, одним из наиболее важных задач исследователей этой страны было сотрудничество компьютерных экспертов и лингвистов. Они приложили немало усилий, чтобы сделать лингвистику одной из дисциплин компьютерной наук, и таким образом, с*гали использовать математические методы. С 50-х годов прошлого столетия с публикации работы Ноама Хомского был начат синтаксический анализ независимо от смысла, но «Дж. Кац» (J.Katz), «Дж. Фодор» (J.Fodor) (1963) и «Пи. Эм. Постал» (P.M. Postal) (1964) ввели семантику в сферу работы машинного перевода. На следующем этапе также изучалось использование достижений науки в области обработки языка (25,43).

В случае персидского языка, при проведении исследований в области компьютерной лингвистики рассмотрены проблемы, имеющиеся между персидской грамматикой и электронными инструментами, и меньше внимания уделено основному принципу компьютерной лингвистики. Большинство учёных, которые проводили исследования по компьютерной лингвистике персидского языка, на самом деле были пользователями результатов исследований данной науки приспосабливавшими его к персидской грамматике. Одним из пионеров в исследовании этой области в Иране можно назвать доктора Мустафа Оси, профессора научно-исследовательского Института гуманитарных наук Ирана. Он возглавил самые результативные научно-исследовательские работы относительно применения компьютерной лингвистики в различных отраслях персидского языкознания в виде научных проектов или. диссертаций докторантов и магистрантов.

Основной частью этого исследования относительно компьютерной обработки персидского языка в четырех фонетических уровнях, структуре слов, синтаксисе и семантике, в рамках междисциплинарных и практических статей о компьютерной обработке персидского языка принадлежат перу этого профессора, опубликованные в специальном периодическом научном издании Академии в первом выпуске первого года месяца исфанд 1383 г.х. (февраль-март 2004г.).

В конце данной диссертации приведены также научные работы ряда иранских исследователей по корпусной лингвистике. Эта информация была опубликована секретариатом Верховного Совета информации и в виде справочника базы данных' персидского языка. Информация, содержащаяся на этом сайте была представлена в порядке датирования и её большая часть к началу написания данной работы была недоступна.

В их числе можно назвать персидско-английский сравнительный корпус Тегеранского Университета, параллельный корпус англо-церсидского уровня, персидско-английский параллельный корпус

Тегерана, телефонный «фарснет», персидский NET, корпус текста на персидском языке.

Замечательная информация об истории компьютерной лингвистики представлена господином Мехди Самой в виде статьи под названием «Числовая группа в машинном переводе» в Институте информации и научной документации Ирана, которая также использована в данной диссертации.

По вопросам персидской письменности и языкознания было проделано всеобъемлющее исследование рабочей группой секретариата Верховного Совета информации по персидской письменности и языкознанию, а также связанными с ней исследовательскими подгруппами.

В отношении обучения персидскму языку не говорящих на персидско, явно ощутимы достижения, предтавление на различных конференциях Совета по распространению персидского языка, Мешхедского Университета имени Фирдоуси и других научно-исследовательских центрах.

Цель и задачи исследования. Главная цель данного исследования заключается в том, что после выявления особенностей новой науки компьютерной лингвистики и её применения, определяется степень её влияния на процесс распространения персидского языка. В зависимости от характера все большего расширения использования цифровых инструментов, особенно в области машинного перевода, возникла необходимость ответить на основной вопрос: является ли желательным или нет номинальный запрашиваемый уровень машинного перевода слов и текста с других языков на персидский и наоборот? В случае если эти инструменты теряют необходимый потенциал для продвижения своей аудитории, то в чем причина возникновения этой проблемы и как можно изменить существующую структуру?

В данной работе рассматривается баланс применения гибкости компьютерной лингвистики в текстах на персидском языке. Но для правильного прояснения вопроса вначале необходимо определить основные понятия в области применения компьютерной лингвистики и её места относительно вычислительной характеристики языка в общем понимании, а затем приступить к сравнению различных языковых грамматик, чтобы скоординировать тип перевода сделанного машиной и человеком.

В третьем разделе первой главы рассматриваются достижения компьютерной лингвистики относительно обработки текстов, и в ходе обсуждения этих аспектов, применительно к персидскому языку, подвергаются анализу достижения в программном обеспечении данной области. Во второй главе рассматривается компьютерная лингвистика и электронные платформы на персидском языке. После изучения вопросов, связанных с положением персидского языка в цифровых средствах

массовой информации, и применения системы электронного обучения »

персидскому языку, а также, выясняя вопросы процесса машинного перевода, на трёх программных обеспечениях, переводящих текст, Сан, Вавилон и Гугл определяется уровень точности этих переводов на персидский язык, изучаются и оцениваются причины отсутствия семантического соответствия между ними.

В данной главе также подвергается всеобъемлющему рассмотрению

система транслитерации персидских текстов на таджикскую кириллицу и

»

наоборот, между родственными языками.

В данной работе внимание также акцентируется на преобразовании процесса развития персидского языка с помощью электронных инструментов и интернета. Исследователи, работающие в этом направлении, несомненно, обращаются к стандартам, существующим в языке, которые доступны для всех электронных платформ, Тем самым

данная работа может быть полезной в решении проблем в области различных стандартов письменности и языка.

В проделанной работе с разных точек зрения делается попытка проанализировать и сформулировать имеющиеся вопросы, проблемы и Приоритеты, а также текущие требования и возможности с целью идеального рассмотрения и анализа существующей ситуации. С тем, чтобы на основе сравнения текущей ситуации, представления руководства к действию, наметив проекты инфраструктурных потребностей, учитывая определенную структуру и отношения, а также соблюдая все необходимые условия, можно было приблизиться к идеальным результатам. Для этого необходимо сначала изучить ситуацию, сложившуюся в сфере осуществленной деятельности, а также вокруг аудитории и компетентных лиц.

Источники исследования. В качестве источников данной научной

»

работы были использованы справочники, словари, многие научные книги, статьи и диссертации. В общем количестве на персидском их более чем 100 единиц. А переведенные с русского и английского языков приводятся в конце работы.

<

Методы и теоретические источники исследования. В данном исследовании использован метод описательно-аналитического изучения научных статей, библиографии и диссертаций. Этим методом изучены и оценены практические работы в области применения компьютерной лингвистики, а также рассмотрены и проанализированы опубликованные печатные, электронные статьи, кандидатские и докторские диссертации, материалы из интернета и электронных библиотек. Для этого изучаемые источники сначала были собраны в носителях и при написании диссертации, выводы использовались в каждом разделе. Относительно 'вопросов, касающихся машинного перевода для проверки правильности передачи межъязыковых данных,

была использована поисковая система «Гугл» и программное обеспечение «Вавилон».

Данное исследование длилось более трёх лет, в течении которых расширялись научные данные в этой области, некоторые неясности рассматриваемые в раз работе вопросов были изменены, а другие устранены. Но сущность поставленных вопросов исследования при этом осталась неизменной.

Научная новизна работы. Данная работа содержит результаты исследований в области использования компьютерной лингвистики по определению значения, перевода текста и слов на персидский язык, а также отражает проблемы машинного перевода на фарси и динамику прогресса этой области.

Другой научной новизной работы является представление программного обеспечения транслитерации персидского письма и кириллицы, в результате которого впервые проанализирована данная обработка письменности двух разных языков на платформе компьютерной лингвистики и автоматической транслитерации.

Следующей научной новизной, которая наблюдается в данной работе, является анализ функциональности и сравнения нескольких онлайновых словарей, электронных глоссариев, некоторые из которых имеют веб - версии и доступны в интернете.

Другим достижением данной работы можно назвать объяснение и описание фундаментальных недостатков машинных переводчиков. В то же время, данная работа включает в себя множество ценных научных исследований, которые были проведены в университетах Ирана. В данной работе после ознакомления с некоторыми образцами средств для перевода слов и текста с других языков на персидский обозначены их достоинства и недостатки. Заслугой данной работы можно считать определение соответствующих моделей в персидском языке для исправления структуры в машинном переводе, основанных на текстовом

переводе с других языков на персидский и обратно, изученных с помощью данных средств.

Теоретическая и практическая значимость работы. Теоретическая значимость этой работы связана с применимостью достижений компьютерной лингвистики к другим языкам и изучением возможности их воспроизведения на персидском языке.

С одной стороны, эта разработка связана с общим языком иранцев

и всех персоязычных, а с другой, здесь рассматриваются вопросы,

*

связанные с персидским языком, в частности с алфавитом персидского

языка, а также с проблемами, связанными с их использованием в »

цифровой среде с тем, чтобы в будущем быть свидетелями более полезного и всеобъемлющего применения наилучших средств, обоснованных наукой компьютерной лингвистики для распространения персидского языка.

Можно сказать, что, с практической точки зрения данное исследование может создать почву для разработки и коррекции новых структур в машинном переводе на персидский язык.

Сравнение производительности машинных переводчиков относительно грамматики персидского языка, сравнение производительности двух письменностей персидской и кириллицы касательно единого языка (несмотря на направление письма слева или справа) в компьютерной обработке и сопоставление производительности электронных словарей являются практическими достижениями данной диссертации.

Данная работа показывает, какое место занимает использование компьютерной лингвистики в текстах на персидском языке, какая часть пути преодолена для достижения устойчивого положения в переводе с других языков на персидский и наоборот, и сколько ещё необходимо приложить усилия.

ч

Апробация и результаты исследования. При завершении данной работы было определено, что нынешние модели персидского языка, особенно в части машинного , перевода, не пропорциональны потенциалу персидского языка, и для решения этой проблемы необходимо предоставить руководящие принципы. В то же время было определено, что потенциал изучения персидского языка, уменьшающийся из-за существующих проблем и препятствий, может быть расширен посредством электронных платформ.

Установлено, что все тексты на кириллице и персидском, имеющие разные словари, можно быстро преобразовать через исследуемые в данной работе средства, а после некоторых исправлений они будут доступны пользователям.

»

Чтобы достичь соответствующего и доступного для всех содержания, следует более чем когда-либо принимать во внимание необходимость использования стандартов, используемых в персидской письменности и компьютерных шрифтах, что показывает все более растущую необходимость комплексных исследований в области персидского письма, используемого в интернете, и проблемы, связанные с этим. Сегодня в компьютерной среде существуют разные редакторы на персидском языке,- но большинство из них не имеют необходимого стандарта для использования на международном уровне.

Похожие диссертационные работы по специальности «Языки народов зарубежных стран Азии, Африки, аборигенов Америки и Австралии», 10.02.22 шифр ВАК

Список литературы диссертационного исследования кандидат наук Мухсен Рахими, 2015 год

Список использованной литературы а) на персидском языке

-^jJUo^JI Lijji^-o^» /'^UJJLS jLJiS'L.»..'^ ^gloJjjS^jг.г..' ¿_£jLuja>iLbj j ^ujjj, tLi?j.v■-<>-*>- ^JUo^jl .1

186 1377 »Ju^ oLSLub <uli о^Л'б'^

i^j^—^L? ^.^...oliiJI^jl ¡yju^SKA /^^jjli (jbj yalsbo ¿ijlj -2

^ 139-.1378

^jLLil—^j c_o.il ^jj jJI^.,. о ^yj Iflj - *i ^JloIj>5 i^jJIjj^J!) ^gjl Ы mi i—-Oiil .3

^ 317 -. 1354 ty^SyJ oljliiil -

222 -.1377 J3I oljLtijl ¡¿l^i— ¿l^a^l Z^-..l&l ^jui, ¿s .4

i

u"

_uj ySX—^i d-C-yoSrj) —^jiii^l^j—J 3 jjl^^S'L 3 .ALO? ^^Jjls jjbj JjLjj-e t^ot-ьпл .5

^ 198 -.1366 i^jAbCiob у JI ^g^jli (jlij JLL^O^J

i

^ d_^J—з j-^bba ^^jLuiobj у (^jLaljJS t,jl3 ^У^З ^ -6

^ 820

^316 OljlAljb^jl^J-^jjjJI y^yl¿JLa ^^jbjj jjbj ег'^'.кЗ^

3 (j^j ^^ O^j О^ЗЗ-0' ^guJjy iySj\jfyA liljj (^ic 3 ^Lujly> ^.¡-ol .8

I ^

3 ot—jjsil)^^! iiljj ^jic J^a 3 ^jjLolyr Jus^l I jlSjilj 4jIjI

50-23 cjL^ULo -.1384((_JJLJ ^LjI ¡»З-Ь-

/jjLij _^Vl—iLo ^jlj^—ol^j 3_J Ja_:> jjL^ftJI '(jl^*"J—«^ьо^_^_waj^I .9

f

52+12^^4" J^-^LJ - о3I jLoJito^jIc

(jol 100 -.1382i4jLilj 182

^о 212-,1384 .О^кэ -.¿¿J^tijßl ¡¿J^I^JIi ¿,Lj ¿UjIj (^isL.l 1

jal_j ^ i.ijli ol—oiil ^ (jl—^_i^l—jl) . ^^^oLuiúbj OLJLI« n^jfyA ^yilj.12

jjö 178 + e^jj—j-.1383 j^j (oLj oljl.t." il :¿jlß^. iSj^l^jy

-.1385 .4SI , ^ЬЬ.13

1

O-152

— ^JLLSLJ L¿jJlxs^C-O/^^ajLLÍ» (jbj 3 (.s^l"®"0 A^J-«-^5-0 íLLo->íL¿jJbo^*oe lsJLLI).14

72-63 obtL¿> Л 364

i

180. 1380^}U ô\j] ôULiJb .jlíjI rjlj—^J-jO^J uL> -J^^jl ^xxjbJj ijLj — J^jüob LSJJLOÄ« ДА>У -¿jjíjLo (jío^J ^jJ.16

^ 183 -.1363.elfl ¿iljLiül

(

¿¡Ljj ^ .1-? ■> 4jblj alSLijlojl CjLsA¿- «Ц^' 3 1 ^kLuj ^ djJlixo ..Ь^сЛл (jL^-jj^-^.l 7

^97 -. 1383 »¿^-¿U- ísí ^з^"/ (frij-S* d_J|ju£ j-lT^ 4_oJ>y 4 4д>y tliUJlLxo J¿ vJS t^jyS ^¡weVb.18

(Jö 199-. 1390.o^iaS ^iJ ^l^-^-oVL AjJ^f/ô^lj

I

^ _^j_» y JA tbS^^JJ^ 3 С^ЗЗ-0^ 4-ÍLOIxaJ jJiLo .^-JÁJ^o j^J . 1 9

- Lwi^Ic/^l d_iblj t-i. H-?^ ^—^Ojli ¿jL-jj 3 Ja—¿-"l?" jl^il yAí jb_OwOj^j.20

I

253 -. 1383 vMüJl ^Lc

^ ^gjl- ... il al*_¿jJbj'y^ ¡jjlj—^J — ^jL jl i^Sül(jl ¿ d_j ^xOjli 1

17-. 2001 ..jSia> оЬЛкл

: —jj^—oj—¿->- /j—J jS ¿j—ш> d_aJ>-y í^gjl_u^il 4_<хЭ-y ^jL jjl 22

I

39-26obcÁ-s oVLlo

bj'j-* 4JCOL> у.Li^l^^J — у ^jICJloäo/ d"......J^J f^^ Э (.^'-'--"^З 'eS^ ¿-o^o ^jjlу .2,3

^ 454 + олуИ, -.1382 Jljb 3 -.1382 oljliiib^jlj^j i^SLoly Jl jl/^jLjj ^з5^ »(»tils' .Jl.ji »<_SLJjj.24

o- 132

^ 178-.1390

,_jíí 244 1389 ^jiLJI ¿j^ otjLtiil:^!^; -o^- ЛзЦ/^^ ,_рззлЛ кЛЦ t>y¿26

^303 -. 1380 í(Jj

(^l^L) Jjijb^^j ájj^to:^!J^j Jlitj I^^jjj^SS] jj — jy" ...O iy'jj 'J^lj |^1<Ь>-.28

118-103 oba^ 1383 JLo 22 ejUi^jls-

(j¡L^зЗ-J l^e^lj^j— _j^L) !^S^j^yS.Jl ^33^1 jCs pi5"... о ^^s^L o^uíjíj^l) ^lb-29

106-93 1384^1^23 ojU-i

^256-.1386

j3—' Ojt_¿Jjl ^gjL^- Ji__o-?c-o / ^ ....l*Cil — — ^juJjIs : (jSj^LULjL3 d_olj ojl^ íiUXc 1

412 .1373

r

1373 ôLSi OjLÍJJI r^jl^j-^L^- Û^JUuyua / cXjloyl joLoJ JL>- OJJJI : OJJJ

I iaí. *LJ-.32

¿s^o 100 -.

íLob ök^/ö'^- окз^ /t_s—Íjtà ¿L3 J-»3 j JI35I |t>y '(jlj.3j ¿CL^IJI jis'jjiób .3 3

u« 168 -.1381

>¿,b_vllil-1 ^jli óWj - sjl^ ur-^ 3 úk) i^b^

^ 124 Л 375 ¿Iw; <J3I

uö736-.1384<c^,

'^^.jb- „J^üL IjJL

36

^232-,1390-J^

—15-^jj ^-Hl' ' ü^í^J J^-^/l (J, ¿bj (^L^ ídJI 'J^?" ¿)l ,;■»■.:■>_).37

^ 198-. 1389 jl^ oljLixJl-.jl^.

|oLi ^¡jj^jjLj ^^cLiij ¿j-.—/^^—ujjli lo •> jJ—el£j 3 J¿> J3-0JW ^^C-Láj.38

(jö 69 -.1315.

O-J^: (V-S- <?3J уц^ ^Lr^ ók) (j-íLl-i 2;1з 3 ^L^l . ^UJ ^.39

^264-. 1384

^^ ú^ f^—ó—«3" /(j—¡>jlá ¿>1—jj (jijbj-j. 3 ¿bj u^j'^ (^ls^^Jj.40

( 92 -. 1370»i_¿jjJo ^IjlLUS úl5LUl¿: (jlj^j .Juijl ^^oliJjjl5"

jjLo^^il—(J^?* / 3 (^З^З-0 : (^g-^jl: wjLj оЬ>Ы1а*»1 <~5LlSbj3 jjLj^^cLj .41

(jö 753 -.(1991) 1369 (jo 408 1385f3.¿ »^Ы-J ii&ji 3 f^lc ol£¿La>3

3 ! !,/i4 — «i I^^ь^ГУ J^ »ilAcl 03^5" t^J^a JLuJ ^jjLO-^J.43

33-21 obóú -. 1384.о1сШ=1

(je 444 -.1390 4i°l ytj r^l^-^ce ^Lc 3 ^jil^Ü OJUC /L-J LS^J^ 3 V^ ^-¿jljlSLoÄ 3 ^ji-A«»/^jÜJj (jljj -^jljl^A 3 ^g-V:-0-"'45

^ 227-.1386 JyJ

olSÜjbí^jlJfyi iJuiij! ^ujb^jjlS' d^U (jbL ¿>jS ^jyjfya I(j^-o i^jii^jj^o .46

^jö 232 -.1374 íi_¿Jj^i LSLx-^¿> -. (1995) 1374 « OjL.-t-ol ¡ól^j'-O'ilj /(^b.t.iLj d-olj ojl^ ÎJ^AIJ e^lj Coo^.47

^410

a ¿Uj ¿h......jS k-j^nn о ^»jjli Jai-

^js 619 -. 1385 (^jls 5 (jbj ¿jli^SiAy r^l^j'-^jS^Lo iJ^il ^150 -.1389ii_>llS' ^jLjâjj-.^j^j—û^ljjlà^ OjAlWd_oJ>Jj ^Lej ^Jy&liOjSbUe ^ 79-.1371J3I <_>L>»}lejJLî ¡jjl^j ^^sus j^SVjj 0jbj»Sjli¿5' ^зл^э.50

¿ьь ^ «. ь i»iis ji ^^y juLO^lúj ^»15*313 ^з^^о ¿y^ '(*^..i-».51

jjö 163-. 1374^1j^j ôl^iJb r^jl^juijl «ut;

52

^ 140-. 1383^LjI

Lb^o ^lc.53 ^420-.1375^^

(OVLLo

^^495-484 -.1382 -соЫе ÔISLÎJIAJ^Î -^Llí ¿LJ

55

' (jö 246-,1376 л^и-J3I vb-

^."-■».;-.elSLAjb d_«li tjjl^j— j3J (jLoj.1 /OJuj^S" jl ^o"... л jhJ>5* ^jujLLJOJIJ Í^LojI |оЫс.56

^300 -. 1379

«133b I^ ....I'd ¿jl—jj ^jijLSo 'OIaLUÜ! Í^^^ÍSO! L 1^33!^

Jje 160 -. 1390 ^iJ: (jt^

^ 126-. 1389

Lsjj /iil—^Lj _^»A LS"*"''"'_uJ _U*^_ôil*»» С)^1л> 1-lfl'úLo-J <Sjj$

(^jlj aLS_¿Jb :ol, .t.ilo(jljLSLoJb 3 jjj<_5"з5" IyjlS" ^^LJo ¿bj» (^l? с5"з5\60

i

^ 99-.1388

146 -.WVf.JLsl yLi-.^yg -yù\ß ¡t^l^l /f>5yJ »(o-aI^I ^jI^.61

^__r^jlJ У 11_~ J—\ I J>3 <LoJ>-y ^{jbAjjiàj .¿jj3.il jiyjS.62

(j¿>308-.1380í(_r^o y¡>

i

-.1389 OIjLÍJJI «Л-ÍV I ¿LIjjjI 5 ¿l>j .o¿lj ^Is 4JI ¿u*sry '»-^чн JúV.63

0-224

|oL? j-JLiî^jlj-^J -4JI3 ¿^л—лл^э- j^jV >■ I(jbj lijos y A^jJLo.^jLs- jJjV.64

^488-, 1383.

^o: jjl-(^JXLj j3J LS¿iaJ dials' /d_o^3^ 3 J3^l t^Aol.((Дэ^ J3J ^ákl.66

^239-. 1371 ^llüb

i

4_J_J'jlo ôjJuJl I\j—5" (jí.—aJ ^j—ujLlJj (jl—jj 3 (J^-^l ' 4JUjíjLo.67

^327-.1380

jLjL> j_Uí^jl^j ^—^JjJlo d—oils ¡¡^jÇ,_Kj^í^yujljL.iJljj (-SLJLAj3 :d_LsJ> Lj ^3 3! id_oJols ^ 6R

f

^510-, (2007)1386

úlSL_¿jló CjIjI—— ^gjjjjl ^Jl^o /(jbj t^i^l Í^Jl^-o j^ijjJI 035^.69

jje 238 -.1377 fC-.U-

als: il^:Л^-JLQ- ^^JJJJI O^SLJLO Idj^iaj ^^Is ó^J ^jJLijJI o^SLi^.VO

o0 240 1389

346 -.1376 i^^^-jujyàjâ -^jjjjJI o^io jbjsjbj Í^gjjjJI

I

o"

OjL-ÍJjb^jl^í í ^¿Ij^JLo ("Ij^J /j^sb- Ь Q^Ja^âl 3! ^jij Cjbf^Ua-al c^LA^i 4 fl^^J <_5.ll Jalo .72

^ 683 -.1378..j3j

o* 404-,

jji_л_u^ly) oIü-JLpu e¿yyayují jjLj^Lyj y¡jü> l^ß ^kic alÄL^jtS í'jjoj£¡

645-63 l.CjbtiLö 1351 ¿jljjJ 1 £ 'ó-^j ¿»л«

(

<j° 367 -. 1373 íjj^^j oIJLÍ^jI JÍL» ¡«jbj ^y^y (JJ^-75

ijüu ¿ypry. i^i-y ¿>3j з cm wlí.76

38-56

ôlj—a ^jbjj_3 _1 íi J^S¿¡ y SjLs yj y-f^ y Jjj^l o< ^íi yj.77

jjö 328 -. 1389<L~^j jA; ¡jjl^-ta-jLuj ^¿bl

LójJ^/^jl l_J Ja^jj—o (O^ic ^jJLoJ»-! ^Зуиз 3 j^yl^Lo 4л>y JI*J ^^ijy iLj^J ^jJ^.78

129-103 obligo 1386 jt^j 37 i^ys-jl?- ^l^Jbj ^yLaj^j j^J ^3

f

J3-79

142-121 ObuLa 1386 ¿jb^ej 42 ûjLJJ ^l^jbj ^yiJbjjj djbto^l^ji

j ..Sol^ d-o-?-y '(Jbs .I.Cjy\J^l-V.M,ibj 3 (jbj -.I.O^jlj-Jbb.80

(je 274 -.1373 ^ VL>

obJUxe jJLiijjl^^j Q^jLoJb / j 3 ^Ь^-.Ьз ¿Lob 0^3 ^j^jLoJb.Sl

up 496-. 13714^5^^^ ¿.IüjJ 3

б) на русском языке

82.Анисимов А. Компьютерная лингвистика для всех: Мифы.

Алгоритмы, язык/ А. Анисимов.- Киев: Наук, думка, 1991. -

83.Ахманова, О.С. Словарь лингвистических терминов / О.С. Ахманова. - М.: Советская энциклопедия, 1969. - 607 с.

84.Лоя Я. В. История лингвистических учений / Я. В. Лоя. - М. : Высшая Школа, - 1968. - 307 с.

85.Оранский И. М. Введение в иранскую филологию / И.М. Оранский; сост. И.М.Стеблин-Каменский; отв. Ред. А.Л.Грюнберг. -2-е изд., дополн. - М.: Наука. 1988. - 388 с. 86.Основы иранского языкознания. Книга 3. Новоиранские языки. Западная группа, прикаспийские языки / по ред. Расторгуевой B.C. -М.: Наука, 1982. - 571 с.

87.Рубинчик Ю.А. Грамматика современного персидского литературного языка / Ю.А. Рубинчик. - М.: Восточная литература, 2001. - 600 с.

88.Шемакин Ю.И. Начала компьютерной лингвистики / Ю. И.

Шемакин. - М.: Издательство МГОУ, А/О "Росвузнаука", 1992. -

в) на английском языке

89.Akmajian and others , Linguistics, mit press, second edition, 1997, 576 pages.

90.Allen,J,Natural Language Understanding, Bonn,The Benjamin / Cummings Publ,1995,312P.

91.Bolshakov. Igor & Gelbukh Alexander, COMPUTATIONAL LINGUISTICS Models, Resources, Applications, Barcelona, INSTITUTO POLITÉCNICO NACIONAL, 2004,186P.

92.Booth, К. H. V., Machine aided translation with a post-editor. In A. D. Booth (Ed.),Machine Translation, Amsterdam: North-Holland Publishing Company, (pp. 53-76)

93.Crystal David, The Cambridge Encyclopedia of language , 3rd edition, Klett ernst verlag, 2011, 516P.

94.Foster Tim,Using Translation Technology at Sun Microsystems,online version, Volume 77, Issue 3

95.Grishman,R.Computational linguistics:An introduction, London, Cambridge University Press, 1986,193P.

96.Jurafsky,D, J.H.Martin,Speech and Language Processing: An Introduction to Natural Language Processing,Computational Linguistics,and Speech Recognition. Prentice-Hall, 2000,988P.

97.Lepschy,G.C,A survery of structurad linguistics, Faber and faber, 1972,192P.

98.Pei Mario & Gaynor Frank, A Dictionary Of Linguistics, Edition No.:4, Philasophical Liberary 1954, 238 Pages.

99.Mayes C.W. and, Ornstein Jacob, Gage William- the ABC's of language and linguistics (A Basic introduction to language science) printed in iran- 195

, pages.

100.Mel'cuk, I.A.Dependency Syntax: Theory and Practice,State University of New York Press, NY, 1988,412P.

101.Newmeyer, F.J, Linguistic Theory in America, N.Y,Academic Press, ,1988,296P.

102.Prakasam Vennelakanti, Encyclopedia of linguistic sciences:Issues and

Theories, allied Publishers, 2008, 505 pages

103.Peck jahn, coyl martin- Literary Term and Criticism- third Edition palgrave macmillan- 2002- 241 p.

104.Roach peter- English phonetics and phanalogy (Apractical course) third Edition- Combridge university press- 2000-283

105. Schütze H, Foundations of Statistical Natural Language Processing, MIT Press, 1999,620P.

106. Strazny Philip, encyclopedia of linguistics, new York fltzory Dearborn, 2005,

1243P.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.