Разработка и исследование систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели тема диссертации и автореферата по ВАК РФ 05.13.11, кандидат технических наук Курганов, Владимир Юрьевич

  • Курганов, Владимир Юрьевич
  • кандидат технических науккандидат технических наук
  • 2005, Рязань
  • Специальность ВАК РФ05.13.11
  • Количество страниц 187
Курганов, Владимир Юрьевич. Разработка и исследование систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели: дис. кандидат технических наук: 05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей. Рязань. 2005. 187 с.

Оглавление диссертации кандидат технических наук Курганов, Владимир Юрьевич

ВВЕДЕНИЕ.

ГЛАВА 1. ПРОБЛЕМЫ ПРЕДСТАВЛЕНИЯ И МОДЕЛИРОВАНИЯ СТРУКТУРНО-НЕСТАБИЛЬНОЙ ИНФОРМАЦИИ ПРИ ПРОЕКТИРОВАНИИ СОВРЕМЕННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ.

1.1. Особенности обработки информации в современных информационных системах. Неоднородность информационных ресурсов.

1.1.1. Организация данных в современных информационных

Ф системах.

1.1.2. Гибридные данные. Основные понятия.

1.1.3. Классификация структурно-нестабильных данных.

1.2. Проблемы моделирования структурно-нестабильных данных.

1.2.1. Современные подходы к представлению структурно-нестабильных данных.

1.2.2. Классификация моделей представления данных.

1.3. Современные методы и способы хранения структурно-нестабильных данных. Классификация методов. Достоинства и недостатки.

1.3.1. Файловый метод.

1.3.2. Метод традиционных моделей представления данных.

1.3.3. Метод специализированных систем.

1.4. Новые подходы к моделированию структурно-нестабильных данных.

Основные результаты.

ГЛАВА 2. УНИВЕРСАЛЬНАЯ МОДЕЛЬ ПРЕДСТАВЛЕНИЯ ГИБРИДНЫХ ДАННЫХ СЛОЖНОЙ НЕСТАБИЛЬНОЙ СТРУКТУРЫ.

Предварительные замечания.

2.1. Структурная составляющая универсальной модели.

2.1.1. Структурные элементы универсальной модели.

2.1.1.1. Слабоструктурированные объекты. Экземпляры ^ слабоструктурированных объектов.

2.1.1.2. Связи.

2.1.1.3. Атрибуты. Свойства атрибутов (метасвойства).

2.2. Формализованное описание слабоструктурированной схемы данных.

2.3. Диаграмма слабоструктурированной схемы данных.

2.4. Формализованное описание экземпляра слабоструктурированной базы данных.

2.5. Диаграмма экземпляра слабоструктурированной базы данных.

2.6. Ограничения слабоструктурированных баз данных. Классификация ограничений.

2.6.1. Функциональные зависимости.

2.6.2. Формализм расширенных функциональных зависимостей.

2.6.3. Виды расширенных функциональных зависимостей.

2.6.4. Ключи. Внешние ключи.

2.6.5. Иерархические ключи. Абсолютные и относительные ключи.

2.6.6. Ограничения общего вида.

Основные результаты.

ГЛАВА 3. ПРОЕКТИРОВАНИЕ СЛАБОСТРУКТУРИРОВАННЫХ БАЗ ДАННЫХ НА ОСНОВЕ УНИВЕРСАЛЬНОЙ МОДЕЛИ ПРЕДСТАВЛЕНИЯ ГИБРИДНЫХ ДАННЫХ.

3.1. Принципы проектирования слабоструктурированных баз данных на основе универсальной модели.

3.2. Аномалии, как следствие информационной избыточности на слабоструктурированной схеме данных.

3.3. Понятие условно-нормальной формы (УНФ) для слабоструктурированной схемы данных.

3.4. Реструктуризация слабоструктурированной схемы.

3.4.1. Эвристические алгоритмы реструктуризации слабоструктурированной схемы данных.

3.4.1.1. Исключение транзитивной расширенной функциональной зависимости (случай 1).

3.4.1.2. Исключение транзитивной расширенной функциональной зависимости (случай 2).

3.4.1.3. Исключение транзитивной расширенной функциональной зависимости (случай 3).

3.4.1.4. Исключение некогерентной расширенной функциональной зависимости.

3.4.2. Итерационный алгоритм привидения схемы данных к условнонормальной форме.

Основные результаты.

ГЛАВА 4. ПРОЕКТИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ГИБРИДНЫМИ ДАННЫМИ СЛОЖНОЙ НЕСТАБИЛЬНОЙ СТРУКТУРЫ.

4.1. Общая методология проектирования систем управления гибридными данными на основе универсальной модели.

4.2. Проектирование банка данных системы управления гибридными данными. Основные этапы.

4.2.1. Проектирование физической модели базы данных метаинформации.

4.2.2. Проектирование физической модели структурированной части гибридных данных.

4.2.2.1. Формирование предварительных реляционных отношений. Рекурсивный алгоритм.

4.2.2.2. Формирование таблиц базы данных.

4.2.3. Проектирование физической модели слабоструктурированной части гибридных данных.

4.2.3.1. Формирование предварительных реляционных отношений.

4.2.3.2. Формирование таблиц базы данных.

4.3. Архитектура систем управления гибридными данными. Основные компоненты системы.

4.4. Проектирование слабоструктурированной базы данных на примере справочников структурных показателей свободных цен на энергоремонт.

4.4.1. Специфика структуры документов нормативно-справочной информации на энергоремонт.

4.4.2. Проектирование логической модели справочника структурных показателей при помощи универсальной модели.

4.4.3. Проектирование базы данных структурированной части справочника структурных показателей.

4.5 Некоторые проектные решения.

4.5.1. Выбор средств разработки.

4.5.2. Технические и программные требования для создания и функционирования СУГД.

4.6. Результаты внедрения.

Основные результаты.

Рекомендованный список диссертаций по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка и исследование систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели»

Актуальность проблемы. В настоящее время огромное количество гетерогенной информации становится доступным в электронном виде. Очень часто одна и та же информация в разных информационных источниках может быть представлена в виде данных разной структуры. Примером таких информационных ресурсов могут служить электронные библиотеки и коллекции данных. Назначение систем такого рода как раз и состоит в том, чтобы хранить разнородные информационные ресурсы. В добавление к этому данные, интегрируемые из распределенных разнородных источников, очень часто являются слабоструктурированными, т.е. лишенными четкой, фиксированной структуры. Разработчикам при проектировании современных информационных систем (ИС) все чаще и чаще приходится сталкиваться с проблемой хранения и обработки одновременно структурированных и слабоструктурированных данных — гибридных данных, представленных с помощью различных форматов и моделей данных.

Структурированные данные - это данные, имеющие регулярную, фиксированную структуру, которая выявляется на этапе проектирования ИС, т.е. схема данных известна заранее и неизменна (статична). Задачи моделирования структурированных данных опираются на принцип фиксированной схемы.

Слабоструктурированные данные — это нерегулярные, несогласованные данные с явно выраженными структурными алогизмами, которые не имеют постоянной, четко определенной структуры, т.е. их структура, тип и состав могут динамически изменяться. В слабоструктурированных данных можно выделить ту или иную структуру, однако эта структура заранее целиком или частично неизвестна или может потенциально измениться.

В последние несколько лет в научных исследованиях в области баз данных появилось новое направление, которому собственно и посвящена эта работа, - управление гибридными данными сложной нестабильной структуры.

На сегодняшний день пока отсутствует полная и систематическая теория управления слабоструктурированными данными.

Несмотря на достаточно большое количество разнообразных моделей представления структурированных и слабоструктурированных данных, разработанных к настоящему времени, существует достаточно большой класс задач, связанных с моделированием гибридных данных сложной нестабильной структуры, синтезирующих структурированные и слабоструктурированные данные. Решение этих задач современными инструментами моделирования недостаточно эффективно. Для традиционных моделей представления структурированных данных (реляционная, объектная, объектно-реляционная) разработаны способы эффективного физического хранения и методы эффективного доступа к структурированным данным. В свою очередь модели представления слабоструктурированных данных (графовые модели, деревья - OEM, XML) позволяют описать данные любой структуры, основное их назначение - нахождение общей схемы при интеграции данных из различных гетерогенных источников, извлечение схемы из слабоструктурированных данных. При этом такие модели не имеют возможности описать семантическую информацию о моделируемых объектах, следствием чего являются отсутствие механизмов эффективного хранения и эффективного доступа к данным и невозможность использования данных моделей в контексте управления базами данных с точки зрения теории баз данных.

Специфика разработки систем управления гибридными данными (СУГД) обусловливает необходимость создания новой модели представления гибридных данных сложной нестабильной структуры, которая позволила бы с единых концептуальных позиций изложить совместное представление данных жесткой и слабой структуры, выявить специфику семантической информации о моделируемых объектах с целью обеспечения эффективного (универсального) доступа к таким данным, эффективного хранения (с минимальной информационной избыточностью) и эффективной обработки (использования стандартных средств для обработки одновременно структурированных и слабоструктурированных данных).

Управление гибридными данными ставит проблемы их хранения, манипулирования и обработки. Отсутствие универсального механизма доступа к таким информационным источникам делает невозможным эффективное хранение, обработку и управление данными со сложной, а главное - нестабильной структурой. От того, как будет организована работа с такими данными, зависит эффективность хранения и извлечения информации в электронных библиотеках, корпоративных хранилищах, которые составляют основу большинства современных информационных систем.

Таким образом, необходимо универсальное, однородное представление (организация) гибридных данных с целью обеспечения эффективного универсального доступа к ним, хранения и дальнейшей автоматизированной программной обработки.

Наиболее полно теоретические вопросы моделирования структурно-нестабильных данных, а также концепции построения систем управления структурно-нестабильными данными изложены в научных работах Калиничен-ко JI.A., Бунемана П., Уидома Д., Абайтбоула С., Винера Д., Линга Т., Мо И., Ульмана Д., Дэвидсона С. и других авторов.

Диссертационная работа посвящена вопросам разработки систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели.

Целью работы являются разработка и исследование способов проектирования систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели, позволяющей с единых концептуальных позиций изложить совместное представление данных с жёсткой и слабой структурой в однородном каноническом виде с целью обеспечения унифицированного доступа, эффективного безызбыточного хранения и автоматизированной программной обработки.

Для достижения поставленной цели решаются следующие задачи:

- формализация представления гибридных данных сложной нестабильной структуры;

- разработка формализованного описания слабоструктурированной схемы данных;

- разработка и исследование условно-нормальной формы для слабоструктурированной схемы данных;

- разработка эвристических алгоритмов реструктуризации слабоструктурированной схемы данных;

- создание методологии проектирования слабоструктурированных баз данных;

- создание технологии проектирования и разработка архитектуры систем управления гибридными данными на основе универсальной модели.

Методы исследования. Исследования осуществлялись на основе теории множеств, теории графов, теории баз данных, методов системного анализа, методов структурного и компонентно-ориентированного программирования.

Научная новизна

1. В диссертации разработана универсальная модель представления гибридных данных сложной нестабильной структуры, позволяющая с единых концептуальных позиций изложить совместное представление данных с жёсткой и слабой структурой.

2. На основе положений теории множеств и теории баз данных предложены формализованные описания слабоструктурированной схемы данных и дерева экземпляра слабоструктурированной базы данных, позволяющие в рамках единой концепции описать представление гибридных данных.

3. Разработана новая характеристика структуры слабоструктурированной схемы данных - условно-нормальной форма.

4. Разработаны эвристические алгоритмы реструктуризации слабоструктурированной схемы данных с целью исключения функциональных зависимостей, следствием которых является информационная избыточность, возникающая при хранении данных.

5. Разработан рекурсивный алгоритм формирования физической модели слабоструктурированной базы данных на основе логической модели - слабоструктурированной схемы данных.

6. Предложена общая методология проектирования слабоструктурированных баз данных на основе универсальной модели представления гибридных данных сложной нестабильной структуры.

Практическая ценность. Результаты диссертационной работы являются основой для проектирования слабоструктурированных баз данных и систем управления гибридными данными. Предложенное в диссертации формализованное описание слабоструктурированной схемы данных, с единых концептуальных позиций излагающее совместное представление данных с жёсткой и слабой структурой, позволяет осуществить унификацию процесса проектирования современных баз данных за счет снижения вероятности принятия ошибочных проектных решений и упрощения процесса сопровождения информационных систем. Проектирование слабоструктурированных баз данных с использованием предложенной методологии позволяет создавать хранилища гибридных данных, характеризующиеся эффективным доступом, безызбыточным хранением и обеспечивающие эффективную обработку гибридных данных. Результаты исследований, проведенные в рамках диссертационной работы, были применены: при проектировании и внедрении программно-информационной системы поддержки ремонтно-восстановительных работ энергооборудования (АРМ-СМЕТА) на предприятии федерального масштаба ОАО «Рязанская ГРЭС»; при проектировании и внедрении программной системы управления нормативно-справочной информацией на ремонт энергооборудования на ОАО «Рязанская ГРЭС»; в учебном процессе ГОУВПО «Рязанская государственная радиотехническая академия» (для студентов специальностей 351400 «Прикладная информатика в экономике» и 220400 «Программное обеспечение вычислительной техники и автоматизированных систем» при изучении дисциплин, связанных с информационными технологиями).

Внедрение результатов работы. Разработанные в диссертационной работе теоретические и практические результаты внедрены на предприятии федерального масштаба ОАО «Рязанская ГРЭС», в учебный процесс ГОУВПО «Рязанская государственная радиотехническая академия».

Разработанные программные продукты имеют свидетельства об официальной регистрации программных систем и баз данных в Российском агентстве по патентам и товарным знакам (РОСПАТЕНТ):

1) программная система поддержки ремонтно-восстановительных работ на энергогенерирующем предприятии «АРМ-СМЕТА», свидетельство № 2003612625 от 02.12.2003;

2) программная система управления нормативно-справочной информацией на ремонт энергооборудования, свидетельство № 2003612626 от 02.12.2003;

3)база данных нормативно-справочной информации на ремонт энергооборудования, свидетельство № 2003620259 от 02.12.2003.

Основные результаты выносимые на защиту

1. Универсальная модель представления гибридных данных сложной нестабильной структуры.

2. Формализованные описания слабоструктурированной схемы данных и дерева экземпляра слабоструктурированной базы данных.

3. Новая характеристика структуры слабоструктурированной схемы данных - условно-нормальная форма.

4. Эвристические алгоритмы реструктуризации слабоструктурированной схемы данных.

5. Рекурсивный алгоритм формирования физической модели слабоструктурированной базы данных.

Структура диссертационной работы. Диссертационная работа состоит из введения, четырех глав, заключения, основных обозначений и сокращений, списка использованной литературы и приложений. Основной текст содержит 169 страниц, 19 таблиц, 42 рисунка. Список литературы состоит из 128 наименований. Приложения выполнены на 15 страницах.

Похожие диссертационные работы по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК

Заключение диссертации по теме «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», Курганов, Владимир Юрьевич

Основные результаты работы состоят в следующем.

1. Рассмотрены проблемы представления и обработки данных в современных информационных системах, в качестве наиболее актуальной проблемы выделена необходимость совместного представления данных жесткой и слабой структуры. Предложена классификация свойств схем слабоструктурированных данных. Приведен обзор теоретических и практических решений, обеспечивающих возможность обработки и манипулирования структурно-нестабильными данными, обусловливающий необходимость создания новой модели представления данных. Выявлены недостатки существующих инструментов моделирования применительно к гибридным данным. Осуществлена классификация современных методов и способов хранения структурно-нестабильных данных. Предложены новые подходы к моделированию гибридных данных.

2. Разработана универсальная модель представления гибридных данных сложной нестабильной структуры, представляющая собой инструмент моделирования структурно-нестабильной информации, позволяющая с единых концептуальных позиций изложить совместное представление структурированных и слабоструктурированных данных для приведения в однородный канонический вид, с целью обеспечения унифицированного доступа к таким данным, эффективного хранения и эффективной автоматизированной программной обработки таких данных.

3. Предложены формализованные описания слабоструктурированной схемы данных и дерева экземпляра слабоструктурированной базы данных на основе положений теории множеств и теории баз данных, позволяющие в рамках единой концепции описать представление гибридных данных. Определены основные типы ограничений, описанных в теории баз данных, применительно к универсальной модели представления данных. Предложен формализм расширенных функциональных зависимостей, как некоторое предположение относительно структуры схемы данных, позволяющий выявить расширенные функциональные зависимости на слабоструктурированной схеме данных. Введено понятие расширенной функциональной зависимости на слабоструктурированной схеме данных. Определены расширенные функциональные зависимости не только между атрибутами слабоструктурированных объектов («атрибут-атрибут»), но и функциональные зависимости вида «объект-объект», «объект-атрибут», «атрибут-объект». Выделены и математически описаны понятия абсолютного и относительного иерархического ключа слабоструктурированного объекта.

4. Показано, что наличие различных расширенных функциональных зависимостей на слабоструктурированной схеме данных является причиной возникновения информационной избыточности, различных аномалий, в случае, если слабоструктурированная схема данных спроектирована некорректно. Разработана концепция условно-нормальной формы для слабоструктурированной схемы данных, представляющая собой совокупность некоторых заданных характеристик схемы данных, позволяющая свести к минимуму наличие информационной избыточности.

5. Разработан набор эвристических алгоритмов устранения различных расширенных функциональных зависимостей на слабоструктурированной схеме данных с целью сведения информационной избыточности к минимуму. Разработана алгоритмическая аппроксимация неформальной процедуры реструктуризации слабоструктурированной схемы данных (итерационный алгоритм). Сформулированы основные принципы и основные этапы процесса моделирования гибридных данных, образующие методологию проектирования слабоструктурированных баз данных на основе универсальной модели.

6. Сформулирована общая методология проектирования систем управления гибридными данными на основе универсальной модели. Предложена архитектура систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели и общей методологии проектирования СУГД.

7. Предложена физическая модель хранения гибридных на основе реляционной СУБД. Разработан рекурсивный алгоритм формирования предварительных реляционных отношений на основе слабоструктурированной схемы данных, представляющих структурированную часть гибридных данных.

8. Спроектирована логическая модель справочника структурных показателей свободных цен на энергоремонт с помощью универсальной модели представления гибридных данных сложной нестабильной структуры. С помощью эвристических алгоритмов реструктуризации слабоструктурированная схема данных справочников структурных показателей приведена к условно-нормальной форме. Изложены результаты внедрения программной системы поддержки ремонтно-восстановительных работ на энергогенерирующем предприятии «АРМ-СМЕТА».

ОСНОВНЫЕ ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ

1НФ, 2НФ, Первая нормальная форма, вторая нормальная форма, третья нор

ЗНФ, 4НФ, мальная форма, четвертая нормальная форма, пятая нормальная

5НФ форма соответственно

АИК Абсолютный иерархический ключ

БД База данных

ГМ Графовая модель

ИС Информационная система мз Многозначная зависимость

НФ Нормальная форма

УНФ Условно-нормальная форма

НФБК Нормальная форма Бойса-Кодца оик Относительный иерархический ключ

ОСУБД Объектная СУБД

ОРСУБД Объектно-реляционная СУБД

О-модель Объектная модель

ОР-модель Объектно-реляционная модель

ООП Объектно-ориентированное программирование оод Объектно-ориентированный дизайн

ОС Операционная система

КОП Компонентно-ориентированное программирование

ПС Программная система

Р-модель Реляционная модель

РСУБД Реляционная СУБД

РФЗ Расширенная функциональная зависимость сед Слабоструктурированные данные

ССБД Слабоструктурированная база данных

ССГ Слабоструктурированный граф ссмд Слабоструктурированная модель данных ссо Слабоструктурированный объект сссд Слабоструктурированная схема данных

СУБД Система управления базами данных

СУГД Система управления гибридными данными

СУСД Система управления слабоструктурированными данными тз Транзитивная зависимость

УМД Универсальная модель представления гибридных данных

УНФ Условно-нормальная форма

ФЗ Функциональная зависимость

ЭВМ Электронная вычислительная машина

ЗАКЛЮЧЕНИЕ

Выполненная диссертационная работа включает исследования, направленные на разработку математического и программного обеспечения систем управления гибридными данными сложной нестабильной структуры на основе универсальной модели.

Список литературы диссертационного исследования кандидат технических наук Курганов, Владимир Юрьевич, 2005 год

1. Abiteboul S. Querying semistructured data // In Proceedings of the International Conference on Database Theory. Delphi, Greece, 1997. P. 1-18.

2. Abiteboul S., Cluet S., Milo. T. A logical view over structured files // VLDB. 1998. V. 7. № 2. P. 96-114.

3. Abiteboul S., Cluet S., Milo T. Quering and updating the file // VLDB. 1993. P. 73-84.

4. Abiteboul S., Goldman R., McHugh J., Vassalos V., Zhuge Y. Views for semistructured data // Technical Report. Standford Universaty. 1997.

5. Abiteboul S., Quass D., Mchugh J., Widom J., Wiener J. The Lorel query language for semistructured data // International Journal on Digital Libraries. 1997. V. l.№ l.P. 68-88.

6. Abiteboul S., Christophides V., Cluet S., Scholl M. From structured documents to novel query facilities // SIGMOD RECORD. 2000. V. 23. № 2.1. P. 313-324.

7. Arocena G., Mendelzon A. WebOQL: Restructuring documents, databasesand Webs // In proceedings of the International Conference on Data Engineering: IEEE Computer Society, 1998. P. 23-33.

8. Ashish N., Knoblock C.A. Wrapper Generation for Semi-structured Internet Sources. Workshop on Management of Semistructured Data, May 1997.

9. Beech D., Lawrence S., Maloney M., Mendelsohn N., Thompson H. XML schema part 1: Structures. http://www.w3.org/TR/xmlschema-l/.

10. Biron P., Malhotra A. XML schema part 2: Datatypes // W3C Working Draft. http://www.w3.org/TR/1999/xmlschema-2/.

11. Borgida A., Brachman R. J., McGuiness D.L., Resnick L.A. CLASSIC: a structural data model for objects // In Proceedings of SIGMOD Conferenceon the Management of Data, 1989. P. 58-67.

12. Bouguettaya A., Benatallah В., Elmagarmid A. Interconnecting Heterogeneous Information Systems // Kluwer. Academic Publishers. 1998.

13. Bray Т., Hollander D., Layman A. Namespaces in XML // W3C Consortium Recommendation. http://www.w3.org/TR/REC-xml-names.

14. Bray Т., Paoli J., Sperberg-McQueen С. M., Maler E. Extensible markup language (XML) 1.0 (second edition) W3C recommendation. http://www.w3.org/TR/2000/REC-xml-20001006.

15. Buneman P. Semistructured data // In Proceedings of the Sixth ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems, Tucson, 1997. P. 117-121.

16. Buneman P. Tutorial: Semistructured data // In proceedings of ACM symposium on Principles of Database systems, 1997. P. 117-121.

17. Buneman P., Davidson S., Fan W., Нага C., Tan W. The keys for XML // Proceedings of the 10th International World Wide Web Conference, 2001.

18. Buneman P., Davidson S., Fernandez M., Suciu D. Adding structure to unstructured data // In proceedings of ICDT, 1997.

19. Buneman P., Davidson S., Hilebrand G., Suciu D. A Query language and optimization techniques for unstructured data // In proceedings of the ACM SIGMOD International Conference on Management of Data, 1996.1. P. 505-516.

20. Carey M.J. Towards heterogeneous multimedia information systems: The Garlic approach // In proceedings of RIDE-DOM Workshop, 1995.

21. Chawathe S., Garcia-Molina H., Hammer J., Ireland K, Ulman J., Widom J. The TSIMMIS project: Integration of heterogeneous information sources // Proceedings of the Tenth Anniversary Meeting. Information Processing Society of Japan, 1994. P. 7-18.

22. Chen P.P. The entity-relationship model: toward a unified view of data // ACM Trans, on Database Systems. 1976. P. 9-36.

23. Codd E.F. A relational model for large data banks // Comm. ACM. 1970. P. 377-387.

24. Codd E.F. Further Normalization of the Data base Relational Model // Data Base Systems. N.J.: Prentice-Hall. 1972. P. 33-64.

25. Cohen W. Integration of heterogeneous databases without common domains using queries based textual similarity // In proceedings of the ACM SIGMOD International Conference on Management of Data, 1998.1. P. 201-212.

26. Cohen W.W. Integration of Heterogeneous Databases without Common Domains Using Queries Based on Textual Similarity // Proceedings of the ACM SIGMOD International Conference on Management of Data, 1998.1. P. 201-212.

27. Consens M. P., Milo. T. Algebras for querying text regions: Expressive power and optimization // Journal of Computer and System Sciences. 1998. № 3. P. 272-288.

28. Deutsch A., Fernandez M., Florescu D., Levy A., Suciu D. A query language for XML // In proceedings of the Eights International World Wide Web Conference (WWW8), Toronto, 1999.

29. Deutsch A., Fernandez M., Suciu D. Storing semistructured data with STORED // In proceedings of the ACM DIGMOD International Conference on Management of Data, 1999.

30. Dobbie G., Wu X., Ling T.W., Lee M. ORA-SS: An object-relationship attribute model for semistructured data. Technical Report TR21/00, School of Computing, National Universaty of Singapore. 2000.

31. Douglas B. The Object Data Standard: ODMG 3.0. Morgan Kauffmann Publishers. 2000.

32. Excelon, the ebusiness information server, http://www.odi.com/excelon.

33. Fernandez M., Florescu D., Kang J., Levy A., Suciu D. Catching the boat with Strudel: experiences with web-site management system // SIGMOD.1. P. 414-425.

34. Florescu D., Kossmann D. Storing and querying XML data using an RDBMS // IEEE Data Engineering Bulletin. 1999. № 3.

35. Fronckowiak J., Garcia M., Whalen E. SQL Server 7.0 Administrator's Companion // Prentice-Hall of India. 2001.

36. Gorskova E., Barashev D. Performance Evaluation of Different Representations of XML data in relational database. Extended abstract // In proceedings of International Conference On Databases and Information Systems. Bal-ticDB-2000, 2000.

37. Gravano L., Papakonstantinou Y. Mediating and Metasearching on the Internet // Data Engineering Bulletin. № 2. 1998.

38. Hammer J., Garcia-Molina H., Cho J., Aranha R., Crespo A. Extracting semistructured information from the Web // In proceedings of the Workshop on Semi-structured Data, Tucson, 1997.

39. Harman D., Fox E., Baeza-Yates R., Lee. W. Inverted files. In W. B. Frakes and R. A. Baeza-Yates, editors // Information Retrieval Data Structures and Algorithms. Prentice Hall. 1992. P. 28-43.

40. Himmeroder R., Lausen G., Ludasher В., Schlepphorst C. On a declarative semantics for web queries // In proceedings of the International Conference on Deductive and Object-Oriented Databases. Switzerland, 1997. P. 386-398.

41. Hull R., Zhou G. A framework for supporting data integration using the materialized and virtual approaches // In proceedings of the ACM SIGMOD International Conference on Management of Data, 1996. p. 81-92.

42. IBM DB2 Universal Database XML Extender administration and programming // http://www-4.ibm.com/software/data/db2/extenders/xmlext/.

43. Kalinichenko L. A. Integration of Heterogeneous Semistructured Data Models in the Canonical One // In proceedings of the First All-Russian Conference on Digital Libraries. St. Petersburg, 1999.

44. Kalinichenko L. A. Integration of heterogeneous semistructured data modelsin the canonical One // In proceedings of the First All-Russian Conference on Digital Libraries. St. Petersburg, 1999.

45. Kalinichenko L.A. The Interoperable Environment Of Heterogenous Information Resources: A Generalization Perspective // In proceedings of The First International Workshop on Interoperability in Multidatabase Systems. Kyoto, 1991.

46. Kanne C., Moerkotte G. Efficient storage of XML Data // In proceedings of IEEE conference on Data Engineering. USA, California, 2000. P. 198-214.

47. Kimball R., Meta Data // DBMS magazine. 1998.

48. Konopnicki D., Shmueli O. W3QS: A query system for the World Wide Web // In Proceedings of the 21th International Conference on Very Large Databases, Zurich, 1996. P. 54-65.

49. Lahiri Т., Abiteboul S., Widom J. Ozone: integrating structured and unstructured data // In proceedings of the Eighth International Workshop on the Web and databases (WEBDB'2000), Dallas, 2000.

50. Lakshmanan L., Sadri F., Subramanian I. A declarative language for querying and restructuring the Web // In Proceedings of the 6th International Workshop on Research Issues in Data Engineering, 1996.

51. Levy A. Obtaining complete answers from incomplete databases // In proceedings of the International Conference on very large databases. Morgan Kaufmann Publishers Inc, 1996. P. 402-412.

52. Levy A.Y., Rajaraman A., Ordille J. Querying heterogeneous information sources using source descriptions // Proceedings of the International Conference on Very Large Data Bases, Morgan Kaufman Publishers, Inc., 1996. P. 251-262.

53. McBrien P., Poulovassilis A. A Semantic Approach to Integrating XML and Structured Data Sources // Proc. CAiSE'01, Springer-Verlag LNCS 2068, 2001. P. 330-345.

54. McBrien P., Poulovassilis A. Schema evolution in heterogeneous databasearchitectures // Proc. CAiSE'02. LNCS 2348. 2002. P. 484^99.

55. McHugh J., Abiteboul S., Goldman R., Widom J. LORE: A database management system for semistructured data // SIGMOD Record. 1997. V. 26. №3.

56. McHugh J., Widom J. Intergrating dynamically-fetched external information into a DBMS for semistructured data // Technical Report. Stanford Univer-saty. 1997.

57. Mendelzohn A., Mihaila G., Milo T. Querying the Word Wide Web // In proceedings of IEEE International conference on parallel and distributed information systems, 1996. P. 80-91.

58. Mendelzon A., Mihaila G., Milo T. Querying the World Wide Web // Digital libraries. 1997. № 1. P. 54-67.

59. Mendelzon A., Mihaila G., Milo T. Querying the World Wide Web. // Proceedings of the First International Conference on Parallel and Distributed Information System, 1996. P. 80-91.

60. Mendelzon A., Mihaila G., Milo T. Querying the WWW // International Journal on Digital Libraries. 1997. V. 1. № 1. P. 54-67.

61. Nayeem I. Distributed Objects Methodologies for Customizing Systems Software // IEEE Computer Society Press. 1996.

62. Nestorov S., Ullman J., Wiener J., Chawathe S. Representative objects: concise representation of semistructured hierarchical data // In proceedings of International Conference on Data Engineering, 1997. P. 79-90.

63. Object Management Group, http://www.omg.org/about/whorwe.htm.

64. Oracle XML SQL Utilities, http://otn.oracle.com/tech/mxl/oraclexsu/.

65. Paepcke A., Chang C., Garcia-Molina,H., Winograd T. Interoperability forф

66. Digital Libraries Worldwide // Communications of the ACM. 1998. № 4. P. 33-43.

67. POET content manager suit, http://www.poet.com/.

68. Quass D., Rajaraman A., Sagiv Y., Ullman J., Widom J. Querying semistructured heterogeneous information // Technical report. Stanford Universaty. 1995.

69. Robie J., Lapp J., Schach D. XML Query Language (XQL) // Workshop on XML Query Language. 1998.

70. Ryamond D, Tompa F., Wood D. From data representation to data models // ^ Computer standards and interfaces. 1996. № 1. P. 25-36.

71. Sahuguet A. Kweelt, the making-of: Mistakes made and lessons learned // Tecnical Report MS-CIS-00-23. University of Pennsylvania. 2000.

72. Scientific literature digital library, http://citeseer.ist.psu.edu/

73. Shanmugasundaram J, Shekita E., Barr R., Carey M., Lindsay В., Pirahesh H., Reinwald B. Efficiently publishing relational data as XML documents // In Proceedings of the 26th International Conference on Very Large Databases, VLDB'2000, 2000. P. 65-76.

74. Shanmugasundaram J, Tufte K., He G., Zhang C., DeWitt D., Naughton J. Relational databases for querying XML documents: Limitations and opporЩtunities // In Proceedings of the 25th International Conference on Very Large Data Bases, VLDB'99, 1999.

75. Shimura Т., Yoshikawa M., Uemura S. Storage and retrieval of XML documents using objectrelational databases // In Proceedings of the 10th International Conference on Database and Expert Systems Applications (DEXA'99), Florence, 1999.

76. Stonebraker M. Object-Relational DBMS: The Next Wave // Informix Software. С A. 1997.

77. Tamino An Internet database system, http://www.tamino.com.

78. The Araneus Project Web site. http://www.dia.uniroma3.it/Araneus.

79. Thompson H., Beech D., Maloney M., Mendelsohn N. XML scheme part 1: Structures // W3C Working Draft, 2000. http://www.w3.org/TR/xmlscheme-l/

80. Tseng F., Chen A., Yang W. Answering heterogeneous databases queries with degrees of uncertainty // Distributed and parallel databases. 1993. № 1. P. 281-302.

81. Ullman J. Principles of database and knowledge-base systems. Volumes 1, 2. // Computer Science Press. Rockville MD. 1989.

82. Wang K., Liu H.Q. Schema discovery from semistructured data // In proceedings of the International Conference on Knowledge Discovery and Data Mining, 1997.

83. XHTML 1.0: The extensible hypertext markup language // W3C Working Draft, http://www.w3.org/TR/1999/xhtml 1 -19990505/.

84. Y.Papakonstantinou, Garcia-Molina H, Widom J. Object Exchange across heterogeneous information sources // In proceedings of the 11th International Conference on Data Engineering, Taipei, 1995.

85. Zwol R., Apers P., Wilschut. A. Modelling and querying semistructured data with MOA // Workshop on Query processing for semistructured data and non-standard data formats. 1999.

86. Артемьев В.И. Обзор способов и средств построения информационных приложений // СУБД. 1996. № 6. С. 52-63.

87. Бойко В.В., Савинков В.М. Проектирование баз данных информационных систем. М.: Финансы и статистика, 1999. 351 с.

88. Броди М. Интероперабельные информационные системы в науке. Сборник материалов семинара, Москва, Апрель 6-7, 1995.

89. Брюхов Д., Задорожный В., Калиниченко JI. Интероперабельные информационные системы: архитектуры и технологии // Системы управления базами данных. 1995. № 4.

90. Гарсиа-Молина Г., Ульман Дж., Уидом Д. Системы баз данных. Полный курс / Пер. с англ. М.: Издательский дом «Вильяме», 2003. 1088 с.

91. Д. Мей ер. Теория реляционных баз данных. М.: Мир, 1984.

92. Дейт К. Введение в базы данных. Изд. 6-е. Киев, «Диалектика», 1998.

93. Игнатович Н. Интеграция технологий управления данными в DB2 // Открытые системы. 2001. № 7.

94. Игнатович Н. Семейство реляционных баз данных IBM DB2 // Системы управления базами данных. 1997. № 2.

95. Калиниченко JI.A., Брюхов Д.О., Задорожный В.И., Курошев М.Ю., Шумилов С.С. Интероперабельные информационные системы: архитектуры и технологии // СУБД. 1995. № 4.

96. Когаловский М.Р. Абстракции и модели в системах баз данных // СУБД. 1998. №8.

97. Когаловский М.Р. Энциклопедия технологий баз данных. М.: Финансы и статистика, 2002. 800 с.

98. Круглински Д., Уингоу С., Шефферд Д. Программирование на Visual С++ 6.0 для профессионалов. ИД «Русская редакция». 854 с.

99. Кузнецов С.В. Введение в информационные системы // Системы управления базами данных. 1997. № 2.

100. Курганов В.Ю. База данных нормативно-справочной информации на ремонт энергооборудования / Свидетельство об официальной регистрации программы для ЭВМ в РОСПАТЕНТ, № 2003620259 от 02.12.2003.

101. Курганов В.Ю. Программная система поддержки ремонтно-восстановительных работ на энергогенерирующем предприятии «АРМ-СМЕТА» / Свидетельство об официальной регистрации программы для ЭВМ в РОСПАТЕНТ, № 2003612625 от 02.12.2003.

102. Курганов В.Ю., Белов В.В., Ермаков В.В. Программная система управления нормативно-справочной информацией на ремонт энергооборудования / Свидетельство об официальной регистрации программы для ЭВМ в РОСПАТЕНТ, № 2003612626 от 02.12.2003.

103. Курганов В.Ю., Блынский Л.Г. Моделирование иерархических структур // Приборы и системы. Управление, контроль, диагностика. 2003. № 9.

104. Курганов В.Ю., Блынский Л.Г. Организация хранилища данных для передачи информации между уровнями АСУТП и АСУСП//Автоматизация в промышленности. 2003. № 9. С. 56-59.

105. Курганов В.Ю., Коричнев Л.П. Структурная характеристика слабоструктурированной схемы данных // Информационно-телекоммуникационные технологии: Тез. докл. 30-й межвузовской науч.-практ. конференции. Рязань: РВВКУС, 2004. С. 64-65.

106. Ладыженский Г.М. Архитектура корпоративных информационных систем. // Системы управления базами данных. 2001. № 6.

107. Луни К. Oracle 8. Настольная книга администратора. М.: Изд-во ЛОРИ, 1999. 500 с.

108. Марков А.С., Лисовский К.Ю. Базы данных: Введение в теорию и методологию. М.: Финансы и статистика, 2004. 511 с.

109. Некрестьянов И.С. Тематико-ориентированные методы информационного поиска: Дис. докт. техн. наук. СПбГУ. 2000.

110. Официальный сайт издательства «Открытые системы». http://www.osp.ru

111. Павлова Е.Ю. Некоторые аспекты поддержки целостности в базах данных: Дис. докт. техн. наук. СПбГУ. 2000.

112. Плесневич Г.С. Концептуальные схемы и модели данных // Изв. АН СССР. Техн. Кибернетика. 1984. № 5. С. 23-39.

113. Пржиялковский В. В. Абстракции в проектировании БД // СУБД. 1998. № 1. С. 90-97.

114. Пржиялковский В. В. Модели, базы данных и СУБД в информационных системах // Вычислительный центр РАН, М., 1996. С. 34-43.

115. Санблед С., Санблед П. Разработка масштабируемых приложений для Microsoft Windows. ИД «Русская редакция». 416 с.

116. Справочник структурных показателей для формирования свободных цен на энергоремонт в условиях перехода к рыночной экономике ч.1-8 // ЦКБ Энергоремонт. 1993.

117. Хоторн Р. Разработка баз данных Microsoft SQL Server 2000 в примерах. Вильяме, 2001. 464 с.

118. Шпеник М., Следж О. Руководство администратора баз данных Microsoft SQL Server 2000. 2001. 928 с.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.