Методы и алгоритмы автоматизированной интеграции информационных ресурсов на основе онтологического подхода тема диссертации и автореферата по ВАК РФ 05.13.12, кандидат наук Семерханов, Илья Александрович

  • Семерханов, Илья Александрович
  • кандидат науккандидат наук
  • 2014, Санкт-Петербург
  • Специальность ВАК РФ05.13.12
  • Количество страниц 140
Семерханов, Илья Александрович. Методы и алгоритмы автоматизированной интеграции информационных ресурсов на основе онтологического подхода: дис. кандидат наук: 05.13.12 - Системы автоматизации проектирования (по отраслям). Санкт-Петербург. 2014. 140 с.

Оглавление диссертации кандидат наук Семерханов, Илья Александрович

СОДЕРЖАНИЕ

СПИСОК СОКРАЩЕНИЙ

ВВЕДЕНИЕ

ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ И ОБЗОР СОВРЕМЕННЫХ ТЕНДЕНЦИЙ В ОБЛАСТИ ИНТЕГРАЦИИ

1.1 Задача интеграции информационных ресурсов

1.2 Основные проблемы интеграции ИС

1.3 Обеспечение интероперабельности

1.4 Способы интеграции ИС

1.4.1 Классификация современных подходов

1.4.2 Технологии для интеграции ИС

1.5 Обеспечение семантической интероперабельности

1.5.1 Метаданные

1.5.2 Связанные данные

1.6 Выводы по первой главе

ГЛАВА 2. ПРИМЕНЕНИЕ ОНТОЛОГИИ ДЛЯ ИНТЕГРАЦИИ ДАННЫХ

2.1 Интеграция на основе онтологии

2.1.1 Понятие предметной области

2.1.2 Понятие онтологии

2.1.3 Семантические метаописания

2.1.4 Способы использования онтологических моделей

2.1.5 Применение онтологии предметной области при интеграции ИС с использованием связанных данных

2.2 Методологии онтологического моделирования

2.2.1 Методология ТОУЕ

2.2.2 Методология ЕМА

2.2.3 Методология МЕТНООТОШОУ

2.2.4 Стандарт ГОЕГ5

2.3 Выбор языка моделирования онтологии

2.3.1 Языки, основанные на синтаксисе

2.3.2 Языки разметки

2.4 1ШР, КОБв и 0\\ГЬ для описания связанных данных

2.5 8РАЯС)Ь для доступа к метаданным

2.6 Выводы по второй главе

ГЛАВА 3. РАЗРАБОТКА МЕТОДОВ И АЛГОРИТМОВ

3.1 Метод извлечения семантических метаописаний

3.2 Алгоритмы излечения связанных данных

3.2.1 Алгоритм отображения информации о структуре БД

3.2.2 Алгоритм извлечения информационных ресурсов

3.3 Метод автоматизированного анализа сходных элементов

3.4 Оценка вычислительной сложности разработанных алгоритмов

3.5 Выводы по третьей главе

ГЛАВА 4. ПРИМЕНЕНИЕ РАЗРАБОТАННЫХ МЕТОДОВ И АЛГОРИТМОВ

4.1 Разработка автоматизированной системы интеграции

4.2 Требования к системе

4.2.1 Функциональные требования

4.2.2 Требования стандартов

4.2.3 Требования безопасности

4.2.4 Требования производительности

4.3 Разработка функциональной модели

4.4 Проектирование архитектуры автоматизированной системы

4.4.1 Модуль R2RMapperCore

4.4.2 Модуль R2RMapperWi

4.4.3 Модуль R2RMapperBatch

4.4.4 Модуль MatchingDB

4.4.5 Матрица соответствия требованиям

4.5 Структура работы автоматизированной системы

4.5.1 Общий алгоритм работы

4.5.2 Интеграция данных при помощи системы R2RMapper

4.6 Анализ полученных результатов

4.6.1 Тестирование производительности

4.6.2 Сравнение с другими системами интеграции

4.7 Выводы по четвертой главе

ЗАКЛЮЧЕНИЕ

ЛИТЕРАТУРА

СПИСОК СОКРАЩЕНИЙ

CORBA — Common Object Request Broker Architecture;

DCOM — Distributed Component Object Model.

DL — Description logic;

EMA — Enterprise Model Approach;

IDEF — Integrated Computer-Aided Manufacturing;

OWL — Web Ontology Language;

RDF — Resource Description Framework;

RDFs — Resource Description Framework Schema;

RPC— Remote Procedure Call;

SPARQL — SPARQL Protocol and RDF Query Language;

SADT — Structured Analysis and Design Technique;

TOVE — Toronto virtual enterprise;

URI — Uniform Resource Identifier;

XML — Extensible Markup Language;

W3C — World Wide Web Consortium;

AC — автоматизированная система;

ПО — программное обеспечение;

САПР — система автоматизации проектирования;

СУБД — система управления базами данных;

ИС — информационная система.

Рекомендованный список диссертаций по специальности «Системы автоматизации проектирования (по отраслям)», 05.13.12 шифр ВАК

Введение диссертации (часть автореферата) на тему «Методы и алгоритмы автоматизированной интеграции информационных ресурсов на основе онтологического подхода»

ВВЕДЕНИЕ

В данной диссертационной работе были исследованы новые обеспечения семантической интероперабельности гетерогенных информационных систем (ИС) и интеграции хранящихся в них ресурсов с применением технологии связанных данных и онтологического подхода. На основе полученных результатов были предложены методы и алгоритмы извлечения данных из информационных систем для дальнейшей интеграции с другими информационными системами и выполнена реализация разработанных алгоритмов в автоматизированной системе интеграции информационных ресурсов.

Актуальность темы. Развитие информационных технологий привело к созданию большого количества разнообразных гетерогенных автоматизированных информационных систем (ИС) и, в частности, систем автоматизации проектирования (САПР), предназначенных для автоматизации бизнес процессов, хранения персональных, справочных и других типов данных, ведения отчетности и статистики. Такой отрасли как приборостроение также свойственно наличие различных ИС и всевозможных источников информации, например: систем хранения нормативно-справочных данных, классификаторов оборудования, материалов и так далее. В данной диссертационной работе термин ИС трактуется как понятие, описанное в федеральном законе №149-ФЗ от 27 июля 2006 года «Об информации, информационных технологиях и о защите информации»: информационная система — совокупность содержащейся в базах данных информации и обеспечивающих её обработку информационных технологий и технических средств [20]. Таким образом, под информационной системой понимаются и всевозможные САПР, и различные СУБД, и другие системы автоматизации. Такие системы отличаются архитектурой, способами доступа, организации хранения и обработки информации, моделями данных и многим другим, однако, на практике, часто оказывается, что в какой-то степени они дублируют

друг друга. Наиболее актуальными задачами развития ИС сейчас становятся обеспечение интероперабельности и интеграция между ними [1, 8]. Объем обрабатываемой информации постоянно растет и специалистам в области информационных технологий необходимо обеспечить эффективный обмен информацией между системами, но при этом избежать дублирования и потерю информации.

Под интеграцией данных в информационных системах понимается обеспечение единого унифицированного интерфейса для доступа к некоторой совокупности неоднородных независимых источников [10]. Иными словами информационные ресурсы из всех распределенных источников, могут быть доступны для пользователя из любой интегрируемой системы или из единого интерфейса для доступа к данным. Системы, реализующие такие возможности, называются системами интеграции, и они избавляют пользователя или другую интегрируемую систему от сведений о том, из какого источника они получают информацию, каким образом осуществляется доступ и какими свойствами обладают эти источники.

Источниками распределенных данных могут быть как обычные системы управления базами данных, работающие на основе различных подходов: реляционные, объектно-ориентированные, объектно-реляционные, так и разнообразные системы, работающие на других технологиях. Таким образом, обеспечение доступа к данным из многих гетерогенных источников через единый интерфейс означает, по сути, создание единого представления совокупности всех данных из множества независимых источников в рамках единой предметной области [8].

Проблематика решения этой задачи обусловлена тем, что информационные системы в большинстве случаев являются распределенными, т.е. физически удаленными друг от друга, сложными программными комплексами, с большим количеством информационных единиц. Помимо этого они строятся на различных технологиях с применением разных

протоколов обмена. Эти факторы препятствуют построению единого унифицированного хранилища данных [12].

Традиционные методы решения этой задачи, чаще всего, работают на основе связей между элементами систем, построенных вручную, и реализуются в виде программного продукта, направленного на решение задачи интеграции для каждого конкретного случая. Этот подход занимает длительное время, в связи с тем, что необходимо провести детальный анализ каждой системы для выявления связей и зависимостей. Также, изменения структуры одной из системы, как правило, приводит к нарушению работы программного комплекса и требует повторного длительного анализа структуры. Таким образом, традиционные методы не предоставляют достаточно унифицированного и гибкого решения для создания системы интеграции данных, однако на практике чаще всего используются именно такие методы.

Другой важной задачей является обеспечение интероперабельности [8, 49]. Интероперабельность это способность информационной системы взаимодействовать с другими системами. Такое взаимодействие может выражаться в виде обмена данными или федеративного выполнения поисковых запросов. Актуальность проблемы обеспечения интероперабельности определяется тем, что она необходима как в новых, разрабатываемых системах, так и в уже существующих ИС, для реализации обмена данными и ресурсами. Эта задача тесно связана с задачей интеграции данных и играет в ней важную роль.

Можно разделить подходы к обеспечению интероперабельности на два вида: структурный и семантический. Структурный вид подразумевает структурное согласование различных элементов в ИС. Семантический -возможность установления связей между смыслами элементов в информационных системах. На данный момент большинство существующих методов и средств решения проблемы интеграции направлены на обеспечение

структурной интероперабельности, не производя анализа семантических, или иными словами смысловых, свойств систем [10].

Таким образом, существует потребность в разработке новых способов обеспечения семантической интероперабельности информационных систем, а также создания новых систем интеграции информационных ресурсов, что подтверждает актуальность диссертационной работы. Использование семантической интеграции в САПР в приборостроении, позволит повысить общий уровень автоматизации принятия решения, а также упростит процесс нахождения оптимальных решений. Необходимо разработать новые алгоритмы и программные продукты, которые смогли бы обеспечить интеллектуальную интеграцию систем в единое информационное поле. Такие программные продукты должны быть унифицированными, надежными и достаточно простыми в использовании.

Одним из наиболее перспективных на данный момент методов интеграции является метод, основанный на использовании метаданных для описания информационных ресурсов [13]. Этот метод тесно связан с технологией семантических сетей и одним из ее самых перспективных и развивающихся направлений - технологией связанных данных. Этот метод и технология и были положены в основу разработанного в рамках настоящей диссертационной работы программного решения для обеспечения семантический интероперабельности систем и интеграции, хранящихся в них данных.

Все вышесказанное определило цели и задачи диссертационного исследования.

Цели и задачи. Целью диссертационной работы является разработка

новых методов и алгоритмов интеграции разнородных источников

информационных ресурсов для увеличения эффективности их взаимодействия.

Требуется разработать и научно обосновать новые алгоритмы обеспечения

интероперабельности и семантической интеграции информационных систем, а

8

также реализовать на их основе программный комплекс. Алгоритмы должны быть реализованы на основе исследований в области методологий и языков описания метаданных, а также современных семантических технологий, таких как связанные данные. Программный комплекс должен быть реализован с учетом различий современных платформ, а также неоднородности источников данных.

Для достижения поставленной цели в диссертационном исследовании были сформулированы следующие задачи:

1. Разработать метод автоматизированной интеграции информационных ресурсов, хранящихся в распределенных информационных системах, на основе онтологий;

2. Разработать алгоритм автоматизированного извлечения информации о структуре ИС в виде отологии из баз данных;

3. Разработать алгоритм для извлечения и представления в виде связанных данных семантических метаописаний информационных ресурсов;

4. Разработать метод автоматизированного нахождения сходных элементов в структуре интегрируемых систем, а также нахождения дублирующихся метаданных;

5. Разработать автоматизированную систему интеграции информационных ресурсов, реализующую разработанные алгоритмы, протестировать и сравнить с существующими системами.

Объект исследования. Гетерогенные источники информационных ресурсов.

Предмет исследования. Интеграция данных в гетерогенных информационных системах и способы обеспечения их семантической интероперабельности.

Методы исследования. Решение вышеперечисленных задач происходит с применением основ теории информационных систем, теории искусственного интеллекта, методов машинного обучения, инженерии знаний и парадигмы представления знаний "семантическая сеть". Использован объектно-ориентированный подход для реализации автоматизированной системы.

Научная новизна диссертационного исследования заключается в новом подходе к интеграции информационных ресурсов в распределённых информационных системах, основанном на определении структурных моделей источников данных и формировании на их основе, с применением общей онтологии предметной области, единой метамодели интегрируемых систем. В работе получены следующие результаты, характеризующиеся научной новизной:

• Метод автоматизированного извлечения семантических метаданных информационных ресурсов из распределенных источников данных, использующий общую структурную онтологию, для определения семантических связей;

• Алгоритмы автоматизированного извлечения онтологии из распределенных информационных источников, с учетом схожести извлекаемых элементов и их семантических взаимосвязей;

• Программное решение, выполняющее интеграцию информационных ресурсов на основе технологии связанных данных и реализующее разработанные алгоритмы.

Положения, выносимые на защиту:

1. Разработан метод автоматизированной интеграции информационных

ресурсов, хранящихся в распределенных информационных системах,

заключающийся в последовательном извлечении структуры каждой

ИС в виде онтологий, формировании на их основе, а также на основе

онтологий предметной области и онтологий верхнего уровня, общей

метамодели, и дальнейшем извлечении семантических метаданных

10

информационных ресурсов из ИС, при помощи общей метамодели и механизмов логического рассуждения;

2. Разработан алгоритм извлечения онтологии из структуры реляционных БД в информационных системах, заключающийся в отображении таблиц и полей на онтологическую структуру и добавлении семантических взаимосвязей, за счет анализа схожести элементов БД по различным признакам;

3. Разработан алгоритм извлечения семантических метаданных информационных ресурсов, заключающийся в использовании общей структурной метамодели интегрируемых систем и механизмов логического рассуждения, для определения смысловых взаимосвязей между ресурсами, и представления их в виде связанных данных;

4. Спроектирована программная автоматизированная система интеграции, реализующая разработанные алгоритмы и позволяющая объединить распределенные гетерогенные информационные ресурсы в единую сеть связанных данных.

Достоверность научных результатов. Обоснованность и достоверность научных положений подтверждается полнотой анализа теоретических и практических исследований, положительной оценкой на научных конгрессах, конференциях и семинарах, практической проверкой и внедрением полученных результатов исследований.

Практическая значимость. Реализованные в диссертационной работе методы, алгоритмы и программный продукт позволяют интегрировать распределенные и разнородные информационные ресурсы в единое информационное поле. Использование интеллектуальной семантической интеграции нормативно-справочной информации, данных об оборудовании, существующих изделиях и другой полезной информации в приборостроении, позволит более эффективно искать информацию и принимать оптимальные решения. Предоставляемые, разработанной в ходе исследования системой,

данные можно использовать, как непосредственно для анализа информации, так и в других автоматизированных системах для других целей.

Апробация работы. Основные положения диссертационного исследования докладывались и обсуждались на международных и всероссийских конгрессах и конференциях различного уровня:

1. Российская конференция аспирантов, студентов и молодых ученых «Информатика и вычислительная техника», 25 - 26 мая 2010 г., г. Ульяновск, Россия.

2. XII международная научно-практическая конференция «Фундаментальные и прикладные исследования, разработка и применение высоких технологий в промышленности», 8-10 декабря

2011 г., г. Санкт-Петербург, Россия.

3. Международная конференция «Современные проблемы и пути их решения в науке, транспорте, производстве и образовании '2011», 20-27 декабря 2011 г.

4. I Всероссийский конгресс молодых ученых, 10-13 апреля 2012 г., г. Санкт-Петербург, Россия.

5. Международная научно-практическая конференция «Перспективные инновации в науке, образовании, производстве и транспорте '2012», 21 июня - 3 июля 2012 г.

6. XII Conference of Open Innovations Association FRUCT, 5-9 ноября

2012 г., г. Оулу, Финляндия.

7. II Всероссийский конгресс молодых ученых, 9-12 апреля 2013 г., г. Санкт-Петербург, Россия.

8. XLIII научная и учебно-методическая конференция НИУ ИТМО, 8— 31 января 2014 г., г. Санкт-Петербург, Россия.

Внедрение результатов исследования Основные результаты работы внедрены и используются в ООО «Т-Системс СиАйЭс» и в ОАО «Всероссийский научно-исследовательский институт гидротехники имени Б.Е.

Веденеева», что подтверждается актами о внедрении. Результаты работы также используются в НИУИТМО на кафедре проектирования и безопасности компьютерных систем, что подтверждается актом внедрения в учебный процесс.

Публикации. По тематике диссертации опубликовано двенадцать работ, в том числе три работы входят в список рекомендованный ВАК для защиты кандидатских диссертаций:

1. Семерханов И.А., Варгин Г.В., Муромцев Д.И. Применение онтологий в системе управления интеллектуальными ресурсами // Научно-технический вестник информационных технологий, механики и оптики. - Санкт-Петербург. - 2011. - №2. С. 170-171

2. Семерханов И.А., Муромцев Д.И. Интеграция информационных систем при помощи связанных данных // Научно-технический вестник информационных технологий, механики и оптики. - Санкт-Петербург, 2013. - №5 (87). С. 123-128.

3. Семерханов И.А Автоматизированное извлечение семантических метаданных из распределенных реляционных бд // В мире научных открытий (Естественные и технические науки). - Красноярск, 2014. -№1(49), с. 10.

В рамках диссертационного исследования были получены два свидетельства о регистрации программы для ЭВМ №2011612823 и №2013661205.

Структура и объем работы.

Диссертация состоит из введения, четырех глав, заключения, изложенных на 140 листах машинописного текста, содержит 36 рисунков и 18 таблиц. Список литературы включает 79 наименований.

Во введении обоснована актуальность темы исследования,

сформулированы цель и задачи работы, показана научная новизна полученных

результатов и практическая ценность работы, представлены основные научные

13

положения, выносимые на защиту, кратко изложено основное содержание работы.

В первой главе производиться обзор современных тенденций в области решения задачи интеграции и обеспечения интероперабельности информационных ресурсов. Рассматривается само понятия интеграции данных в ИС, актуальность этой задачи и проблемы, возникающие при ее решении, как с организационной точки зрения, так и с технической. Приводиться определение понятия интероперабельности, ее виды, пути ее достижения. Делается обзор трех поколений решений этой задачи и рассмотрено самое современное на данный момент решение. Также приведена классификация подходов к интеграции, включающая в себя шесть различных уровней. Приведен анализ современных технологий для достижения желаемого уровня интеграции и поставлена задача разработки новых методов и средств, для решения этой задачи.

Вторая глава посвящена использованию семантических технологий и, в частности, связанных данных, для решения задачи интеграции данных в ИС и обеспечения семантической интероперабельности. В главе приводиться понятие онтологии предметной области, выделяются преимущества, которые дает ее использование. Рассматриваются современные стандарты обеспечения интероперабельности, такие как семейство стандартов ГОЕБ и один из его представителей - стандарт онтологического исследования сложных систем ГОЕР5. В главе детально раскрывается термин связанные данные, производиться анализ языков представления данных и методов описания метаданных. Показано, что связанные данные могут решить множество традиционных проблем, а интегрирующие системы, основанные на них, могут быть эффективнее традиционных систем.

В третьей главе рассматриваются, разработанные в рамках исследования, методы и алгоритмы автоматизированной интеграции данных на основе онтологии, в том числе метод автоматического извлечения метаописаний из

баз данных и представления их в виде облака связанных данных, включающий в себя нахождение связей между системами. Разработан алгоритм для извлечения структуры базы данных ИС в онтологию, показаны подходы к автоматическому обнаружению схожести структуры, а также способ отображения соответствий между схемами в извлеченной структуре. В главе также рассматривается алгоритм для извлечения хранимых данных из ИС и описания их средствами онтологии. Показана общая единая модель описания метаданных в системах.

Четвертая глава посвящена практической разработке программного комплекса на основе разработанных алгоритмов. Определены требования к автоматизированной системе, основанные на анализе существующих решений. Приведена функциональная модель разрабатываемой системы. В главе также показана архитектура предлагаемого решения и некоторые сценарии использования. Произведено тестирование созданной автоматизированной системы и анализ полученных результатов работы.

В приложении приведены документы, подтверждающие внедрение результатов диссертационной работы на производстве.

В заключении подведен итог всей проделанной работы и приведены основные полученные результаты в ходе выполнения диссертационной работы.

ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ И ОБЗОР СОВРЕМЕННЫХ ТЕНДЕНЦИЙ В ОБЛАСТИ ИНТЕГРАЦИИ

1.1 Задача интеграции информационных ресурсов

В большинстве крупных производств, организаций и компаний существуют различные информационные системы, разработанные в разное время, для разных целей. Системы эти могут быть использованы в разных департаментах, подразделениях и различными пользователями, часто информация в таких ИС дублируется. В такой ситуации невозможно произвести анализ всей имеющейся информационной базы организации и использовать все ресурсы по назначению. В связи с этим обычно возникает задача интеграции таких систем в единую информационную систему. По оценке компании Gartner Group на каждый доллар, который организации тратят на разработку и внедрение прикладных информационных систем, приходится еще от пяти до двадцати долларов затрат, связанных с интеграцией с другими системами [4].

Иными словами задача заключается, по сути, в создании новых методов и алгоритмов автоматизации интеграции данных, лежащих в основе системы, способной предоставить доступ к распределенным данным, хранящимся в других системах или агрегировать эту информацию внутри себя. Создание такой интегрирующей системы осложняется различными факторами, как техническими, так и организационными. К организационным факторам относятся:

• Отсутствие сотрудников, ответственных за интеграционные процессы;

• Недостаточный административный ресурс или несвоевременное его применение;

• Отсутствие ответственных за качество данных;

• Закрытость служб сопровождения и разработчиков информационных систем компании заказчика;

• Отсутствие предметных экспертов, отвечающих за анализ данных и разработку бизнес-правил преобразования.

Однако в диссертационной работе интеграция рассматривается в основном с технической точки зрения. Технически задача интеграции может решаться на нескольких уровнях: физическом, синтаксическом, семантическом. Интеграция на физическом уровне теоретически является наиболее простой и с развитием современных технологий, в частности, сетевых технологий, не представляет особого интереса для исследования. Синтаксическая интеграция подразумевает создание единого глобального интерфейса для доступа к ресурсам гетерогенных систем, без учета их семантических свойств. Семантический же уровень интеграции добавляет к синтаксическому уровню поддержку семантических свойств в рамках единой онтологии предметной области. В работе будут рассматриваться два последних уровня интеграции: синтаксический и семантический.

12 Основные проблемы интеграции ИС

Существуют следующие проблемы осложняющие решение задачи интеграции ресурсов в автоматизированных ИС:

• Технологическая гетерогенность - информационные системы часто используют для работы с данными разные технологии и протоколы взаимодействия;

• Различия в понятиях - многие ИС, работающие даже в одной области, могут описывать одни и те же объекты разными терминами и понятиями;

• Автономность - ИС часто разрабатываются и эксплуатируются независимо друг от друга, а, следовательно, не имеют средств для обмена информацией;

• Повторяющаяся информация - даже в ИС работающих внутри одного подразделения часто информация дублируется, что осложняет ее поиск и

фильтрацию. Эта проблема тесно связана с проблемой различий в понятиях.

Современные автоматизированные информационные системы в большинстве случаев являются распределенными, т.е. физически удаленными друг от друга, сложными программными комплексами, с большим количеством информационных единиц. Системы изначально имеют различную функциональность, построены на разных технологиях с применением специфичных протоколов обмена данных, имеют различную производительность. Они могут быть построены на отличающихся программных платформах, использовать разные модели данных и интерфейсы и иметь еще много отличий. Это связано с тем, что обычно на производстве или в организации информационные системы представляют собой автономные независимые приложения, автоматизирующие ту или иную деятельность. Неоднородность все больше проявляется с ростом таких ИС, с добавлением нового функционала, усложнением архитектуры.

13 Обеспечение интероперабельности

Все эти проблемы препятствуют построению единого унифицированного интерфейса доступа к данным. Одним из подходов, направленных на решение этих проблем является создание открытых, интероперабельных информационных систем [43, 49, 50]. Интероперабельность - способность информационной системы взаимодействовать с другими системами. Интероперабельность можно рассматривать, как свойство интегрируемых ИС, которое необходимо для объединения их в общую унифицируемую систему. Согласно федеральному закону №149-ФЗ, ИС это совокупность множества всех данных, технологий и технических средств, ее обрабатывающих.

Добавляя в понятие ИС такое свойство как интероперабельность, ч получаем множество:

/5 - {{О}, {77/}, {ТМ}, Ш},

где {И} - набор всех данных, {ТН} - множество технологий, {ТМ} - набор технических средств, Ш - свойство интероперабельности.

Таким образом, задачу интеграции можно решить, обеспечив интероперабельность каждой из интегрируемых систем, а интегрированные системы — это системы, основанные на интероперабельном взаимодействии их компонентов.

В целом можно выделить несколько видов интероперабельности: системный, структурный и семантический. Под системным видом подразумевается базовое взаимодействие распределенных систем через различные протоколы взаимодействия. Структурный вид направлен на стандартизацию способов взаимодействия систем и согласование хранящихся в них данных. Семантический вид интероперабельности направлен, в основном, на определение соответствия между смыслами единиц в информационных системах. Задача обеспечения интероперабельности изучается уже несколько десятков лет и насчитывает уже, как минимум, три поколения систем, обеспечивающих ее в той или иной степени [57]. В таблице 1.1 приведены основные черты всех трех поколений.

Таблица 1.1. Основные черты трех поколений интероперабельности

2§|1|||5 * ^ЙФкл^ёние 1 Щоклонение 2 ^Поклонение 3

Период 1980- 1995 1995-2001 2001 - ...

Виды Системная. Структурная. Семантическая.

Типы источников данных Структурирова нные базы данных и файлы. Структурирован ные базы данных, текстовые данные, XML. Все типы источников цифровой информации.

Похожие диссертационные работы по специальности «Системы автоматизации проектирования (по отраслям)», 05.13.12 шифр ВАК

Список литературы диссертационного исследования кандидат наук Семерханов, Илья Александрович, 2014 год

ЛИТЕРАТУРА

1. Батоврин В.К., Гуляев Ю.В., Олейников А.Я. Обеспечение интероперабельности - основная тенденция в развитии открытых систем // Информационные технологии и вычислительные системы - 2009. - № 5. -С. 7-15.

2. Вениаминов Е.М. Некоторые проблемы широкого внедрения онтологий в IT и направления их решений. //Труды Симпозиума "Онтологическое моделирование". М.:ИПИ РАН, 2008, с.71-82.

3. Гудков В. Ю., Гудкова Е. Ф. N-граммы в лингвистике // Вестник Челябинского государственного университета. - 2011. - № 24 (239). - С. 69-71.

4. Данилин А. В. Технологии интеграции информационных систем на основе стандартов XML и Web-служб. http://www.benran.ru/Magazin/cgi-bin/Sb03/pr03 .ехе?! 18

5. Загоруйко Н.Г., Гусев В.Д., Завертайлов A.B., Ковалёв С.П., Налётов А.М., Саломатина Н.В. Система ONTOGRID для автоматизации процессов построения онтологий предметных областей // Автометрия, т. 41, №5.-2005.-С. 13-25.

6. Ивашко А.Г., Иванова Е.И., Овсянникова Е.О., Коломиец С.И. Применение дескрипционной логики для описания архитектуры информационной системы // Вестник Тюменского государственного университета. - 2012. - №4. - С. 137-142.

7. Клещев А. С. Математические модели онтологии предметных областей.Ч. 1. Существующие подходы к определению понятия "онтология" // Научно—техническая информация Сер. 2 Информационные процессы и системы. - 2001. - №2.

8. Когаловский М.Р. Перспективные технологии информационных систем. -Москва: ИТ-Экономика. - 2003. - 288 с.

9. Майкевич H.B. От информационного пространства к пространству знаний. Онтологии в Интернет // Труды конференции КИИ-98, Пущино, Россия.-С.152-158.

10. Михайлов И.С. Математическое и программное обеспечение структурной и семантической интероперабельности информационных систем на основе метамоделей: диссертация к.т.н. - НИУ МЭИ. - 2003 [Электронный ресурс]. - Режим доступа: http://www.dissercat.com/content/issledovanie-i-razrabotka-metoda-obespecheniya-strukturnoi-interoperabelnosti-informatsionny, закрытый. Яз. рус. (дата обращения 18.01.2014).

11. Ньюкомер Э. Веб-сервисы. XML, WSDL, SOAP и UDDI. Для профессионалов. - Санкт-Петербург: Питер. - 2003. - 256 с.

12. Новицкий A.B. Обзор некоторых направлений интеграции гетерогенных ресурсов в электронных библиотеках // Труды 11 й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» - RCDL'2009, Петрозаводск, Россия. - 2009. - С. 350-356

13. Полотнюк И.С. Метаданные как базис интеграции. Вестник компьютерных и информационных технологий. - 2005. - № 12.

14. Черняк JI. Интеграция данных: синтаксис и семантика // «Открытые системы». - 2009. - №10.

15. Семерханов И.А., Муромцев Д.И. Интеграция информационных систем при помощи связанных данных // Научно-технический вестник информационных технологий, механики и оптики. - Санкт-Петербург, 2013.- №5 (87). С. 123-128.

16. Семерханов И. А., Варгин Г. В., Интеграция реляционных баз данных с использованием rdf\owl // Сборник тезисов докладов 2ого всероссийского конгресса молодых ученых. СПБ: НИУИТМО. - 2013 -. -№1, С. 117-118.

17. Тельнов Ю.Ф., Трембач В.М. Интеллектуальные информационные

системы // Учебное пособие. - М.: МГУЭСИ. - 2008. - 63 с.

134

18. Тузовский А.Ф., Ямпольский В.З. Интеллектуальное пространство в системах управления знаниями // Известия вузов. Физика. - 2004. - № 7. -С. 23-29.

19. Фастовский Э.Г. Сервис-ориентированные технологии интеграции информации. [Электронный ресурс] URL: http://khpi-iip.mipk.kharkiv.edu/library/sotii/lectures/, (дата обращения 25.01.2014).

20. Федеральный закон Российской Федерации от 27 июля 2006 г. N 149-ФЗ [Электронный ресурс] // Российская газета URL: http://www.rg.ru/2006/07/29/informacia-dok.html (дата обращения 25.01.2014).

21. Aminul Islam, Diana Inkpen, Iluju Kiringa Database Schema Matching using Corpus-based Semantic Similarity and Word Segmentation // Proceedings of the International Workshop on Databases, Information Systems and Peer-to-Peer Computing (DBISP2P 2007)? Austria, Сентябрь 2007.

22. Berlin Jacob, Motro Amihai Database Schema Matching Using Machine Learning with Feature Selection // CAISE 2002, LNCS 2348. - 2002. - C. 452-466.

23. Bauer Florian, Kaltenbock, Martin Linked Open Data: The Essentials. -Vienna: DGS, 2009 - 64.

24. Bermes Emmanuelle, Convergence and Interoperability: a Linked Data perspective // IFLA, Puerto Rico. - 2011. - C. 1-12.

25. Gabriel Recchia, Max Louwerse A Comparison of String Similarity Measures for Toponym Matching // Proceedings of The First ACM SIGSPATIAL International Workshop on Computational Models of Place. - 2013. - 54-62.

26. Bohannon Philip, Eiman Elnahrawy, Wenfei Fan, Michael Flaster Putting Context into Schema Matching // Proceedings of Very Large Data Bases -VLDB2006. - C. 307-318.

27. Dentler K., Cornet R., A. ten Teije, Keizer de N Comparison of reasoners for large ontologies in the OWL 2 EL profile // Semantic Web 1. - 2011. - С. 117.

28. Doan AnHai, Madhavan Jayant, Domingos Pedro, Halevy Alon Y., Sridhar M. S. Learning to map between ontologies on the semantic web // Proceedings of World Wide Web Conference Series - WWW. - 2002. - C. 662-673.

29. Evren Sirin, Bijan Parsia, Bernardo Cuenca Grau, Aditya Kalyanpur, Yarden Katz Pellet: A Practical OWL-DL Reasoner // Journal of Web Semantics , т. 5, №2.-2007.-С. 51-53.

30. Fernandez Lopez, M. Overview of methodologies for building ontologies // International Joint Conference on Artificial Intelligence - IJCAI. - 1999. - C. 4-1-4-12.

31. Fielding Roy Thomas Architectural Styles and the Design of Network-based Software Architectures: диссертация, д.т.н. - University of Southern California, Irvine, 2000.

32. Frischmuth Philipp, Klimek Jakub, Auer Sören, Tramp Sebastian, Unbehauen Jörg, Holzweißig Kai, Marquardt Carl-Martin Linked Data in Enterprise Information Integration // Semantic Web 0.-2012.-C. 1-17.

33. Fareh Messaouda, Boussaid Omar, Challal Rachid Multi-level Metadata Integration System: XML, RDF and RuleML // World Academy of Science, Engineering and Technology 62. - 2012. - C. 845-850.

34. Gruber Tomas Robert A Translation Approach to Portable Ontology Specifications // Knowledge Acquisition. - 1993 - 5(2). - С. 199-220.

35. Gomez-Perez A., Fernandez М. and de Vicente, A. Towards a Method to Conceptualize Domain Ontologies // ECAI '96Workshop on Ontological Engineering. Budapest, Hungary. - 1996. - C. 41-52.

36. Halpin H., Herman I., Hayes P. J., Wood D., Decker S. When owksameAs isn't the Same: An Analysis of Identity Links on the Semantic Web // RDF Next Steps Workshop, June 26-27. - 2010.

37. Heflin Jeff Searching the Web with SHOE // Defense Technical Information Center. - 2000.

38. Heath Tom, Bizer Christian Linked Data: Evolving the Web into a Global Data

Space (1st edition). Synthesis Lectures on the Semantic Web: Theory and

136

Technology, - Morgan & Claypool, 2011. - 136.

39. Hartig Olaf, Bizer Christian, Freytag Johann-Christoph Executing SPARQL Queries over the Web of Linked Data // International Semantic Web Conference - ISWC. - 2009. - C. 293-309.

40. Hladky D., Maltseva S.V. Linked data paradigm for enterprises: information integration and value chain // Бизнес-информатика №2(24). - 2013. - С. 3-12

41. Henning Michi. The Rise and Fall of CORBA // ACM Queue, 4(5), Июнь 2006.

42. Jones Dean, Bench-Capon Trevor, Visser Pepijn Methodologies for ontology development. - 1998. - C. 14.

43. Ke-Qing He, Jian Wang, Peng Liang Semantic Interoperability Aggregation in Service Requirements Refinement // Journal of Computer Science and Technology - JCST , т. 25, №6. - 2010. - С. 1103-1117.

44. Li Ding, Vassilios Peristeras, Michael Hausenblas, Linked Open Government Data // IEEE intelligent systems. - 2012. - С. 11-15.

45. Madhavan Jayant, Bernstein Philip A., Chen Kuang, Halevy, Pradeep Alon Y. Shenoy Corpus-based Schema Matching // Proceedings of International Joint Conference on Artificial Intelligence - IJCAI. - 2003. - C. 59-63.

46. Maniraj V., Dr. Sivakumar R. Ontology Languages - A Review // International Journal of Computer Theory and Engineering, т.2, №6. - 2010. -887-891.

47. Rahm Erhard, Bernstein Philip A. A survey of approaches to automatic schema matching // Proceedings of the VLDB Endowment, т. 10, №4. - 2001. - С. 334-350.

48. Rahm Erhard, Bernstein Philip A., Madhavan Jayant Generic Schema Matching, Ten Years Later // Proceedings of the VLDB Endowment, т. 10, №11. - 2011. - С.695-701.

49. Rajabifard Abbas Critical issues in global geographic information management

with a detailed focused on Data Integration and Interoperability of Systems and

Data // Scoping Paper for the 2nd Preparatory Meeting of the Proposed UN

137

Committee on Global Geographic Information Management New York, USA 10-11 Мая 2010. -С. 1-14.

50. Ruokolainen Toni Modelling framework for interoperability management in collaborative computing environments // Department of computer science series of publications report, Helsinki, Июнь 2009.

51. Rodriguez-Muro Mariano, Diego Calvanese Dependencies: Making Ontology Based Data Access Work. In AMW. - 2011.

52. Sangsoo S. Ontology-based semantic integration of heterogeneous information sources: диссертация д.т.н. - University of Southern California, 2008.

53. Sheth Amit P. Changing focus on interoperability in information systems: from system, syntax, structure to semantics // The Springer Interoperating Geographic Information Systems, 1999.

54. Semerhanov I.A., Vargin G.V., Muromtsev D.I. Integration of computer systems with the use of ontology // 12th Conference of Open Innovations Association FRUCT. Oulu, Finland, 5-9 Ноябрь 2012.

55. Uschold M. King M. Towards a Methodology for Building Ontologies // Workshop on Basic Ontological Issues in Knowledge Sharing. - 1995.

56. Uschold M. Building Ontologies: Towards A Unified Methodology // Expert Systems. - 1999. Cambridge.

57. Ziegler P, Dittrich K. R. Three decades of data integration - All problems solved? // World Computer Congress - IFIP. - 2004. - C. 3-12.

58. Voigt Martin, Mitschick Annett, Schulz Jonas Yet Another Triple Store Benchmark? Practical Experiences with Real-World Data // Proceedings of the 2nd International Workshop on Semantic Digital Archives. - 2012. - C. 85-94.

59. Wache H., Vogele T., Visser U., Stuckenschmidt K. Ontology-Based Integration of Information - A Survey of Existing Approaches // IJCAI-01 proceedings of the Seventeenth International Joint Conference on Artificial Intelligence, Seattle, Washington, 4-10 Августа, 2001.

60. Altova [Электронный ресурс] // Altova Data Integration URL: http://www.altova.com/mapforce/data-integration.html (дата обращения 25.01.2014).

61. Apache Camel [Электронный ресурс] // Apache Camel URL: http://camel.apache.org/ (дата обращения 25.01.2014).

62. Computer science [Электронный ресурс] // Дмитрий Барашев Big Data'13 Лекция IX: поиск похожих документов URL: http://compscicenter.ru/sites/default/files/materials/2013 04 18_BigData_lectu re_09.pdf (дата обращения 25.01.2014).

63. Denodo [Электронный ресурс] // Denodo platform URL: http://www.denodo.com/en/product/overview.php (дата обращения 25.01.2014).

64. D2RQ Platform [Электронный ресурс] // D2R Server: Accessing databases with SPARQL and as Linked Data URL: http://d2rq.org/d2r-server (дата обращения 25.01.2014).

65. Fluid Operations [Электронный ресурс] // Information Workbench URL: http://www.fluidops.com/information-workbench/ (дата обращения 25.01.2014).

66. IDEF5. [Электронный ресурс] // IDEF5 Ontology Description Capture Method URL: http://www.idef.com/IDEF5.htm (дата обращения 25.01.2014).

67. Informática [Электронный ресурс] // Introducing Informática Vibe URL: http://www.informatica.com/us/products/data-integration/vibe/ (дата обращения 25.01.2014).

68. KIF [Электронный ресурс] // Knowledge Interchange Format URL: http://www-ksl.stanford.edu/knowledge-sharing/kif/ (дата обращения 25.01.2014).

69. Ontoquad [Электронный ресурс] // EventOS Ontoquad URL: http://my-eventos.com/solution/ontoquad/ (дата обращения 25.01.2014).

70. Optique Project [Электронный ресурс] // Optique - Scalable end-user access to Big Data URL: http://www.optique-project.eu/ (дата обращения 25.01.2014).

71. Ontolingua [Электронный ресурс] // Ontolingua software URL: http://www.ksl.stanford.edu/software/ontolingua/ (дата обращения 25.01.2014).

72. Openlink Virtuoso [Электронный ресурс] // Virtuoso Universal Server URL: http://virtuoso.openlinksw.com/ (дата обращения 25.01.2014).

73. OWL Test cases [Электронный ресурс] // OWL Web Ontology Language Test Cases URL: http://www.w3.org/TR/owl-test/ (дата обращения 25.01.2014).

74. Pelle OWL2 Reasoner [Электронный ресурс] // Pellet: OWL 2 Reasoner for Java - Clark & Parsia URL: http://clarkparsia.com/pellet/ (дата обращения: 25.01.2014).

75. R2RML [Электронный ресурс] // R2RML: RDB to RDF Mapping Language URL: http://www.w3.org/TR/r2rml/ (дата обращения 25.01.2014).

76. Redis [Электронный ресурс] // Redis in-memory storage URL: http://redis.io/ (дата обращения 25.01.2014).

77. RDF [Электронный ресурс] // Resource Description Framework URL: http://www.w3.org/RDF/ (дата обращения 25.01.2014).

78. SPARQL [Электронный ресурс] // SPARQL Query Language for RDF URL: http://www.w3.org/TR/rdf-sparql-query/ (дата обращения 25.01.2014).

79. White Simon How to Strike a Match [Электронный ресурс] URL: http://www.catalysoft.com/articles/StrikeAMatch.html (дата обращения 25.01.2014).

/

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.