Технология построения информационно-справочных систем для научного сообщества тема диссертации и автореферата по ВАК РФ 05.25.05, кандидат технических наук Леонова, Юлия Викторовна

  • Леонова, Юлия Викторовна
  • кандидат технических науккандидат технических наук
  • 2005, Новосибирск
  • Специальность ВАК РФ05.25.05
  • Количество страниц 166
Леонова, Юлия Викторовна. Технология построения информационно-справочных систем для научного сообщества: дис. кандидат технических наук: 05.25.05 - Информационные системы и процессы, правовые аспекты информатики. Новосибирск. 2005. 166 с.

Оглавление диссертации кандидат технических наук Леонова, Юлия Викторовна

ВВЕДЕНИЕ.

ГЛАВА 1 ИССЛЕДОВАНИЕ СОВРЕМЕННЫХ СПРАВОЧНЫХ НИС И ОПРЕДЕЛЕНИЕ ТРЕБОВАНИЙ, ПРЕДЪЯВЛЯЕМЫХ К ИНТЕГРИРОВАННЫМ НИС.

1.1 Анализ недостатков существующих НИС.

1.2 Определение требований, предъявляемых к НИС.

1.3 Обзор наиболее близких решений.

Выводы к главе 1.

ГЛАВА 2 ИНФОРМАЦИОННАЯ МОДЕЛЬ НИС.

2.1 Информационная модель НИС.

2.2 Информационная модель документа.

2.3 Выбор схемы данных.

2.4 Модель отношений между документами.

Выводы к главе 2.

ГЛАВА 3 ИНФОРМАЦИОННОЕ ХРАНИЛИЩЕ.

3.1 выбор модели хранения коллекций.:.

3.2 Уровень реализации хранилища данных.

3.3 Отображение информационной модели отношений на реляционную модель.

3.4 Представление информации на нескольких языках.

3.5 Описание информационных коллекций.

Выводы к главе 3.

ГЛАВА 4 РЕАЛИЗАЦИЯ И ВНЕДРЕНИЕ.

4.1 технологические принципы реализации НИС.

4.2 Описание приложения "БД Организаций и сотрудников СО РАН".

4.3 Описание приложения "администратор БД Организаций и сотрудников СО РАН".

Выводы к главе 4.

Рекомендованный список диссертаций по специальности «Информационные системы и процессы, правовые аспекты информатики», 05.25.05 шифр ВАК

Введение диссертации (часть автореферата) на тему «Технология построения информационно-справочных систем для научного сообщества»

Актуальность исследования

Информационные ресурсы, переведенные в электронную форму, приобретают новое качество, которое обеспечивает им более широкое распространение и эффективное использование. Важными аспектами успешной научной деятельности являются информационная поддержка подготовки проектов, обеспечение научных мероприятий справочной информацией.

Необходимым условием деятельности для крупного территориально распределенного научного сообщества, такого как Сибирское отделение РАН (СО РАН), является доступ к управленческо-административным ресурсам (УАР). УАР [58] - это информация о структуре научных организаций, контактная информация, данные о руководстве организаций, научных сотрудниках, описания проектов и т.п. Поэтому построение научной информационно-справочной системы (НИС), предназначенной для предоставления доступа к УАР СО РАН, является актуальной задачей.

Существует большое число справочных информационных систем, функционирующих на серверах. организаций и хранящих информацию о научном сообществе, но эта информация разобщена по интерфейсам систем, что не дает возможности осуществления общего поиска по всем ресурсам. Необходимость объединения разрозненных научных информационных ресурсов в концептуально единую справочную информационную систему, обеспечения централизованного поиска и доступа через единый интерфейс к информации является актуальной задачей.

Не все имеющиеся справочные системы удовлетворяют требованиям интероперабельности, то есть способности к взаимодействию с другими информационными системами, что делает невозможным интеграцию ресурсов этих систем и осуществление единого поиска по всем ресурсам. Важным системообразующим элементом построения единой справочной системы является унификация доступа к совокупности источников информации, что позволяет создать у пользователя иллюзию объединенного источника информации. Для успешной интеграции ресурсов в справочную систему требуется преодолеть различия в форматах и структуре данных, поставляемых в нее из разных информационных источников.

Поэтому выработка технологических решений для построения единой информационно-справочной системы, обеспечивающей интеграцию существующих и вновь создаваемых информационных ресурсов в общее информационное пространство, является актуальной задачей. Важнейшие аспекты этой задачи: интеграция информационных ресурсов в единое пространство; использование метаданных для описания информационных ресурсов; применение открытых стандартов взаимодействия систем, поиска, обмена и представления информации.

При формировании своей содержательной информации НИС должна использовать информацию, которая находится в организациях СО РАН, например, такие информационные ресурсы как кадровые базы, информационные системы, содержащие управленческо-административную информацию.

Взаимодействие НИС с другими информационными системами может строиться на общих стандартах OSI, единых схемах данных, согласовании схем данных НИС и подключаемых информационных систем. Для обеспечения доступа должна быть решена доверительность на уровень поиска и сформулированы правила доступа, реализованные в НИС.

Разработанная НИС может быть использована как единая «точка входа» для доступа к различным ресурсам, создаваемых в организациях СО РАН, включая и кадровые базы.

Таким образом, при создании НИС были решены следующие важные задачи: интеграция информационных ресурсов; разработка удобного для пользователя интерфейса;

• соблюдение требований интероперабельности.

Для обеспечения решения этих задач была проделана следующая работа.

Построена модель документов, формализована структура обменных документов для обеспечения интероперабельности.

Построена модель взаимодействия НИС с другими системами.

Разработаны механизмы представления пользовательских интерфейсов НИС на основе шаблонов, описывающих способ визуализации информации.

Степень изученности проблемы

Идея сетевого и унифицированного доступа к справочным электронным ресурсам не нова.

Одним из крупных проектов построения единой справочной информационной системы была разработка рекомендаций Х.500, описывающего работу электронного справочника.

Рекомендации справочника3 Х.500 разработаны Международным телекоммуникационным союзом - ITU, как справочная служба для систем передачи сообщений на основе стандарта Х.400. Х.500 (ISO 9594) представляет собой группу стандартов и рекомендаций для построения справочников [68]. Первая его версия появилась в 1988 году, затем она дорабатывалась в 1993 и 1996 годах. Х.500 предлагает описание модели, услуги протоколов взаимодействия справочных систем и является частью модели взаимодействия открытых систем (ВОС, OSI). Главная его цель - обеспечить доступ различных систем (почтовых служб, систем выдачи сертификатов, электронной подписи) к единой справочной информации. С этой точки зрения Х.500, как и другие стандарты OSI, определяет правила "внешнего" поведения систем с минимальными предположениями об их внутреннем устройстве.

Справочник Х.500 может содержать сетевую информацию, адреса электронной почты, телефонные номера и другую информацию, например, касающуюся идентификации и авторизации пользователей. Услуги справочника могут предоставляться как другим приложениям, так и конечным пользователям. Человек может искать в справочнике номер телефона, а приложение - например, сетевой адрес какого-либо другого процесса.

Стандарт Х.500 появился, конечно же, не на пустом месте - у него есть предшественники, опыт использования которых был учтен в ходе разработки. Среди них важное место занимает протокол finger, при помощи которого пользователи ОС Unix получали информацию друг о друге.

Предшествующий опыт позволил сформулировать требования, предъявляемые к идеальному справочнику [33]. Он должен иметь: децентрализованное управление: каждый сервер должен отвечать только за свою локальную часть базы справочника, чтобы обновление данных и сопровождение можно было выполнять немедленно; мощные возможности поиска, позволяющие пользователям создавать запросы произвольной степени сложности; единое глобальное пространство имен по аналогии с DNS4; структурированный информационный каркас, допускающий локальные расширения;

3 В русскоязычной литературе встречается также термин "служба каталогов", однако, по мнению автора, он не подчеркивает справочной специфики описываемой технологии.

4 DNS - служба доменных имен, основное предназначение которой — хранить информацию о соответствии IP-адресов доменным именам и наоборот, а также множество других полезных сведений, например адреса сервера почтового обмена для домена. стандартный интерфейс, единый протокол доступа. Приложения, нуждающиеся в ресурсах справочника, должны производить запросы, используя стандартизированный протокол, одинаковый для всех платформ.

Всем этим требованиям как раз и отвечают системы, построенные на основе рекомендаций Х.500.

Большие изменения в технологии Х.500 и в построении систем на базе этой технологии произошли в 1997 году [46]. Были приняты изменения в рекомендациях, которые позволяли использовать международные символьные наборы в справочниках. В литературе появился термин "распределенные глобальные" справочники (global distributed directory).

Глобальные распределенные справочники подразумевают справочники, в которых части информации размещены на различных серверах, объединенных по определенным правилам, и, с точки зрения пользователя, образуют единый логический каталог.

Доступ к справочникам, построенным по Х.500 технологии, осуществляется по протоколу DAP, имеющего все механизмы доступа к справочникам, включая реплицирование, механизмы защиты и другие. Протокол DAP реализован в ряде операционных систем, например, в Windows 2003 (Active Directory) и на отдельных платформах Unix.

Для доступа к справочникам в среде Internet в 1997 году был разработан протокол LDAP. Фактически создание протокола LDAP было попыткой приспособить стандарт Х.500 к стеку протоколов TCP/IP. LDAP отвечает только за доступ клиентских систем к каталогам Х.500, в то время как полное соответствие Х.500 предполагает наличие совместимости между серверами.

Этот прорыв, как в технологии построения глобальных справочников, так и в технологии доступа к ним, породил бурное развитие прикладных приложений на базе технологии Х.500.

В 1997 году был создан первый распределенный глобальный мировой справочник Challenge'97 [6]. Он был построен более чем на 30 серверах справочников, расположенных в 9 странах мира. При построении данного справочника использовалось программное обеспечение различных фирм производителей.

В России технологии Х.500 были применены для построения справочников, используемых в различных отраслях. Например, на Центральном телеграфе была создана "Единая Справочная Служба Главных телеграфных узлов" [45], которая представляет собой распределенную службу справочных серверов Х.500, содержащих адресную и другую дополнительную информацию о различных сетях и субъектах (организациях, фирмах, частных лицах). В рамках Ассоциации документальной электросвязи построен справочник контактных координат людей и организаций АДЭ (vvww.ctel.msk.ru/x500).

Почти параллельно с Х.500 развивалась справочная информационная система WAIS5 [23], использовавшая простой язык -управления, близкий к естественному. WAIS базировалась на протоколе Z39.50, который описывает прикладной уровень взаимодействия распределенных информационно-поисковых систем. С развитием протокола HTTP6 WAIS была вытеснена системой поиска ресурсов WWW. Фактически Z39.50 - это протокол доступа к каталогам, а не к самим ресурсам. Поэтому WAIS - это система доступа к каталогам. (Каталог является более широким понятием, чем справочник)

В результате проводимых библиотекой конгресса США исследований и разработок, технология WAIS превратилась в распределенную систему доступа к каталогам, содержащих каталожные карточки (метаданные) — описания некоторых неэлектронных информационных ресурсов, а протокол Z39.50 в 1998 году был принят как международный стандарт ISO-23950. Это сыграло ключевую роль в развитии распределенных систем доступа к каталогам и организации метаданных на базе стандарта Z39.50. В России наибольшее распространение протокол Z39.50 [43, 44] получил в системах доступа к библиотечным каталогам. При этом область применения протокола Z39.50 не ограничивается библиотечными каталогами. Поскольку справочник - это частный случай каталога, на базе протокола Z39.50 может быть организован доступ к справочникам, в которых может содержаться и административная информация.

Кроме того, существуют также не стандартизированные справочные информационные системы, функционирующие на серверах организаций, которые содержат информацию о научном сообществе, такую, как данные о публикациях, конференциях, проектах, информацию о структуре организаций, сотрудниках отдельных организаций, связях, совместных программах и т.п.

Особой разновидностью справочника являются системы доступа к каталогам библиотек, издательств и т.п.

В настоящее время в институтах СО РАН библиотечных ресурсов представлено мало. Библиотечные ресурсы представлены на сайтах отдельных институтов СО РАН. Библиотечные информационные системы имеются только в Государственной публичной научно-технической библиотеке г. Новосибирска (ГПНТБ) и Объединенном институте геологии, геофизики и минералогии СО РАН (ОИГГМ), и в некоторых библиотеках научных

5 WAIS (Wide Area Information Servers) - распределенная информационно-поисковая система сети Internet, которая обеспечивает поиск документа по определенной теме на основе ключевых слов

6 HTTP (HyperText Transfer Protocol) - протокол прикладного уровня для распределенных, совместных, многосредных информационных систем центров, которые являются филиалами ГПНТБ. В ОИГГМ O.JI. Жижимовым и А.Н. Мазовым был создан корпоративный каталог библиотек Новосибирска и Сибири, работающий на базе протокола Z39.50 [44]. Этот каталог интегрирует электронные каталоги библиотек Новосибирска: ГПНТБ, Областной научной библиотеки и крупных библиотек в других городах Сибири [35].

В издательстве СО РАН автором диссертации был разработан сводный электронный полнотекстовый каталог журналов и электронный каталог книг, выпускаемых в СО РАН.

Примером НИС является Интегрированная система информационных ресурсов Российской Академии Наук (ИСИР РАН) созданная коллективом ученых под руководством В.А. Серебрякова [42]. Основной целью проекта ИСИР РАН являлась разработка концептуальной структуры для интеграции разнородных информационных и вычислительных ресурсов РАН в единое информационное пространство. Текущая версия ИСИР РАН реализована как информационно-поисковый справочник РАН, ориентированный на накопление и предоставление оперативной научно-административной информации. ИСИР РАН обеспечивает доступ к данным об институтах, ученых, проектах, публикациях.

Коллективом, возглавляемым С.И. Париновым, была разработана система "Соционет", которая содержит информацию о различных информационных ресурсах [67]. Среди них архивы электронных публикаций, оглавления онлайновых журналов, каталоги новых поступлений библиотек, планы издательств и др., информация об организациях, персонах.

На сервере ГосНИИ информационных технологий и телекоммуникаций М.В. Булгаковым и С.С. Внотченко создана информационная система "Информика", содержащая ряд баз данных по организациям, персонам, технологиям, конференциям в Российской Федерации, журналам и газетам в сфере образования и информационных технологий [38]. С точки зрения структуры информации - это наиболее полная система, предназначенная для информационной поддержки научно-образовательного сообщества.

Зарубежными учеными также ведутся разработки НИС.

Хельсинский университет технологий (Helsinki University of Technology, HUT) создал информационную систему для отчетной деятельности о событиях, видах деятельности, и другой. научной информации о проводимых университетом исследованиях. Следует отметить, что HUT удалось интегрировать в одну информационную систему и связать процессы научной и учебной деятельности [31].

Шью (Shyu), Ю-Мей (Yuh-Mei), Чию-Фэнг (Chiu-Fang) [29] была создана информационная система для обеспечения информационных потребностей управления наукой и прикладными исследованиями Government Research Bulletin (GRB). Предложена схема жизненного цикла информации о проектах, в которой участвуют как ученые, так и академические и правительственные чиновники. Система интегрирует данные о проектах, отчетах, патентах, исследователях.

А. Ассерсон (A. Asserson), К. Джеффери (К. Jeffeiy), А. Лопатенко (A. Lopatenko) была разработана модель ИСС на базе стандарта CERIF для описания научных ресурсов и научных баз данных [1].

Проведенный анализ показал, что в настоящее время существуют различные рекомендации и стандарты построения справочных систем. Также в научных учреждениях ведутся работы по созданию электронных справочных информационных ресурсов, в том числе и с использованием Интернет-технологий. Однако для того, чтобы придать этому процессу системный характер, облегчить поиск необходимых ресурсов, необходимо, на наш взгляд, перейти к созданию интегрированных информационных систем научных учреждений, построенных на основе согласованных стандартов и с применением современных информационных технологий.

Цель диссертационной работы состоит в выработке технологических решений построения НИС, которые допускают как интеграцию разнородных информационных ресурсов, так и интеграцию с другими информационными системами.

Для достижения этой цели решены следующие основные задачи:

1. Исследованы современные справочные информационные системы и определены требования, предъявляемые к информационным системам для построения интегрированных НИС.

2. Проведен анализ существующих технологий, протоколов и стандартов в области проектирования и построения информационно-справочных систем с доступом через Internet.

3. Разработана модель информационных процессов в НИС.

4. Определены схемы данных для представления информации рассматриваемой предметной области.

5. Реализована прикладная логика и пользовательские интерфейсы НИС, обеспечивающие выполнение предъявляемых требований. Построена НИС на основе объектной модели документа, поддерживающая много языков (как для интерфейсов, так и для хранимых документов), предоставляющая удобные интерфейсы для поиска, просмотра, редактирования документов и обеспечивающая разные права доступа к документам для разных категорий пользователей.

Исходя из поставленных целей в работе были получены следующие основные результаты.

1. Построена структурированная модель документа и предложена информационная модель представления документа в системе на основе коллекционного подхода. Информационная система рассматривается как множество связанных различными отношениями документов. Документ обладает структурой и содержанием. Структура документа - это набор структурных элементов. Содержание документа - объединение значений экземпляров элементов, составляющих документ. Коллекция - это множество документов, обладающих одинаковой структурой и одинаковой содержательной направленностью. Эта модель не зависит от конкретной предметной области и может быть адаптирована к другой предметной области путем введения метаданных.

2. Предложена многоуровневая модель информационных процессов, обеспечивающая функционирование многопользовательской НИС и интероперабельность с другими системами.

Модель информационных процессов имеет пять уровней: уровень хранения выполняет выборку информации из информационного хранилища; уровень коллекции выполняет вычисление отношений и подтверждение прав доступа запроса к документу на уровне его структуры; уровень обмена выполняет генерацию внутреннего представления документа; уровень отбора выполняет отбор необходимых элементов документа на основании запроса и прав доступа; уровень презентации генерирует презентационное представление документа в виде, удобном для представления пользователю.

3. Предложена модель описания отношений между документами, даны примеры отображения модели отношений ■ в общепринятые модели представления информационных структур (реляционная, графовая модели). Для описания отношений между документами в НИС выбран язык описания структурированной информации RDF7. Отношения в НИС выстраиваются на уровне элементов, определяющих структуру документов.

4. Предложена реализация НИС в виде следующих коллекций документов: коллекций, содержащих основную информацию в системе - «Персоны» и

Организации»;

7 RDF (Resource Description Framework) - Схема описания ресурсов, стандарт RDF. Основанный на языке XML стандарт, утвержденный консорциумом W3C. Вводит правила создания метаданных, позволяет стандартным образом описывать содержание ресурсов Интернет. дополнительных коллекций, включающих в себя о коллекцию «Неструктурированные документы», содержащую дополнительную информацию, как по персонам, так и по организациям; о коллекцию «Каталог» (публикаций, проектов и т.д.). На основе международных стандартов и рекомендаций выбраны следующие схемы данных для описания структуры документов в коллекциях: для представления персон и о организаций - схемы данных Dublin Core (DC) и LDAP, а для дополнительных коллекций - схема данных Dublin Core. Количество коллекций в системе может быть расширено при необходимости.

5. Реализована модель информационного хранилища, предоставляющего по запросу доступ к таблицам, соответствующим одной коллекции, которые могут быть распределены по сети.

6. Разработанные технологические принципы реализованы в ИС «База данных организаций и сотрудников СО РАН», и применены в «Электронном полнотекстовом каталоге журналов» и «Электронном каталоге книг» для Издательства СО РАН.

На защиту выносятся следующие положения:

1) Предложены технологические требования, предъявляемые к основным элементам реализации НИС, позволяющие создавать интегрированные НИС, которые обеспечивают доступ через Интернет к разнородным информационным ресурсам.

2) Предложена информационная модель представления документов в системе, построенная на основе коллекционного подхода, которая не зависит от конкретной предметной области. На основе международных стандартов и рекомендаций обоснован выбор схем данных, позволяющих описывать структуры документов в коллекциях НИС.

3) Предложена новая многоуровневая модель процессов в НИС, разработанная на основе современных международных стандартов взаимодействия открытых систем, которая обеспечивает функционирование многопользовательской НИС и интероперабельность с другими системами. Предложена информационная модель отношений между документами, построенная на основе RDF, позволяющая описывать отношения между персонами и организациями, персонами и проектами, организациями и подразделениями и т.п. Построена модель информационного хранилища, позволяющая реализовать доступ к распределенным БД.

4) На основе выработанных технологических решений разработаны научные информационно-справочные системы:

8 Dublin Core - Стандарт метаданных Дублинского ядра (Dublin Core), набор элементов для описания широкого спектра сетевых ресурсов.

База данных организаций и сотрудников СО РАН», которая предоставляет доступ к справочной управленческо-административной информации СО РАН;

Электронный полнотекстовый каталог журналов», который предоставляет доступ к аннотациям и полным текстам статей из научных журналов, издаваемых в СО РАН;

Электронный каталог книг», который предоставляет доступ к описаниям учебников, научных и научно-популярных книг, издаваемых в СО РАН, с возможностью заказа книг.

Научная новизна работы связана с разработкой технологии построения НИС.

1. Предложены технологические требования, предъявляемые к . основным элементам реализации НИС, которые должны учитываться при построении интегрированных НИС.

2. Впервые в научных справочных информационных системах был применен коллекционный подход для представления документов в системе, позволяющий настраиваться на требуемую предметную область информационно-справочной системы.

3. Впервые предложена многоуровневая модель информационных процессов, обеспечивающая функционирование многопользовательской НИС и интероперабельность с другими системами.

4. Разработана информационная модель отношений между документами, позволяющая описывать отношения между персонами и организациями, персонами и проектами, организациями и подразделениями.

Практическая ценность

Предложенная информационная модель НИС реализована в информационной системе «База данных организаций и сотрудников СО РАН», а также в «Электронном полнотекстовом каталоге журналов» и «Электронном каталоге книг» для Издательства СО РАН.

Исходя из технологических требований к НИС, разработанная технология их построения может быть перенесена на другую предметную область. Примером такого переноса являются созданные автором «Электронный полнотекстовый каталог журналов» и «Электронный каталог книг» для Издательства СО РАН.

Достоверность и обоснованность результатов диссертационной работы подтверждаются:

1. Результатами анализа существующих технологий, протоколов и стандартов в области проектирования и построения информационно-справочных систем с доступом через Internet. . .

2. Результатами анализа существующих научных информационно-справочных систем на соответствие технологическим требованиям.

3. Теоретическим обоснованием построенных моделей НИС.

4. Успешным практическим использованием системы «БД организаций и сотрудников СО РАН», заполнение которой осуществляется Президиумом СО РАН, отделами кадров институтов СО РАН.

5. Успешным практическим использованием в Издательстве СО РАН «Электронного полнотекстового каталога журналов» (содержит 18 журналов) и «Электронного каталога книг» (содержит информацию о ~ 800 книгах).

6. Признанием достижений автора на конференциях и присуждением автору диплома второй степени конкурса молодых ученых, проведенного администрацией Новосибирской области в 2002 г.

Личный вклад автора. Основные результаты, представленные в работе, получены непосредственно автором, а именно: технологические требования, предъявляемые к НИС, структурированная модель документа, модель представления отношений между документами, модель информационных процессов, обоснование выбора схем данных для описания структуры документов, модель информационного хранилища, информационные системы «БД организаций и сотрудников СО РАН», «Электронный полнотекстовый каталог журналов» и «Электронный каталог книг» для Издательства СО РАН.

Апробация работы Научные результаты, изложенные в диссертации докладывались на следующих конференциях.

1. Конференция молодых ученых, посвященная 10-летию ИВТ СО РАН, Новосибирск, 2000;

2. VI-ое Международное рабочее совещание по электронным публикациям (El-Pub2001), Новосибирск, 2001;

3. Конференция, посвященная 90-летию со дня рождения А.А. Ляпунова, Новосибирск, 2001;

4. Конференция молодых ученых по математике, математическому моделированию и информатике, Новосибирск, 2001;

5. Международная конференция «Вычислительные технологии и математическое моделирование в науке, технике и образовании», Алма-Ата, 2002;

6. Международная конференция молодых ученых по математическому моделированию и информационным технологиям, Новосибирск, 2002;

7. УП-ая Международная конференция по электронным публикациям " El-Pub2002", Новосибирск, 2002;

8. Четвертая Всероссийская научная конференция «Электронные библиотеки: перспективные методы и технологии, электронные коллекции», Дубна, 2002;

9. Международная конференция "Вычислительные и информационные технологии в науке, технике и образовании", Усть-Каменогорск, 2003;

10. УШ-ая Международная конференция по электронным публикациям "El-Pub2003", Новосибирск, 2003;

11. Г/-ая Всероссийская конференция молодых ученых по математическому моделированию и информационным технологиям, Красноярск, 2003;

12. Ш-я Всероссийская конференция «Математика, информатика, управление», посвященная памяти профессора О.В. Васильева, Иркутск, 2004;

13. IX-ое Международное рабочее совещание по электронным публикациям (El-Pub2004), Новосибирск, 2004;

14. Международная конференция "Вычислительные и информационные технологии в науке, технике и образовании", Алма-Ата, 2004.

Работа «Интегрированная информационная система научного сообщества» в 2002 г. была награждена дипломом второй степени конкурса молодых ученых, проведенного администрацией Новосибирской области.

Публикации. По теме диссертации опубликовано 17 печатных работ из них 8 тезисов.

Структура и объем работы

Диссертация состоит из введения, 4 глав, заключения, списка цитированной литературы, 5-ти приложений. Основное содержание работы изложено на 128 страницах текста, содержит 46 рисунков, 7 таблиц. Список цитированной .литературы включает 71 наименование.

Похожие диссертационные работы по специальности «Информационные системы и процессы, правовые аспекты информатики», 05.25.05 шифр ВАК

Заключение диссертации по теме «Информационные системы и процессы, правовые аспекты информатики», Леонова, Юлия Викторовна

Выводы к главе 4

1. Разработаны механизмы представления пользовательских интерфейсов НИС на основе шаблонов, описывающих способ визуализации информации.

2. С использованием разработанной в данной работе технологии построения НИС реализованы два приложения: ИС «БД организаций и сотрудников СО РАН» и ИС «Администратор БД организаций и сотрудников СО РАН».

ЗАКЛЮЧЕНИЕ

К основным результатам диссертации можно отнести следующие.

1. Построена структурированная модель документа и предложена информационная модель представления документа в системе на основе коллекционного подхода. Информационная система рассматривается как множество документов, связанных различными отношениями. Документ обладает структурой и содержанием. Структура документа - это набор структурных элементов. Содержание документа - объединение значений экземпляров элементов, составляющих документ. Коллекция - это множество документов, обладающих одинаковой структурой и одинаковой содержательной направленностью. Эта модель не зависит от конкретной предметной области и может быть специфицирована на другую предметную область путем введения метаданных.

2. Предложена многоуровневая модель информационных процессов, обеспечивающая функционирование многопользовательской НИС и интероперабельность с другими системами.

Модель информационных процессов имеет пять уровней: уровень хранения выполняет выборку информации из информационного хранилища; уровень коллекции выполняет вычисление отношений и подтверждение прав доступа запроса к документу на уровне его структуры; уровень обмена выполняет генерацию внутреннего представления документа; уровень отбора выполняет отбор необходимых элементов документа на основании запроса и прав доступа; уровень презентации генерирует презентационное представление документа в виде, удобном для представления пользователю.

3. Предложена модель описания отношений между документами, позволяющая описывать отношения между персонами и организациями, персонами и проектами, организациями и подразделениями. Даны примеры отображения модели отношений в общепринятые модели представления информационных структур (реляционная, графовая модели). Для описания отношений между документами в НИС используется язык представления структурированной информации RDF. Отношения в НИС выстраиваются на уровне элементов, определяющих структуру документов.

4. Предложена реализация НИС в виде следующих коллекций документов: коллекций, содержащих основную информацию в системе - «Персоны» и «Организации»; дополнительных коллекций, включающих в себя о коллекцию «Неструктурированные документы», содержащую дополнительную информацию, как по персонам, так и по организациям; о коллекцию «Каталог» (публикаций, проектов и т.д.). Выбраны следующие схемы данных для описания структуры документов в коллекциях: для представления персон и организаций - схемы данных Dublin Core и LDAP, а для дополнительных коллекций - схема данных Dublin Core. Количество коллекций в системе может быть расширено при необходимости.

5. Реализована модель информационного хранилища, предоставляющего по запросу доступ к таблицам, соответствующим одной коллекции, которые могут быть распределены по сети.

6. Разработанные технологические принципы реализованы в ИС «База данных организаций и сотрудников СО РАН», и применены в «Электронном полнотекстовом каталоге журналов» и «Электронном каталоге книг» для Издательства СО РАН.

Дальнейшее развитие и применение технологии, предложенной в диссертации, представляется перспективным. Основные направления развития НИС связаны с расширением предложенной технологии на реализацию других коллекций и других отношений, которые возникают в научном сообществе: проекты, научные достижения, разработки и т.д.

Список литературы диссертационного исследования кандидат технических наук Леонова, Юлия Викторовна, 2005 год

1. Assersori A., Jeffery К. G., Lopatenko A. CERIF: Past, Present and Future: An Overview // www.eurocris.org

2. Barker, P. and S. Kille, The COSINE and Internet X.500 Schema, RFC 1274, November 1991.

3. Bemers-Lee Tim. Relational Databases on the Semantic Web // http://www.w3 .org/Designlssues/RDB-RDF.html

4. Bemers-Li Т., Fielding R., Irvine U.C., Masinter L. Uniform Resource Identifiers (URI): General Syntax. RFC 2396. August 1998.

5. Brian Matthews, Alistair Miles, Michael Wilson. CRISs, Thesauri and the Semantic Web

6. Challenge "97 толчок в сторону X.500 //Сети, №9, 1996, http://www.osp.ni/nets/l 996/09/104.htm

7. Dagobert Soergel. Data models for an integrated thesaurus database

8. Dawson, F. , Howes, T. vCard MIME Directory Profile, RFC 2426, Lotus Development Corporation, Netscape Communications, September 1998.

9. Deutsch P., Emtage A., Koster M., Stumpf M. Publishing Information on the Internet with Anonymous FTP, INTERNET DRAFT, Bunyip, Nexor, Munich University of Technology, January 1995 //http://www.ifla.org/documents/libraries/cataloging/metadata/iafa.txt

10. Dublin Core Metadata Element Set Reference Description, Version 1.1, 1999-07-02. http://purl.org/dc/documents/proposedrecommendations/pr-dces-19990702.htm.

11. Dublin Core Qualifiers. Dublin Core Meta Data Initiative Recommendation. http://purl.org/dc/documents/rec/dcmes-qualifiers-20000711 .htm.

12. Extensible Markup Language (XML) 1.0 (Second Edition). W3C Recommendation. 6-October-2000. http://www.w3.org/TR/2000/REC-xml-20001006.

13. Extensible Stylesheet Language (XSL). Version 1.0. W3C Working Draft. 18 October 2000. http://www.w3.org/TR/2000/WD-xsl-20001018.

14. H.Foster I., Kesselman C., Nick J.M., Tuecke S. The Phisiology of the Grid. An Open Grid Services Architecture for distributed system interation // Grid Computing.

15. Making the Global Infrastructure a Reality. New York: Wiley & Sons, 2003.-P.217-250.

16. IS02788: Guidelines for establishment and development of monolingual thesauri, 2nd ed., Geneva: ISO 1986.

17. IS05964: Guidelines for establishment and development of multilingual thesauri, 1 st ed., Geneva: IS01985.

18. Jurg, P. Introduction to White Pages Services based on X.500, RFC 1684, SURFnet bv, August 1994.

19. Hardcastle-Kille S.E. Replication and Distributed Operations extensions to provide an Internet Directory using X.500, RFC 1276, University College London, November 1991.

20. Keranen S. Content Management Concept and Indexing Term Equivalence in a Multilingual Thesaurus

21. Microsoft.Net // http://www.microsoft.com/net/

22. Modelling Thesauri for the Semantic Web // http://www.w3.org/2001/sw/Europe/plan/workpackages/live/esw-wp-8.html

23. Open Information Model. XML Encoding. Version 1.0. Review Draft 2. Meta Data Coalition. December 1999

24. Pan Z., Heflin J. DLDB: Extending Relational Databases to Support Semantic Web Queries// http://www.cse.lehigh.edu/~heflin/pubs/psss03-poster.pdf

25. Pierre, M. St., Fullton, J., Gamiel, K., Goldman, J., Kahle, В., Kunze, J., Morris, H., Schiettecatte, F. WAIS over Z39.50-1988, RFC 1625, WAIS, Inc., CNIDR, Thinking Machines Corp., UC Berkeley, FS Consulting, June 1994.

26. RDF Encoding of Multilingual Thesauri // http://www.w3c.rl.ac.Uk/SWAD/deliverables/8.3.html

27. Resource Description Framework (RDF). Schema Specification 1.0.

28. W3C Candidate Recommendation 27 March 2000. http://www.w3.org/TR/2000/CR-rdf-schema-20000327.

29. Review of RDF Thesaurus Work // http://www.w3c.rl.ac.Uk/SWAD/deliverables/8.2.html

30. Seguin K. The Code Project Creating multilingual websites - Part 2 //ASP.NET http://www.codeproject.com/aspnet/LocalizedSamplePart2.asp

31. Shyu, Yuh-Mei and Kao, Chiu-Fang. The Integrated Research Information System: Government Research Bulletin (GRB)// (CRIS-2000) ftp://ftp.cordis.lu/pub/cris2000/docs/shyufulltext.pdf

32. Smith, M. Definition of the inetOrgPerson LDAP Object Class, RFC 2798, Netscape Communications, April 2000, http://www.ietf.org/rfc/rfc2798.txt

33. TENTTU Information Retrieval System. Helsinki University Technology http://otatrip.hut.fi/tkk/englindex.html

34. Wahl, M. A Summary of the X.500(96) User Schema for use with LDAPv3, RFC 2256, Critical Angle Inc., December 1997.

35. Х.500 На пути к информационному раю//Мир Internet, №5, 2002, http://www.iworld.ru/magazine/index.phtml?do=shownumber&m=94701987

36. XForms 1.0. W3C Working Draft 16 February 2001. http://www.w3.org/TR/2001/WD-xforms-20010216.

37. Барахнин В.Б., Леонова Ю.В. Информационная модель отношений между документами в информационной системе // Вычислительные технологии -2005. Т.10, №3.-С. 23-33.

38. Брюхов Д.О., Задорожный В.И., Калиниченко Л.А., Курошев М.Ю., Шумилов С.С. "Интероперабельные информационные системы: архитектуры и технологии"//СУБД, 1995, №4.

39. Булгаков М. В., Внотченко С. С. Реализация каталога образовательных Интернет ресурсов в составе образовательного федерального портала.

40. ГОСТ 7.25-80: Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления.

41. ГОСТ 7.24-90: Тезаурус информационно-поисковый многоязычный. Состав, структура и основные требования к построению.

42. Давид Бич. К объектным базам данных // Открытые системы-1994, №4

43. ЕНИП РАН (http://isir.ras.ru)

44. Жижимов O.JI. Введение в Z39.50. Новосибирск: Изд-во НГОНБ, 2001.

45. Жижимов O.JI., Мазов Н.А. Принципы построения распределенных информационных систем на основе протокола Z39.50 // ОИГГМ СО РАН, Новосибирск: Изд-во ИВТ СО РАН, 2004.

46. ЗАО РОСТЕЛЕГРАФ Справочная Служба (Х500)// http://rt.rostelemail.ru/treeinfo.htm

47. ИгнатьеваМ. Итоги развития Х.500 в 1997 году //Сборник АДЭ, 1998, http://www.ctel.msk.ru/x500/Publ/myp.pdf

48. Информационная система «База данных организаций и сотрудников СО РАН» (справочно-методические материалы) / Леонова Ю.В., Клименко О.А.; под ред. Федотова A.M. Новосибирск: РИЦ "Прайс-Курьер", 2005.

49. Информика (http://www.informika.ru/text/centre/)

50. Когаловский М.Р. Глоссарий по технологиям XML. http://www.libweb.ru/resource/docs/xml/xml-gloss.html.ru.

51. Концепция открытых систем // Материалы к межотраслевой Программе "Развитие и применение открытых систем" http://www.cplire.rU/nis/casr/os/3l/3.htm

52. Кричел Т., Паринов С.И.База данных RePEc и ее российский партнер система Соционет//Электронные библиотеки -2002 Т. 5 - Выпуск 2

53. Кричел Т., Ляпунов В.М., Паринов С.И. Онлайновые информационные ресурсы для исследователей по экономике: база данных RePEc и веб-портал RuPEc //Электронные библиотеки -1999 Т. 2 - Выпуск 3

54. Кузнецов С. Объектно-ориентированные базы данных -основные концепции, организация и управление: краткий обзор // http://www.citforum.ru/database/articles/art24.shtml

55. Леонова Ю.В., Федотов A.M. О содержательном наполнении системы информационного обеспечения научного сообщества // Вычислительные технологии, (Совместный выпуск) Региональный вестник Востока, 2003. — 4.4. -С. 294-303.

56. Леонова Ю.В., Федотов A.M. Унификация доступа к данным в ИРИС// Вычислительные технологии, (Совместный выпуск) Региональный вестник Востока-2003. -Т.8, №3.-4.4, С. 304-311.

57. Лопатенко А. С. Современные Научные Информационные Системы. Перспективы использования // http://e-science.narod.ru/CRISDOC.htm

58. Паринов С.И., Ляпунов В.М., Пузырев Р.Л. Система Соционет как платформа для разработки научных информационных ресурсов и онлайновых сервисов // Электронные библиотеки -2003 Т. 6 - Выпуск 1

59. Петер Пин-Шен Чен. Модель "сущность-связь" шаг к единому представлению о данных //СУБД, 1995, №3.

60. Приказ от 11 декабря 1992 г. N 1126 Об утверждении разрядов оплаты труда и тарифно-квалификационных требований.по должностям работников науки и научного обслуживания Российской Федерации

61. Сетевые службы //http://mf.grsu.by/UchProc/livak/kursi/po/lections/setsl.htm

62. Словарик ООП // http://www.ctc.msiu.ru/materials/Book/node86.html

63. Созыкин А.В., Масич Г.Ф., Масич А.Г., Бездушный А.Н. Вопросы интеграции управления идентификацией пользователей сетевых, вычислительных и информационных сервисов // Электронные библиотеки -2004 Т. 7 - Выпуск 2.

64. Соционет (http://socionet.ru/)

65. Стандарты службы справочников // http://www.fima.net/mac/x500.html

66. Таненбаум Э., Ван Стеен М. Распределенные системы. Принципы и парадигмы// СПб.: Питер, 2003.

67. Шокин Ю.И., Федотов A.M., Леонова Ю.В. Объектная модель документа в электронных коллекциях // Материалы VII Международной конференции по электронным публикациям "El-Pub2002", Новосибирск, 2002 г., http://www.ict.nsc.ru/ws/elpub2002/4488/.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.