Представление знаний и семантическое программирование тема диссертации и автореферата по ВАК РФ 01.01.09, кандидат физико-математических наук Малых, Антон Александрович
- Специальность ВАК РФ01.01.09
- Количество страниц 144
Оглавление диссертации кандидат физико-математических наук Малых, Антон Александрович
Введение
1 Концептуальные основы теории информационных ресурсов
1.1 Семантический Интернет.
1.2 Ресурсы и их идентификация.
1.3 Метаописания ресурсов.
1.4 Представление знаний в Интернете.
1.5 Интернет и логический вывод.
1.6 Онтологии.
2 Теория информационных ресурсов
2.1 Онтологии и семантическое программирование.
2.2 Термальная надстройка над моделью: описание объектов
2.3 Иерархия и наследование информации.
2.4 Аппроксимация и объединение информации
2.5 Классы
2.6 Ресурсы.
2.7 Онтологии.
2.8 Пример языка описания классов.
3 Апробация методов
Рекомендованный список диссертаций по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК
Исследование методов анализа Интернет-ресурсов и реализация на этой основе мультиагентной системы поиска информации1999 год, кандидат технических наук Майкевич, Наталия Вадимовна
Логический вывод и обработка знаний в информационных средах2007 год, кандидат физико-математических наук Липовченко, Владимир Андреевич
Методы и программные средства для анализа документов на основе модели предметной области2006 год, кандидат физико-математических наук Сидорова, Елена Анатольевна
Метод и технологии семантической обработки информации для государственного и муниципального управления2011 год, кандидат технических наук Ломов, Павел Андреевич
Метод формального описания содержания сложных естественно-языковых текстов и его применение к проектированию лингвистических процессоров2005 год, доктор технических наук Фомичев, Владимир Александрович
Введение диссертации (часть автореферата) на тему «Представление знаний и семантическое программирование»
Цели и задачи исследования
Диссертационная работа посвящена развитию автоматизированных методов работы со знаниями в глобальном информационном пространстве. Цель работы — создание на основе диалекта семантического программирования [68][69] логической системы представления и обработки знаний, ориентированной на работу в распределенных информационных средах. Данная система должна совмещать использование продвинутых логических методов с возможностью эффективной реализации и устойчивостью к агрессивным условиям глобальной сети. С содержательной точки зрения система должна быть ориентирована на решение ключевых задач, накопившихся на сегодняшний день в Интернете, включая моделирование понятия информационного ресурса, имени ресурса, механизмов метаописаний ресурсов.
Для достижении этой цели решались задачи:
• разработка концептуальных основ системы обработки знаний в распределенных информационных средах на базе семантического программирования;
• разработка логического формализма (теории информационных ресурсов, ТИР), удовлетворяющего концептуальным положениям и условиям работы в глобальной информационной среде;
• исследование применимости ТИР к представлению и автоматизированной обработке иерархических систем данных и знаний;
• апробация ТИР в приложении к практическим задачам реальной сложности.
Научная новизна
В работе впервые исследованы возможности применения концептуальных положений семантического программирования к обработке больших массивов знаний и данных в распределенных информационных системах и Интернете [19]. Разработан логический формализм, реализующий данный подход. Построены логические модели базовых понятий, включая понятие информационного ресурса, имени информационного ресурса, онтологии как системы описания предметных областей, в терминологических рамках семантического программирования. Исследованы возможности практического использования разработанной логической системы.
Научная и практическая значимость работы
Работа ориентирована на решение актуальных проблем, возникающих сегодня в Интернете. В связи с бурным и неконтролируемым наполнением разнообразными информационными ресурсами мировая информационная среда постепенно превращается в необозримое собрание разрозненной и неупорядоченной информации. Данная ситуация, которая с течением времени только усугубляется, не позволяет эффективно использовать информационные богатства глобальной сети. Подход, на котором основана диссертационная работа, состоит в том, чтобы интеллектуализи-ровать работу компьютера в Интернете, передать ему ряд задач, которые сегодня приходится решать человеку, включая поиск информации, анализ найденной информации, выполнение ряда практических задач по взаимодействию с Интернет-сервисами и т.д. Существенную роль в нашей работе играет использование гибкого и логически чистого подхода семантического программирования. На его основе построена теория информационных ресурсов, служащая базовым формализмом для разработки различных проектов, ориентированных на интеллектуализацию работы компьютеров в Интернете. С другой стороны, теория информационных ресурсов является определенным вкладом в развитие самого семантического программирования. Подходы, развиваемые в данной работе, апробировались на большом количестве практически значимых задач в области дистанционного образования, разработки электронных библиотек, систем управления кадрами, продвинутыми задачами web-пpoгpaммиpoвaния. Полученные в рамках апробации результаты вселяют надежды на хорошие перспективы применения разработанных методов в самых разнообразных сферах представления данных и знаний в распределенных информационных системах.
На защиту выносятся
1. Разработка концептуального подхода к представлению знаний в глобальной информационной среде на основе семантического программирования.
2. Логическая теория информационных ресурсов.
3. «Мета-2» — программная система, реализующая базовые механизмы представления знаний в формате онтологий в соответствии с теорией информационных ресурсов.
Структура и объём диссертации
Диссертация состоит из введения, трех глав, заключения и списка использованной литературы.
Похожие диссертационные работы по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК
Инструментальные средства создания элементов пользовательского интерфейса на основе семантического описания компьютерных пиктограмм2008 год, кандидат технических наук Гранин, Михаил Николаевич
Онтолого-семантические модели в корпоративных системах управления знаниями2007 год, доктор технических наук Тузовский, Анатолий Федорович
Методы моделирования объектно-ориентированных данных средствами дескриптивных логик2010 год, кандидат физико-математических наук Ульянов, Владимир Сергеевич
Организация онтологических баз знаний и программное обеспечение для описания информационных ресурсов в молекулярной спектроскопии2009 год, кандидат технических наук Привезенцев, Алексей Иванович
Разработка и реализация формальных онтологий пространственных данных и сервисов2008 год, кандидат физико-математических наук Динь Ле Дат
Заключение диссертации по теме «Дискретная математика и математическая кибернетика», Малых, Антон Александрович
Заключение
В диссертации представлены методы работы с данными и знаниями в глобальных информационных сетях, основанные на принципах семантического программирования. Логическим базисом для этих методов служит разработанная нами теория информационных ресурсов. Как с теоретической, так и с практической точки зрения существует ряд направлений исследований, которые мы планируем осуществить в дальнейшем. Отметим лишь некоторые направления работ:
1. С теоретической точки зрения требуется развитие и уточнение логических структур, лежащих в основе представления информации с помощью наследственно-конечных надстроек над базовой моделью типов данных. Возможно, требуют развития и базовые понятия, определенные выше. Уже сейчас видно, что полезными являются подходы, связанные с представлением логических конструкций в формате пространств Ю.Л. Ершова, информационных систем Д. Скотта [77j, а также как системы сс-программирования (concurrent constraint programming [76]). Этот подход связан с общей проблемой построения логических исчислений в рамках ТИР, причем исчислений, интересных с практической точки зрения, позволяющих реализовывать практические задачи поиска и обработки информации в виртуальных информационных средах. Отсюда возникает вопрос о построении эффективных стратегий поиска вывода в данных логических исчислениях, а также построении соответствующих систем автоматического доказательства. Интересной задачей является применение различных финитных систем вывода из определения онтологии, в первую очередь, основанных на дескриптивных логиках. Ограничим перечисление этими задачами, хотя имеется и ряд других теоретических проблем, подлежащих решению.
2. Прикладные аспекты. С нашей точки зрения, универсальность и в то же время естественность рассматриваемых конструкций позволяет надеяться на возможность использования данного диалекта семантического программирования в самых разных сферах обработки информации. В первую очередь следует упомянуть о новых подходах, связанных с обработкой документов, представленных в наиболее распространенных в сегодняшнем Интернете форматах — XML и HTML. Следует также упомянуть о системах метаописаний ресурсов в Интернете — идее, на которой основан проект Semantic Web. Близко к этому стоит вопрос описания предметных областей в формате онтологий, что позволяет описывать знания в виде, удобном для использования Интернет-сервисами, в частности, теми же системами метаописаний. Отдельно стоит задача построения систем вывода новых знаний из описаний ресурсов и метаданных, а также использования этих знаний для практической работы с информационными ресурсами. По нашему представлению, здесь есть очень интересные возможности вплоть до развития принципиально новых подходов к структуре операционных систем и работы с файлами как ресурсами (эти приложения ориентированы на самый широкий круг пользователей компьютеров). Любопытно исследовать возможности ТИР для новых способов работы с ресурсами на локальных компьютерах, что можно охарактеризовать как объектный подход к построению операционных систем. И конечно, очень интересной представляется задача построения языков логического программирования нового поколения, что мы пытаемся реализовать в рамках развития функционально-логического языка Флэнг.
Можно говорить о методологических и других аспектах использования семантического программирования в глобальной информационной среде. Все это — предмет дальнейших исследований.
Список литературы диссертационного исследования кандидат физико-математических наук Малых, Антон Александрович, 2005 год
1. Подход к стандартизации в информационно-образовательной среде открытого образования / Е.И. Горбунова, С.Л. Лобачев, A.A. Малых, A.B. Манцивода // Труды всероссийской конф. «Телематика'2003». -С.-Пб., 2003. С.423-425.
2. Система МЕТА: документация, дистрибутив ранней версии. 2004. -http://teacode.com/meta.
3. Система «ONTOGRID» для построения онтологий / В.Д. Гусев, А.В Завертайлов, Н.Г. Загоруйко, С.П. Ковалёв, A.M. Налётов, Н.В.Саломатина. http://www.dialog-21.ru/Archive/2005/Zagoruiko%20Gusev%20Zavertailov/ZagoruykoNG.htrn.
4. Флэнг-проект: web-страница. 2002-2004. - http://teacode.com/flang.
5. ГОСТ 7.1-2003. Библиографическая запись. Библиографическое описание. Межгосударственный стандарт.
6. QTI-плейер: онлайновый сервис поддержки тестирования /A.B. Манцивода, A.A. Малых, O.A. Романова, Н.О. Стукушин. // Труды всероссийской конф. «Телематика'2004». С.-Пб., 2004.
7. Липовченко В.А., Манцивода A.B. Трансляция математических формул из документов MS WORD в стандартный формат // Труды всероссийской конф. «Телематика'2004». С.-Пб., 2004.
8. Малых A.A., Манцивода A.B. МЕТА: разработка метаописаний образовательных ресурсов // Труды всероссийской конф. «Телематика'2003». С.-Пб., 2003. - С.169-170.
9. Малых A.A., Манцивода A.B. МЕТА: метаописания и образовательные пакеты // Труды всероссийской конф. «Телематика'2004». С.-Пб., 2004. - С.552-553.
10. Малых A.A., Манцивода A.B. Система МЕТА и открытые модели знаний // Труды всероссийской конф. «Научный сервис в сети Интер-нет-2004». М.: Изд-во МГУ, 2004. - С.173-175.
11. Малых A.A. МЕТА-2: система метаописаний как основа построения информационных систем // Труды молодеж. научно-метод. конф. «Современные информационные технологии в науке и образовании». Иркутск: Изд-во БГУЭП, 2004. - С.21.
12. Малых A.A., Мандивода A.B. МЕТА-2: поддержка онтологий и образовательные системы // Труды всероссийской конф. «Телематика'2005».- С.-Пб., 2005. С.232-233.
13. Малых A.A. Дескриптивные термы и именующие ограничения // Материалы VII школы-семинара «Математическое моделирование и информационные технологии». Иркутск: Изд-во ИДСТУ, 2005. - С.23-24.
14. Манцивода A.B., Куроптев A.C. Изображение математических формул в формате MathML // Труды всероссийской конф. «Телематика'2004».- С.-Пб., 2004.
15. Манцивода A.B., Малых A.A. Метаописания и логическая структура электронных образовательных ресурсов// Труды межд. конф. «Новые инфокоммуникационные технологии: достижения, проблемы, перспективы». Новосибирск, 2003. - С.73-77.
16. Манцивода A.B., Ульянов B.C. Онтологические системы и задачи управления контентом // Труды всероссийской конф. «Телематика'2005». С.-Пб., 2005.
17. Манцивода A.B., Малых A.A. Представление и обработка знаний в Интернете. // Серия: Информационные системы и логика. Вып. 2. -Иркутск: Изд-во Иркутского ун-та, 2005. 111 с.
18. Манцивода A.B., Петухин В.А. Порталы, обработка структурированной информации и языки искусственного интеллекта // Труды всероссийской конф. «Телематика'2003». С.-Пб., 2003. - С. 168-169.
19. Манцивода А.В., Малых А.А., Петухин В.А. Электронные учебные материалы: стандарты и решения // Труды всероссийской конф. «Теле-матика'2002». С-Пб., 2002. - С.85-86.
20. Манцивода А.В. Язык Флэнг и обработка XML-документов // Труды всероссийской конф. «Научный сервис в сети Интернет-2004 г.» М.: Изд. МГУ, 2004. - С.236-239.
21. Манцивода А.В., Петухин В.А., Шивторов М.И. RTF, LaTeX и логическая разметка документов // Труды всероссийской конф. «Телемати-ка'2004». С.-Пб., 2004.
22. Романова О.А., Нартов Д.С., Стукушин Н.О. Онлайновая консультация по математике // Труды всероссийской конф. «Телематика'2003». С.-Пб., 2003. - С.203-205.
23. About Google Desktop Search: (поисковая система на локальном компьютере). http://desktop.google.corn/about.html.
24. About the Unicode Standard: (спецификация Unicode). -http: / / www.unicode.org/standard / standard.html.
25. DCMI Metadata Terms. http://dublincore.org/documents/dcmi-terms/.
26. The Description Logic Handbook: Theory, Implementation, and Applications / Franz Baader, Diego Calvanese, Deborah L. McGuinness,
27. Daniele Nardi, Peter F. Patel-Schneider (Eds.). Cambridge University Press, 2003. - ISBN 0-521-78176-0.
28. The DLP Experimental Description Logic System and Propositional Modal Logic Satisfiability Checker. http://www.bell-labs.com/user/pfps/dlp/.
29. Dublin Core Metadata Initiative: (дублинское ядро, инициативная группа по метаописаниям). http://dublincore.org/.
30. Dublin Core: Projects. http://dublincore.org/projects/.
31. Guidelines for implementing Dublin Core in XML. -http://dublincore.org/documents/dc-xml-guidelines/.
32. Human resources consortium. http://www.hr-xml.org/.
33. IMS Content Packaging vl.1.4: Final specification. -http://www.imsglobal.org/ content/packaging/.
34. IMS Global Learning Consortium: (консорциум IMS). -http: / / www.imsglobal.org/.
35. IMS Learning Resource Meta-Data Information Model Version 1.2.1: Final Specification (спецификация IMS «Метаданные учебных объектов. Информационная модель». -http://www.imsglobal.org/metadata/imsmdvlp2pl/imsmdinfovlp2pl.html.
36. Learning object metadata: IEEE Learning Technology Standards Committee. http://ltsc.ieee.org/.
37. Mathematical Markup Language (MathML) Version 2.0: W3C
38. Recommendation. http://www.w3.org/TR/2003/REC-MathML2-20031021/.
39. Namespaces in XML. http://www.w3.org/TR/REC-xml-names.
40. OWL Web Ontology Language: Overview. -http://www.w3.org/TR/2004/REC-owl-features-20040210/.
41. Protégé: open source ontology editor and knowledge-base framework. -http://protege.stanford.edu/.
42. RDF: Resource Description Framework. http://www.w3.org/RDF/.
43. RDFCore: Resource Description Framework (RDF) Schema Specification 1.0.
44. Semantic Web activity. http://www.w3.org/2001/sw/.
45. The Description Logic Handbook. Theory, Implementation and Applications / edited by Franz Baader, Diego Calvanese, Deborah McGuinness, Daniele Nardi, Peter Patel-Schneider. Cambridge, 2003. -574p.
46. TeaCode UDC: проект. http://teacode.com/online/udc/.
47. Uniform Resource Identifiers (URI): Generic Syntax. 1998. -http: / / www.ietf.org/rfc / rfc2396.txt.
48. Universal Decimal Classification Consortium. http://www.udcc.org.
49. W3C: About the World Wide Web Consortium. http://www.w3.org/Consortium/.
50. What's a blog: (система электронных дневников, блоггинг). -http://www.blogger.com/tour-start.g.
51. Web Ontology Working Group. http://www.w3.org/2001/sw/WebOnt/.
52. XML: Extensible Markup Language 1.0 // W3C Recommendation. 04 February 2004. - http://www.w3.org/TR/2004/REC-xml-20040204.
53. XML Schema Part 2: Datatypes, W3C Recommendation // World Wide Web Consortium. 2 May 2001. - http://www.w3.org/TR/2001/REC-xmlschema-2-20010502/.
54. Baader F., Sattler U. Number restrictions on complex roles in description logics //In Proceedings of KR-96. 1996. - 328-339pp.
55. Baker T. A Grammar of Dublin Core. // D-Lib Magazin. 2000. - N10. -http://www.dlib.org/dlib/october00/baker/10baker.html.
56. Berners-Lee T., Hendler J., Lassila О. The Semantic Web // Scientific American. May, 2001.
57. Brickley D., Guha R.V. Resource Description Framework (RDF) Schema Specification: W3C proposed recommendation. Mar. 1999. -http://www.w3.org/TR/1999/PR-rdf-schema-19990303.
58. Champin P.-A. RDF Tutorial. 2001. - http://www710.univ-lyon 1 .fr/ ~ champin / rdf-tutorial /.
59. Haarslev V., Moller R. RACE System Description. University of Hamburg, Computer Science Department. - http://www.sts.tu-harburg.de/~r.f.moeller/racer/papers/1999/HaMo99c.pdf.
60. Hillrnann D. Using Dublin Core: Dublin Core Metadata Initiative. -http://dublincore.org/documents/2003/08/26/usageguide.
61. Horrocks I., Patel-Schneider P., Van Harmelen F. From SHIQ and RDF to OWL: The making of a Web Ontology Language. -www.cs.man.ac.uk/~horrocks/Publications/download/2003/HoPH03a.pdf.
62. Lagoze K. Keeping Dublin Core Simple. Cross-Domain. Discovery or Resource Description // In D-Lib Magazin. 2001. - N1. -http: / / www.dlib.org/dlib/january01 /lagoze/Ollagoze.html.
63. Lassila O., Swick R.R. Resource Description Framework (RDF) Model and Syntax Specification: W3C recommendation. Feb.1999. -http://www.w3.org/TR/1999/REC-rdf-syntax-19990222.
64. Laurent S. St. XML: A Primer. M & T Books, Foster City, CA, 1999.
65. Goncharov S.S., Ershov Yu.L., Sviridenko D.I. Semantic foundations of programming // Lecture Notes in Computer Science. v.278, 1987. - 116-122pp.
66. Goncharov S.S., Ershov Yu.L., Sviridenko D.I. Semantic programming // Information processing, Proc. IFIP 10-th World Comput. Congress. -Dublin, v.10, 1986. 1093-1100pp.
67. Mantsivoda A. Flang: A Functional-Logic Language // Lecture Notes in Computer Science. 567. - 257-270pp.
68. Mantsivoda A., Petukhin V., Weimann A. Memory Management of Constraints in Flang // Proc. of 10th Int. Conf on Logic Programming. MIT Press, 1993. - 633-646pp.
69. Pal'chunov D.E. Logical Methods of Ontology Generation with the Help of GABEK //IV International GABEK Symposium. Innsbruck, Austria, 2002. - p.17.
70. Pal'chunov D.E. Logical Definition of Object Domain Ontology // Abstracts of the 9th Asian Logic Conference. Novosibirsk, 2005. - 138-139pp.
71. Pal'chunov D.E. GABEK for Ontology Hierarchy Generation // V International GABEK Symposium. Innsbruck, Austria, 2004. - 5-6pp.
72. Organization, Bd. II). Wien: LIT-publishing Company, 2005, forthcoming. - 21 p.
73. Saraswat V.A. Constraint Logic Programming. MIT Press, 1993.
74. Scott D. Domains for Denotational Semantics // Lecture Notes In Computer Science Proceedings of the 9th Colloquium on Automata, Languages and Programming table of contents. 1982. - 577-613pp.
75. Sowa J.F. Ontology, Metadata, and Semiotics. -http: / / users.bestweb.net/~sowa/ peirce/ontometa.htm.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.