Разработка автоматизированного центрального аналитического регистра с автоматическим кодированием наименований понятий тема диссертации и автореферата по ВАК РФ 08.00.13, кандидат экономических наук Литвинова, Валентина Александровна

  • Литвинова, Валентина Александровна
  • кандидат экономических науккандидат экономических наук
  • 1984, Москва
  • Специальность ВАК РФ08.00.13
  • Количество страниц 218
Литвинова, Валентина Александровна. Разработка автоматизированного центрального аналитического регистра с автоматическим кодированием наименований понятий: дис. кандидат экономических наук: 08.00.13 - Математические и инструментальные методы экономики. Москва. 1984. 218 с.

Оглавление диссертации кандидат экономических наук Литвинова, Валентина Александровна

ВВЕДЕНИЕ.

1. ПОСТАНОВКА ЗАДАЧИ ПОСТРОЕНИЯ АВТОМАТИЗИРОВАННОГО ЦЕНТРАЛЬНОГО АНАЛИТИЧЕСКОГО РЕГИСТРА (АЦАР).

1.1. Цель создания автоматизированных регистров.

1.2. Основные задачи и функции центральных регистров.

1.3. Состав и объем данных центральных регистров. Кодирование входной информации.

1.4. Статистическая обработка данных о состоянии объектов слежения в АЦАР.

2. РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ АВТОМАТИЗИРОВАННОГО ЦЕНТРАЛЬНОГО АНАЛИТИЧЕСКОГО РЕГИСТРА С АВТОМАТИЧЕСКИМ КОДИРОВАНИЕМ НАИМЕНОВАНИЙ ПОНЯТИЙ (АЦАР).

2.1. Методика адаптации автоматизированных регистров.

2.1.1. Описание входных документов.

2.1.2. Методы автоматизированного контроля. Язык задания контроля входной информации.

2.1.3. Генератор отчетов (таблиц). Язык описания выходных документов.

2.1.4. Вычисление табличных данных.

2.2. Информационная база системы.

2.3. Структура программного обеспечения регистра.

2.3.1. Управление работами. Средства защиты данных.

2.3.2. Ввод данных.

2.3.3. Организация многофакторного поиска по дискретным признакам.^

3. МЕТОДИКА АВТОМАТИЗИРОВАННОЙ ОБРАБОТКИ ЕСТЕСТВЕННО-ЯЗЫКОВЫХ ТЕКСТОВ.

3.1. Этапы автоматизированной обработки текстов.

3.1.1. Описание структуры тезауруса.

3.1.2. Формирование тезауруса.

3.1.3. Метод автоматического членения предложения на семантические составляющие.

3.1.4. Организация поиска по тезаурусу. Морфологический анализ текста.

3.1.5. Семантико-синтаксический анализ текста. Преобразование текста в формальные структуры.Ю

3.2. Методика машинного сравнения формальных структур естественно-языковых текстов.^

3.2.1. Критерий смыслового соответствия двух структур.

3.2.2. Алгоритм сравнения двух формальных структур.12?

4. МЕТОДИКА. ПРИМЕНЕНИЯ АВТОМАТИЗИРОВАННОЙ ОБРАБОТКИ ТЕКСТОВОЙ ИНФОРМАЦИИ ПРИ ПОСТРОЕНИИ ЦЕНТРАЛЬНОГО РЕГИСТРА.

4.1. Функциональная схема и структура системы автоматического кодирования.

4.2. Построение информационной базы системы автоматического кодирования.

4.3. Организация кодирования текстовой информации.

4.4. Поиск данных по запросам на нормализованном русском языке.^

5. ЭФФЕКТИВНОСТЬ ПРИМЕНЕНИЯ АВТОМАТИЗИРОВАННОГО ЦЕНТРАЛЬНОГО АНАЛИТИЧЕСКОГО РЕГИСТРА С АВТОМАТИЧЕСКИМ КОДИРОВАНИЕМ НАШЕНОВАНИЙ ПОНЯТИЙ.

5.1. Техническая эффективность.

5.1.1. Полнота и точность. I

5.1.2. Достоверность и надежность.

5.1.3. Время реашщи системы.

5.1.4. Форма выдачи результатов поиска.

5.2. Эффективность программного обеспечения.

5.2.1. Простота эксплуатации.

5.2.2. Типизация АЦАР

5.2.3. Анализ различных модификаций диалоговых операционных систем на мини - ЭВМ типа СМ

5.3. Результаты практического использования онкологического регистра.

ЗАКЛКЛЕНЙЕ.

Рекомендованный список диссертаций по специальности «Математические и инструментальные методы экономики», 08.00.13 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка автоматизированного центрального аналитического регистра с автоматическим кодированием наименований понятий»

ХХУ1 съезд КПСС наделил всю плановую деятельность народного хозяйства на сбалансированность, научную обоснованность пятилетки.

В экономической литературе не раз критиковался метод планирования "от достигнутого". Переход к более совершенному методу планирования непрост. Он требует полноты соответствующей информации для реальной оценки возможностей, потенциала каждого звена общественного производства, анализа результатов и путей достигнутого уровня производства. Необходимы паспорта предприятий и объединений, которые отражали бы состояние не только отдельного предприятия и не только предприятий отрасли, но всю цепь, включающую характеристики и возможности как предприятий-поставщиков, так и предприятий-потребителей продукции. И неважно, идет ли здесь речь о развитии сельского хозяйства или отрасли тяжелой промышленности, достижение конечного результата зависит от прочности всех звеньев в цепи, которую образуют предприятия, участI вующие в выпуске той или иной продукции. Без учета и анализа реальных возможностей предприятий отрасли и их связей с другими предприятиями невозможно достичь сбалансированности плановых заданий, дать объективную оценку деятельности того или иного предприятия, принять обоснованное управляющее решение по расширению существующих или вводу новых мощностей.

Автоматизация процессов сбора и обработки информации, описывающей состояние экономических объектов, может оказать существенную помощь в решении поставленной задачи.

Решениями ХХУТ съезда КПСС, постановлениями ЦК КПСС и Совета Министров СССР по развитию экономики перед органами и учреждениями всех отраслей народного хозяйства поставлены задачи по дальнейшему повышению качества и эффективности учета, управления и планирования. Для решения этих задач предусмотрено выполнение заданий государственной программы работ по научно-технической проблеме 0.80.10 "Создать новые и усовершенствовать действующие АСУ в сфере торговли, просвещения, культуры и в здравоохранении". Программой работ ГКНТ и Госплана СССР намечено соз дание автоматизированных систем учета и слежения за контингента-ми больных по специализированным видам медицинской помощи: онкологической, кардиологической, психиатрической, противотуберкулезной.

Актуальность и социально-экономическая значимость построения . автоматизированных систем учета и наблюдения за специализированными контингентами больных (регистров) вытекает из значимости проблемы борьбы с этими видами заболеваний и необходимости совершенствования управления специализированной медицинской помощью. Необходимость построения регистров для учета и наблюдения за различными по своей природе объектами делает актуальной задачу разработки типового программного и математического обеспечения регистров.

Анализ функционирующих к настоящему времени регистров, а также анализ входных и выходных потоков данных и процессов обслуживания запросов к регистрам позволяет отметить типовость по набору реализуемых функций, сходность технологических процессов сбора, передачи информации, кодирования и ввода в ЭВМ. Состояние объектов слежения описывается в регистрах с помощью стандартного набора показателей при взятии объекта на учет, в процессе слежения за его состоянием и при снятии с учета. Разрабатываемые соответственно этапам наблюдения первичные документы имеют принципиально сходную структуру - бланк, состоящий из стандартного набора реквизитов, подлежащих заполнению на различных этапах наблюдения. Все это позволило сделать вывод о принципиальной возможности разработки общих принципов и способов организации информационной базы и построения программного обеспечения, адаптируемого к конкретным объектам наблкщения.

Особенностью социально-экономических объектов наблкщения является то, что в их описании преобладают качественные показатели, значениями которых служат нечисловые символы. Значения этих показателей выражаются словосочетаниями или целыми предложениями естественного языка. Обилие текстовой информации, большой объем номенклатуры, тенденция к постоянному ее обновлению, занятость квалифицированных специалистов отрасли процессом кодирования текстовой информации делают актуальной задачу разработки методики и алгоритмов обработки текстовой информации для автоматического кодирования при вводе данных в текстовом представлении, а также для поиска данных по запросам на естественном языке.

Создаваемые автоматизированные регистры - это специализированные информационные системы. Основная цель их создания -полное использование накопленных сведений по проблеме и обеспечение оперативного доступа к информации широкого круга конечных пользователей, минуя специалистов промежуточного звена. Достижение этой цели возможно на пути создания развитой диалоговой системы с возможностью одновременного доступа к системе многих пользователей с различных терминалов. Решение этих задач в свою очередь требует обеспечение защиты от несанкционированного доступа, защиты от разрушения, системы контроля информации и способов восстановления при разрушении.

Функционирущие в нашей стране регистры реализованы, как правило, на ЭВМ второго поколения или ЭВМ серии ЕС с решением задач в пакетном режиме. Должного внимания простоте эксплуатации, приближении системы к конечному пользователю в этих разработках не уделялось.

Таким образом, новым в постановке задачи построения автоматизированной информационной системы учета и слежения за объектами некоторой совокупности является обеспечение адаптируемости разрабатываемой системы к конкретной предметной области, автоматизация процесса кодирования текстовой информации, ориентация разрабатываемой системы на широкий круг конечных пользователей информации, разработка развитой системы диалога с обеспечением защиты информации от несанкционированного доступа и от разрушения при одновременном доступе к системе многих пользователей с различных. терминалов.

Научная новизна диссертационной работы состоит в:

- разработке принципов организации автоматизированного центрального аналитического регистра;

- разработке методики адаптации регистра к различным предметным областям (экономика, медицина и др.);

- разработке методики анализа и сопоставления нормализованных текстов документов и запросов, обеспечивающих высокую полноту и точность поиска документов, возможность варьирования критериев выдачи, реализацию диалогового режима взаимодействия пользователей и ЭШ;

- исследовании принципов и разработке алгоритмов построения тезауруса для представления данных в системе НОРМИН на мини-ЭВМ;

- разработке методов автоматического смыслового кодирования текстовых наименований понятий (на примере кодирования диагнозов онкологических заболеваний);

- разработке комбинированного метода поиска данных на основе сочетания формализованного и текстового представлений запроса на поиск;

- разработке методики предварительной обработки статистических данных регистра в группе категоризованных признаков. Разработанные методы и принципы построения автоматизированного центрального аналитического регистра с автоматическим кодированием наименовании понятии, алгоритмы и программы, обеспечиващие выполнение регистром его функций и условий функционирования, реа

1 - с -М ¿4 А лизованы на мини-ЭВМ РДР-П/70 в операционной системе'/'/УЖ^ / внедрены в промышленную эксплуатацию в онко-диспансерном отделении Клинической больницы № 6 Министерства здравоохранения СССР и используются онко-диспансерным отделением в его повседневной работе.

Основные результаты диссертационной работы докладывались на научно-техническом совете отдела АСУ Института биофизики МЗ СССР в октябре 1981 года, декабре 1983 года и апреле 1984 года, на научно-практической конференции Клинической больницы Ш 6 в мае 1983 года, на заседании кафедры вычислительной техники МИНХ им. Г. В. Плеханова.

Регистр демонстрировался в июле 1983 года комиссии ЦНИИ "Монолит" и было принято решение о его внедрении для решения задач этого института, для чего между ЦНИИ "Монолит" и ИБФ МЗ СССР заключен договор о научно-техническом сотрудничестве.

По теме диссертации имеется 5 публикаций, в которых отражены основные научно-практические результаты работы.

При практической реализации разработанных методов были использованы программы, созданные сотрудниками отдела АСУ ИБФ МЗ СССР Костюком В.В., Копцевой Е. И., Тараловой В. Н., Дубининой Е. И.

- 10

Похожие диссертационные работы по специальности «Математические и инструментальные методы экономики», 08.00.13 шифр ВАК

Заключение диссертации по теме «Математические и инструментальные методы экономики», Литвинова, Валентина Александровна

ЗАКЛЮЧЕНИЕ

1. Проведен анализ предметной области, показавший необходимость и целесообразность типизации АЦАР в направлении принципов и способов организации базы данных и программного обеспечения центрального регистра, допускающих использование регистра в различных предметных областях.

2. Для выявления закономерностей наблюдаемых процессов предложена методика предварительной обработки статистических данных регистра в группе категоризованных признаков.

3. Разработана организация и выполнена реализация программного обеспечения типового автоматизированного центрального аналитического регистра (АЦАР), обладающего следующими особенностями: а) модульным принципом организации и сетевой диспетчеризацией работ; б) разветвленной системой'защиты, контроля и обеспечения надежности работы АЦАР; в) гибкой системой диалога, обеспечивающей простоту эксплуатации регистра и ориентацию его на широкого пользователя.

4. Разработана и реализована в АЦАР система автоматической обработки текстов на языке, близком к естественному, включающая: а) исследование и разработку принципов построения тезауруса для представления данных в системе НОРМИН на мини-ЭВМ типа СМ-4 (РДР-П/70); . б) разработку методики анализа и сопоставления нормализованных текстов документов и запросов, обеспечивающей высокую полноту и точность поиска документов, реализацию диалогового режима взаимодействия пользователей и ЭВМ; в) разработку математической модели и алгоритмов распознавания нормализованных текстовых сообщений с использованием древови^щых ориентированных графов; г) применение в АЦАР разработанной системы автоматической обработки текстовой информации в двух взаимосвязанных задачах, имеющих самостоятельное значение.

5. Разработана система автоматического смыслового кодирования понятий и проведена ее реализация для кодирования диагнозов заболеваний.

6. Разработан комбинированный метод поиска, использующий формализованное представление запроса на поиск с перечнем значений реквизитов, а также текстовое описание информации на нормализованном русском языке.

7. Разработана методика адаптации АЦАР к разным предметным областям, включая область экономического характера. Определеяющи-ми элементами конкретной предметной области, для которой формируется АЦАР, являются Еходные и выходные документы. Разработанная методика адаптации включает в себя возможность описания входных документов и гибкую систему выдачи выходных документов, настраиваемую на различные формы документов с учетом потребностей пользователя.

8. Проведено внедрение АЦАР в практику службы здравоохранения, обеспечившее углубленный анализ показателей деятельности медицинских учреждений и показателей заболеваемости контингентов больных с выработкой обоснованных рекомендаций по улучшению деятельности службы.

9. Намечены пути расширения использования АЦАР в других предметных областях (для учета дорогостоящей техники (самолетов, турбин, ЭВМ), предприятий розничной сети (магазинов, аптек и других).

Список литературы диссертационного исследования кандидат экономических наук Литвинова, Валентина Александровна, 1984 год

1. Материалы Пленума Центрального Комитета КПСС, 26-27 декабря 1983 года. М., Политиздат, 1983 г.

2. Основные направления экономического и социального развития СССР на 1981-1985 годы и на период до 1995 года. В кн.: Материалы 2ХУ1 съезда КПСС. М. Политиздат, 1981.

3. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Основы моделирования и первичная обработка данных. М: Финансы и статистика, 1983.

4. Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. М.: Мир, 1982.

5. Белоногов Г.Г., Новоселов А.П. Автоматизация процессов накопления, поиска и обобщения информации. М: Наука, 1979.

6. Белоногов Г.Г., Новоселов А.П. О принципах построения автоматизированных информационных систем. Семиотика и информатика, $ 3, М.: ВИНИТИ, 1979.

7. Белоногов Г.Г., Кузнецов Б.А. Языковые средства автоматизированных информационных систем. М.: Наука, 1983.

8. Виноград Т. Программа, понимающая естественный язык. -М.: Мир, 1976.

9. Воробьев Е.И., Китов А.И. Введение в медицинскую кибернетику. М.: Медицина, 1977.

10. Воробьев Е.И., Китов А.И. Медицинская кибернетика. -М.: Радио и связь, 1983.

11. Венецкий И.Г. Вероятностные методы в демографии. Финансы и статистика, 1981.

12. Двойрин В.В. Оценка достоверности статистических показателей. Показатели частоты Вопр. онкол., № 8, 1975.

13. Донат К.Д., Лозе Р.В., Миттенцвейг В., Темле Д. Информационные системы с регистром. В кн: Состояние и перспективы развития автоматизированных систем управления и применения вычислительной техники в здравоохранении. М.; 1981.

14. Дрожжин P.M., Соколова Н.В., Должникова Э.М. и др. Методические вопросы создания автоматизированного регистра населения по артериальной гипертензии. Мед.техника, 1980, № 6.

15. Джонсон Н., Лион Ф. Статистика и планирование эксперимента в технике и науке (методы обработки данных). М.: Мир, 1980.

16. Дюран В., Оделл П. Кластерный анализ. М.¡Статистика, 1977.

17. Каст ел лани К. Автоматизация решения задач управления. -М.: Мир, 1982.

18. Китов А.И., Будько H.H., Самедова М.А. Нормализованный язык документально-фактографической ИПС (НОРМИН). Вопросы информационной теории и практики, № 33, 34, М.: ВИНИТИ, 1978 г.

19. Китов А.И., Литвинова В.А., Дубинина Е.И., Таралова В.Н. Программная реализация информационно-поисковых систем на мини-ЭВМ типа СМ. Программирование, 1981, № 3.

20. Корнева Г.Н. Решение задач классификации при обработке информации в базах данных реляционного типа. Автореферат кандидатской диссертации. Л., АЭТИ, 1980.

21. Клименков A.A., Вардомская И.В., Золотарев А.Е. и др. Унифицированный больничный раковый регистр международного противоракового союза. Вопросы онкологии, том XXIX, 1983, Л 9.

22. Леман Э., Проверка статистических гипотез. М.: Наука, 1964.

23. Майзер X., Зиджин Н., Тролл Р. и др. Исследование операций. М.: Мир, 1981.

24. Мартин Дж. Организация без данных в вычислительных системах. М.: Мир, 1978.

25. Мидоу Ч. Анализ информационных систем. М.: Прогресс, 1977.

26. Мазур М.А., Копылова И.Ф., Байчук Г.И. Оптимизация управления территориальной противотуберкулезной службой на осног-ве информационно-решающей системы. В кн.: Шт. 5 Всерос. съезда фтиз., М., 1980.

27. Мельник М. Основы-прикладной статистики. М.: Энерго-издат, 1983.

28. Мерков A.M. Здоровье населения и методы его изучения. М.¡Статистика, 1979.

29. Миркин Б.Г. Анализ качественных признаков и структур -М.: Статистика, 1980.

30. Мишура В.Н., Шабашова Н.Я., БармишН.М. Онкологическийдиспансер. М., 1982. л е. ,

31. Попов Э.В. Общение с ЭВМ на естественном языке. М. -Наука, 1982.

32. Пиняжко P.M., Парновский Б.Л. Вопросы разработки автоматизированного регистра учреждений системы главного аптечJ

33. Рафаал Б. Думающий компьютер. М. : Мир, 1979.

34. Самедова М.А. Структура и функции машинного словаря документально-фактографической ИПС. Программирование, 1978, & 2.

35. Самедова М.А. Алгоритм и программная реализация семан-тико-синтаксического анализа нормализованных текстов. Программирование, 1978, № 2.

36. Симанаускас Л.Ю., Бразайтис. Основы проектирования машинной обработки данных. М.: Финансы и статистика, 1982.

37. Суханова Г.Б., Чесноков C.B. Детерминационный анализ качественных социально-экономических данных в режиме диалога. -В кн.: Методология комплексного исследования социально-экономических систем. Труды ВНИИСИ ГКБТ и АН СССР, M., 1980.

38. Сэлтон Г. Автоматическая обработка, хранение и поиск информации. М.: Сов. радио, 1973.

39. Тейер Т., Липов М., Нельсон Э. Надежность программного обеспечения. М.: Мир, 1981.

40. Трофимов В.А. Модели качественного факторного анализа матриц связи. В кн.: Проблемы анализа дискретной информации. Новосибирск, 1976.

41. Финн В.К. Логические проблемы информационного поиска. -М.: Наука, 1976.

42. Флорес И. Структуры и управление данными. М.: Финансы и статистика, 1982.

43. Чесноков C.B. Детерминационный анализ социально-экономических данных. М.: Наука, 1982.

44. Четыркин Е.М., Калихмани И.Л. Вероятность и статистика, 1982.- 192

45. Шенк Р. Обработка концептуальной информации. М., Энергия, 1980.

46. Шефер Л.Б., Корзун В.А., Валиева Р.Г. и др. Автоматизированная система учёта контингентов противотуберкулёзных учреждений. В кн.: Тез.докл. совмести, научн.сессии ЦНИИ туберкулёза МЗ СССР и Киргиз. НИИ туберкулёза, Фрунзе, 1980.

47. Штраус З.Э. Роль регистров рака в развитии некоторых основных направлений эпидемиологии злокачественных опухолей в Соединённых штатах Америки. Медицина и здравоохранение, серия: Онкология, 1982, № 2.

48. Eberhardt H., Lochmann U. Erhöhung der Effektivität der epikritischen Dokumentation und Information durch Anwendung der elektronischen Rechentechnik auf dem Gebit der Strahlentherapie. -Radiobiol. Radiother., 1977,N 18.

49. Johansson S.G., Manell P. Database technology impact on a drug information system. MEDINF0-80.

50. Lancaster T.W. Design and Evoluation ef Information Systems. Annual Review of Information Science and Technology, 1970, N5.53« Sage C.R. et al. Adaptive information Dissemination. -American Dokumentation , oct. 1967.

51. Uslenghi C., Centenaro G., Sigart D., Volteranie P.

52. A computerized cacerpatient information system. In : Advances in medical oncology. Oxford e.a.,,1978.

53. Wettler M. Semantisches Langzeit gedechtnis und das Verstehen vor Sprache. - Working Papers, Pondatione Dalle Moll, 1979, N37.

54. Haase J.,Klar R., Pietzuk P. Ein Programm zur Diagnosenverschlüsselung in Dialogverkehr. Meth. Inform. Med., 1978, N3.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.