Разработка архитектуры и методов организации слабосвязанных архивных систем для автоматизации проектирования тема диссертации и автореферата по ВАК РФ 05.13.12, кандидат технических наук Лукьянов, Николай Михайлович

  • Лукьянов, Николай Михайлович
  • кандидат технических науккандидат технических наук
  • 2011, Санкт-Петербург
  • Специальность ВАК РФ05.13.12
  • Количество страниц 85
Лукьянов, Николай Михайлович. Разработка архитектуры и методов организации слабосвязанных архивных систем для автоматизации проектирования: дис. кандидат технических наук: 05.13.12 - Системы автоматизации проектирования (по отраслям). Санкт-Петербург. 2011. 85 с.

Оглавление диссертации кандидат технических наук Лукьянов, Николай Михайлович

ВВЕДЕНИЕ.

Глава 1. СИСТЕМЫ АРХИВНОГО ХРАНЕНИЯ И ДОСТАВКИ ФАЙЛОВЫХ ДАННЫХ.

1.1. Место систем архивного хранения в автоматизации проектирования.

1.2. Классификация систем хранения данных.

1.3. Организация доставки данных и основные протоколы.

1.4. Проблемы архивных систем.

1.5. Слабосвязанные системы хранения данных.

1.5.1. Параллельные системы.

1.5.2. Гибридные системы.

1.5.3. СХД ЕМС АШюб.

1.6. Организация доступа к системам хранения.

1.7. Обеспечение доступности.

1.8. Выводы.

Глава 2. РАЗРАБОТКА АРХИТЕКТУРЫ СИСТЕМЫ АРХИВНОГО ХРАНЕНИЯ ДАННЫХ.

2.1. Предпосылки и требования для разработки архитектуры.

2.2. Структурно-функциональная организация системы хранения ЬС082.

2.2.1. Сервер управления доставкой.

2.2.2. Сервер метаданных.

2.2.3. Узел хранения.

2.2.4. Модуль статистики.

2.3. Репликация данных.

2.4. Модель данных.

2.5. Балансировка нагрузки на узлы.

2.6. Восстановление данных.

2.7. Соответствие теореме САР.

2.8. Выводы.

Глава 3. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ СИСТЕМЫ ЬСББг.

3.1. Базовое системное программное обеспечение.

3.2. Универсальный программный интерфейс.

3.3. Запросы чтения/записи.

3.4. Организация эксперимента.

3.5. Анализ результатов эксперимента и выводы.

Рекомендованный список диссертаций по специальности «Системы автоматизации проектирования (по отраслям)», 05.13.12 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка архитектуры и методов организации слабосвязанных архивных систем для автоматизации проектирования»

Системы автоматизации проектирования составляют широкий и особо важный класс современных информационных систем. В последние десятилетия эти системы достигли такого уровня развития, что проектирование практических во всех областях невозможно без их использования [1]. Системы автоматизированного проектирования теперь используются не только в конструировании трехмерном моделировании, но и во многих других областях, например программировании.

Все чаще проектирование становится распределенным, что влечет за собой соответствующую организацию работы проектных коллективов с проектными данными на всех стадиях разработки. Возможность работы в распределенной среде стала важным критерием при выборе систем автоматизации.

Общим свойством для САПР систем является то, что они продуцируют большие объемы данных, в особенности файлового типа. Мы фокусируем внимание не на подсистемах справочников и баз данных, а на хранении неструктурированных данных, которые являются основным по объему объектом архивного хранения.

В таких условиях системы архивного хранения и доставки проектных материалов для их возможного повторного использования и анализа приобретают особое значение. В целом в последние годы отмечается экспоненциальный рост объемов сохраняемых неструктурированных данных [2]. Нужно также отметить, что долгое время основное внимание уделялось хранению структурированных данных в базах. Архивные системы развивались исключительно в направлении организации хранения редко используемых данных, что и определяется самим термином - архивирования данных. Во многих сферах применения файловые системы хранения серьезного развития не получали, хотя использование файловых серверов является повсеместным. Увеличение объемов ставит задачу организации хранения неструктурированных данных на новый уровень, дополняя функцию хранения необходимостью иметь и средства доставки данных. Отрасль в целом только начинает предлагать коммерческие системы такого типа и имеется очень много архитектурных вопросов, нуждающихся в обосновании [3]. Этим и определяется актуальность представляемой работы.

Развитие систем хранения выявило два основных их класса: системы прямого серверного подключения в формате дисковых массивов различного уровня и системы на специальном аппаратно-программном обеспечении корпоративного применения [4]. В центре внимания ведущих мировых производителей систем хранения традиционно находятся средства, приспособленные для хранения транзакционных данных из таких сфер применения, как финансы, управление, связь. Основная масса решений представляет собой высокопроизводительные системы среднего и высокого класса, которые имеют высокоскоростные каналы связи с серверами и функционируют в масштабе локальной сети [5]. Такие системы называют ■"жесткосвязанными", имея ввиду связь систем хранения с серверами. Это не только высокопроизводительные, но и очень дорогостоящие системы. Их применение в сфере обеспечения проектных работ ограничено, так как основное их назначение - работа в центрах обработки данных (ЦОД).

Другим типом систем хранения являются системы, работающие вне крупных ЦОД, часто распределенно, при ограниченной полосе пропускания каналов связи. Такие системы мы называем "слабосвязанными". Важнейшим требованием к таким системам является экономическая доступность, которая может достигаться только при использовании доступных аппаратных компонентов и открытого программного обеспечения.

Однако работа над этим типом систем идет менее интенсивно. Имеются лишь отдельные, мало исследованные и ограниченно документированные решения. Наряду с открытыми существуют и коммерческие проекты систем такого типа. В 2009 г. решение признанного лидера в системах хранения — компании EMC Centera Virtual Archive 1.0, было заявлено как система уровня выше локальных сетей и практически неограниченного масштабирования [3]. Это решение основано полностью на аппаратно-программном обеспечении ЕМС и предполагает шокирующие капитальные затраты и достаточно высокую удельную стоимость владения, что не позволяет использовать его на малых или средних предприятиях.

Слабосвязанные системы исследованы гораздо меньше, а с учетом постоянного роста требований во всех сферах информационного обслуживании, в том числе и в автоматизации проектирования, необходимость развития и исследования архитектуры таких систем хранения становится актуальной.

Исследованию данного класса систем хранения, разработке базовой архитектуры системы архивного хранения и доставки неструктурированных данных и ее программной реализации посвящена настоящая работа. Специфические особенности, конкретизирующие наш предмет, выражаются: в распределенности уровня выше локальной сети, ориентации на доступные и неоднородные аппаратные средства, узкие каналы связи, регулировании нагрузки при доставке данных и гибкое горизонтальное масштабирование. В совокупности реализация этих требований должна обеспечить приемлемые экономические параметры таких систем.

Целью работы является разработка архитектуры и программная реализация распределенной системы архивного хранения и доставки файловых данных при ограничениях на полосу пропускания каналов связи.

Для достижения данной цели в работе были поставлены и решались следующие задачи:

1. Разработать архитектуру распределенной системы архивного хранения и доставки файловых данных, построенную на слабосвязанных гетерогенных узлах с узкими каналами связи.

2. Предложить и обосновать разделение программной и аппаратной составляющих системы.

3. Разработать метод адаптации системы в части управления, как размещением, так и доставкой контента.

Первая глава работы посвящается общему рассмотрению систем хранения и архивных систем, которые используются в САПР системах, в результате которого разрабатываемая архитектура позиционируется среди функционально и архитектурно различных известных решений. Материал главы имеет сравнительно-аналитический характер и служит целям обоснования последующих предлагаемых решений.

Во второй главе работы предлагается к рассмотрению архитектура разрабатываемой системы хранения LCDS2, которая характеризуется слабой связанностью узлов. Подробно рассматриваются основные компоненты системы, их назначение, функциональность и принципы работы. Предложенные архитектурные и программные решения удовлетворили ранее сформулированным требованиям. Предлагается подход программного резервирования данных путем их динамического реплицирования по узлам системы, который позволяет избежать использования аппаратных средств резервирования. Это в свою очередь позволяет охватить широкий круг различных программно-аппаратных платформ, которые возможно использовать для развертывания предлагаемой системы хранения данных.

В третьей главе рассматривается вопрос реализации системы хранения со слабосвязанными узлами в форме прототипа. Предлагается программный интерфейс DDPI, основанный на протоколе HTTP, как наиболее распространенном в Интранет и Интернет среде. Представляются результаты испытания системы восстановления данных, основанной на репликации узлов хранения.

Научная новизна работы.

Разработана архитектура распределенной системы хранения и доставки неструктурированных данных с адаптивными свойствами, способная работать в условиях ограниченных каналов связи.

Разработан метод обеспечения естественной масштабируемости распределенной системы хранения и доставки данных программно-аппаратного типа с использованием гетерогенных аппаратных узлов (серверов) начального уровня, который позволяет осуществлять горизонтальное масштабирование системы без остановки или изменения конфигурации.

Разработан программный метод резервирования данных путем их динамического размещения по узлам системы, в которых не используются аппаратные средства резервирования данных.

Похожие диссертационные работы по специальности «Системы автоматизации проектирования (по отраслям)», 05.13.12 шифр ВАК

Заключение диссертации по теме «Системы автоматизации проектирования (по отраслям)», Лукьянов, Николай Михайлович

Основные результаты состоят в следующем:

1. Разработана архитектура распределенной системы архивного хранения данных, удовлетворяющая сформулированным требованиям и реализующая, в отличие от большинства коммерческих систем, практически неограниченное, плавное масштабирование, а также возможность использования гетерогенных, экономически доступных аппаратных компонент (серверов нижнего уровня или достаточно мощных рабочих станций). Это свойство обеспечивает улучшенные экономические характеристики систем архивного хранения.

2. На прототипе подтверждена работоспособность предложенного разделения программных и аппаратных компонент.

3. Разработан программный метод адаптации системы в части управления, как размещением, так и доставкой контента, повышающий скорость доставки и снижающий затраты архивной памяти.

4. Предложен авторский алгоритм управления количеством реплик, обеспечивающий достижение требуемой доступности хранимых данных.

5. Разработан программный метод восстановления данных с отказавших узлов системы с помощью сетевого реплицирования данных, исключающий безвозвратную потерю данных.

6. Реализована и эксплуатируется распределенная система хранения файлового контента в области архивного хранения и представления видеоданных. Эксплуатация системы подтвердила выполнение основных требований к системам архивного хранения данного типа: плавное расширение и соответствующее снижение единовременных капитальных затрат; сохранение работоспособности системы при отказах узлов;

ЗАКЛЮЧЕНИЕ

При выполнении диссертационной работы была предложена и исследована архитектура и программная реализация распределенной системы архивного хранения и доставки файловых данных, состоящая из гетерогенных узлов с узкими каналами связи.

Список литературы диссертационного исследования кандидат технических наук Лукьянов, Николай Михайлович, 2011 год

1. Зыков О. Промышленная автоматизация: движение от САПР к PLM // Журнал IT News. — 2005. — №5 (30). — http://www.ict.edu.ru/ft/004645/itnews2005030805.pdf.

2. Gartner Technology Trends You Can't Afford to Ignore Электронный ресурс. [Сайт]. [2010].http://www.gartner.com/it/content/1258400/1258425/january6techtrendsr paquet.pdf.

3. EMC Corp EMC Centera Virtual Archive 1.0 Detailed Review Электронный ресурс. [Сайт]. [2010].http://www.emc.com/collateral/software/white-papers/h7062-centera-virtual-archive-wp.pdf.

4. Основы хранения данных почему важно обеспечить надежность ИТ-инфраструктуры Fujitsu-Siemens Электронный ресурс. [Сайт]. [2011 г]. http://ru.fujitsu.com.

5. Red Hat Enterprise Linux 5 Оптимальное решение для финансовых организаций Электронный ресурс. [Сайт]. [2007]. http://www.redhat.com.

6. Норенков И. П. Основы автоматизированного проектирования. — М : МГТУ им. Баумана, 2002. 333 с.

7. G. Held A practical guide to content delivery networks // CRC Press, 2010

8. Банковский В. Создаем распределенныую сеть доставки контента // Журнал Системный администратор. — 2008. — №2.

9. Танненбаум Э. Современные операционные системы. 2-е изд. — СПб : Питер, 2002.- 1040 с.

10. Postel J. RFC959 File Transfer Protocol. // Стандарт RFC Электронный ресурс. [Сайт]. [1985]. —http://tools.ietf.org/html/rfc959.

11. Качуров В. Современные распределенные файловые системы для Linux: Основные сведения // Журнал Компьютера. — 2002. — №9.

12. Артемов С. и Гришунин М. Виртуальные ленточные библиотеки: мифы и реальность // Электронный журнал Сетевые решения. — 2008. —12. — http://www.nestor.minsk.by/sr/2008/! 2/sr81213 .html.

13. Lustre 1.6. Manual // Инструкция пользователя Электронный ресурс. [Сайт]. [2007].http://manual.lustre.org/manual/LustreManual 16HTML/TOC.html.

14. Гаврилюк А. и Алексеев В. Сетевые журнальные файловые системы на основе серверов реляционных баз данных // Институт Программных Систем НАНУ (Киев). 2005.

15. Ghemawat Sanjay, Gobioff Howard и Leun Shun-Tak The Google File System. // Google : SOSP. 2003.

16. Dean Jeffrey и Ghemawat Sanjay MapReduce: Simplifed Data Processing on Large Clusters // Google: OSDI. 2004.

17. White Tom Hadoop: The Definitive Guide. // O'Reilly. Электронный ресурс. [Сайт]. [2009]. http://www.oreilly.com.

18. Atmos Hardware Guide // EMC Support Center Электронный ресурс. [Сайт]. [2010]. http://community.emc.com.

19. McGaughey Katryn EMC Extends Leadership with New Cloud Storage Service and Information Management Offerings. Электронный ресурс. [Сайт]. [2009]. http://community.emc.com.

20. Sacks David IBM Demystifying Storage Networking. Электронный ресурс. [Сайт]. [2001]. http://www03.ibm.com/industries/ca/en/education/kl2/technical/whitepapers/storagenet working.pdf.

21. Alabi Duran NAS, DAS or SAN? Choosing the Right Storage Technology for Your Organization // StorageSearch.com. Электронный ресурс. [Сайт]. [2004]. http://www.storagesearch.com/xtore-artl.html.

22. Singer Wolfgang NAS and iSCSI Technology Overview // SNIA. Электронный ресурс. [Сайт]. [2009].http://www.snia.org/education/tutorials/2009/fall/networking/WolfgangSinge rNASISCSITechnologyOverview.pdf.

23. Танненбаум Э. и Ван Стеен М. Распределенные системы. Принципы и парадигмы. — СПб : Питер, 2003. 302 с.

24. Шнитман В. Аппаратно-программные платформы корпоративных систем // Центр Информационных Технологий. Электронный ресурс. [Сайт]. [2010]. http://citforum.ru/hardware/appkis/contents.shtml.

25. Persson Jimmy и Evertsson Gustav RAID Systems // Blekinge Institute of Technology : Sweden, 2002

26. RAID // Энциклопедия Wikipedia. Электронный ресурс. [Сайт]. [2011]. http://en.wikipedia.org/wiki/Redundantarrayofindependentdisks.

27. Николов А. Кластерные системы высокой готовности // Журнал ВУТЕ:Россия. — 2005. — №5.

28. Hammonds К.Н. How Google Grows and Grows and Grows // Журнал FastCompany. Электронный ресурс. [Сайт]. [2003]. http://www.fastcompany.com/magazine/69/google.html.

29. Фильчаков А. Кластеры и кластеризация // Журнал КомпьютерПресс. — 2000.—№10.

30. Hanson J. Jeffrey An introduction to the Hadoop Distributed File System // IBM. Электронный ресурс. [Сайт]. [2011].http://www.ibm.com/developerworks/web/library/wa-introhdfs/?ca=drs-.

31. Кормен Т. Алгоритмы: построение и анализ, 2-е изд. — М : Вильяме, 2005. 1296 с.

32. Колисниченко Д. РНР 5/6 и MySQL 6. Разработка Web-приложений. — СПб :БХВ, 2010.-528 с.

33. Bauer Lujo Mechanisms for secure modular programming in Java // Software Practice and Experience. Электронный ресурс. [Сайт]. [2003]. http://www.ece.cmu.edu/~lbauer/papers/jms-spe03.pdf.

34. Вахалия Ю. UNIX изнутри. — СПб : Питер, 2003. 848 с.

35. Гарсия-Молина Гектор и Ульман Джеффри Системы баз данных. Полный курс. — М : Вильяме, 2004. 1055 с.

36. Олифер В. и Олифер Н. А. Сетевые операционные системы. — СПб : Питер, 2003.

37. Шрамм Оптимальное использование ресурсов памяти // Журнал сетевых решений. — 2011. — №3.

38. Дейт К. Введение в системы баз данных. — СПб : Вильяме, 2000. 848 с.

39. Salchow Ken Load Balancing 101 : Nuts and Bolts // F5. . Электронный ресурс. [Сайт]. [2007]. http://www.f5.com/pdf/white-papers/Ioad-balancing 101 wp .pdf.

40. Yokota H. A proposal of DNS-based adaptive load balancing method for mirror server systems and its implementation // Advanced Information Networking and Applications. Электронный ресурс. [Сайт]. [2004]. ieeexplore.ieee.org/iel5/9028/28653/01283788.pdf.

41. Waizumi Yuji Dynamic Mirror Server Selection Method with Consideration about Congestion of Link // Transactions of Information Processing Society of Japan. — 2004 — №45.

42. Brewer Eric Towards robust distributed systems // Principales of Distributed Computing. Электронный ресурс. [Сайт]. [2000].http ://guide. couchdb. org/draft/consistency .html.

43. Programming Community Index // TIOBE. Электронный ресурс. [Сайт]. [2010]. http://www.tiobe.com/index.php/content/paperinfo/tpci/index.html.

44. Таненбаум Э. и Вудхалл А. Операционные системы. Разработка и реализация. — СПб : Питер, 2007. 704 с.

45. Публикации и научно-исследовательскиеработы автора

46. Лукьянов Н.М., Дергачев A.M. Организация сетевого взаимодействия узлов распределенной системы хранения данных // Научно-технический вестник СПбГУ ИТМО №02(72). 2011. - 137-141 с.

47. Лукьянов Н.М., Кириллов В.В. Анализ факторов, влияющих на качественные и количественные показатели функционирования систем распределенного хранения данных // Научно-технический вестник СПбГУ ИТМО №56. 2008. - 9-17 с.

48. Лукьянов Н.М., Дергачев A.M. Ложные вычислительные системы для исследования и отвлечения атак // Научно-технический вестник СПбГУ ИТМО №45. 2007. - 32-39 с.

49. Лукьянов Н.М. Принципы организации многоточечного доступа к распределенной системе хранения данных // Сборник тезисов докладов конференции молодых ученых, Выпуск 1.Труды молодых ученых СПбГУ ИТМО 2010. - 17-18 с.

50. Лукьянов Н.М., Дергачев A.A. "Алгоритмы обработки информационных потоков в распределенной системе хранения данных" // Сборник тезисов докладов конференции молодых ученых, Выпуск 4.Труды молодых ученых СПбГУ ИТМО 2009. - 217-223 с.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.