Разработка архитектуры объектно-характеристической базы данных для работы с системами большой размерности
Практическая значимость подтверждается возможностью работы специалистов с разными уровнями описания модели системы хранимой в ОХБД. Использование предложенного метода обработки информации в ОХБД позволяет интерпретировать результаты экспериментов в виде математических формул, и следовательно получать методом интерполяции/экстраполяции недостающие данные на уровне БД. Получены результаты… Читать ещё >
Содержание
- ОПРЕДЕЛЕНИЯ, ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ
- ГЛАВА 1. АНАЛИЗ СОВРЕМЕННЫХ МЕТОДОВ ПРОЕКТИРОВАНИЯ БАЗ ДАННЫХ
- 1. 1. Сложные системы и системы большой размерности
- 1. 1. 1. Развитие сложных систем
- 1. 1. 2. Подход к преодолению трудностей при описании систем большой размерности
- 1. 1. 3. Автоматизация процессов создания управляемых семантических сетей
- 1. 2. Особенности существующих типов баз данных
- 1. 2. 1. Ранние типы баз данных
- 1. 2. 2. Основные особенности систем, основанных на инвертированных списках
- 1. 2. 3. Иерархические системы
- 1. 2. 4. Сетевые системы
- 1. 2. 5. Достоинства и недостатки ранних СУБД
- 1. 2. 6. Реляционный подход к организации БД
- 1. 2. 7. Объектно-ориентированные базы данных (ООБД)
- 1. 3. Достоинства и недостатки баз данных
- 1. 1. Сложные системы и системы большой размерности
- Г. 4. Задача поиска в базах данных
- 1. 5. Использование нечеткой логики
- 1. 6. Объектно-характеристическая база данных
- 1. 6. 1. Описание объектно-характеристической таблицы (ОХТ)
- 1. 6. 2. Задачи прямого и обратного поиска в ОХТ
- 1. 6. 3. Особенности задач, решаемых с использованием ОХТ
- 1. 7. Объектно-характеристическая база данных для задач моделирования структурированных систем
- 1. 8. Использование объектно-характеристической базы данных для задач большой размерности
- Выводы по главе
- ГЛАВА 2. МЕТОДЫ И АЛГОРИТМЫ, ПРИМЕНЯЕМЫЕ В ИССЛЕДОВАНИИ
- Определения и обозначения, используемые в главе
- 2. 1. Описание комплекса системы большой размерности
- 2. 2. Определение операции деления в нечетких отношениях
- 2. 3. Определение операций четкой логики
- 2. 4. Формализация нечеткости
- 2. 5. Расширение операций для нечетких отношений
- 2. 5. 1. Нормы
- 2. 5. 2. Нечеткие значения
- 2. 6. Применение деления к нечетким отношениям
- 2. 6. 1. Обзор предыдущих работ
- 2. 6. 2. Интерпретация в терминах порогов
- 2. 6. 3. Интерпретация в терминах важности
- 2. 7. Расширение операции деления
- 2. 8. Выражение деления нечетких отношений в
- Выводы по главе
- ГЛАВА 3. РАЗРАБОТКА ОБЪЕКТНО-ХАРАКТЕРИСТИЧЕСКОЙ БАЗЫ ДАННЫХ ДЛЯ СИСТЕМ БОЛЬШОЙ РАЗМЕРНОСТИ
- 3. 1. Актуальность создания локальной объектно-характеристической базы данных
- 3. 2. Архитектура локальной объектно-характеристической базы данных
- 3. 3. Интерфейс межмашинного взаимодействия локальной гибридной базы данных и сетевого хранилища системы большой размерности
- 3. 4. Метод сжатия данных в ОХБД
- 3. 5. Разработка языка запросов
- 3. 5. 1. Описание основных семантических конструкций
- 3. 5. 2. Функции принадлежности и операции нечеткой логики, используемые в языке запросов
- 3. 5. 3. Проектирование анализатора запросов
- 3. 5. 4. Основные команды, поддерживаемые анализатором
- 3. 5. 5. Типы лексем
- 3. 5. 6. Описание функций БС^Ь-анализатора
- 3. 6. Экспериментальные данные
- 3. 7. Пример использования языка запросов
- 3. 8. Метод подбора коэффициентов для функций принадлежности на основе семантических отношений в базе данных
- Выводы по главе
Разработка архитектуры объектно-характеристической базы данных для работы с системами большой размерности (реферат, курсовая, диплом, контрольная)
Актуальность темы
В последние несколько лет все острее становится проблема решения задач моделирования систем большой размерности (СБР). Главной отличительной чертой данных систем является необходимость работать с разными уровнями (масштабами) описания систем.
Данную проблему можно проиллюстрировать следующим примером. При исследовании какого-либо молекулярного процесса (например, химической реакции) и проектировании соответствующей модели системы мы сталкиваемся с необходимостью создания нескольких уровней описаний. Т. е. на более высоком уровне мы имеем молекулярные процессы, а на более низком — межатомные взаимодействия. Данные уровни будут иметь как различные временные режимы, так и разные точности измерений отдельных переменных в физических системах. То есть масштабы относятся! и к времени, и к самим физическим величинам, которые приходится измерять. Специалистам приходится осмысливать это и при взаимодействии на межатомном уровне, и при взаимодействии на молекулярном уровне, когда крупные атомные образования взаимодействуют между собой.
Основная задача описания СБР — связать эти уровни в единой модели и сделать возможным взаимодействие специалистов, работающих с разными уровнями описаний. Естественно, что каждый специалист в меру человеческих способностей не может охватить всю систему целиком, а может работать с частью системы и взаимодействовать со специалистами на других уровнях, и со специалистами на своем уровне. Для координации действий специалистов нужно подняться на верхний уровень и посадить специалиста, который будет заниматься координацией действий этих специалистов. Если порождается более высокий уровень, появляется необходимость создавать описания на более высоком уровне. Нужно ввести способы описания при интегрировании. Точно также, когда мы имеем некоторое интегрированное описание — нужно его декомпозировать и посмотреть, как это связано с. более низкими уровнями.
Bi течение продолжительного периода времени в лаборатории^ языков5″ и методов моделирования систем? большой’размерности при институте проблем управления РАНбыло'! выполнено множество работ, направленных наг решение данной проблемы. Воронцов И. Н., Келдыш: I I.B., Дыбо A.B. иСта-: ростин G.A. в ряде публикаций рассматривают особенности данных задач и пути их решение ([1— 5]). Также в работах Воронцова И. Н. и Греши лова М. М1. описана спроектированная системамоделированиясистем^ большой размерности с собственным языком ([6— 11]).-.
Насегодняшний день стоит задача организации хранения описаний разной общности, от конкретных феноменологических результатовсвязанных с неиосредствениымиизмерениямидо сколь угодно — общих описаний различных сфер знаний. Необходимо определить, каким образом располагать результаты измерений* и хранить их в базах данных, каким-, образом должны взаимодействовать отдельные автоматизированные процедуры. и каким образом должнывзаимодействовать людишршиспользованишданных.,.
Поэтому возникла необходимость выбора архитектуры базыданных, способной эффективно хранить описания систем на различных семантических уровнях, результаты экспериментов и статистических данных, предоставляющей удобные средства для работы с информацией специалистам в различных областях.
В диссертационной-работе рассмотрены особенности проектирования' баз данных, возможность, созданияновой архитектуры БД и языка запросовдля работы с многоуровневой информацией.
Объектом-исследования являются системы большой размерности.
Предметом исследования являются математические модели описания баз данныхпринципы построения систем управления: базами, данныхтехнологии реализации баз данных и языков запросов^к базам данных.
Целью диссертационной работы является проектирование и разработка эффективного средства хранения и обработки информации для систем большой размерности.
Для достижения поставленной цели были сформулированы следующие задачи:
1. Проанализировать задачи описания систем большой размерности, определить особенности данных, используемых для построения моделей сложных систем:
2. Рассмотреть способы организации хранения информации, особенности доступа к данным, возможность применения при решении задач большой размерности.
3. Разработать архитектуру базы данных для работы с экспертами в определенной предметной области, разработатьязык запросов с применением4 нечеткой логикидля доступа к описаниям и экспериментальным данным.
4. На основе проведенных исследований реализовать компьютерное средство хранения и обработки данных, позволяющее использовать методы сжатия и4интерполяции. данных, а также осуществлять доступ к данным с использованием конструкций естественного языка.
Основными теоретическими результатами" работы, выносимыми^ на защиту и определяющими научную новизну работы, являются:
• Предложен новый метод обработки информации в ОХБД, позволяющий на больших массивах экспериментальных данных сократить объем хранимой информации:
• Предложен новый метод подбора коэффициентов для функций принадлежности на основе семантических отношений в базе данных.
• Разработана архитектура локальной гибридной объектно-характеристической базы данных для решения задач большой размерности.
• Спроектирован язык запросов для объектно-характеристической базы данных, основанный на нечеткой логике.
Практическая значимость подтверждается возможностью работы специалистов с разными уровнями описания модели системы хранимой в ОХБД. Использование предложенного метода обработки информации в ОХБД позволяет интерпретировать результаты экспериментов в виде математических формул, и следовательно получать методом интерполяции/экстраполяции недостающие данные на уровне БД. Получены результаты эксперимента, показывающего повышение результативности тестирования знаний на 10% при использовании метода формирования тестов с использованием нечеткой логики. Разработанный метод подбора коэффициентов для функций принадлежности позволит сократить до 13% временных затрат на ввод исходных данных о системе.
Научная значимость результатов исследования:
• разработан алгоритм для предложенного метода обработки информации в ОХБД и уменьшения объема хранимых данных;
• разработан алгоритм для предложенного метода подбора коэффициентов функций принадлежности;
• разработанный язык запросов для объектно-характеристической базы данных с возможностью использования, нечетких отношений позволяет облегчить и ускорить работу специалиста при формировании семантической основы базы данных, а также при работе с экспериментальными данными.
Апробация работы. Основные научные выводы и результаты работы докладывались на следующих конференциях: «Научно-техническая конференция МИРЭА» 56, 57 и 58 и Международной научно-технической конференции 1п1егта11с-2009. Материалы работы были опубликованы в 5-ти печатных работах (тезисы и материалы международных и российских конференций) [12 — 15], а также в 3 журналах, входящих в перечень рекомендованных ВАК [16 — 18]. Также имеется два акта внедрения результатов диссертационного исследования в учебный процесс кафедры МОВС МИРЭА и в работу ООО «Форинтранс».
Структура и объем работы: Диссертация, объемом в 131 страницу, состоит из введения, трех глав, заключения, списка использованной литературы из 109 наименований.
Выводы по главе.
1. Показана актуальность создания базы данных налокальном компьютере при хранении большого количества разнородной информацииОпределены основные компоненты в программном комплексе системы большой размерности:;
• две базы, данных, хранящихся в серверной части комплекса (лингвистическая база данных и объектно-ориентированная. .". база данных) — г ¦'.. • локальная объектно-характеристическая база данных.
2. Разработана архитектура-локальной объектно-характеристической базы данных (ОХБД), которая представляет собой гибрид реляционной и сетевой архитектур. Выделены основные: области (объекты, характеристики и матрица значений) и типы семантических отношений между элементами БД.
3. Предложен, интерфейсмежмашинного взаимодействиялокальной ОХБД и сетевого хранилища" системыбольшой размерности. Описан алгоритм прохождения запроса пользователя на формирование ОХБД.
41 Разработан метод, позволяющий уменьшить объем хранимой в базе данных информации и обеспечить организацию работы специалистов на разных семантических уровнях описания системы.
5. Разработан язык запросов для ОХБД, основанный на нечеткой логике. Определены, основные операции нечеткой логики, используемые в языке запросов. Описаны основные семантические конструкции языка-запросов.
6. Разработан интерпретаторязыка запросов для ОХБД и описаны его основные функции;
7. Приведены экспериментальные данные по обработке вопросов для тестирования знаний с применением нечетких множеств.
8. Приведен пример использования разработанного языка запросов с применением нечетких множеств, показывающий возможность увеличения полноты информации, получаемой при запросе к базе данных.
9. Предложен метод подбора коэффициентов для функций принадлежности и формирования нечетких множеств на основе семантических отношений в базе данных, позволяющий уменьшить трудоемкость внесения информации в ОХБД.
ЗАКЛЮЧЕНИЕ
.
В диссертационном исследовании, на основании изучения-программного комплекса СБР и теоретических исследований* по сложным системам, нами сформулированы требования к локальной базеданных программного комплекса системы большой размерности. Среди основных требований были определены следующие:
• возможность хранить описания систем на различных семантических уровнях;
• хранить результаты экспериментов и статистических данных;
• предоставлять средства для работы с информацией специалистам в различных областях.
Основываясь на сформулированных требованиях, нами была спроектирована новая гибридная архитектура базы данных, построенная на основе принципиальной модели объектно-характеристической таблицы, предложенной Криницким [58] и современных подходов и. методов проектирования сетевых и реляционных баз данных. Основными особенностями спроектированной объектно-характеристической базы данных следует считать разбиение базы на три связанных между собой области:
• область объектов;
• область характеристик;
• матрица значений.
Внутри областей объекты и характеристики, помимо-установленной иерархии, связанымежду собой семантическими отношениями.
Для ОХБД разработан метод замещения ряда значений на соответствующее уравнение, описывающее данную последовательность значений. Предложенный метод в случаях больших объемов экспериментальных данных позволяет уменьшать объем хранимой информации, а также позволяет организовать работу специалистов на разных уровнях описания-системы, когданапример, одному специалисту будут требоваться точные данные, а другому только общие принципы" и закономерности в изучаемой системе.
Быласоздана действующая программная модель объектно-характеристической базы данных.
Нами были проанализированы работы, посвященные нечетким множествам и их использованию в языках запросов БД: На основании изученных материалов г был — разработан язык: запросов для • объектно-характеристической базы данных, имеющийинструменты для4 обработки нечетких запросов: пользователей. В работе также рассмотрен математический аппарат, лежащий в основе этого языка запросов.
Для уменьшения трудоемкости при внесении информации .в ОХБД нами1 был, разработанметодподбора коэффициентов для, функцийпринадлежности на основе семантических, отношений и уже: указанных функций принадлежности в базе данных. В случаекогда. объем, данных? велик (более 10 001 понятий)., количество понятийсостоящих в семантически? близких отношениях, может составлять до 13% от общего объема. данных и, следовательнообосновано использование, предложенного метода;
Был разработан интерфейс межмашинноговзаимодействиямежду объектно-характеристической базой данных и сетевой лингвистической-базой данных. Дляэтого был разработанинтерпретатор, переводящий: команды с языка нечетких запросов ОХБД на стандартный язык 8С>Е-запросов.
Список литературы
- Воронцов И.Н. О создании Международного центра проблем управления и междисциплинарных исследований. Доклад Ученому совету ИПУ РАН 29 июня 2006 г., Письмо в Президиум РАН, 4 стр.
- Vorontsov I.N. Control problems and interdisciplinary research and development. Pr. of the International Conference SICPRO «System Identifiction and Control Problems». Institute of Control Sciences, Moscow, January, 2007
- И.Н.Воронцов, М. М. Грешилов. Система математических методов машинного моделирования «Взаимодействия». Язык системы. (Машинная реализация, версия ВМ-3). Библиотека операторов ипроцедур (сообщение 1). Институт проблем управления, Москва, 1979 (37 стр.).
- Языки и модели в управлении большими системами. Разработка концептуального базиса языка описания и анализа сложных систем. Институт проблем управления им. В. А. Трапезникова. Отчет по теме № 303−04/03/28. Москва, 2004 г.
- И.Н.Воронцов, М. М. Грешилов. Система математических методов машинного моделирования «Взаимодействия». Язык системы. (Машинная реализация, версия ВМ-3). Институт проблем управления, Москва, 1979 (75 стр.).
- И.Н.Воронцов, М. М. Грешилов. Система математических методов машинного моделирования «Взаимодействия». Язык теории и язык системы. Институт проблем управления, Москва, 1979 (47 стр.).
- И.Н.Воронцов. Система математических методов машинного моделирования «Взаимодействия». Элементы теории. Институт проблем управления, Москва, 1979 (59 стр.).
- Д.Э.Федотова, В. М. Ткаченко, А. А. Сорочинский. Анализ и способы реализации объектно-ориентированных баз данных. Сборник трудов 58-й НТК МИРЭА. М.: МИРЭА, 2009-
- Сорочинский А.А. Объектно-характеристическая база данных. Объединенный научный журнал. Выпуск 10 (288), М.: АНП, 2009.
- Сорочинский А.А. Использование нечетких запросов к объектнохарактеристической базе данных. Наукоемкие технологии № 6, т.11, Москва 2010. с.55−59
- Сорочинская Н.К., Сорочинский А. А. Нечеткий язык запросов для объектно-характеристической базы данных. Естественные и технические науки № 5, Москва 2010.
- Сорочинская Н.К., Сорочинский А. А., Ткаченко В. М. Решение задач идентификации и реконструкции на неполных наборах данных в программном комплексе «система большой^ размерности». Труды ИСА РАН 2010. Т. 49 (1). с. 224−235
- Воронцов И.Н., Келдыш Н. В., Дыбо А. В., Базлев М. С., Базлева Е. А. Отчет о научно-исследовательской работе «Автоматизация синтеза и исследования моделей социально-экономических систем», Институт проблем управления РАН, Москва 2009 г.
- Кнут Д- Искусство программирования для ЭВМ: М-: Мир, 1978.Т. 3: Сортировка и поиск.
- Кудрявцев В. Б. Функциональные системы. М.:Изд-во Моск. ун-та, 1982.
- Ли Д., Препарата Ф. Вычислительная геометрия. Обзор // Кибернет. сб. 1987. Вып. 24. С. 5—96.
- Мартин Дж. Организация: баз данных в вычислительных системах.М.: Мир, 1980.
- Ньюмен У. М., Спруэлл Р. Ф. Основы интерактивной машинной графики.М.: Мир, 1976.
- Препарата Ф., Шеймос Ml Вычислительная геометрия: Введением.: Мир- 1989-
- Решетников В. Н. Алгебраическая теория информационного поиска //Программирование Л 979.№ З.С. 68-—74.
- Селтон F. Автоматическая обработка, хранение и поиск информации//М.: Советское радио, 1973 .
- Ben-Or М. Lower bounds for algebraic computation trees // Proc. 15th ACM Ann. Symp. Theory Comput. (April 1983).P. 80—86.33,34,35