Разработка специального математического обеспечения для отождествления записей в базах данных на основе операций нестрогого соответствия
Обеспечение обмена данными между удаленными организациями требует установления соответствий распределенных отношений — множеств однотипных объектов баз данных (БД) и элементов этих множеств — отдельных объектов. В первом случае говорят об интеграции схем баз данных, во втором о построении процедур отождествления объектов БД. Разработан программный комплекс, осуществляющий отождествление записей… Читать ещё >
Содержание
- 1. Идентификация объектов в базах данных
- 1. 1. Направления развития современных баз данных
- 1. 2. Модели данных для интеграции баз данных
- 1. 2. 1. Реляционная модель данных и ограничения целостности
- 1. 3. Расстояние между строками
- 1. 3. 1. Способы определения расстояния
- 1. 3. 2. Алгоритмы вычисления расстояния Левенштейна
- 1. 4. Методы поиска строк по сходству
- 1. 5. Средства обработки текстовых данных
- 1. 6. Постановка цели и задач исследования
- 2. 1. Введение
- 2. 2. Построение морфизма алгебраических систем
- 2. 3. Нестрогие реляционные операции
- 2. 3. 1. Нестрогие алгебраические выражения
- 2. 3. 2. Свойства нестрогих реляционных операций
- 2. 4. Алгоритм выполнения операции нестрогого соединения на основе хэширования по сигнатуре
- 2. 4. 1. Применение хеширования по сигнатуре к задаче нестрогого соединения
- 2. 4. 2. Объем промежуточной таблицы
- 2. 4. 3. Определение оптимальной хеш-функции
- 2. 4. 4. Анализ эффективности метода хеширования по сигнатуре
- 2. 5. Алгоритм выполнения операции нестрогого соединения на основе trie-деревьев
- 2. 5. 1. Соединение на основе trie-деревьев
- 2. 5. 2. Анализ вычислительной сложности алгоритма нестрогого соединения
- 2. 5. 3. Анализ вычислительной сложности алгоритма построения trie-дерева
- 2. 6. Анализ количества ошибок
- 2. 6. 1. Связь расстояния между строками с вероятностью появления ошибки
- 2. 6. 2. Количество ошибок первого рода
- 2. 6. 3. Количество ошибок второго рода
Разработка специального математического обеспечения для отождествления записей в базах данных на основе операций нестрогого соответствия (реферат, курсовая, диплом, контрольная)
3.2. Структура программного обеспечения.63.
3.3. Процедуры и функции для работы с системой управления базами данных.65.
3.3.1. Типы данных.65.
3.3.2. Процедуры и функции, доступные пользователю. 65.
3.3.3. Закрытые процедуры и функции (доступные внутри пакета) .67.
3.4. Библиотека внешних функций.67.
3.4.1. Типы данных.67.
3.4.2. Функции, отвечающие за загрузку и сохранение данных 72.
3.4.3. Функции, отвечающие за работу с trie-деревом. 73.
3.4.4. Функции, выполняющие построение индекса.75.
3.4.5. Функции, выполняющие операцию нестрогого соединения.76.
3.4.6. Диаграммы вызовов функций .78.
3.5. Вызов функций нестрогих реляционных операций.78.
3.5.1. Нестрогое соединение.78.
3.5.2. Нестрогая разность.81.
3.5.3. Нестрогое объединение.81.
3.6.
Заключение
82.
4. Практическое применение алгоритмов отождествления записей баз данных 83.
4.1.
Введение
83.
4.2. Информационные потоки в страховой медицинской организации .84.
4.3. Анализ быстродействия выполнения основных функций библиотеки.87.
4.3.1. Время выполнения операции нестрогого соединения. 87.
4.3.2. Время построения индекса.89.
4.4. Отождествление записей баз данных страховой компании и лечебно-профилактических учреждений.91.
4.4.1. Используемые таблицы.91.
4.4.2. Примеры применения операции нестрогого соединения 93.
4.4.3. Эффективность процедуры отождествления записей. 98.
4.5.
Заключение
100.
Заключение
101.
Список литературных источников 103.
Актуальность темы
Обеспечение обмена данными между удаленными организациями требует установления соответствий распределенных отношений — множеств однотипных объектов баз данных (БД) и элементов этих множеств — отдельных объектов. В первом случае говорят об интеграции схем баз данных, во втором о построении процедур отождествления объектов БД.
Построение процедур отождествления объектов в распределенных БД осложняется наличием ошибок операторского ввода при наборе первичных ключей, что влечет за собой существенные информационные потери при выполнении алгебраических операций над отношениями. Различие между строками, вызванное ошибками операторского ввода, хорошо описывается при помощи расстояния Левенштейна. Однако, современные системы управления базами данных (СУБД) не предоставляют возможности поиска близких в смысле расстояния Левенштейна записей, а использование для вычисления расстояния внешних функций приводит к непомерно временным затратам.
Поэтому актуальна задача разработки специального математического и программного обеспечения для отождествления записей в базах данных с целью снижения информационных потерь, вызванных ошибками операторского ввода данных.
Работа выполнения в соответствии с научным направлением ЛГТУ «Современные сложные системы управления» .
Цель исследования состоит в разработке специального математического обеспечения процедур отождествления записей реляционных баз данных и создании реализующего эти процедуры программного обеспечения, встраиваемого в СУБД промышленного типа.
Задачи исследования:
— провести анализ методов и моделей, возникающих при интеграции объектов в базах данных;
— разработать и исследовать специальные реляционные операции, возникающие в задаче отождествления записей баз данных, учитывающие возможность наличия ошибок операторского ввода;
— разработать программное обеспечение, реализующее специальные реляционные операции и дополняющее реляционные СУБД возможностями отождествления записей;
— применить разработанное специальное и программное обеспечение к задаче отождествления записей реестров лечебно-профилактических учреждений с базой данных страховой компании.
Методы исследования основаны на теории множеств, абстрактной алгебре, теории графов, дискретной математике, математической статистике, методах модульного и структурного программирования.
Научная новизна. В диссертации получены следующие результаты, характеризующиеся научной новизной:
— метод отождествления объектов баз данных, отличающийся построением морфизма алгебраических моделей, позволяющий находить решение в наиболее общем виде;
— операции нестрогого реляционного соединения, объединения и разности, отличающиеся использованием условия непревышения расстоянием Левенштейна заданного порогового значения, реализация которых позволяет снизить информационные потери, обусловленные наличием ошибок операторского ввода в ключевых полях;
— алгоритм ускоренного выполнения нестрогих реляционных операций, отличающийся применением в реляционных базах данных метода хэширования по сигнатуре, что позволяет сократить время выполнения операций;
— метод идентификации параметров функции хэширования по сигнатуре для выполнения нестрогого реляционного соединения, отличающийся использованием генетического алгоритма, позволяющий оценить целесообразность применения хэширования;
— алгоритм выполнения нестрогих реляционных операций над таблицами большого объема, отличающийся применением в реляционных базах данных trie-деревьев.
Практическая значимость состоит создании на основе разработанных методов и алгоритмов программной библиотеки функций, являющейся надстройкой к промышленной СУБД реляционного типа и обеспечивающей отождествление записей реляционных таблиц, хранящихся в отдельных БД. Использование функций этой библиотеки позволяет сократить количество записей, требующих ручной обработки для устранения ошибок операторского ввода.
Разработан программный комплекс, осуществляющий отождествление записей застрахованных и пациентов лечебно-профилактических учреждений, в 2−5 раз сокративший количество обрабатываемых вручную данных за счет интеграции информационной системы и реализации разработанного специального математического обеспечения.
Реализация и внедрение результатов работы. Разработанный программный комплекс внедрен при модернизации информационных систем страховых обществ г. Липецка: ООО «Новолипецкая страховая компания», ООО СМК «Арго-Шанс» .
Результаты диссертационной работы используются в учебном процессе ЛГТУ при подготовке инженеров по специальности «Прикладная математика» .
Апробация работы. Теоретические и практические результаты, полученные в процессе исследования, докладывались и обсуждались на XXXV Международной научной студенческой конференции «Студент и научно-технический прогресс» (Новосибирск, 1997), П-й Республиканской электронной научной конференции «Современные проблемы информатизации» (Воронеж, 1997), Ш, У1-й Международных электронных научных конференциях «Современные проблемы информатизации» (Воронеж, 1998), Научно-технической студенческой конференции технических ВУЗов центральной России (Орел, 1999), VI, VIII-ft Международных электронных научных конференциях «Современные проблемы информатизации в технике и технологиях» (Воронеж, 2001, 2003), Международной научно-практической конференции «Современные сложные системы управления CCCy/HTCS'2005» (Тула, 2005).
Положения работы поддержаны грантами по фундаментальным исследованиям:
— Министерством образования РФ — Г00 4.1−68 «Разработка теории оптимизации проектирования информационных систем» ;
— Российским фондом фундаментальных исследований — N 03−01−96 487 «Оптимизация схем баз данных и запросов на основе теории преобразований реляционных выражений», N 03−01−96 487 «Формализация алгоритма оптимизации реляционных запросов» и N 05−01−96 402 «Совершенствование методологии проектирования информационных систем для управления производственными объектами» .
Публикации. По материалам диссертационной работы опубликовано 18 работ, из них 10 без соавторов. В [7, 9, 10] автором предложен алгоритм построения конечных алгебрв [8] разработан алгоритм синтеза тождествв [54, 55, 56] введена операция нестрогого реляционного соединения и предложена реализация введенной операции на основе хэширования по сигнатурев [57] предложен основанный на использовании trie-деревьев алгоритм выполнения операции нестрогого соединения.
Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, библиографического списка из 121 наименования, приложений. Основная часть работы изложена на 117 страницах машинописного текста, содержит 19 рисунков и 11 таблиц.
ЗАКЛЮЧЕНИЕ
.
В ходе исследования были получены следующие результаты:
1. Разработан метод отождествления объектов сложной структуры, хранимых в реляционных базах данных, отличающийся построением морфизма алгебраических моделей, позволяющий находить решение в наиболее общем виде.
2. Предложены операции нестрогого реляционного соединения, объединения и разности, отличающиеся использованием условия непревышения расстоянием Левенштейна заданного порогового значения, позволяющие снизить информационные потери, обусловленные наличием ошибок операторского ввода в ключевых полях.
3. Разработан алгоритм ускоренного выполнения нестрогих реляционных операций на основе метода хэширования по сигнатуре, позволяющий сократить время выполнения операций.
4. Разработан метод идентификации параметров функции хэширования по сигнатуре для выполнения нестрогого реляционного соединения с использованием генетического алгоритма, позволяющий оценить целесообразность применения хэширования.
5. Разработан алгоритм выполнения нестрогих реляционных операций над таблицами большого объема, использующий trie-деревья.
6. Предложена методика определения порогового значения расстояния Левенштейна в условии нестрогого равенства ключевых атрибутов, основанная на оценке вероятности ошибочного отождествления объектов БД, позволяющая контролировать уровень ошибочных отождествлений.
7. Разработана библиотека программ, реализующая операции нестрогого реляционного соединения, объединения, разности.
8. Разработан и внедрен в ООО «НСК» и ООО СМК «Арго-Шанс» программный комплекс, осуществляющий отождествление записей застрахованных и пациентов лечебно-профилактических учреждений, в 2−5 раз сокративший количество обрабатываемых вручную данных за счет интеграции информационной системы и реализации разработанного специального математического обеспечения.
Список литературы
- Алгоритмы. Методы. Исходники http://algolist.manual.ru/.
- Арсеньев Б. П. Интеграция распределенных баз данных / Арсеньев Б. П., Яковлев С. А. М.: Лань, 2001. — 464 с.
- Аткинсон М. Манифест систем объектно-ориентированных баз данных / Аткинсон М., Бансилон Ф., ДеВитт Д., Диттрих К., Майер Д., Здоник С. Ц Системы управления базами данных. 1995. — N 04.
- Ахо А. Структуры данных и алгоритмы / Ахо А., Хопкрофт Дж., Ульман Дж. М.: Диалектика, 2000. — 384 с.
- Банди Б. Основы линейного программирования. М.: Радио и связь, 1989. — 176 с.
- Белкин П.Ю. Есть ли цена у опечатки? // Вопросы интернет-образования. N 12. http://vio.fio.ru/vio12/cdsite/Articles/art25.htm.
- Иванова Г. О. Алгоритм построения конечных алгебр / Блюмин С. Л., Иванова Г. О. // Современные проблемы информатизации: тез. докл. III Междунар. электрон, науч.конф. 1998. — С. 167−168.
- Иванова Г. О. Анализ и синтез тождеств в алгебрах произвольной сигнатуры на основе комбинаторных алгоритмов / Блюмин С. Л., Иванова Г. О. // Современные проблемы информатизации: тез. докл. III Междунар. электрон, науч.конф. 1998. — С. 122−123.
- Иванова Г. О. Компьютерное генерирование группоидов / Блюмин С.
- JI., Иванова Г. О. // Современные проблемы информатизации: тез. докл. II Респ. электрон, науч.конф. 1997. — С. 121.
- Иванова Г. О. Компьютерная классификация группоидов / Блюмин С. Л., Иванова Г. О. // Тезисы докладов Всеросс. науч.-технич.конф., посвящ. 40-летию ЛГТУ. 1996. — С. 404−406.
- Бойцов Л. М. Использование хеширования по сигнатуре для поиска по сходству // Прикладная математика и информатика. 2000.- N 7.
- Бойцов Л. М. Поиск по сходству в документальных базах данных: хеширование по сигнатуре оптимальное соотношение скорости поиска, простоты реализации и объема индексного файла. // Программист. — 2001. — N 1.
- Брюхов Д. О. Интероперабельные информационные системы: архитектуры и технологии / Брюхов Д. О., Задорожный В. И., Калиниченко Л. А., Курошев М. Ю., Шумилов С. С. // Системы Управления Базами Данных. 1995. — N 4. — С. 96−113.
- Вирт Н. Алгоритмы и структуры данных. СПб.: Невский Диалект, 2001. — 352 с.
- Грахам А. Стефан. Анализ строк. перевод М. С. Галкиной, под ред. П. Н. Дубнера. — 1992. — 100 с. http://masters.donntu.edu.ua/2002/fvti/ vasylenko/diss/lib/alg.zip.
- Гринев M. Н. UQL: язык запросов к интегрированным данным в терминах UML / Гринев М. Н., Кузнецов С. Д. // Программирование. 2002. — N 4. — С. 9−19.
- Дейт К. Дж. Введение в системы баз данных, 7-е издание. Пер. с англ. — М.: Издательский дом Вильяме, 2001. — 1072 с.
- Ермаков А. Е. Полнотекстовый поиск: проблемы и их решение // Мир ПК. 2001. — N 05.
- Запрос совпадающих и наиболее близких строк // Рассылка в рамках проекта «Открыто об Oracle». Выпуск 72. http://ln.com.ua/~openxs/projects/oracle/ora072.html.
- Зильбершац А. Стратегические направления в системах баз данных / Зильбершац А., Здоник С. // Системы управления базами данных. -1997. N 04.
- Зиндер Е. 3. Проектирование баз данных: новые требования, новые подходы // Системы управления базами данных. 1996. • N 3. • С. 10−22.
- Зыкин С. В. Соответствие состояний реализации исходной и целевой моделей данных // Материалы конф., посвященной 90-летию со дня рождения А. А. Ляпунова. 2001. — 6 с.
- Иванова Г. О. Конгруэнции алгебраических систем в задачах различения объектов при неполной информированности // Современные проблемы информатизации в технике и технологии: сб. трудов. Вып. 6. 2001. — С. 66−67.
- Иванова Г. О. Многообразия алгебраических систем // Региональная молодежная научн. и инженерная выставка «Шаг в будущее» Центр России: Сборник тез. докл. — 1999. — С. 3−4.
- Иванова Г. О. Операция нечеткого реляционного соединения для интеграции данных разнородных локально автономных БД // Современные проблемы информатизации в технике и технологии: сб. трудов. Вып. 8. 2003. — С. 106−107.
- Иванова Г. О. Открытый-замкнутый мир, внешнее соединение и семантика ER-модели // Современные проблемы информатизации в технике и технологии: сб. трудов. Вып. 8. 2003. — С. 42−43.
- Иванова Г. О. Подход к анализу тождеств и многообразий алгебраических систем // Вестник ЛГТУ-ЛЭГИ. 1999. — N 3(4). -с. 201−204.
- Иванова Г. О. Применение рекуррентных алгоритмов к проблеме классификации алгебраических структур // Студент и научно-технический прогресс: математика. Материалы XXXV Междунар. науч. студенческой конференции. 1998. — С. 38−39.
- Иванова Г. О. Тождества в алгебраических системах // Сборник тез. докл. Науч.-технич. студенческая конф. технич. ВУЗов Центральной России. 1999. — С. 173.
- Иванова Г. О. Тождества произвольного вида // Вестник ЛГТУ-ЛЭГИ.- 1999. N 3(4). — с. 205−209.
- Калиниченко Л. А. Методы и средства интеграции неоднородных баз данных. М.: Наука, 1983. — 423 с.
- Калиниченко Л. А. Десять Лет Московской Секции ACM SIG-MOD / Калиниченко Л. А., Когаловский М. Р., Кузнецов С. Д. // Программирование. 2002. — N 6.
- Кнут Д. Искусство программирования (3 тома). М.: Вильяме, 2000.- 2472 с.
- Кодд Е. Ф. Реляционная модель данных для больших совместно используемых банков данных // Системы управления базами данных.- 1995. N 1. — С. 145−160.
- Когаловский М. Р. Абстракции и модели в системах баз данных // Системы управления базами данных. 1998. — N 04−05. — С. 73−81.
- Когаловский М. Р. Очерк отечественной истории технологий баз данных (отрывок из книги «Энциклопедия технологий баз данных») // Открытые системы. 2002. — N 1.
- Кодд Э. Ф. Расширение реляционной модели для лучшего отражения семантики // Системы управления базами данных. 1996. — N 5. -С. 163−192.
- Системы баз данных третьего поколения: Манифест / Комитет по развитию функциональных возможностей СУБД // Системы управления базами данных. 1995. — N 2. — С. 143−159.
- Концепция информатизации здравоохранения липецкой области на 2004−2010 годы. Приложение N 1 к распоряжению администрации Липецкой области от 12 апреля 2004 г. N 288-р.
- Кормен Т. Алгоритмы: построение и анализ / Кормен Т., Лейзерсон Ч., Ривест Р. М.: МЦНМО, 2001. — 960 с.
- Коровин С. Е. Моделирование семантики и прагматики документа в нотации языка XML / Коровин С. Е., Мельников А. В., Кафтанников И. Л. // Известия Челябинского научного центра. 2002. — вып. 3(16).- С. 9−13.
- Крёнке Д. Теория и практика построения баз данных, 8-е изд. СПб.: Питер, 2003. — 800 с.
- Кузнецов С. Д. Введение в информационные системы // Системы управления базами данных. 1997. — N 02.
- Кузнецов С. Д. Направления исследований в области управления базами данных: краткий обзор // Системы управления базами данных.- 1995. N 1.
- Кузнецов С. Д. Основы современных баз данных // Информационно-аналитические материалы Центра информационных технологий, http: / /www. citforum, ru/ .
- Мальцев А. И. Алгебраические системы. М.: Наука, 1970. — 392 с.
- Максимов В. Алгоритмы поиска, или «Как искать неизвестно что» // Монитор. -1995. N 6.
- Марчук А. Г. К вопросу об идентификации электронных документов и коллекций / Марчук А. Г., Осипов А. Е. // Программирование. -2000. N 3. — С. 53−62.
- Мейер Д. Теория реляционных баз данных. Пер. с англ. М. К. Валиева и др.- - М.: Мир, 1987. — 608 с.
- Мюллер Р. Дж. Базы данных и UML. М.: Лори, 2002. — 420 с.
- Плоткин Б. И. Универсальная алгебра, алгебраическая логика и базы данных. М.: Наука, 1991. — 446с.
- Федоркова Г. О. Метод нестрогого соединения реляционных таблиц баз данных / Погодаев А. К., Федоркова Г. О. // Современные сложные системы управления CCCy/HTCS'2005: Сб. трудов международной научн.-практ.конф. 2005. — Т.1. — С. 252−259.
- Федоркова Г. О. Нестрогое соединение реляционных таблиц: хеширование по сигнатуре / Погодаев А. К., Федоркова Г. О. // Системы управления и информационные технологии. 2005. — N 2(19).- С. 93−95
- Федоркова Г. О. Нестрогое соединение таблиц в базах данных информационных систем / Погодаев А. К., Федоркова Г. О. // Теория и практика производства листового проката: Сб. науч. тр. 4.2. 2005.- С. 170−176.
- Погодаев А. К., Федоркова Г. О. Программный комплекс «Нестрогое реляционное соединение». М.: ФАП ВНТИЦ, 2005. Per. N 50 200 500 374 от 30.03.2005.
- Послед Б. С. Borland С++ Builder 6. Разработка приложений баз данных. М.: ДиаСофтЮП, 2003. — 320 с.
- Пржиялковский В. В. Абстракции в проектировании баз данных // Системы управления базами данных. 1998. — N 1−2. — С. 90−97
- Про SELECT из хранимой процедуры // Рассылка в рамках проекта «Открыто об Oracle». Выпуск 11. http://In.com.ua/~openxs/projects/oracle/oraOll.html.
- Программа исследований в области баз данных на следующее десятилетие / Асиломарский отчет о направлениях исследований в области баз данных // Открытые системы. 1999. — N 01.
- Рутковская Д. Нейронные сети, генетические алгоритмы и нечеткие системы / Рутковская Д., Пилиньский М., Рутковский JI. Изд-во: Горячая линия-Телеком, Радио и связь, 2004. — 452 с.
- Тони Стаблибайн Регулярные выражения. Карманный справочник. -Питер, 2004. 160 с.
- Бьерн Страуструп Язык программирования С++. Специальное издание. Невский Диалект, 2004. — 1104 с.
- Ульман Дж. Основы систем баз данных. М.: Финансы и статистика, 1983. — 334 с.
- Федоркова Г. О. Комбинаторные алгоритмы генерирования тождеств и многообразий конечных алгебраических систем // Вестник молодых ученых. Серия «Прикладная математика и механика». 2003. — N 2. -С. 59−66.
- Федоркова Г. О. Применение метода нечеткого поиска в операции соединения реляционных таблиц баз данных. Электронный журнал «Исследовано в России», 188, стр. 2002−2013, 2004 г. http://zhurnal.аре.relarn.ru/articles/2004/188.pdf
- Ходоровский В. В. К вопросу нормализации отношений в реляционных базах данных // Программирование. 2002. — N 1. — С. 55−71.
- Цаленко М. Ш. Моделирование семантики в базах данных. М.: Наука, 1989. — 287 с.
- Цаленко М. Ш. Реляционная модель данных с оценками в гейтинговых алгебрах // Программирование. 1995. — N 2. — С. 3−8.
- Чен, Питер Пин-Шен Модель «сущность-связь» — шаг к единому представлению данных // Системы управления базами данных. 1995.- N 3. С. 137−158.
- Шилд Г. Программирование на BORLAND С++ для профессионалов.- Пер. с англ. М.: ООО «Попурри», 1998. — 800 с.
- Aho А. V., Beeri С., Ulman J. D. The Theory of Joins in Relational Databases // ACM Transactions on Database Systems, 4(3), 1979.
- Atkinson M., Francois Bancilhon F., et al. The Object-Oriented Database System Manifesto // Proceedings of the First International Conferenceon Deductive and Object-Oriented Databases. Kyoto, Japan, 1989, pp. 223−240.
- Baeza-Yates, R. and Navarro, G. A practical q-Gram Index for Text Retrieval Allowing Errors // CLEI Electronic Journal, 1(2), 1998.
- Baeza-Yates, R. and Navarro, G. Faster Approximate String Matching // Algorithmica 23 (2), 1999, p. 127−158.
- Baeza-Yates, R. and Soza-Pollman, H. Analysis of Linear Hashing Revisited // Nordic Journal on Computing 5, 1998, p. 70−85.
- Bagai R., Orgun M. A. A Temporal Paraconsistent Relational Algebra for Incomplete and Inconsistent Information // Proceedings of the 33rd Annual ACM Southeast Conference, 1995, pp.240−248.
- A. P. Berman A new data structure for fast approximate matching // Technical Report 1994−03−02. Department of Computer Science, University of Washington. March, 1994.
- D. Chamberlin, J. Robie, and D. Florescu Quilt: An XML Query Language for Heterogeneous Data Sources // Lecture Notes in Computer Science, Springer-Verlag, 2000. http://www.almaden.ibm.com/cs/people/chamberlin/ quiltilncs.pdf.
- Chen P. P-S. The Entity-Relationship Model — Toward a Unified View of Data // ACM Transactions on Database Systems, 1(1), 1976. p.9−36.
- Chen P. P. S. A Preliminary Framework for Entity-Relationship Models // Entity-Relationship Approach to Information Modeling and Analysis, Saugus, Calif., 1981.
- Codd E. F. A Relation Model of Data for Large Shared Data Banks // Comm. ACM 13, 6, ACM, New York, London, Amsterdam, June 1970. P. 377−387.
- Codd E. F. Does Your DBMS Run By the Rules? // ComputerWorld, Oct 21, 1985.
- Codd E. F. Further Normalization of the Data Base Relational Model // Courant Computer Sci. Symposia (vol. 6: «Data-Base System»), ed. by R. Rustin, Prentice-Hall, Inc., Englewood Cliffs, New Jersey, 1972.
- Codd, E. F. Extending the Relational Database Model to Capture More Meaning // IBM Research Report RJ2599 (August 6th, 1979). Republished in ACM Transactions on Database Systems 4(4), December 1979.
- Codd E. F. Is Your DBMS Really Relational? // ComputerWorld, Oct 14, 1985.
- Codd, E. F. The Relational Model for Database Management Version 2. Reading, Mass.: Addison-Wesley, 1990.
- Cohen, William W. Integration od Heterogeneous Databases Without Common Domains Using Queries Based on Textual Similarity // Proc. ACM Sigmod-98, ACM Press, New York, 1998, pp. 201−212.
- Cohen, William W., Hirsh, Haym Joins that Generalize: Text Classification Using WHIRL // In Proceedings of the Fourth International Conference on Knowledge Discovery and Data Mining, August, 1998.
- Date, C.J. The Extended Relational Model RM/T // In C.J.Date, Relational Database Writings 1991−1994. Reading, Mass.: Addison-Wesley, 1995.
- Darwen H., Date С. J. The Third Manifesto // SIGMOD Record, Vol. 24, No. 1, March 1995. pp.39−49.
- Date, C.J. and Hugh Darwen A Guide to the SQL Standard (4th edition) // Reading, Mass.: Addison-Wesley, 1997.
- Date. C. J. Thirty years of relational: Extending the Relational Model // Intelligent Enterprise, June 1, 1999, Volume 2, Number 8.
- Date, C. J. What is a Distributed Database System // Date C. J. Relational Database writings 1985−1989. — Reading, Mass.: Addison-Wesley, 1990.
- Date C. J. When’s an extension not an extension? // Intelligent Enterprise, June 1, 1999, Volume 2, Number 8
- Dayal, U., Goodman N., Kata R.H. An Extended Relational Algebra with Control Over Duplicate Elimination // Proc. ACM PODS 1982.
- Debabrata Dey, Sumit Sarkar A Probabilistic Relational Model and Algebra // ACM Trans. Database Syst. 21(3), 1996. p.339−369.
- Fundamental Algorithms for a declarative Pattern matching, Stefan Kurtz. Ph. D. Thesis.
- J. Galindo, J. M. Medina, M. Carmen Garrido Fuzzy Division in Fuzzy Relational Databases. An Approach // Fuzzy Sets and Systems, Volume 121, Number 3, 1 August 2001. P. 471−490.
- Janifer Gatenby Internet, Interoperability and Standards Filling the Gaps // National Information Standards Organization, August 23, 2000. Available: http://www.niso.org/press/whitepapers/Gatenby.html
- Farshad Hakimpour, Andreas Geppert Resolving Semantic Heterogeneity in Schema Integration: an Ontology Based Approach // International Conference on Formal Ontology in Information Systems (FOIS-2001), pp. 297−308, ACM press.
- L. Kalinichenko, M. Kogalovsky, S. Kuznetsov and B. Novikov. Database Research Activities in Russia: a Brief Overview. // Proc. of the ADBIS-DASFAA Symposium, 234−245, Prague, Chech, September 2000.
- Kent, William Solving Domain Mismatch and Schema Mismatch Problems with an Object-Oriented Database Programming Language // 17th International Conference on Very Large Data Bases, 1991, p. 147 160.
- MySQL Documentation http://www.mysql.com/documentation/.
- Oracle Documentation http://docs.oracle.com/.
- PHP documentation http://www.php.net/docs.php/.
- PostgreSQL: Documentation http://www.postgresql.org/docs/.
- H. Shang & Т. H. Merrett Tries for Approximate String Matching // IEEE Trans, on Knowledge and Data Engineering, special issue on Digital Libraries, Nabil R. Adam, ed., 8 4(August, 1996) pp. 540−547.
- Snodgrass R.T. The Temporal Query Language TSQL2 // Dortrecht, Netherlands: Kluwer Academic Pub., 1995.
- SQL Server 2000 Books Online (Updated 2004) http://www.microsoft.com/sql/I
- ISO/IEC 9075:1992 «Database Language SQL»
- ISO/IEC 9075:1999 «Database Language SQL»