- •1.История развития средств компьютерной обработки данных. Обоснование концепции баз данных, основные положения концепции.
- •2. Архитектура представления информации в концепции баз данных.
- •Внешние представления
- •3. Понятие системы управления базами данных (субд).
- •4. Понятие и роль схемы и подсхемы.
- •5. База данных как средство отображения информационной модели предметной области.
- •6. Модели данных. Классические модели данных (плоская, иерархическая, сетевая)
- •8. Операции реляционной алгебры. Реляционное исчисление.
- •9. Языки манипулирования данными sql и qbe (общие сведения).
- •10. Использование sql для создания и актуализации баз данных, формирования представлений, хранимых процедур и триггеров, запросов к базе данных.
- •Команда выборки информации
- •Команда создания индекса
- •Команды удаления файла (таблицы) и индекса
- •1 1. Системы управления базами данных. Общие свойства субд. Обобщенная схема обмена данных с использованием субд.
- •12.Типовые информационные процедуры, реализуемые субд.
- •13.Общие сведения о субд первого поколения (ims-ока, adabas, ids-Банк ос), реляционных субд (FoxPro, Access), субд, обеспечивающих технологию клиент-сервер (oracle, ms sql, my sql).
- •14.Информационные системы, основанные на бд и субд. Физическая организация базы данных; хешированные, индексные файлы; защита баз данных; целостность и сохранность баз данных.
- •15.Проектирование баз данных. Проектирование с использованием метода сущность – связь, средства поддержки проектирования (erWin).
- •16.Традиционные методики проектирования бд, современная интеграционная методика проектирования.
- •17.Проектирование системы баз данных на принципах единой информационной среды.
- •18.Современные направления использования баз данных.
- •19.Распределенные базы данных и распределенная обработка.
- •20.Понятие транзакции и параллельная обработка. Oltp, olap, Data Mining технологии.
- •21.Единая информационная среда.
- •22. Базы знаний.
- •23. Хранилища данных. Базы данных большого объема.
18.Современные направления использования баз данных.
Новые направления использования БД связаны, в основном:
с повсеместным использованием корпоративных и глобальных вычислительных сетей; со значительной «историей» функционирования информационных систем.
Первое направление (работа в сети), в свою очередь, связано:
- с проблемами параллельной (одновременной) работы многих, удаленных приложений (пользователей) с одной и той же БД (новые проблемы комплексного использования информации, теперь уже баз данных);
- со стремлением повышения надежности и эффективности работы информационных систем за счет распределения данных и их обработки между узлами сети.
Второе направление (накопление информации) приводит:
- к необходимости интеграции данных и приложений созданных в разные периоды времени, в различных информационно-программных средах (ОС, СУБД, инструментальных средствах);
- к новым подходам к использованию «исторических» данных (Warehouse , OLAP , Data Mining , Management knowledge)
Выделяют три направления в области СУБД следующего поколения.
Направление Postgres. Основная характеристика: максимальное следование (насколько это возможно с учетом новых требований) известным принципам организации СУБД (если не считать коренной переделки системы управления внешней памятью).
Направление Exodus/Genesis. Основная характеристика: создание собственно не системы, а генератора систем, наиболее полно соответствующих потребностям приложений. Решение достигается путем создания наборов модулей со стандартизованными интерфейсами, причем идея распространяется вплоть до самых базисовых слоев системы.
Направление Starburst. Основная характеристика: достижение расширяемости системы и ее приспосабливаемости к нуждам конкретных приложений путем использования стандартного механизма управления правилами. По сути дела, система представляет собой некоторый интерпретатор системы правил и набор модулей-действий, вызываемых в соответствии с этими правилами. Можно изменять наборы правил (существует специальный язык задания правил) или изменять действия, подставляя другие модули с тем же интерфейсом.
В целом можно сказать, что СУБД следующего поколения - это прямые наследники реляционных систем. Тем не менее, различные направления систем третьего поколения стоит рассмотреть отдельно, поскольку они обладают некоторыми разными характеристиками.
19.Распределенные базы данных и распределенная обработка.
Распределенная база данных (РБД) - система логически интегрированных и территориально распределенных БД, языковых, программных, технических и организационных средств, предназначенных для создания, ведения и обработки информации. Информация физически хранится на разных ЭВМ, связанных сетью передачи данных. Любой узел (участок) может выполнять приложение и участвовать в работе, по крайней мере, одного приложения.
Большинство требований, предъявляемых к РБД, аналогично требованиям к централизованным БД, но в РБД иногда полезна избыточность.
Доп. специфическими требованиями являются:
1) язык описания данных(ЯОД) в рамках схемы должен быть один для всех локальных БД;
2) доступ должен быть коллективным к любой области РБД с соответствующей защитой информации;
3) подсхемы должны быть определены в месте сосредоточения алгоритмов (приложений, процессов) пользователя;
4) степень централизации должна быть разумной;
5) необходимы сбор и обработка информации об эффективности функционирования РБД.
В РБД выделяют пользовательский, глобальный (концептуальный), фрагментарный (логический) и распределенный (локализационный) уровни представления данных, определяющие сетевую СУБД.
Глобальный уровень, определяется при проектировании теми же методами, что и концептуальная модель централизованной БД. Не все данные глобального уровня доступны конкретному пользователю.
Пользовательский уровень состоит из фрагментов глобального уровня, которые составляют фрагментарный, логический уровень.
Выделяют горизонтальную и вертикальную фрагментацию (расчленение).
Горизонтальное фрагментирование связано с делением данных по узлам. Горизонтальные фрагменты не перекрываются.
Вертикальная фрагментация связана с группированием данных по задачам.
Фрагментация чаще всего не предполагает дублирования информации в узлах. В то же время при размещении фрагментов по узлам (локализации) распределенного уровня в узлах разрешается иметь копии той или иной части РБД. После размещения каждый узел имеет локальное, узловое представление (локальная логическая модель).
Физическую реализацию (логического) фрагмента называют хранимым фрагментом.
Сеть в РБД образуют сетевые операционные системы (например, Windows NT, Novell NetWare). В качестве СУБД, изначально предназначавшихся для использования в сети, следует назвать BTrieve, Oracle, Interbase, Sybase, Informix.
В силу распределенности данных особую значимость приобретает словарь данных (справочник) РБД, который в отличие от словаря централизованной БД, имеет распределенную, многоуровневую структуру.
В общем случае могут быть выделены сетевой, общий внешний, общий концептуальный, локальные внешние, локальные концептуальные и внутренние составляющие словаря РБД.
Естественно, что для работы в РБД необходимы администраторы РБД и локальных БД, рабочими инструментами которых являются перечисленные словари.
Пользовательский запрос, определяемый приложением, поступает в систему управления распределенной базы данных (СУРБД) и через сетевую и локальную операционные системы попадает в локальную СУБД. Если запрос связан с локализованными данными, СУБД осуществляет вызов данных из локальной БД, которые поступают пользователю. Если часть данных для выполнения приложения находится в другой локальной БД, локальная СУБД дополнительно через локальные и сетевые операционные системы осуществляет удаленный вызов процедуры (Remote Procedure Call - PRC), после выполнения которой данные передаются пользователю.
Возможны четыре стратегии хранения данных: централизованная (часто обеспечиваемая архитектурой клиент/сервер), расчленение (фрагментации), дублирование, смешанная.