Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информационные технологии 22-26.docx
Скачиваний:
5
Добавлен:
14.08.2019
Размер:
51.37 Кб
Скачать

Достоинства и недостатки рмд

Широкое распространение реляционной модели объясняется в первую очередь простотой представления и формирования базы данных, универсальностью и удобством обработки данных, которая осуществляется с помощью декларативного языка запросов SQL (Structured Query Language).Моделирование предметной области в рамках реляционной модели создаёт некоторые сложности, т.к. в этой модели нет специальных средств для отображения различных типов связей и агрегатов. Отсутствие агрегатов приводит к тому, что при проектировании реляционной БД приходится проводить нормализацию отношений. После нормализации данные об одной сущности предметной области распределяются по нескольким таблицам, что усложняет работу с БД. Отсутствие специальных механизмов навигации (как в иерархической или сетевой моделях), с одной стороны, ведёт к упрощению модели, а с другой – к многократному увеличению времени на извлечение данных, т.к. во многих случаях требуется просмотреть всё отношение для поиска нужных данных.В РМД нет понятий режим включения и класс членства. Но с помощью внешних ключей и дополнительных возможностей СУБД их можно эмулиро-вать. Итак, реляционная модель данных – это модель данных, основанная на представлении данных в виде набора отношений, каждое из которых является подмножеством декартова произведения определённых множеств. Манипулирование данными в РМД осуществляется с помощью операций реляционной алгебры (РА) или реляционного исчисления [1]. Реляционная алгебра основана на теории множеств, а реляционное исчисление базируется на математической логике (вернее, на исчислении предикатов первого порядка). Изучение реляционного исчисления выходит за рамки данного пособия. Мы рассмотрим только операции реляционной алгебры.

Операции реляционной алгебры

Операндами для операций реляционной алгебры являются реляционные отношения. Результатом выполнения операций РА также является отношение. Таким образом, механизм реляционной алгебры замкнут относительно понятия отношения. Это позволяет применять операции РА каскадно.

Использование операций РА накладывает на отношения два ограничения:

  • -порядок столбцов (полей) в отношении фиксирован;

  • -отношения конечны.

Существует пять основных операций реляционной алгебры – проекция, селекция, декартово произведение, разность, объединение, – и три вспомога-тельных: соединение, пересечение и деление. Вспомогательные операции могут быть выражены через основные, но в некоторых системах реализуются с помощью специальных команд (ключевых слов) для удобства пользователей.

1. Проекция (projection). Это унарная операция (выполняемая над одним отношением), служащая для выбора подмножества атрибутов из отношения R. Она уменьшает арность отношения и может уменьшить мощность отношения за счёт исключения одинаковых кортежей.

2. Селекция (selection). Это унарная операция, результатом которой является подмножество кортежей исходного отношения, соответствующих условиям, которые накладываются на значения определённых атрибутов.

3. Декартово произведение (Cartesian product). Это бинарная операция над разносхемными отношениями, соответст-вующая определению декартова произведения для РМД.

4.Объединение (union).Объединением двух односхемных отношений R и S называется отношение T = R ∪ S, которое включает в себя все кортежи обоих отношений без повторов.

5. Разность (minus).Разностью односхемных отношений R и S называется множество кортежей R, не входящих в S.

Следующие три операции являются вспомогательными операциями РА.

6. Пересечение (intersection).Пересечение двух односхемных отношений R и S есть подмножество кортежей, принадлежащих обоим отношениям. Это можно выразить через разность:R∩S=R - (R-S))

7. Соединение (join).Эта операция определяет подмножество декартова произведения двух разносхемных отношений. Кортеж декартова произведения входит в результирующее отношение, если для атрибутов разных исходных отноше-ний выполняется некоторое условие F. Соединение может быть выражено так:

RS=F(R×S))     F

Если условием является равенство атрибутов исходных отношений, такая операция называется эквисоединениемЕстественное соединение – это эквисоединение по одинаковым атрибутам исходных отношений.

8.Деление (division).Пусть отношение R содержит атрибуты {r1,r2,...,rk, rk+1,...,rn}, а отношение S – атрибуты {rk+1,...,rn}. Тогда результирующее отношение содержит атрибуты {r1,r2,...,rk}. Кортеж отношения R включается в результирующее отношение, если его декартово произведение с отношением S входит в R

Языком обработки данных, основанным на реляционной алгебре, является SQL

24. Базы данных бывают фактографическими и документальными. В фактографических БД содержатся краткие сведения об описываемых объектах, представленные в строго определенном формате. Из приведенных выше примеров две первые БД скорее всего будут организованы как фактографические. В БД библиотеки о каждой книге хранятся библиографические сведения: год издания, автор, название и пр. Разумеется текст книги в ней содержаться не будет. В БД отдела кадров учреждения хранятся анкетные данные сотрудников: фамилия, имя, отчество; год и место рождения. Фактографическая база данных — база, представленная поисковым образом документа и текстом в его полном или частичном объёмах, т. е. полнотекстовая или фрагментарная база. При этом содержание вводимых в ЭВМ фрагментов текстов определяется в соответствии с потенциальными информационными потребностями, характеристиками технических средств, возможностями программы и т.д. Для фактографической базы характерны соответствия «элемент = файл». То есть на каждого адресата заводится свой компьютерный файл. Характерной особенностью фактографических систем является то, что они работают не с текстом, а с фактическими сведениями, которые представлены в виде записей. Основные компоненты ФС - это сами БД и системы управления БД (СУБД). На базе ФС создаются справочники, системы анализа и управления предприятиями, бухгалтерские системы. В дальнейшем будем рассматривать фактографические системы. СУБД должна предоставлять доступ к данным любым категориям пользователей, включая и тех, которые практически не имеют или не хотят иметь представления:  о физическом размещении в памяти данных и их описаний;  о механизмах поиска запрашиваемых данных;  о проблемах, возникающих при одновременном запросе одних и тех же данных многими пользователями (прикладными программами);  о способах обеспечения защиты данных от некорректных обновлений и (или) несанкционированного доступа;  о поддержании баз данных в актуальном состоянии и множестве других функций СУБД. Базы данных в третьем и четвертом примерах наверняка будут организованы как документальные. Первая из них будет включать в себя тексты законов; вторая — тексты и ноты песен; биографическую и творческую справочную информацию о композиторах, поэтах, исполнителях; звуковые записи и видеоклипы. Следовательно, документальная БД содержит обширную информацию самого разного типа: текстовую, графическую, звуковую, мультимедийную. Документографические БД содержат описания документов. В зависимости от содержания описания различают документографические БД типов БО (только библиографическое описание документа), БК (библиографическое описание и ключевые слова) и БКР (библиографическое описание, ключевые слова, реферат или аннотация). Появились также полнотекстовые БД, содержащие полные тексты документов, которые являются собственно документальными. Документографические системы, как правило, строятся по двухконтурной схеме: первый контур содержит документографическую БД и используется для автоматизированного поиска документов, второй контур в случае необходимости обеспечивает выдачу полного текста документа в виде копии первоисточника на бумаге, микрофильме или выводит текст на экран с оптического диска (в некоторых случаях с жесткого магнитного диска большой емкости). В составе данного класса выделены следующие виды БД: - по публикуемым научно-техническим документам ; - по публикуемым документам в области общественных наук; - по патентным документам; - по отчетам по НИР, ОКР, программным средствам ; - по материалам межотраслевого обмена (научно-техническим достижениям, ППТО, ИЛ, каталожная, выставочная информация и т.п.); - по стандартам и другой нормативно-технической документации; - библиографические БД, создаваемые в библиотеках, книгоиздательских и книготорговых организациях; - реферативные и полнотекстовые БД по общественно-политической информации, создаваемые средствами массовой информации; - БД законодательной и правовой информации; - документографические документографические по специальным видам документов ; - БД по архивным документам. Анализ состояния дел с ДБД различных видов в стране показывает, что в настоящее время наибольшее развитие получили ДБД документографического типа, главным образом, по опубликованным документам в области научнотехнической информации, общественных наук, патентным документам, отчетам по НИР, ОКР и другим видам документов, созданные в рамках системы научно-технической информации. Современные информационные технологии постепенно стирают границу между фактографическими и документальными БД. Существуют средства, позволяющие легко подключать любой документ (текстовый, графический, звуковой) к фактографической базе данных. Документальные БД характеризуются нерегулярностью типов данных, слабо структурированной информацией, записями неопределенной длины. Традиционно, в документальных БД структуры ориентированы в основном на поиск, а не на изменение, плохо представлены решения для лексического анализа, реализуются в специальных СУБД. Предпосылками к проектированию модели послужила возможность реализации документальных БД в реляционной СУБД в связи с развитием фактографических СУБД, которые уменьшают ограничения на поля и время доступа. Перечислим типы баз данных, получившие к настоящему времени наибольшее развитие, что связано с внедрением информационных технологий в специализированные отрасли хозяйства: - документографические и документальные БД, создаваемые в средствах массовой информации; - БД по промышленной, строительной и сельскохозяйственной продукции; - БД по экономической и конъюнктурной информации (статистическая, кредитно-финансовая, внешнеторговая); - фактографические базы социальных данных, включающие сведения о населении и о социальной среде; - БД транспортных систем; - справочные данные для населения и учреждений (энциклопедии и справочники, расписания самолетов и поездов, адреса и телефоны граждан и организаций и др.); - ресурсные БД , включающие фактографическую информацию о природных ресурсах (земля, вода, недра, биоресурсы, гидрометеорология, вторичные ресурсы и отходы, экологическая обстановка); - фактографические базы и банки научных данных, обеспечивающие фундаментальные научные исследования; - фактографические БД в области культуры и искусства; - лингвистические БД, т.е. Документальные системы предназначены для работы с документами на естественном языке: книги, тезисы, статьи... Наиболее распространенным видом ДС явлюется информационно-поисковые системы (ИПС), которые предназначены для накопления и поиска по различным критериям документов. В состав ИПС входят: программные средства, поисковый массив документов и средства поддержки информационного языка этой системы. Программные средства ИПС служат для организации ввода и хранения информации, а также обработки пользовательских запросов на поиск документов. Поисковый массив документов обычно называют БД, и он не содержит текстов, а включает только библиографические сведения: рефераты и аннотации. При выполнении поиска документа используют поисковые образы, отражающие содержание документа. Эти образы строятся путем индексирования документов и являются ключевыми словами поискового документа. Информационные языки (ИЯ) в ИПС строятся на базе ограниченных естественных языков. Это приводит к неоднозначной интерпретации смысла запросов. Для решения этой проблемы вводятся словари - тезаурусы. Они описывают лексические единицы языка и смысловые связи между ними. Наибольшим распространением для реализации таких ИЯ получили языки дескрипторного типа, которые в качестве лексических единиц или дескрипторов используют слова или словосочетания, соответствующие основным понятиям предметной области. Дескрипторы заносятся в тезаурус ИПС. Информационный запрос формируется на таком ИЯ, затем преобразуется в поисковый образ запроса (ПОЗ), ПОЗ сопоставляется с поисковыми образами документов по критерию смыслового соответствия, и в результате выдаются все документы, которые оказались релевантными этому запросу.