- •Понятие информации. Информация и данные.
- •Понятие экономической информации. Виды реквизитов.
- •Организация данных на машинных носителях. Структурные элементы для хранения данных – массивы, списки, деревья, графы.
- •Единицы физической и логической организации данных.
- •Базы данных – основа аис.
- •Уровни моделей предметной области в аис
- •Классификация моделей данных в аис
- •Способы документирования моделей в аис.
- •Реляционная модель данных. Основные термины реляционной модели.
- •Реляционная алгебра. Основные понятия – атомарное значение, домен, отношение.
- •Реляционная алгебра. Операция объединения.
- •Реляционная алгебра. Операция пересечения.
- •Реляционная алгебра. Операция вычитания.
- •Реляционная алгебра. Операция – декартово произведение.
- •Реляционная алгебра. Операция выборки.
- •Реляционная алгебра. Операция проекции.
- •Реляционная алгебра. Операция соединения.
- •Реляционная алгебра. Операция деления.
- •Нормализация модели. Цель нормализации. Аномалии бд.
- •Правила нормализации логической модели. Целостность бд.
- •Файл базы данных в ms Access. Создание бд, открытие бд, сохранение бд.
- •Объекты бд в ms Access. Их назначение.
- •Создание таблиц в ms Access. Режимы просмотра.
- •Типы данных в таблицах ms Access.
- •Назначение ключевого поля в таблице.
- •Сортировка и фильтрация записей в таблицах.
- •Разработка форм. Их назначение и режимы просмотра.
- •Работа с формой в режиме конструктора. Области формы, их назначение и свойства.
- •Элементы формы: надпись, линия, прямоугольник. Их назначение и свойства.
- •Элементы формы: поле, список, поле со списком. Способы добавления этих элементов в форму, их назначение и свойства.
- •Элементы формы: переключатель, выключатель, флажок, группа переключателей. Способы добавления этих элементов в форму, их назначение и свойства.
- •Элемент формы – кнопка. Ее назначение и настройка.
- •Создание многотабличных форм.
- •Разработка запросов. Режимы просмотра и виды запросов.
- •Запросы на выборку. Условия отбора записей.
- •Вычисляемые поля в запросах. Запросы с параметром.
- •Группрвые операции в запросах.
- •Запросы на обновление, добавление и удаление.
- •Перекрестные запросы.
- •Макет отчета. Мастер и Конструктор отчетов.
- •Конструирование отчетов. Области отчета, их назначение и свойства.
- •Конструирование отчетов. Элементы, добавляемые в отчет, их назначение и свойства.
- •Вычисляемые поля в отчетах.
- •Создание макросов. Структура макроса.
- •Выполнение макросов.
- •Работа с базой данных, открытой для общего пользования. Репликации базы данных.
- •Язык sql. Операторы манипулирования данными (dml).
- •Язык sql. Операторы определения объектов бд (ddl).
- •Надежность систем обработки данных. Защита от потери информации. Восстановление базы данных.
- •Базы данных коллективного пользования. Компоненты модели клиент/сервер.
- •Автоматизация. Сервер приложений. Клиент приложений.
- •Использование модулей vba. Стандартные модули и обработчики событий форм и отчетов.
- •Возможности субд sql Server.
- •Хранимые процедуры. Триггеры.
- •Многомерные хранилища данных. Модели кубов данных.
- •Витрины данных. Методы организации витрин данных.
- •Понятие мер, измерений, иерархий и агрегирования данных.
Многомерные хранилища данных. Модели кубов данных.
В многомерных хранилищах данных содержатся агрегатные данные различной степени подробности, например, объемы продаж по дням, месяцам, годам, по категориям товаров и т.п. Цель хранения агрегатных данных - сократить время выполнения запросов, поскольку в большинстве случаев для анализа и прогнозов интересны не детальные, а суммарные данные. Поэтому при создании многомерной базы данных всегда вычисляются и сохраняются некоторые агрегатные данные.
Отметим, что сохранение всех агрегатных данных не всегда оправданно. Дело в том, что при добавлении новых измерений объем данных, составляющих куб, растет экспоненциально (иногда говорят о <взрывном росте> объема данных). Если говорить более точно, степень роста объема агрегатных данных зависит от количества измерений куба и членов измерений на различных уровнях иерархий этих измерений. Для решения проблемы <взрывного роста> применяются разнообразные схемы, позволяющие при вычислении далеко не всех возможных агрегатных данных достичь приемлемой скорости выполнения запросов.
Как исходные, так и агрегатные данные могут храниться либо в реляционных, либо в многомерных структурах. Поэтому в настоящее время применяются три способа хранения данных:
MOLAP (Multidimensional OLAP) -- исходные и агрегатные данные хранятся в многомерной базе данных. Хранение данных в многомерных структурах позволяет манипулировать данными как многомерным массивом, благодаря чему скорость вычисления агрегатных значений одинакова для любого из измерений. Однако в этом случае многомерная база данных оказывается избыточной, так как многомерные данные полностью содержат исходные реляционные данные.
ROLAP (Relational OLAP) - исходные данные остаются в той же реляционной базе данных, где они изначально и находились. Агрегатные же данные помещают в специально созданные для их хранения служебные таблицы в той же базе данных.
HOLAP (Hybrid OLAP) - исходные данные остаются в той же реляционной базе данных, где они изначально находились, а агрегатные данные хранятся в многомерной базе данных.
Некоторые OLAP-средства поддерживают хранение данных только в реляционных структурах, некоторые - только в многомерных. Однако большинство современных серверных OLAP-средств поддерживают все три способа хранения данных. Выбор способа хранения зависит от объема и структуры исходных данных, требований к скорости выполнения запросов и частоты обновления OLAP-кубов.
Отметим также, что подавляющее большинство современных OLAP-средств не хранит <пустых> значений (примером <пустого> значения может быть отсутствие продаж сезонного товара вне сезона).
Витрины данных. Методы организации витрин данных.
Витрина данных— срез хранилища данных, представляющий собой массив тематической, узконаправленной информации, ориентированный, например, на пользователей одной рабочей группы или департамента.
Витрины данных по определению намного дешевле и проще в построении, чем хранилища данных, их внедрение не требует больших временных затрат и приносит быстрый и ощутимый эффект. В то же время необходимо понимать, что при таком подходе независимые витрины данных не будут создавать единой информационной системы компании, не будет единой системы извлечения информации, консолидации, управления и обслуживания.
Если компания небольшая, она может смело идти на создание автономных витрин данных. Если же компания крупная, то создание автономных витрин данных должно координироваться из единого центра с тем, чтобы в итоге придти к созданию единого хранилища данных компании.
Создание витрины данных
Создание витрины данных это создание соответствующей базы данных и системы ее загрузки. Если создание базы данных вопрос чисто технический, создание системы загрузки представляет основную сложность. Эта система содержит три этапа:
извлечение данных из исходных систем; преобразование их в требуемую форму; загрузка подготовленных данных в витрину.
1. Извлечение данных требует точного знания структуры исходных систем. Структуры и взаимосвязи таблиц, структуры информации в исходной системе. Необходимо четко знать из каких таблиц и полей необходимо извлекать данные и какова структура этих данных.
2. Исходная система изначально никак не ориентирована на работу с витриной данных и данные, извлекаемые из нее, не предназначены для непосредственного использования и должны пройти ряд преобразований. Процесс этих преобразований зависит и от структуры исходных систем, и от требований к самой витрине данных, он может заключать в себе множество функций:
Создание агрегатных данных
Изменение форматов данных.
Проверку достоверности и целостности данных.
Удаление избыточных данных И т.д.
Все эти преобразования осуществляются только на этапе ввода данных в витрину, что обеспечивает высокую скорость извлечения данных из витрины и наилучшее представление этих данных с точки зрения пользователя. В конечном итоге это приводит к лучшему информационному обеспечению пользователя, и способствуют быстрому принятию им правильных управленческих решений.
3. Данные в витрине должны соответствовать данным исходных систем, которые, естественно, изменяются со временем. Поэтому инструменты, осуществляющие преобразования и загрузку данных в витрину должны запускаться периодически при определенных изменениях данных исходных систем и/или автоматически по определенному расписанию.
Из изложенного вытекает довольно важный вывод. Нельзя купить готовую витрину данных для своей компании. Витрина данных это эксклюзивный заказной продукт, который должен создаваться непосредственно под конкретную компанию, под всю ее специфику.