Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 2007.docx
Скачиваний:
55
Добавлен:
21.04.2019
Размер:
11.87 Mб
Скачать

Московская финансово-промышленная академия

 

 

Кафедра Информационного менеджмента и электронной коммерции

 

 

Алексеева Т. В.

 

 

 

Учебное пособие

по курсу

«Информационно-аналитические системы»

 

 

 

Москва

2007

 

Содержание

 

 

 

 

 

Тема 1. Информация в контексте современной экономики. 5

 

Тема 2. Анализ информации на предприятии. 12

 

Тема 3. Информационно – аналитическая система как инструмент проведения экономического анализа. 21

 

Тема 4. Хранилища данных. 28

 

Тема 5. Оперативный анализ данных. 37

 

Тема 6. Интеллектуальный анализ данных. 46

 

Тема 7. Инструментальные средства автоматизации аналитической работы и планирования. 53

 

Тема 8. Программные инструментальные средства информационно – аналитических систем. 60

 

 

Глоссарий

BI  (Business Intelligence) - это процесс анализа информации, выработки интуиции и понимания для улучшенного и неформального принятия решений бизнес-пользователями, а также инструменты для извлечения из данных значимой для бизнеса информации.

Data Mining - Интеллектуальный анализ данных

Data Mining — это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.

Data Warehouse - Хранилища данных или Склады данных.

DeskTop-системы  - системы автоматизации труда одного специалиста.

Drilling down  - операция спуска.

DSS - Decision Support System

EIS (Executive Information Systems) - информационная система руководителя (ИСР).

ETL-средства (extraction, transformation, loading) - средства извлечения, преобразования и загрузки данных

HOLAP (Hybrid OLAP) – гибридный OLAP

Knowledge Discovery in Databases (KDD)– это процесс поиска полезных знаний в "сырых" данных

MOLAP (Multidimensional OLAP) – многомерный OLAP

OLAP – куб (гиперкуб, метакуб) – многомерный набор данных.

OLAP (On-Line Analytical Processing,) -  оперативная аналитическая обработка данных

OLAP-клиент – инструментальное средство, которое обращается с запросами к имеющимся источникам данных, формирует OLAP – куб и выполняет промежуточные вычисления в памяти клиентского компьютера, отображает полученные результаты в  аналитических интерфейсах.

OLAP-компонента – это инструмент разработчика. С ее помощью разрабатываются клиентские OLAP-программы.

OLAP-отчеты – это интерфейсы для OLAP-анализа данных из БД или микрокубов, представляющие собой динамические OLAP-таблицы, которые сопровождаются синхронной диаграммой (графиком).

OLAP-приложение (файл формата *.caf) – отдельный программный ресурс (репозиторий метаданных), в котором хранятся настройки источников данных, запросов к источникам данных и аналитические отчеты.

OLAP-продукты - это готовые прикладные решения для конечного пользователя.

OLAP-сервер – это инструментальное средство, которое производит вычисление и хранение агрегатных данных, предоставляя клиентскому приложению результаты запросов к многомерным кубам, которые хранятся на сервере.

OLAP-таблица – таблица, автоматически суммирующая данные (факты) в различных разрезах (измерениях) и позволяющая интерактивно управлять вычислениями и формой отчета

OLTP-системы (On-Line Transaction Processing) – системы оперативной обработки транзакций.

PivotTable - сводная таблица.

ROLAP (Relational OLAP) – реляционный OLAP

Rolling up  - операция подъема.

Агрегация данных – это вычисление обобщенных показателей из детальных данных для поддержки стратегического или тактического управления.

Агрегирование данных - суммирование итогов по заданным в репозитории признакам.

Ассоциация -  связь, возникающая при определенных условиях между двумя или несколькими событиями.

Витрина данных – это предметно-ориентированное хранилище данных, как правило, агрегированной информации, предназначенное для использования группой пользователей в рамках конкретного вида деятельности предприятия, например маркетинга и т.д.

Гиперкубическая модель – модель данных, в которой все Показатели должны определяться одним и тем же набором Измерений.

Двумерная кросс-таблица - матрица значений, каждая ячейка которой лежит на пересечении значений атрибутов.

Деревья решений - это упрощенная форма индукции логических правил.

OLAP Диаграмма – синхронное с OLAP-таблицей графическое представление данных.

Единица информации - набор символов, которому придаётся определенный смысл.

Запросы – SQL-запросы к источникам данных, описываемые в системе на уровне правил объединения таблиц источников данных по ключевым полям, условия фильтрации данных и набора возвращаемых полей.

ИАД – интеллектуальный анализ данных.

ИАС – информационные аналитические системы

Измерение - это множество однотипных данных, образующих одну из граней гиперкуба.

Инструментальные OLAP-системы – это программные продукты, предназначенные для создания аналитических приложений

Интеграция данных – это объединение данных, которые изначально вводятся в разные  системы.

Информационная культура - это область корпоративной культуры, определяющая качество обмена информацией и знаниями в организации.

Информационное пространство - совокупность  банков и баз данных, технологий их сопровождения и использования, информационных телекоммуникационных систем, функционирующих на основе общих принципов и обеспечивающих информационное взаимодействие организаций и граждан и удовлетворение их информационных потребностей.

Информационная компетентность - общая способность к эффективному использованию различных источников информации в процессе познавательной деятельности при решении конкретных задач в реальных жизненных ситуациях.

Информационные ресурсы - это отдельные документы и отдельные массивы документов, документы и массивы документов в информационных системах: библиотеках, архивах, фондах, банках данных, других видах информационных систем.

Информация  – это сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представления.

Источники данных – локальные таблицы и реляционные БД автоматизированных систем, в которых хранятся корпоративные данные для анализа.

Классификациясистема соподчиненных понятий (классов объектов) какой-либо предметной области, используемая для установления связей между этими понятиями.

Кластеризация - отличается от классификации тем, что сами группы заранее не заданы.

Кластерный анализ – интерфейс, позволяющий объединять объекты в группы (кластеры) по заданным признакам, сравнивать группы, выявлять среди них крупные (наиболее влиятельные) и мелкие (наименее влиятельные).

Консолидация данных – это сбор в единую базу данных из удаленных филиалов многофилиального предприятия, или предприятий, входящих в холдинг.

Контур OLAPBrowser – средство для выпуска мобильных отчетов через Интранет/Интернет, в локальной сети и на ПК.

Контур Генератор кубов – средство для пакетного создания мобильных отчетов по заданным сценариям из различных информационных систем.

Контур Дизайнер кубов – средство для проектирования мобильных отчетов из различных информационных систем и настройки сценариев пакетного создания отчетов.

Контур Стандарт – средство для выпуска отчетов в режиме on-line из информационных систем.

ЛПР – лицо, принимающее решение.

Метод – способ теоретического исследования или практического осуществления чего-нибудь.

Методика – совокупность методов практического выполнения.

Микрокуб — небольшая многомерная база данных.

Микрокуб Контур – это мобильный контейнер аналитических отчетов и данных для анализа.

Нейронные сети - средство обработки информации, представляют собой наборы соединенных узлов, каждый из которых имеет вход, выход и активационную функцию.

Область активных измерений – строки и столбцы OLAP-таблицы.

Область неактивных измерений (фильтры) – область, содержащая измерения, не отображенные в OLAP-таблице, но влияющие на представленные в ней данные.

Область фактов – таблица с числовыми данными, над которыми выполняются вычисления.

Поворот - добавление нового признака анализа.

Показатель – это высказывание с законченным смыслом, включающее как название переменной величины, так и её конкретное количественное значение со всеми качественными признаками,  необходимыми  для   идентификации   последнего.

Показатель - это поле (обычно цифровое), значения которого однозначно определяются фиксированным набором Измерений.

Поликубическая модель – модель данных, содержащая несколько гиперкубов с различной размерностью и с различными Измерениями в качестве их граней.

Прием - способ осуществления чего-нибудь.

Проекция - выборка подмножества по задаваемой совокупности измерений.

Раскрытие - декомпозиция признака агрегации на компоненты.

Реквизит - это информационное отображение свойства объекта, какого-либо процесса или явления.

Репозиторий - описание структуры информационного хранилища.

Свертка - операция обратная раскрытию, т.е. агрегация признака.

Сечение или срез - выделение подмножества данных по конкретным значениям одного или нескольких измерений.

СОД – система обработки данных

Составная единица информации – это информационное отображение объекта или его части, собирается из набора соответствующих определению данного объекта реквизитов.

Способ - действие или система действий, применяемых при осуществлении чего-нибудь.

СППР - Системы Поддержки Принятия Решений.

СУБД – система управления базами данных.

Таблица измерений (dimension tables) – таблица, содержащая неизменяемые или редко изменяемые данные.

Таблица фактов (fact table) – основная таблица информационного хранилища.

Таблицы – плоские списочные отчеты, сопровождаемые графиками.

Тест FASMI (Fast Analysis of Shared Multidimensional Information) - Быстрый Анализ Разделяемой Многомерной Информации.

Тренды – отчеты, отражающие изменение показателей во времени и динамику этих изменений.

Хранилище данных - это предметно-ориентированное, привязанное ко времени и неизменяемое собрание данных для поддержки процесса принятия управляющих решений.