- •Deductor
- •Руководство аналитика
- •Введение
- •Анализ данных – основные принципы
- •Два подхода к анализу данных
- •Базовые методы анализа
- •Online Analytical Processing
- •Knowledge Discovery in Databases
- •Data Mining
- •Поддержка процесса от разведочного анализа до отображения данных
- •Тиражирование знаний
- •Основные модули
- •Подготовка сценариев
- •Визуализация данных
- •Работа с отчетами
- •Работа с избранными узлами
- •Пакетная обработка
- •Многомерное представление данных
- •Физическая реализация Deductor Warehouse
- •Создание хранилища данных
- •Подключение к Deductor Warehouse
- •Создание структуры хранилища с помощью Редактора метаданных
- •Загрузка данных в хранилище
- •Процессы
- •Измерения
- •Автоматическая загрузка данных в хранилище
- •Импорт данных из хранилища
- •Импорт процесса
- •Импорт измерения
- •Кубы в хранилище данных
- •Виртуальное хранилище Virtual Warehouse
- •Работа с OLAP-кубом
- •Кросс-таблица
- •Размещение измерений
- •Способы агрегации и отображения фактов
- •Селектор – фильтрация данных в кубе
- •Функция «Калькулятор»
- •Пример
- •Кросс-диаграмма
- •Описание аналитических алгоритмов
- •Очистка данных
- •Парциальная обработка
- •Заполнение пропусков
- •Редактирование аномалий
- •Сглаживание
- •Очистка от шумов
- •Факторный анализ
- •Корреляционный анализ
- •Обнаружение дубликатов и противоречий
- •Фильтрация
- •Трансформация данных
- •Настройка набора данных
- •Скользящее окно
- •Преобразование даты
- •Квантование значений
- •Сортировка
- •Слияние
- •Замена данных
- •Группировка
- •Разгруппировка
- •Кросс-таблица
- •Свертка столбцов
- •Data Mining
- •Автокорреляция
- •Нейронные сети
- •Линейная регрессия
- •Прогнозирование
- •Логистическая регрессия
- •Деревья решений
- •Карты Кохонена
- •Кластеризация (k-means и g-means)
- •Ассоциативные правила
- •Декомпозиция
- •Пользовательские модели
- •Вспомогательные методы обработки
- •Скрипт
- •Групповая обработка
- •Калькулятор
- •Условие
- •Команда ОС
- •Сценарий Deductor
- •Переменные
- •Интерпретация результатов
- •ROC-анализ
- •Анализ «Что-если»
- •Таблица «Что-если»
- •Диаграмма «что–если»
- •Подготовка данных для анализа
- •Выдвижение гипотез
- •Формализация и сбор данных
- •Представление и минимальные объемы необходимых данных
- •Построение моделей – анализ
- •Оптимизация работы и создания сценариев
- •Какие источники использовать
- •Кэширование
- •Динамические фильтры
- •Быстрая подготовка сценариев (скрипты)
- •Использование переменных
- •Обработка сценариев при помощи Deductor Server
- •Пример создания законченного аналитического решения
- •Создание хранилища данных
- •Прогнозирование объемов продаж
- •Поиск оптимальной наценки
- •Анализ потребительской корзины
- •Аналитическая отчетность
- •Создание отчетности
- •Что делать при возникновении ошибок
- •Заключение
- •Дополнительные источники
- •Контакты
Deductor
Руководство аналитика
Версия 5.2
© 1995-2009 Компания BaseGroup™ Labs
www.basegroup.ru
© 1995-2009 Компания BaseGroup™ Labs
В руководстве описана аналитическая платформа Deductor 5.2: идеология анализа данных, реализованные механизмы, составные части и архитектура, демонстрируются типовые задачи анализа бизнес-данных и способы их решения при помощи Deductor Studio. Книга предназначена для аналитиков, руководителей подразделений и других специалистов, которым необходимо применение в работе современных методов анализа. Специальных знаний в области анализа данных не требуется, но предполагается, что читатель знаком с базовыми сведениями вузовского курса высшей математики и является квалифицированным пользователем компьютера.
стр. 2 из 192
www.basegroup.ru
Содержание |
|
Введение ............................................................................................................................................. |
6 |
Анализ данных – основные принципы ........................................................................................... |
8 |
Два подхода к анализу данных ......................................................................................................... |
8 |
Базовые методы анализа .................................................................................................................. |
9 |
Online Analytical Processing ............................................................................................................ |
9 |
Knowledge Discovery in Databases................................................................................................ |
12 |
Data Mining.................................................................................................................................... |
13 |
Состав и назначение аналитической платформы Deductor....................................................... |
15 |
Поддержка процесса от разведочного анализа до отображения данных...................................... |
15 |
Тиражирование знаний.................................................................................................................... |
16 |
Архитектура Deductor Studio – аналитическое приложение ...................................................... |
20 |
Основные модули ............................................................................................................................ |
20 |
Подготовка сценариев ..................................................................................................................... |
20 |
Визуализация данных...................................................................................................................... |
24 |
Работа с отчетами ........................................................................................................................... |
26 |
Работа с избранными узлами.......................................................................................................... |
27 |
Пакетная обработка......................................................................................................................... |
28 |
Архитектура Deductor Warehouse – многомерное хранилище данных..................................... |
30 |
Многомерное представление данных ............................................................................................. |
30 |
Физическая реализация Deductor Warehouse................................................................................. |
32 |
Создание хранилища данных.......................................................................................................... |
33 |
Подключение к Deductor Warehouse ............................................................................................... |
36 |
Создание структуры хранилища с помощью Редактора метаданных ........................................... |
36 |
Загрузка данных в хранилище......................................................................................................... |
37 |
Процессы...................................................................................................................................... |
37 |
Измерения .................................................................................................................................... |
39 |
Автоматическая загрузка данных в хранилище.............................................................................. |
45 |
Импорт данных из хранилища......................................................................................................... |
45 |
Импорт процесса.......................................................................................................................... |
45 |
Импорт измерения........................................................................................................................ |
49 |
Кубы в хранилище данных .............................................................................................................. |
50 |
Виртуальное хранилище Virtual Warehouse.................................................................................... |
53 |
Работа с OLAP-кубом....................................................................................................................... |
55 |
Кросс-таблица.................................................................................................................................. |
55 |
Размещение измерений ............................................................................................................... |
55 |
Способы агрегации и отображения фактов................................................................................. |
60 |
Селектор – фильтрация данных в кубе ....................................................................................... |
61 |
Функция «Калькулятор» ............................................................................................................... |
64 |
Пример .................................................................................................................................... |
64 |
Кросс-диаграмма ............................................................................................................................. |
65 |
Описание аналитических алгоритмов........................................................................................... |
68 |
Очистка данных ............................................................................................................................... |
69 |
Парциальная обработка............................................................................................................... |
69 |
Заполнение пропусков............................................................................................................ |
69 |
Редактирование аномалий..................................................................................................... |
70 |
Сглаживание ........................................................................................................................... |
71 |
Очистка от шумов ................................................................................................................... |
73 |
Факторный анализ........................................................................................................................ |
74 |
Корреляционный анализ .............................................................................................................. |
75 |
Обнаружение дубликатов и противоречий .................................................................................. |
77 |
Фильтрация .................................................................................................................................. |
80 |
стр. 3 из 192 |
|
www.basegroup.ru
Трансформация данных .................................................................................................................. |
81 |
Настройка набора данных............................................................................................................ |
81 |
Скользящее окно.......................................................................................................................... |
83 |
Преобразование даты.................................................................................................................. |
85 |
Квантование значений ................................................................................................................. |
86 |
Сортировка ................................................................................................................................... |
88 |
Слияние ........................................................................................................................................ |
88 |
Замена данных ............................................................................................................................. |
93 |
Группировка.................................................................................................................................. |
94 |
Разгруппировка ............................................................................................................................ |
95 |
Кросс-таблица .............................................................................................................................. |
97 |
Свертка столбцов......................................................................................................................... |
98 |
Data Mining ....................................................................................................................................... |
99 |
Автокорреляция ........................................................................................................................... |
99 |
Нейронные сети .......................................................................................................................... |
101 |
Линейная регрессия .................................................................................................................... |
108 |
Прогнозирование......................................................................................................................... |
109 |
Логистическая регрессия ............................................................................................................ |
111 |
Деревья решений ........................................................................................................................ |
115 |
Карты Кохонена........................................................................................................................... |
119 |
Кластеризация (k-means и g-means)........................................................................................... |
121 |
Ассоциативные правила ............................................................................................................. |
126 |
Декомпозиция .............................................................................................................................. |
133 |
Пользовательские модели.......................................................................................................... |
137 |
Вспомогательные методы обработки ............................................................................................ |
140 |
Скрипт.......................................................................................................................................... |
141 |
Групповая обработка................................................................................................................... |
144 |
Калькулятор................................................................................................................................. |
146 |
Условие........................................................................................................................................ |
147 |
Команда ОС................................................................................................................................. |
149 |
Сценарий Deductor ...................................................................................................................... |
151 |
Переменные ................................................................................................................................ |
152 |
Интерпретация результатов .......................................................................................................... |
154 |
ROC-анализ .................................................................................................................................... |
155 |
Анализ «Что-если» ......................................................................................................................... |
161 |
Таблица «Что-если».................................................................................................................... |
161 |
Диаграмма «что–если» ............................................................................................................... |
162 |
Подготовка данных для анализа................................................................................................... |
165 |
Выдвижение гипотез....................................................................................................................... |
165 |
Формализация и сбор данных ........................................................................................................ |
166 |
Представление и минимальные объемы необходимых данных................................................... |
167 |
Построение моделей – анализ....................................................................................................... |
169 |
Оптимизация работы и создания сценариев .............................................................................. |
170 |
Какие источники использовать....................................................................................................... |
170 |
Кэширование................................................................................................................................... |
170 |
Динамические фильтры.................................................................................................................. |
171 |
Быстрая подготовка сценариев (скрипты) ..................................................................................... |
173 |
Использование переменных........................................................................................................... |
175 |
Обработка сценариев при помощи Deductor Server ...................................................................... |
175 |
Пример создания законченного аналитического решения........................................................ |
177 |
Создание хранилища данных......................................................................................................... |
177 |
Прогнозирование объемов продаж ................................................................................................ |
178 |
Поиск оптимальной наценки........................................................................................................... |
183 |
Анализ потребительской корзины.................................................................................................. |
185 |
Аналитическая отчетность ............................................................................................................. |
186 |
Создание отчетности...................................................................................................................... |
187 |
стр. 4 из 192 |
|
www.basegroup.ru
Что делать при возникновении ошибок....................................................................................... |
188 |
Заключение...................................................................................................................................... |
190 |
Дополнительные источники.......................................................................................................... |
191 |
Контакты........................................................................................................................................... |
192 |
стр. 5 из 192