Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
guide_analyst_5.2.0.pdf
Скачиваний:
373
Добавлен:
21.03.2015
Размер:
6.37 Mб
Скачать

Deductor

Руководство аналитика

Версия 5.2

© 1995-2009 Компания BaseGroupLabs

www.basegroup.ru

© 1995-2009 Компания BaseGroupLabs

В руководстве описана аналитическая платформа Deductor 5.2: идеология анализа данных, реализованные механизмы, составные части и архитектура, демонстрируются типовые задачи анализа бизнес-данных и способы их решения при помощи Deductor Studio. Книга предназначена для аналитиков, руководителей подразделений и других специалистов, которым необходимо применение в работе современных методов анализа. Специальных знаний в области анализа данных не требуется, но предполагается, что читатель знаком с базовыми сведениями вузовского курса высшей математики и является квалифицированным пользователем компьютера.

стр. 2 из 192

www.basegroup.ru

Содержание

 

Введение .............................................................................................................................................

6

Анализ данных – основные принципы ...........................................................................................

8

Два подхода к анализу данных .........................................................................................................

8

Базовые методы анализа ..................................................................................................................

9

Online Analytical Processing ............................................................................................................

9

Knowledge Discovery in Databases................................................................................................

12

Data Mining....................................................................................................................................

13

Состав и назначение аналитической платформы Deductor.......................................................

15

Поддержка процесса от разведочного анализа до отображения данных......................................

15

Тиражирование знаний....................................................................................................................

16

Архитектура Deductor Studio – аналитическое приложение ......................................................

20

Основные модули ............................................................................................................................

20

Подготовка сценариев .....................................................................................................................

20

Визуализация данных......................................................................................................................

24

Работа с отчетами ...........................................................................................................................

26

Работа с избранными узлами..........................................................................................................

27

Пакетная обработка.........................................................................................................................

28

Архитектура Deductor Warehouse – многомерное хранилище данных.....................................

30

Многомерное представление данных .............................................................................................

30

Физическая реализация Deductor Warehouse.................................................................................

32

Создание хранилища данных..........................................................................................................

33

Подключение к Deductor Warehouse ...............................................................................................

36

Создание структуры хранилища с помощью Редактора метаданных ...........................................

36

Загрузка данных в хранилище.........................................................................................................

37

Процессы......................................................................................................................................

37

Измерения ....................................................................................................................................

39

Автоматическая загрузка данных в хранилище..............................................................................

45

Импорт данных из хранилища.........................................................................................................

45

Импорт процесса..........................................................................................................................

45

Импорт измерения........................................................................................................................

49

Кубы в хранилище данных ..............................................................................................................

50

Виртуальное хранилище Virtual Warehouse....................................................................................

53

Работа с OLAP-кубом.......................................................................................................................

55

Кросс-таблица..................................................................................................................................

55

Размещение измерений ...............................................................................................................

55

Способы агрегации и отображения фактов.................................................................................

60

Селектор – фильтрация данных в кубе .......................................................................................

61

Функция «Калькулятор» ...............................................................................................................

64

Пример ....................................................................................................................................

64

Кросс-диаграмма .............................................................................................................................

65

Описание аналитических алгоритмов...........................................................................................

68

Очистка данных ...............................................................................................................................

69

Парциальная обработка...............................................................................................................

69

Заполнение пропусков............................................................................................................

69

Редактирование аномалий.....................................................................................................

70

Сглаживание ...........................................................................................................................

71

Очистка от шумов ...................................................................................................................

73

Факторный анализ........................................................................................................................

74

Корреляционный анализ ..............................................................................................................

75

Обнаружение дубликатов и противоречий ..................................................................................

77

Фильтрация ..................................................................................................................................

80

стр. 3 из 192

 

www.basegroup.ru

Трансформация данных ..................................................................................................................

81

Настройка набора данных............................................................................................................

81

Скользящее окно..........................................................................................................................

83

Преобразование даты..................................................................................................................

85

Квантование значений .................................................................................................................

86

Сортировка ...................................................................................................................................

88

Слияние ........................................................................................................................................

88

Замена данных .............................................................................................................................

93

Группировка..................................................................................................................................

94

Разгруппировка ............................................................................................................................

95

Кросс-таблица ..............................................................................................................................

97

Свертка столбцов.........................................................................................................................

98

Data Mining .......................................................................................................................................

99

Автокорреляция ...........................................................................................................................

99

Нейронные сети ..........................................................................................................................

101

Линейная регрессия ....................................................................................................................

108

Прогнозирование.........................................................................................................................

109

Логистическая регрессия ............................................................................................................

111

Деревья решений ........................................................................................................................

115

Карты Кохонена...........................................................................................................................

119

Кластеризация (k-means и g-means)...........................................................................................

121

Ассоциативные правила .............................................................................................................

126

Декомпозиция ..............................................................................................................................

133

Пользовательские модели..........................................................................................................

137

Вспомогательные методы обработки ............................................................................................

140

Скрипт..........................................................................................................................................

141

Групповая обработка...................................................................................................................

144

Калькулятор.................................................................................................................................

146

Условие........................................................................................................................................

147

Команда ОС.................................................................................................................................

149

Сценарий Deductor ......................................................................................................................

151

Переменные ................................................................................................................................

152

Интерпретация результатов ..........................................................................................................

154

ROC-анализ ....................................................................................................................................

155

Анализ «Что-если» .........................................................................................................................

161

Таблица «Что-если»....................................................................................................................

161

Диаграмма «что–если» ...............................................................................................................

162

Подготовка данных для анализа...................................................................................................

165

Выдвижение гипотез.......................................................................................................................

165

Формализация и сбор данных ........................................................................................................

166

Представление и минимальные объемы необходимых данных...................................................

167

Построение моделей – анализ.......................................................................................................

169

Оптимизация работы и создания сценариев ..............................................................................

170

Какие источники использовать.......................................................................................................

170

Кэширование...................................................................................................................................

170

Динамические фильтры..................................................................................................................

171

Быстрая подготовка сценариев (скрипты) .....................................................................................

173

Использование переменных...........................................................................................................

175

Обработка сценариев при помощи Deductor Server ......................................................................

175

Пример создания законченного аналитического решения........................................................

177

Создание хранилища данных.........................................................................................................

177

Прогнозирование объемов продаж ................................................................................................

178

Поиск оптимальной наценки...........................................................................................................

183

Анализ потребительской корзины..................................................................................................

185

Аналитическая отчетность .............................................................................................................

186

Создание отчетности......................................................................................................................

187

стр. 4 из 192

 

www.basegroup.ru

Что делать при возникновении ошибок.......................................................................................

188

Заключение......................................................................................................................................

190

Дополнительные источники..........................................................................................................

191

Контакты...........................................................................................................................................

192

стр. 5 из 192

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]