- •Deductor
- •Руководство аналитика
- •Введение
- •Анализ данных – основные принципы
- •Два подхода к анализу данных
- •Базовые методы анализа
- •Online Analytical Processing
- •Knowledge Discovery in Databases
- •Data Mining
- •Поддержка процесса от разведочного анализа до отображения данных
- •Тиражирование знаний
- •Основные модули
- •Подготовка сценариев
- •Визуализация данных
- •Работа с отчетами
- •Работа с избранными узлами
- •Пакетная обработка
- •Многомерное представление данных
- •Физическая реализация Deductor Warehouse
- •Создание хранилища данных
- •Подключение к Deductor Warehouse
- •Создание структуры хранилища с помощью Редактора метаданных
- •Загрузка данных в хранилище
- •Процессы
- •Измерения
- •Автоматическая загрузка данных в хранилище
- •Импорт данных из хранилища
- •Импорт процесса
- •Импорт измерения
- •Кубы в хранилище данных
- •Виртуальное хранилище Virtual Warehouse
- •Работа с OLAP-кубом
- •Кросс-таблица
- •Размещение измерений
- •Способы агрегации и отображения фактов
- •Селектор – фильтрация данных в кубе
- •Функция «Калькулятор»
- •Пример
- •Кросс-диаграмма
- •Описание аналитических алгоритмов
- •Очистка данных
- •Парциальная обработка
- •Заполнение пропусков
- •Редактирование аномалий
- •Сглаживание
- •Очистка от шумов
- •Факторный анализ
- •Корреляционный анализ
- •Обнаружение дубликатов и противоречий
- •Фильтрация
- •Трансформация данных
- •Настройка набора данных
- •Скользящее окно
- •Преобразование даты
- •Квантование значений
- •Сортировка
- •Слияние
- •Замена данных
- •Группировка
- •Разгруппировка
- •Кросс-таблица
- •Свертка столбцов
- •Data Mining
- •Автокорреляция
- •Нейронные сети
- •Линейная регрессия
- •Прогнозирование
- •Логистическая регрессия
- •Деревья решений
- •Карты Кохонена
- •Кластеризация (k-means и g-means)
- •Ассоциативные правила
- •Декомпозиция
- •Пользовательские модели
- •Вспомогательные методы обработки
- •Скрипт
- •Групповая обработка
- •Калькулятор
- •Условие
- •Команда ОС
- •Сценарий Deductor
- •Переменные
- •Интерпретация результатов
- •ROC-анализ
- •Анализ «Что-если»
- •Таблица «Что-если»
- •Диаграмма «что–если»
- •Подготовка данных для анализа
- •Выдвижение гипотез
- •Формализация и сбор данных
- •Представление и минимальные объемы необходимых данных
- •Построение моделей – анализ
- •Оптимизация работы и создания сценариев
- •Какие источники использовать
- •Кэширование
- •Динамические фильтры
- •Быстрая подготовка сценариев (скрипты)
- •Использование переменных
- •Обработка сценариев при помощи Deductor Server
- •Пример создания законченного аналитического решения
- •Создание хранилища данных
- •Прогнозирование объемов продаж
- •Поиск оптимальной наценки
- •Анализ потребительской корзины
- •Аналитическая отчетность
- •Создание отчетности
- •Что делать при возникновении ошибок
- •Заключение
- •Дополнительные источники
- •Контакты
www.basegroup.ru
В калькуляторе в закладке Переменные выбираем для полей Цена и Количество способ агрегации фактов – Сумма, Это позволит при расчете использовать значения, отнесённые к конкретному виду товара.
В результате добавления нового факта результирующая таблица в OLAP-кубе имеет вид:
Кросс-диаграмма
Кросс-диаграмма представляет собой график заданного типа, построенный на основе куба. Основное отличие кросс-диаграммы от обычной диаграммы в том, что она однозначно соответствует текущему состоянию куба и при любых ее изменениях изменяется соответственно.
Приведем пример кросс-диаграммы для следующего куба.
стр. 65 из 192
www.basegroup.ru
Кросс-диаграмма для него имеет следующий вид.
На ней можно наблюдать поквартальную тенденцию продаж в различных магазинах. К кроссдиаграмме, так же как и к кубу, можно применять транспонирование. Результат транспонирования будет следующий:
Кросс-диаграмма может строиться по нескольким фактам. Выбрать интересующие факты можно,
нажав кнопку .
При построении диаграммы вводятся ограничения числа серий и числа точек в каждой серии, отображаемых на графике. Данное ограничение вызвано, с одной стороны, большими вычислительными затратами при построении диаграммы, а с другой, сложностью восприятия
больших диаграмм. Кнопка Огр аничени я на панели инструментов будет иметь синий цвет, если ограничения не превышены, и красный в противоположном случае.
стр. 66 из 192
www.basegroup.ru
Максимальное количество отображаемых серий и точек можно настроить, нажав на кнопку Ограничени я на панели инструментов.
Щелчок по этой кнопке выводит окно «Сведения об ограничениях», в котором представлена информация:
§Количество серий – сколько серий необходимо для того, чтобы отобразить все данные из кросс-диаграммы и максимальное количество отображаемых серий.
§Количество точек – сколько точек необходимо для того, чтобы отобразить все данные из кросс-диаграммы и максимальное количество отображаемых точек.
Под «точками» понимаются группы столбцов, которые соответствуют значениям измерения по строкам. Каждому значению измерения по строкам могут соответствовать несколько значений измерения по столбцам. Для каждого из них строится свой столбец в каждой точке кроссдиаграммы. Количество столбцов в группе называется «серией».
Таким образом, если фактическое количество серий и точек не превышает заданный поток, то в диаграмме отображается вся информация.
стр. 67 из 192