Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

9074

.pdf
Скачиваний:
0
Добавлен:
25.11.2023
Размер:
2.22 Mб
Скачать

c.Какой процент опрошенных клиентов использует SMS более 30 раз

вдень?

d.Сколько клиентов готово сменить оператора?

e.Какой тип рекламы сотовых операторов и тарифов наиболее попу-

лярен?

f.Имеются ли в полях набора данных пропущенные значения?

20.Сохраните конфигурацию визуализатора Статистика под названием «К2

Статистика».

21. Используя обработчик Замена значений, сделайте следующую замену в поле Возможна смена оператора: значение True измените на Да, False на

Нет.

22.Сделайте следующую замену в поле Сумма оплаты в месяц (в руб.) зна-

чение 50-100 – на 100, 100-300 – на 200, более 300 – на 300.

23.Старые поля удалите из набора данных, а новые поля Возможна смена оператора_REPLACE и Сумма оплаты в месяц (в руб.)_REPLACE пере-

именуйте в Возможна смена оператора и Сумма оплаты в месяц.

24.Отсортируйте последний набор данных по полю Сумма оплаты в месяц. 25.Скопируйте какой-либо узел в сценарии , удалите какой-либо узел

или ветвь сценария .

Внимание: После вставки нового узла или удаления существующего уз-

лы-потомки могут стать нерабочими, в зависимости от обработки, которая выполняется новым узлом. Удаленная ветвь восстановлению не подлежит,

потому к данной операции необходимо подходить с осторожностью.

26. Используя обработчик Калькулятор (функцию RowNum()), добавьте по-

ле Номер строки.

27. Используя Узел Калькулятор, создайте новое поле Дата обработки, зна-

чения в котором равны текущей дате.

28. Создайте новое поле Сегмент, которое делит всех клиентов на сегменты по следующим правилам (используйте функцию IFF или IF):

61

a. ЕСЛИ Кол-во мин. в день =до 10 и Сумма оплаты в месяц < 200, то

Сегмент=Сегмент 1

b. ЕСЛИ Кол-во мин. в день =10-30 мин, то Сегмент=Сегмент 2 c. Сегмент=Сегмент 3 во всех остальных случаях.

29. Загрузите экспортированный в п.15 текстовый файл «Оценка критериев

выбора оператора».

30.С помощью обработчика фильтрация получите две отдельные таблицы

«Оценка критериев выбора оператора МТC» и «Оценка критериев выбора

оператора НСС»

31. Используя обработчик Парциальная предобработка (алгоритм Макси-

мальное правдоподобие), восстановите пропуски в данных таблицы

«Оценка критериев выбора оператора МТC».

32. Используя обработчик Калькулятор функцию Stat("ИмяСтолбца";"Avg"),

вычислите интегральный показатель для оценки выбора оператора НСС

по формуле:

10

1

 

(1)

 

 

 

* Stat("i показатель";" Avg")

10

 

i 1

 

 

33. Используя обработчик Калькулятор функцию Round(интегральный пока-

затель;2), округлите полученное в предыдущем узле значение интеграль-

ного показателя с точностью до сотых.

34. Используя обработчик «Настройка набора данных», сделайте все поля кроме двух «сотовые операторы» и «интегральный показатель округ» не-

используемыми. Метку столбца «интегральный показатель округ» изме-

ните на «интегральный показатель».

35.С помощью обработчика Группировка объедините записи, содержащие одинаковые значения. Введите следующие параметры группировки дан-

ных: поле «сотовые операторы» - измерение, поле «интегральный показа-

тель» – факт, способ агрегации – «первый»:

36.Добавьте к сценарию узел Скрипт, выполняющий те же действия с набо-

ром данных «Оценка критериев выбора оператора НСС», что и в п.п. 31-

35.

62

Указание. Скрипты предназначены для автоматизации процесса добавле-

ния в сценарий однотипных ветвей обработки. Аналогом скрипта является функция или процедура в языках программирования. Ветвь обработки стро-

ится один раз, а затем скриптами выполняются заложенные в ней универ-

сальные обработки.

Для добавления в сценарий скрипта предусмотрены следующие шаги:

Выбор начального этапа обработки и настройка полей:

Выбор конечного этапа обработки

Рис. 12. Этапы обработчика Скрипт

Запуск процесса обработки

Если обработка данных была завершена успешно, то в секции "Название процесса" появится сообщение "Успешное завершение".

37. С помощью обработчика «Слияние с узлом» (выбрав тип слияния «объ-

единение») получите результирующий набор данных, объединяющий строки узлов Группировка и Скрипт (см. рис. 14).

Объединение включает в результирующий набор данных все строки из входящего набора данных, дополненные снизу строками из связанного набора данных. Нужный результат представлен на рис. 13.

63

Рис. 13. Результат объединения двух таблиц

Рис. 14. Слияние двух узлов сценария Группировка и Скрипт

38. Сравните ваш сценарий с приведенным ниже на рис. 15

Рис. 15. Фрагмент сценария для п.п. 29-37

39.Сохраните проект и завершите работу.

40.Дополнительное задание. Откройте и посмотрите Демопример по анали-

зу данных (главное меню Файл).

64

Задания для раздела 2.

Задание 1. Создание ХД в аналитической платформе Deductor Studio

Academic 5.3»

Имеется история продаж и поступлений различных товаров по дням в не-

скольких торговых объектах. Данные представлены текстовыми файлами, ко-

торые включают в себя выгрузку информации о поступлении товара, продаже товара и предоставляемую скидку при продаже товара, а также справочники:

Артикулы, Единицы измерения, Группы клиентов, Группы товаров, Номера клиентов, Обобщенные группы товаров, Список городов.

Артикулы (фрагмент)

Таблица 1

Группа клиентов

Таблица 2

Группа товаров (фрагмент)

Таблица 3

65

Единицы измерения

Таблица 4

Клиенты (фрагмент)

Таблица 5

Клиенты (фрагмент)

Таблица 5 (продолжение)

Номера клиентов (фрагмент)

Таблица 6

66

Обобщенные группы товаров

Таблица 7

Приход (фрагмент)

Таблица 8

Скидка (фрагмент)

Таблица 9

67

Список городов (фрагмент)

Таблица 10

Указания

При проектировании ХД необходимо учитывать следующее:

совокупность измерений процесса должна однозначно определять единственную запись в таблице процесса («точку» в многомерном простран-

стве);

если существуют иерархии, то выбор должен быть в пользу измере-

ния;

если по объекту хранилища данных предполагается в будущем де-

лать частые «срезы», то снова лучше отдать предпочтение измерению;

таблицы измерений содержат только справочную информацию (ко-

ды, наименования и т.п.) и ссылки на другие измерения при необходимости;

таблица процесса содержит только факты и коды измерений (без их

атрибутов);

наличие возможных пропусков (необязательное поле) говорит о том, что объект лучше сделать атрибутом процесса.

Покажем, какие данные являются измерениями, какие атрибутами, а ка-

кие фактами и что представляют собой процессы.

В табл. 1 «Артикулы» измерениями являются следующие поля: Артикул,

Группа товаров, Группа товаров | Обобщенная группа товаров, а поле Наимено-

вание товара является атрибутом.

Таблица «Группа клиентов» (табл. 2) содержит в себе всего 1 поле

68

«Группа клиентов», которое является измерением.

В таблице «Группа товаров» (табл. 3) измерениями являются следующие поля: Группа товаров, Обобщенная группа товаров.

Таблица «Единицы измерения» (табл. 4) содержит в себе всего 1 поле

«Единица измерения», которое является измерением.

В таблице «Клиенты» (табл. 5) измерениями являются следующие поля:

Дата продажи, Номер клиента, Артикул, Единицы измерения, Номер клиента |

Город, Номер клиента | Группа клиентов, Артикул | Группа товаров. Атрибута-

ми являются поля: Номер клиента | Город | Экономический район, Номер кли-

ента | Город | Федеральный округ, Артикул | Наименование товара, а такие по-

ля, как Цена за единицу, Количество и Сумма с учетом скидки являются факта-

ми. Т.е. табл. 5 является описанием процесса продажи товаров.

В таблице «Номер клиента» (табл. 6) поля Номер клиента, Город и Груп-

па клиентов являются измерениями.

Таблица «Обобщенная группа товаров» (табл. 7) содержит в себе всего 1

поле «Обобщенная группа товаров», которое является измерением.

В таблице «Приход» (табл. 8), измерениями являются следующие поля:

Дата прихода, Артикул, Артикул|Группа товаров, Артикул|Группа това-

ров|Обобщенная группа товаров, Номер счет-фактуры, и Номер поставщика.

Поле Артикул | Наименование товара является атрибутом, а такие поля как Це-

на за единицу и Количество являются фактами. Т.е. таблица 8 является описа-

нием процесса поступления товаров.

В таблице «Скидка» (табл. 9), измерениями являются следующие поля:

Дата продажи, Номер клиента, Артикул, Номер клиента|Город, Номер клиен-

та|Группа клиентов, Артикул|Группа товаров, Артикул|Группа това-

ров|Обобщенная группа товаров. Атрибутами являются поля: Номер клиен-

та|Город|Экономический район, Номер клиента|Город|Федеральный округ, Ар-

тикул|Наименование товара, а такие поля, как Цена за единицу, Количество,

Скидка по группе клиента %, Скидка по сумме клиента %, Общая сумма скидки

69

% являются фактами. Т.е. табл. 9 является описанием процесса предоставления

скидки клиентам при покупке товаров.

Втаблице «Список городов» (табл. 10) поле Город является измерением,

аЭкономический район и Федеральный округ являются его атрибутами.

Стоит отметить, что таблицу «Продажи» можно объединить с таблицей

«Скидки» с помощью обработки «Слияние с узлом». Целесообразность данного действия заключается в том, что в данных таблицах хранятся практически одни и те же данные, различие лишь в том, что в одной таблице есть скидки, а в дру-

гой – сумма с учетом скидок, поэтому для наглядного отображения данных ре-

шено два процесса объединить в один процесс – Продажи.

Таким образом, было выделено два основных процесса: Поступление и Продажи товаров.

Основные этапы создания ХД в АП Deductor:

1. Для создания нового хранилища данных в Deductor или подключения к существующему нужно перейти на закладку «Подключения» и запустить «Ма-

стер подключений» (рис. 16).

Рис. 16. Создание (подключение) хранилища данных

2. Пройти первые два шага, выбрав тип приемника (источника) Deductor

Warehouse и тип базы данных Firebird.

70

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]