Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
билеты все.doc
Скачиваний:
15
Добавлен:
23.04.2019
Размер:
972.8 Кб
Скачать
  1. Что такое holap?

Гибридные системы (Hybrid OLAP, HOLAP ) разработаны с целью совмещения достоинств и минимизации недостатков, присущих предыдущим классам. К этому классу относится Media/MR компании Speedware. По утверждению разработчиков, он объединяет аналитическую гибкость и скорость ответа MOLAP с постоянным доступом к реальным данным, свойственным ROLAP.

  1. Что означает термин Data Mining и чем он отличается от olap?

ИАД (Data Mining) – это процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации). При этом накопленные сведения автоматически обобщаются до информации, которая может быть охарактеризована как знания. OLAP (англ. online analytical processing, аналитическая обработка в реальном времени) — технология обработки информации, включающая составление и динамическую публикацию отчётов и документов.

  1. Сколько и каких закономерностей позволяют выделить методы иад?

Выделяют пять стандартных типов закономерностей, выявляемых методами Data Mining:

1)ассоциация: высокая вероятность связи событий друг с другом (один товар часто приобретается вместе с другим);

2)последовательность: высокая вероятность цепочки связанных во времени событий (в течение определенного срока после приобретения одного товара будет с высокой степенью вероятности приобретен другой);

3)классификация: имеются признаки, характеризующие группу, к которой принадлежит то или иное событие или объект (обычно при этом на основании анализа уже классифицированных событий формулируются некие правила);

4)кластеризация: закономерность, сходная с классификацией и отличающаяся от нее тем, что сами группы при этом не заданы — они выявляются автоматически в процессе обработки данных;

5)временные закономерности: наличие шаблонов в динамике поведения тех или иных данных (сезонные колебания спроса на те или иные товары либо услуги), используемых для прогнозирования.

Методы ИАД:

  1. Непосредственное использование обучающих данных (Data Retention):

Рассуждения на основе анализа прецедентов. Алгоритм типа Lazy – learning:

  • Метод ближайшего соседа - NN,

  • Метод к-ближайшего соседа – k-NN,

  • Метод NGE

  1. Выявление и использование формализованных закономерностей (Data Distillation)

  1. Методы логической индустрии

    • Деревья решений

    • Индустрия правил

  2. Методы вывода уравнений

  • Статистика

    • Ряды динамики

    • Корреляционно – регрессионный анализ

    • Нелинейная

  • Нейронные сети

  1. Из каких стадий состоят методы иад?

В общем случае процесс ИАД состоит из трёх стадий:

1) выявление закономерностей (свободный поиск) – 1. Выявление закономерностей условной логики Conditional logic, 2. выявление закономерностей ассотиативной логики Associations and Affinities, 3. Выявление трендов и колебаний Trends and Variations;

2) использование выявленных закономерностей для предсказания неизвестных значений (прогностическое моделирование) – 1. Предсказание неизвестных значений Outcome Prediction, 2. Прогнозирование развития процессов Forecasting;

3) анализ исключений, предназначенный для выявления и толкования аномалий в найденных закономерностях – выяление отклонений Deviation Detection.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]