Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лек2-Основные понятия интеллектуального анализа....docx
Скачиваний:
15
Добавлен:
04.11.2018
Размер:
334.81 Кб
Скачать
  1. Основные понятия интеллектуального анализа данных

Интеллектуальный анализ данных часто описывается как процесс извлечения допустимых, достоверных данных и данных с быстрым доступом из крупных баз данных. Другими словами, интеллектуальный анализ извлекает шаблоны и тренды, существующие в данных. Такие шаблоны и тренды могут быть собраны воедино и определены как модель интеллектуального анализа данных. Модели интеллектуального анализа данных могут применяться к конкретным бизнес-сценариям, а именно:

  • прогнозирование продаж;

  • почтовая рассылка определенным клиентам;

  • определение продуктов, которые с высокой долей вероятности могут быть проданы вместе;

  • выявление последовательностей в том порядке, в котором клиенты добавляют продукты в корзину для покупок.

Важно понимать, что построение модели интеллектуального анализа данных является составной частью более масштабного процесса, который включает в себя все этапы, начиная с определения базовой проблемы, которую модель будет решать, до развертывания модели в рабочей среде. Данный процесс может быть задан при помощи следующих шести базовых шагов:

  1. Постановка задачи

  2. Подготовка данных

  3. Просмотр данных

  4. Построение моделей

  5. Исследование и проверка моделей

  6. Развертывание и обновление моделей

На следующей диаграмме представлены связи между всеми шагами процесса и технологии Microsoft SQL Server 2005, которые можно использовать для выполнения каждого шага.

Хотя процесс, иллюстрируемый при помощи диаграммы, носит циклический характер, каждый шаг не обязательно ведет напрямую к следующему шагу. Создание модели интеллектуального анализа данных представляет собой динамический итеративный процесс. Выполнив обзор данных, пользователь может обнаружить, что существующих данных недостаточно для создания требуемых моделей интеллектуального анализа данных, что, соответственно, ведет к необходимости поиска дополнительных данных. Можно разработать несколько моделей и понять, что они не решают сформулированной задачи. Следовательно, требуется изменение характеристик задачи. Может возникнуть необходимость в обновлении уже развернутых моделей за счет новых поступивших данных. Таким образом, важно понимать, что создание модели интеллектуального анализа данных является процессом и что каждый шаг такого процесса может быть повторен столько раз, сколько необходимо для создания эффективной модели.

SQL Server 2005 представляет интегрированную среду для создания и работы с моделями интеллектуального анализа данных, известную как среда Business Intelligence Development Studio. Данная среда включает алгоритмы интеллектуального анализа данных и средства, облегчающие разработку исчерпывающего решения, применимого в рамках самых разных проектов. Дополнительные сведения об использовании среды BI Development Studio см. в разделе Разработка решений и проектов служб Analysis Services.

Дополнительные сведения о применении средств SQL Server в отношении бизнес-сценариев, перечисленных ранее в данном разделе, см. в разделе Учебник по интеллектуальному анализу данных.