Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lab05_Decision trees_2011.doc
Скачиваний:
0
Добавлен:
13.11.2019
Размер:
905.22 Кб
Скачать

Інтелектуальна обробка даних. ЛР №5: Дерева прийняття рішень.

МІНІСТЕРСТВО ОСВІТИ ТА НАУКИ УКРАЇНИ

НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ “ЛЬВІВСЬКА ПОЛІТЕХНІКА”

Дерева прийняття рішень”

Методичні вказівки

до лабораторної роботи №5

з курсу “Інтелектуальна обробка даних”

для студентів напрямку

8.05010103, 7.05010103“Системне проектування”

Затверджено

на засіданні кафедри “Системи автоматизованого проектування” Протокол № 1 від 22.08.2011

Львів 2011

“Дерева прийняття рішень”. Методичні вказівки до виконання лабораторної роботи №5 з курсу: “Інтелектуальна обробка даних” для 8.05010103, 7.05010103“Системне проектування”.

Укладачі: Керницький А.Б., др.інж, доц.

Денисюк П.Ю., канд.техн.наук, доц.

Мельник М.Р., канд.техн.наук, доц.

Відповідальний за випуск: Ткаченко С.П., канд.техн.наук, доц.

Рецензенти: Каркульовський В.І., канд.техн.наук, доц.

Яковина В.С., канд.фіз.-мат.наук, доц.

1. Мета роботи

Навчитися будувати дерева рішень на базі алгоритму ID3 та вирішувати проблему суперечливості даних у таблицях прийняття рішень.

2.Короткі теоретичні відомості

Для проведення досліджень або для комерційних цілей часто створюються дуже великі бази даних. Іноді ці бази даних стають настільки великими, що їх опрацювання й інтерпретація даних людиною майже не можлива. В наслідок цього утворюється розбіжність між появою нових даних і їх розумінням. Цю розбіжність можуть допомогти подолати інструменти й методи для виявлення нових, раніше невідомих закономірностей, схованих у даних. Ця проблематика спричинила розвиток нових галузей штучного інтелекту — дослідження даних (Data mining), видобування знань з баз даних (Knowledge discovery іn databases) та машинного навчання (Machine learning).

Крім цього постає велика кількість задач прийняття рішень, коли потрібно відносити нові об'єкти до певного класу. Такі задачі прийняття рішень щодо нових об'єктів вимагають пошуку правил, які дозволяють класифікувати об'єкт. Такий пошук правил належить до класу задач машинного навчання, і відбувається на основі вже наявної інформації про об'єкти, яка представляється у вигляді таблиці прийняття рішень.

Knowledge discovery in databases (KDD) - аналітичний процес дослідження людиною великого обсягу інформації з залученням засобів автоматизованого дослідження даних з метою виявлення схованих у даних структур або залежностей. Передбачається повна або часткова відсутність апріорних уявлень про характер прихованих структур і залежностей.

KDD включає в себе:

  • попереднє осмислення і неповне формулювання задачі (у термінах цільових змінних);

  • перетворення даних до придатного для автоматизованого аналізу формату і їхню попередню обробку;

  • виявлення засобами автоматичного дослідження даних (data mining) схованих структур або залежностей;

  • апробація виявлених моделей на нових даних, що не використовувалися для побудови моделей, та інтерпретація людиною виявлених моделей.

Data mining (дослівно, "розробка даних") - дослідження і виявлення "машиною" (алгоритмами, засобами штучного інтелекту) в необроблених даних прихованих структур або залежностей, які:

  • раніше не були відомі;

  • нетривіальні;

  • практично корисні;

  • доступні для інтерпретації людиною.

В цих галузях використовується велика кількість різних методів і їхні різні комбінації. Перерахуємо найбільш важливі і часто використовувані методи:

  • кластеризація (дискретизація);

  • асоціація;

  • дерева рішень;

  • метод найближчих сусідів;

  • нейронні мережі;

  • генетичні алгоритми;

  • регресійні методи;

  • неточні множини;

  • еволюційне програмування.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]