Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
диплом_NY_30 (1).doc
Скачиваний:
46
Добавлен:
16.02.2016
Размер:
2.87 Mб
Скачать

Календарний план

з/п

Назва етапів дипломного

проекту (роботи)

Строк виконанняетапів проекту

( роботи )

Примітка

1.

Опрацювання літературних та Інтернет джерел

вересень

2013 р.

виконано

2.

Розділ 1. Аналіз гібридних інтелектуальних систем

листопад 2013 р.

виконано

3.

Розділ 2. Методологічні основи побудови гібридної інтелектуальної системи для вирішення основного класу задач Data Mining

грудень

2013 р.

виконано

4.

Розділ 3.Проектування гібридної інтелектуальної системи для рішення задач кластеризації та регресії.

лютий

2014 р.

виконано

5.

Розділ 4. Охорона праці та безпека в надзвичайних ситуаціях

травень

2014 р.

виконано

6.

Попередній захист

за графіком

виконано

7.

Захист дипломної роботи

за графіком

виконано

Студентка _____________ Романюк І. С.

( підпис ) (прізвище та ініціали)

Керівник проекту (роботи) _______________ Ноздріна Л. В.

(підпис ) (прізвище та ініціали)

ЗМІСТ

стор.

Вступ………………………………………………………………………….

6

РОЗДІЛ 1. АНАЛІЗ ГІБРИДНИХ ІНТЕЛЕКТУАЛЬНИХ СИСТЕМ ……

9

1.1. Аналіз та порівняльні дослідження методів та підходів для вирішення задач інтелектуального аналізу даних………………………….

9

1.2. Дослідження сутності гібридних інтелектуальних систем………...…

22

1.3. Аналіз основних задач Data Mining…………………………………….

РОЗДІЛ 2. МЕТОДОЛОГІЧНІ ОСНОВИ ПОБУДОВИ ГІБРИДНОЇ ІНТЕЛЕКТУАЛЬНОЇ СИСТЕМИ ДЛЯ ВИРІШЕННЯ ОСНОВНОГО КЛАСУ ЗАДАЧ DATA MINING……………………………………………

27

2.1. Аналіз алгоритмів і методів кластеризації та регресії для вирішення класу задач Data Mining……………………………………………………...

30

2.2. Методика дослідження ГІС для вирішення основного класу задач Data Mining……………………………………………………………………

30

2.3. Побудова моделі гібридної інтелектуальної системи з використанням математичного апарату…………………………………….

48

Розділ 3. Проектування гібридної інтелектуальної інформаційної системи для вирішення задач кластеризації та регресії……………………....................................

57

3.1. Узагальнена структура гібридної інформаційної системи та алгоритм її роботи …………………………………………………………...

57

3.2. Програмна реалізація гібридної інтелектуальної системи для рішення задач кластеризації та регресії …………………………………....

66

3.3. Ефективність побудови гібридної інтелектуальної системи для рішення задач кластеризації та регресії…………………………………….

69

Розділ 4. Охорона праці ТА БЕЗПЕКА В НАДЗВИЧАЙНИХ СИТУАВЦІЯХ………………..………………………………………………

73

4.1. Вимоги до робочого місця програміста………………………………..

73

4.2. Безпека роботи програміста…………………………………………….

76

4.3. Вимоги до приміщень на підприємстві………………………………..

77

Висновки…………………………………………………………………..

84

Список використаних джерел……………………………………

86

Додатки…………………………………………………………………….

95

ВСТУП

Актуальність. В умовах сучасного розвитку суспільства насущною вимогою є автоматизація інтелектуальної діяльності з використанням інформаційних технологій. В умовах сучасної конкурентної економіки критичне значення для підприємств набуває управління їх найбільш цінними активами. Для того, щоб проаналізувати величезні масиви інформації використовується інтелектуальний аналіз даних.

Інтелектуальний аналіз даних полягає в перетворенні вихідних необроблених даних в цінну інформацію для прийняття стратегічних рішень, що впливають на результати діяльності підприємства. Такий підхід до управління інформацією дозволяє підвищити ефективність ведення бізнесу, отримати конкурентну перевагу і, як результат, збільшити прибутковість.

Традиційні методи аналізу даних в основному орієнтовані на перевірку заздалегідь сформульованих гіпотез, що становить основу оперативної аналітичної обробки даних, в той час як одним із основних положень Data Mining є пошук неочевидних закономірностей.

Особливе значення технологія Data Mining набуває у зв’язку з тим, що в багатьох галузях останнім часом накопичився значний обсяг даних, представлений у вигляді різних баз даних, що містять корисну інформацію. Для вилучення цієї інформації починають використовувати методи Data Mining. Основними задачами, розв’язуваними цими методами, є класифікація, регресія, кластеризація, асоціація та встановлення закономірностей між зв’язаними в часі подіями. Використання окремих методів для рішення задач не дозволяють охопити усю сукупність даних, та зробити стратегічні висновки, тому необхідно використовувати деякий гібрид.

В останні роки стали інтенсивно розвиватися гібридні інтелектуальні системи (ГІС), які дозволяють використовувати переваги традиційних засобів штучного інтелекту, і в той же час долають деякі їхні недоліки, здатні вирішувати завдання, які не вирішуються окремими методами штучного інтелекту. ГІС дозволили більш ефективно поєднувати формалiзовані, і неформалізовані знання за рахунок інтеграції традиційних засобів штучного інтелекту. Гібридний підхід передбачає, що тільки комбінація моделей досягає повного спектру обчислювальних можливостей.

Аналіз досліджень з даної проблематики присвячені роботи вітчизняних вчених, таких як: А. В. Колесников, Г. С. Федорова, А. В. Щербаков, проте, незважаючи на значний внесок науковців у дослідження, низка нерозв’язаних проблем залишається.

Дана робота присвячена розробленні методики для побудови гібридної інтелектуальної системи для рішення основного класу задач Data Mining та дослідженню методів і алгоритмів кластеризації та регресії. Інтелектуальний аналіз даних пов’язаний з пошуком в даних прихованих нетривіальних і корисних закономірностей, що дозволяють отримати нові знання про досліджувані дані. Особливий інтерес до методів аналізу даних виник у зв’язку з розвитком засобів збору і зберігання даних. У фахівців з різних галузей людської діяльності постає питання про обробку даних. Статистичні методи покривають лише частину потреб з обробки даних. У такій ситуації методи інтелектуального аналізу даних набувають особливої актуальності. Їх головна особливість полягає у встановленні наявності та характеру прихованих закономірностей у даних, тоді як традиційні методи займаються головним чином параметричною оцінкою вже встановлених закономірностей. Серед методів інтелектуального аналізу даних особливе місце займають класифікація, кластеризація та регресія. Задача кластеризації має різні способи вирішення. Складність полягає у відсутності на момент початку аналізу будь-якої додаткової інформації про дані. Тому особливу актуальність має розроблення методики адаптивної кластеризації, за якої вибір найкращого рішення здійснюється формально, за заданими критеріями. З огляду на те ця проблема є актуальною.

Метою дослідження є підвищення ефективності процесу прийняття рішень за рахунок впровадження гібридної інтелектуальної системи для рішення основного класу задач Data Mining. З поставленої мети випливають такі завдання:

  • пророаналізувати підходи для рішення задач інтелектуального аналізу даних та існуючі методи задач кластеризації і регресії;

  • формалізувати з використанням математичного апарату гібридну інтелектуальну систему;

  • – запропонувати методику побудови гібридної інтелектуальної системи для вирішення основного класу задач Data Mining;

  • проаналізувати адекватність запропонованої гібридної інтелектуальної системи.

Об’єктом дослідження є процеси побудови гібридної інтелектуальної системи для вирішення основного класу задач Data Mining.

Предметом дослідження є теоретичні, науково-методичні та практичні положення побудови гібридної інтелектуальної системи для вирішення основного класу задач Data Mining.

Наукова новизна дипломної роботи полягає у наступному: запропоновано методику адаптивної кластеризації та регресії, заснованої на використанні критеріїв оцінки якості рішення, що дозволить повністю формалізувати рішення задачі кластеризації та регресії. Відмінною особливістю методики є оцінка якості кожного розбиття та вибір найкращого з них.

Теоретичне значення. Основні матеріали викладені у дипломній роботі можуть бути використані при вивченні студентами спеціальності «Економічна кібернетика» таких дисциплін, як: системи підтримки прийняття рішень, стратегічний управління.

Практичне значення. Пропозиції подані у третьому розділі можуть бути використані при вирішенні задач кластеризації та регресії; описана в роботі методика адаптивної кластеризації та регресії та рекомендації щодо її застосування дозволяють значно формалізувати аналіз даних, а впровадження гібридної інтелектуальної системи сприятиме підвищенню ефективності прийняття рішень у багатьох сферах.

Апробація. Основні результати роботи, зокрема, методика адаптивної кластеризації та регресії була перевірена та впроваджена у діяльність ТДВ «Епіцентр К»

Структура роботи. Дипломна робота складається зі вступу, чотирьох розділів, висновків, списку використаних джерел та додатків. Основний зміст роботи викладено на 85 сторінках, робота містить 18 рисунків, 9 таблиць, 4 додатки.