Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5389

.pdf
Скачиваний:
1
Добавлен:
21.11.2023
Размер:
600.33 Кб
Скачать

3)Количество правил =

4)Товары – лидеры продаж, (имеющие поддержку в нашей задаче)>10%:

5)Указание: используйте фильтр в визуализаторе «Популярные наборы».

6)Тривиальные правила (включающие лидеры продаж):

7)Тривиальные правила (экспертное мнение):

8)Полезные правила:

9)Непонятные правила:

4.Для Полезных правил найти и проанализировать показатели значимости: S, C, L, T, I

5.Сделать вывод, оформить отчет:

Какие полезные правила выявлены:

Какое максимальное значение лифта было зафиксировано? Какое правило имеет максимальный лифт?

Заказчика, в частности, интересует, какие товары покупают к поздравительной от-

крытке. Сколько таких товаров? Какая из ассоциаций здесь представляет наиболь-

ший интерес (имеет максимальный лифт)

как полезные правила применять на практике.

.4. Методические указания по организации самостоятельной работы

. 4.1 Общие рекомендации для самостоятельной работы

Самостоятельная работа студентов является основным способом овладения учебным мате-

риалом в свободное от обязательных учебных занятий время.

Целями самостоятельной работы студентов являются:

-систематизация и закрепление полученных теоретических знаний и умений студентов;

-углубление и расширение теоретических знаний;

-формирование умений использовать нормативную, правовую, справочную документацию

испециальную литературу;

-развитие познавательных способностей и активности студентов:

-формирования самостоятельности мышления, способностей к саморазвитию, самосовер-

шенствованию и самореализации.

Запланированная в учебном плане самостоятельная работа студента рассматривается как связанная либо с конкретной темой изучаемой дисциплины, либо с подготовкой к расчетной рабо-

те. В данном разделе рассматривается только самостоятельная работа первого вида.

Самостоятельная работа выполняется в два этапа: планирование и реализация.

11

Планирование самостоятельной работы включает:

-уяснение задания на самостоятельную работу;

-подбор рекомендованной литературы;

-составление плана работы, в котором определяются основные пункты предстоящей подго-

товки.

Составление плана дисциплинирует и повышает организованность в работе.

На втором этапе реализуется составленный план. Реализация включает в себя:

-изучение рекомендованной литературы;

-составление плана (конспекта) по изучаемому материалу (вопросу);

-взаимное обсуждение материала.

Необходимо помнить, что на лекции обычно рассматривается не весь материал. Оставшаяся восполняется в процессе самостоятельной работы. В связи с этим работа с рекомендованной лите-

ратурой обязательна.

Работа с литературой и иными источниками информации включает в себя две группы при-

емов: техническую, имеющую библиографическую направленность, и содержательную. Первая группа – уяснение потребностей в литературе; получение литературы; просмотр литературы на уровне общей, первичной оценки; анализ надежности публикаций как источника информации, их относимости и степени полезности. Вторая – подробное изучение и извлечение необходимой ин-

формации.

Для поиска необходимой литературы можно использовать следующие способы:

-поиск через систематический каталог в библиотеке;

-просмотр специальных периодических изданий;

-использование материалов, размещенных в сети Интернет.

В процессе взаимного обсуждения материала закрепляются знания, а также приобретается практика в изложении и разъяснении полученных знаний, развивается речь.

При необходимости студенту следует обращаться за консультацией к преподавателю.

Составление записей или конспектов позволяет составить сжатое представление по изучае-

мым вопросам. Записи имеют первостепенное значение для самостоятельной работы студентов.

Они помогают понять построение изучаемого материала, выделить основные положения, просле-

дить их логику.

Ведение записей способствует превращению чтения в активный процесс. У студента, си-

стематически ведущего записи, создается свой индивидуальный фонд подсобных материалов для

12

быстрого повторения прочитанного. Особенно важны и полезны записи тогда, когда в них находят отражение мысли, возникшие при самостоятельной работе.

Можно рекомендовать следующие основные формы записи: план, конспект, тезисы, пре-

зентация.

План – это схема прочитанного материала, краткий (или подробный) перечень вопросов,

отражающих структуру и последовательность материала. Подробно составленный план вполне заменяет конспект.

Конспект – это систематизированное, логичное изложение материала источника. Объем конспекта не должен превышать 10 страниц. Шрифт Times New Roman, кегль 14, интервал 1,5.

Список литературы должен состоять из 5-8 источников, по возможности следует использовать по-

следние издания учебных пособий и исследований.

Тезисы – это последовательность ключевых положений из некоторой темы без доказа-

тельств или с неполными доказательствами. По объему тезисы занимают одну страницу формата А4 или одну – две страницы в ученической тетради. В конце тезисов студент должен сделать соб-

ственные выводы.

Презентации по предложенной теме составляются в программе Power Point или Impress.

Количество слайдов должно быть не менее 15 и не превышать 20 слайдов. Кроме текста на слай-

дах можно создавать схемы и таблицы. Шрифт должен быть читаемым, например, шрифт черного цвета на светлом фоне или светлый шрифт на темном фоне. Также шрифт не должен быть слиш-

ком мелким. В слайдах указываются только основные тезисы, понятия и нормы.

. 4.2 Темы для самостоятельного изучения

1.Технологии анализа данных. Data Mining, Visual Mining, Text Mining.

2.Типы многомерных OLAP-систем. Задачи и содержание оперативного (OLAP) анализа.

3.Data Mining: Data Mining: задача кластеризации. Методы кластерного анализа.

4.Data Mining: Искусственные нейронные сети для решения задач прогнозирования.

5.Data Mining: логистическая регрессия.

6.Data Mining: задача кластеризации. Карты Кохонена.

7.Современные методы анализа данных. Обнаружение логических закономерностей в данных

спомощью алгоритмов машинного обучения.

8.Оперативная аналитическая обработка данных. OLAP-технологии. Примеры применения.

9.Современные пакеты прикладных программ анализа, включающие методы машинного обу-

чения.

10.Интеллектуальные анализ данных и прогнозирование в АП Loginom.

13

. 5.1 Общие требования к оформлению расчетной работы

Расчетная работа оформляется на листах формата А4 в печатном виде в формате Word

(шрифт 12-14, поля: слева 2,5 см, остальные – по 2 см). Страницы работы следует пронумеровать.

Работа сдаётся на кафедру «Прикладной информатики и статистики». Работа, признанная не отве-

чающей предъявляемым требованиям, возвращается студенту для доработки. При этом указыва-

ются недостатки работы и даются рекомендации по их устранению.

Содержание отчета:

1.Титульный лист (по образцу).

2.Автоматически собираемое оглавление с указанием страниц на каждое задание и на список литературы

3.Цель работы и требования задания.

4.Для каждого задания нужно дать краткое описание алгоритма решения на основании мате-

риала лекционного курса.

5.Привести подробные расчеты с комментариями и пояснениями.

6.Выводы по работе.

Оценка «зачтено» выставляется студенту, являющемуся автором расчетной работы, соот-

ветствующей всем предъявляемым требованиям, в том числе формальным.

Оценка «не зачтено» выставляется студенту, являющемуся автором расчетной работы, не соответствующей предъявляемым требованиям. Оценка «не зачтено» выставляется также, если студент неправильно решил более 50% задач, не ориентируется в тексте работы; не может дать ответы на уточняющие вопросы, касающиеся методов машинного обучения, использованных при выполнении заданий и т.д.).

. 5.2 Примерные варианты расчетной работы

Вариант 1.

Построить нейронную сеть, позволяющую аппроксимировать заданную многомерную нели-

нейную функцию:

Подготовить обучающую выборку средствами приложения Microsoft Excel и оформить ее в виде текстового файла с разделителями.

Рекомендации: Чтобы создать набор случайных чисел, нужно использовать функцию Excel

СЛЧИС(). Затем случайные числа следует перевести в нужный диапазон и рассчитать значение

заданной функции в соседнем столбце.

14

Провести обучение нескольких нейронных сетей (с различной архитектурой) с помощью

Deductor по алгоритму обратного распространения;

Проверить качество каждой обученной сети с помощью диаграммы рассеяния.

Выбрать наилучшую модель и оценить точность аппроксимации.

Общее задание: f x1 x2 (использовать готовый файл multi.txt)

Индивидуальные задания:

1.

f

 

x1 x2

x

4

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x3

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.

f

x

20Sin(x

2

) 5x

3

 

x4

 

 

 

1

 

 

 

 

 

 

 

 

 

e x5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

x

2

 

 

 

 

 

 

 

 

 

3.

f

 

1

 

2

Sin(x4

x5 )

 

 

 

 

 

 

 

 

x3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4.f x1 x2 x3 x4 x52

5.f 0,5Cos (x1 x2 )2 x3 1x4 2 x5

6.f 5x1 Cos(x2 x3 ) Sin(x4 x25 )

7.f 3Cos(x1 x2 ) 2Sin(x3 ) ln x4 10x52

8.f x12 x22 x32 x42 x52

9.f x1 2Cos(x2 ) x32 x4 Sin(x5 )

 

 

x

x

2

 

10.

f

1

 

2

Cos(x4 x5 )

 

 

 

 

x3

 

 

 

 

 

 

 

11.

f x

20Cos(x

2

) 5x

3

 

x4

 

 

1

 

 

 

e x5

 

 

 

 

 

 

 

12.f 5x1 Sin(x2 x3 ) Cos(x4 x25 )

Вариант 2. по теме «Алгоритм обратного распространения ошибок нейросетевого моде-

15

лирования»

1)Выполнить полностью 3 цикла прямого и обратного прохода ИНС, используя алгоритм обратного распространения ошибок для входного образца (0,1; 0,9) и целевого выходного значения 0,9 в предположении, что сеть имеет архитектуру 2-3-1 c весовыми коэффици-

ентами:

для первого слоя:

 

0,1

0,1

 

 

 

 

 

 

0,2

0,1

 

0,1

0,3

 

 

 

для второго слоя:

0,2

0,2

0,3

Параметры обучения: 1 и 0,1

2)Для НС типа 3-2-3 на вход подается вектор (1; 0,9; 0,9) для которого целевым выходным вектором является (0,1; 0,9; 0,1).

Пусть выходом элемента В является значение 0,6, а выходом элемента С – значение 0,8.

Функцией активации является сигмоида.

a)Вычислите фактический выходной вектор

b)Вычислите значения ошибок для каждого выходного элемента

c)Вычислите значения ошибок для каждого скрытого элемента

Вариант 3. Решение задачи классификации и прогнозирования с помощью нейросете-

вого моделирования

1.Импортировать данные из файла Риэлтор.txt.

2.В графическом экране отсортировать по убыванию поле Цена.

3.Используя OLAP, определить характеристики 10 самых дорогих квартир.

4.Выполнить предобработку данных с помощью обработчика Парциальная обработка (по данным цена – удалить аномалии).

5.Выполнить корреляционный анализ (для определения незначащих факторов): на входе:

все факторы, кроме номера примера; На выходе –цена.

Какие из признаков более значимые, какие – нет?

6.Выполните квантование данных по полю Цена по трем интервалам.

16

7.Применяя обработчик Замена данных, замените названия интервалов на дешевые, сред-

ние, дорогие.

8.Построить классификатор на основе нейронной сети для оценки недвижимости, относя-

щий объекты недвижимости на основе их признаков к одному из трех классов «дорогие,

средние, дешевые квартиры.

9.Для оценки качества модели постройте таблицу сопряженности и диаграмму «качество классификации».

10.Используя обработчик Нейросеть, постройте несколько моделей прогнозирования цены

с разной конфигурацией, (поле «номер пример» – информац., все – на вход, а цена – на вы-

ход). Теперь поле «цена» обязательно должно быть непрерывным.

11.Сколько весовых связей имеет нейронная сеть? Рассчитайте максимально возможное число нейронов скрытого слоя.

12.В ходе проектирования нейросетевой модели выявите оптимальную конфигурацию нейронной сети, используя визуализаторы оценки качества модели.

13.Определить оптимальную структуру нейронной сети с точки зрения минимизации средне-

квадратической ошибки обучения.

14.Изучить графические зависимости среднеквадратической ошибки обучения от количества нейронов, используемых в скрытых слоях, и от количества итераций, используемых для обучения.

15.При помощи визуализатора «Что-если» проверьте, как работает построенный нейросете-

вой классификатор и лучшая нейросеть прогноза цены.

17

Прокопенко Н.Ю.

МАШИННОЕ ОБУЧЕНИЕ

Учебно-методическое пособие по подготовке к лекциям, лабораторным занятиям

(включая рекомендации по организации самостоятельной работы),

по выполнению расчетной работы для обучающихся по дисциплине «Машинное обучение»

по направлению подготовки 09.03.04 Программная инженерия,

профиль Разработка программно-информационных систем

Федеральное государственное бюджетное образовательное учреждение высшего образования

«Нижегородский государственный архитектурно-строительный университет»

603950, Нижний Новгород, ул. Ильинская, 65.

http://www. nngasu.ru, srec@nngasu.ru

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]