- •1. Процес набуття знань. Його мета, основні складнощі. Функції його учасників.
- •2. Основні стадії процесу набуття знань та їх взаємодія.
- •3. Види методів витягу знань з експерта.
- •4. Оболонки експертних систем. Система emysin, як універсальна оболонка.
- •5. Система teiresias як універсальний інтерфейс експертної системи
- •6. Що таке дані? Набори даних, види даних.
- •7. Дані. Шкалування даних.
- •8. Інтелектуальний аналіз даних. Основні стадії.
- •9. Задачі інтелектуального аналізу даних.
- •10.Задача класифікації, як задача інтелектуального аналізу даних.
- •11. Процесс розв’язання задачі класифікації інтелектуального аналізу даних
- •12.Задача кластерізації, як задача інтелектуального аналізу даних.
- •Методы кластеризации
- •13. Порівняння задач класифікації та кластерізації.
- •15. Дерево прийняття рішень як апроксимація булевської функції
- •16. Дерева прийняття рішень. Ентропія, як характеристика цільової функції.
- •17. Критерій приросту інформації. Проблеми з критерієм приросту інформації.
- •18. Дерева прийняття рішень. Оверфіттінг
- •19. Генетичний алгоритм. Загальна схема генетичного алгоритма.
- •20. Генетична операція «кроссовер».
- •21. Представлення даних у вигляді бітових рядків.
- •22. Відбір, як основний елемент генетичного алгоритму.
- •23. Покажіть на прикладі «метод рулетки» та «ранговий метод», як методи відбору генетичного алгоритму.
- •24. Відображення теорій Ламарка та Болдуіна у генетичних алгоритмах.
5. Система teiresias як універсальний інтерфейс експертної системи
Следующую ступень в развитии экспертных систем представляет система TEIRESIAS. Это промежуточная программа (интерфейс), ведущая диалог с экспертом на естественном языке с целью освободить его от анализа отдельных частностей. Система TEIRESIAS может не только непосредственно использовать свои знания, но и заниматься их изучением, обобщением и обсуждением. В программе TEIRESIAS можно выделить три уровня обобщения:
- знания об объектах данных, специфические для предметной области;
- знания о типах данных, специфические для метода представления знаний;
- знания, независимые от метода представления.
Эксперт может использовать программу TEIRESIAS для взаимодействия с экспертной системой, подобной MYCIN, и следить с ее помощью за тем, что делает экспертная система и почему. Поскольку на этапе разработки экспертной системы мы всегда имеем дело с неполным набором правил, в котором к тому же содержится множество ошибок, можно задать вопрос эксперту: «Что вы знаете такого, что еще не знает программа?» Решая конкретную проблему, эксперт может сосредоточить внимание на корректности правил, вовлеченных в этот процесс, из числа тех, что ранее введены в систему, их редактировании при необходимости или включении в систему новых правил. В составе TEIRESIAS имеются и средства, которые помогают оболочке EMYCIN следить за поведением экспертной системы в процессе применения набора имеющихся правил.
6. Що таке дані? Набори даних, види даних.
Данные — это результат фиксации, отображения информации на каком-либо материальном носителе, то есть зарегистрированное на носителе представление сведений независимо от того, дошли ли эти сведения до какого-нибудь приёмника и интересуют ли они его. Наборы данных представляют собой объекты, содержащие таблицы данных, в которых можно временно хранить данные для их использования в приложении. Если ваше приложение требует работы с данными, можно загрузить их в набор данных. Данные для работы приложения в этом случае будут храниться в локальной памяти. Можно работать с данными в наборе данных, даже если приложение отключается от базы данных. Набор данных хранит информацию об изменениях своих данных. Так что обновления можно отслеживать и отправлять обратно в базу данных, когда ваше приложение вновь подключится к ней. Существует три основных типа структур данных: линейная, иерархическая и табличная. Линейные структуры – это хорошо знакомые нам списки. Список – это простейшая структура данных, отличающаяся тем, что адрес каждого элемента данных однозначно определяется его номером. Проставляя на отдельных страницах рассыпанной книги, мы создаем структуру списка, поскольку все студенты группы зарегистрированы в нем под своими уникальными номерами. Мы называем номера уникальными потому, что в одной группе не могут быть зарегистрированы два студента с одним и тем же номером. Линейные структуры данных (списки) – это упорядоченные структуры, в которых адрес элемента однозначно определяется его номером. С таблицами данных мы тоже хорошо знакомы, достаточно вспомнить всем известную таблицу умножения. Табличные структуры отличаются от списочных тем, что элементы данных определяются адресом ячейки, который состоит не из одного параметра, как в списках, а из нескольких. Для таблицы умножения, например, адрес ячейки определяется номерами строки и столбца. Нужная ячейка находится на их пересечении, а элемент выбирается из ячейки. Табличные структуры данных (матрицы) – это упорядоченные структуры, в которых адрес элемента определяется номером строки и номером столбца, на пересечении которых находится ячейка, содержащая искомый элемент. Нерегулярные данные, которые трудно представить в виде списка или таблицы, часто представляют в виде иерархических структур. С подобными структурами мы очень хорошо знакомы по обыденной жизни. Иерархическую структуру имеет система почтовых адресов. Подобные структуры также широко применяются в научных систематизациях и всевозможных классификациях. В иерархической структуре адрес элемента определяется путем доступа (маршрутом), ведущим от вершины структуры к данному элементу.