- •2. Поиск ап(Ассоциативные правила)
- •2.1 Формальная модель.
- •Определение модели вычисления точности и важности.
- •2.3 Алгоритмы выявления ассоциативных правил.
- •2.4 Ассоциативные правила в реляционной базе данных.
- •Нечеткие транзакции и нечеткие ассоциативные правила.
- •3.2. Нечеткие транзакции и нечеткие ассоциативные правила. Наш путь
- •Поддержка и доверие в нечетких ассоциативных правилах.
- •Различные модели для определения точности и важности.
- •4 Приложение.
- •Нечеткие ассоциативные правила в реляционной базе данных.
- •4.2.Нечеткость и приближенные функциональные зависимости.
- •Связанные правила
4.2.Нечеткость и приближенные функциональные зависимости.
Используя подходящие подходящие определения элементов и транзакций НАП могут описать структуру паттерна отличную от описанной в предыдущей секции. В дальнейшем мы суммируем методологию обработки функциональных зависимостей в реляционных базах данных при помощи ассоциативных правил с подходящим представлением элементов и транзакций.
Пусть RE множество атрибутов и r экземпляр RE. Функциональная зависимость , содержится в r, если значение определяет для каждого кортежа . Формально эту зависимость можно описать можно описать так
, if then
Зависимость содержится в RE , если она содержится во всех экземплярах RE.
Открытие скрытых знаний это очень интересно, но в тоже время очень трудно найти «превосходную» зависимость, преимущественно потому, что обычно существуют исключения. Для того чтобы справиться с этим существует два основных подхода (оба представляют собой некий вид сглаженных зависимостей): нечеткие функциональные зависимости и аппроксимация зависимостей.
Мы используем АП, чтобы представить приближенные зависимости. Для этой цели ассоциируем транзакции и элементы с парами кортежи и атрибуты соответственно. Договоримся, что элемент ассоциирован с атрибутом X, , и транзакция ассоциированная с парными кортежами , где . Множество транзакций, соотнесенное на экземпляр r в RE обозначим как , содержащее транзакций.
Очевидно, что поддержка и достоверный фактор АП в измеряют важность и точность соответствующей приближенной функциональной зависимости. Главный недостаток этого пути вычислительная сложность, потому что и алгоритм имеет линейную сложность от числа транзакций. Мы решили эту проблему путем анализа нескольких транзакций в то время. Алгоритм хранит поддержку для каждого элемента формы с для того, чтобы получить поддержку .
Пример 4. Пусть отношение на таблице 7. Экземпляр RE={ID, Y ear, Course, Lastname}.
Таблица 8 показывает T множество и таблица 9 содержит некоторые АП из .
Точность и поддержка АП в таблице 9 измеряют точность и поддержку соответствующей функциональной зависимости.
Нечеткие ассоциативные правила необходимы и в этом контексте, когда участвуют количественные признаки. Наши алгоритмы обеспечивают не только приближенная зависимость, но и модель, которая состоит из набора АП (в обычном смысле в реляционных базах данных), касающихся значений предшествующих со значениями последующих зависимостей. Но когда атрибуты количественные, эта модель страдает теми же проблемами, что и в предыдущей подсекции. Чтобы справиться с ними, мы предлагаем использовать множество лингвистических меток. Набор меток индуцирует нечеткое схожее отношение в области X следующим образом.
Для всех , принимая, что для каждого есть один , такой что
Тогда элемент в транзакции со степенью . Транзакции из таблицы r нечеткие и обозначим как . В новой ситуации мы можем найти приближенную зависимость в r ища нечеткие ассоциативные правила (НАП) в .Моделью таких приближенных зависимостей будет множество ассоциативных правил из . Эти зависимости могут быть использованы для обобщения данных в отношение.
Функциональные зависимости могут быть сглажены (скорее всего, имелось в виду вместо «сглажены» - «представлены как» {мое личное мнение}) в нечеткие функциональные зависимости несколькими альтернативными способами представленными в [16]. Мы показали, что большинство из них можно получить, заменяя равенство и универсальный квантификатор в правиле 5, используя отношение подобия S и нечеткий квантификатор Q соответственно[34].
Для примера, пусть отношение сходства[25] и такое что,
Так же пусть , где
Функциональная зависимость определяется как [26]
, if then
Может быть смоделирована в r , используя ассоциативные правила из . Здесь обозначает нечеткое множество нечетких сходств, заданными S между парами кортежей из r.
Мы также столкнулись с более общей задачей: интеграции нечетких и приближенных зависимостей в то, что мы называем нечеткие количественные зависимости [34] (то есть нечеткие функциональные зависимости с исключениями). Заметим, что наш семантический подход, основанный на оценке количественного предложения позволяет оценить правила более гибким путем. Следовательно, иметь дело с определенными видами паттернов возможно, как мы увидели выше.