Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kovalev_Karaseva_Multilingvisticheskie_tekhnologii.doc
Скачиваний:
129
Добавлен:
06.03.2016
Размер:
3.28 Mб
Скачать

4.3.2. Динамический профиль лпр в информационно-управляющих системах

А теперь рассмотрим новую схему моделирования интересов пользователя, основанную на инициализации начального профиля и его последовательной корректировке в процессе работы.

Как уже отмечалось, для того чтобы следить и непрерывно анализировать возможные изменения интересов пользователя, в латентное семантическое пространство необходимо ввести понятие временного измерения, рассматривая тем самым уже не само латентное семантическое пространство, а его модификацию – временное латентное семантическое пространство [103]. Каждое измерение такого векторного пространства (за исключением временно́го) представляет собой условные вероятности при заданном классе P( | z), документы являются векторами с весовыми коэффициентами (координатами) P(z | d), а временное измерение полагаем равным нулю.

Запросы, как и сами документы, могут быть векторами во временном латентном семантическом пространстве. Кроме весов P(z | Q) у них есть дополнительное (временное) измерение – текущий вес, первоначально равный некоторой положительной величине, уменьшающейся с течением времени исходя из предположения о падении интереса пользователя к определенной тематике при отсутствии ее фигурирования в запросах продолжительное время. Если же пользователь инициирует запрос, связанный с определенной категорией из его текущего профиля, то вес данной категории может быть либо стабилизирован на определенное время, либо увеличен.

Согласно теории латентного семантического пространства, запрос, состоящий из терминов, проецируется в латентное семантическое пространство[92]. Таким образом, гиперповерхностьSi, образованная запросомQi, является пересечением вероятностных поверхностей всех классов, введенных на латентном семантическом пространстве, в которых с определенной вероятностью фигурирует данный термин:

Для реализации запроса используется алгоритм адаптивной коррекции профиля, основанный на неявной обратной связи с пользователем, которая реализуется на основе истории его запросов. На вход алгоритма поступает запрос пользователя, на выходе будет получена одна или более троек (триплетов) вида (Ci,Wi,i), гдеCi– категория интересов;Wi– текущий вес; i – уровень изменчивости (смысл данной величины состоит в том, чтобы отразить, насколько изменяются интересы пользователяв рамках текущего запроса по отношению к прошлым запросам).

Итак, профиль пользователя представляет собой набор троек. При этом он организован таким образом, что интересы пользователя разделены на два типа: краткосрочные (краткосрочный профиль) и долгосрочные (долгосрочный профиль). Как правило, емкость долгосрочного профиля больше емкости краткосрочного. При этом считается, что тройки, в которых величина текущего веса положительная, относятся к краткосрочному профилю, если вес отрицательный, то к долгосрочному профилю. Текущий вес для троек, находящихся в краткосрочном профиле, уменьшается линейно, тогда как для троек, находящихся в долгосрочном профиле, снижение весов экспоненциальное.

Структуру профиля пользователя можно представить в табличном виде (рис. 4.2).

Кино

Музыка

Квантовая

физика

Спорт

Категория

95

85

35

70

Текущий вес

0.60

0.45

0.20

0.15

Уровень изменчивости

Рис. 4.2. Краткосрочный профиль пользователя

Формально профиль в текущий момент iописывается следующим образом:

Pri = {(Cj, Wj, j)i, j = 1, k}. (4.8)

При этом

Pri = PrRi  PrLi, (4.9)

где PrRi = {(Cj, Wj, j)i |  Wj  0, j = 1, k } – краткосрочный профиль; PrLi = {(Cj, Wj, j)i |  Wj  0, j = 1, k } – долгосрочный профиль.

Уровень изменчивости iрассчитывается как близость двух последовательных запросовQiиQi–1, представленных в пространстве частот их терминов:

(4.10)

где – взвешенные частоты терминов.

На основании приведенных выше расчетов можно сделать вывод о том,что емкость долгосрочного профиля действительно больше емкости краткосрочного.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]