4.3.2. Динамический профиль лпр в информационно-управляющих системах

А теперь рассмотрим новую схему моделирования интересов пользователя, основанную на инициализации начального профиля и его последовательной корректировке в процессе работы.

Как уже отмечалось, для того чтобы следить и непрерывно анализировать возможные изменения интересов пользователя, в латентное семантическое пространство необходимо ввести понятие временного измерения, рассматривая тем самым уже не само латентное семантическое пространство, а его модификацию – временное латентное семантическое пространство [103]. Каждое измерение такого векторного пространства (за исключением временно́го) представляет собой условные вероятности при заданном классе P( | z), документы являются векторами с весовыми коэффициентами (координатами) P(z | d), а временное измерение полагаем равным нулю.

Запросы, как и сами документы, могут быть векторами во временном латентном семантическом пространстве. Кроме весов P(z | Q) у них есть дополнительное (временное) измерение – текущий вес, первоначально равный некоторой положительной величине, уменьшающейся с течением времени исходя из предположения о падении интереса пользователя к определенной тематике при отсутствии ее фигурирования в запросах продолжительное время. Если же пользователь инициирует запрос, связанный с определенной категорией из его текущего профиля, то вес данной категории может быть либо стабилизирован на определенное время, либо увеличен.

Согласно теории латентного семантического пространства, запрос, состоящий из терминов, проецируется в латентное семантическое пространство[92]. Таким образом, гиперповерхностьS_i, образованная запросомQ_i, является пересечением вероятностных поверхностей всех классов, введенных на латентном семантическом пространстве, в которых с определенной вероятностью фигурирует данный термин:

Для реализации запроса используется алгоритм адаптивной коррекции профиля, основанный на неявной обратной связи с пользователем, которая реализуется на основе истории его запросов. На вход алгоритма поступает запрос пользователя, на выходе будет получена одна или более троек (триплетов) вида (C_i,W_i,_i), гдеC_i– категория интересов;W_i– текущий вес; _i – уровень изменчивости (смысл данной величины состоит в том, чтобы отразить, насколько изменяются интересы пользователяв рамках текущего запроса по отношению к прошлым запросам).

Итак, профиль пользователя представляет собой набор троек. При этом он организован таким образом, что интересы пользователя разделены на два типа: краткосрочные (краткосрочный профиль) и долгосрочные (долгосрочный профиль). Как правило, емкость долгосрочного профиля больше емкости краткосрочного. При этом считается, что тройки, в которых величина текущего веса положительная, относятся к краткосрочному профилю, если вес отрицательный, то к долгосрочному профилю. Текущий вес для троек, находящихся в краткосрочном профиле, уменьшается линейно, тогда как для троек, находящихся в долгосрочном профиле, снижение весов экспоненциальное.

Структуру профиля пользователя можно представить в табличном виде (рис. 4.2).

Кино

Музыка

Квантовая

физика

Спорт

Категория

Текущий вес

0.60

0.45

0.20

0.15

Уровень изменчивости

Рис. 4.2. Краткосрочный профиль пользователя

Формально профиль в текущий момент iописывается следующим образом:

Pr_i = {(C_j, W_j, _j)_i, j = 1, k}. (4.8)

При этом

Pr_i= PrR_i  PrL_i, (4.9)

где PrR_i = {(C_j, W_j, _j)_i|  W_j 0, j = 1, k } – краткосрочный профиль; PrL_i = {(C_j, W_j, _j)_i|  W_j 0, j = 1, k } – долгосрочный профиль.

Уровень изменчивости _iрассчитывается как близость двух последовательных запросовQ_iиQ_i_–1, представленных в пространстве частот их терминов:

(4.10)

где – взвешенные частоты терминов.

На основании приведенных выше расчетов можно сделать вывод о том,что емкость долгосрочного профиля действительно больше емкости краткосрочного.

<<< < Предыдущая 9 10 11 12 13 14 15 16 17 18 19 20 2122 / 3322 23 24 25 26 27 28 29 30 31 32 33 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
17.03.201533.06 Кб11Kontrolnaya_rabota.docx
#
12.07.201979.36 Кб9Kontrolnaya_rabota_dlya_zaochnikov.doc
#
17.03.2015313.32 Кб17Kontrolnye_semestrovye_zadanija_po_discipline.pdf
#
17.03.2015963.07 Кб19kontr_detali.doc
#
06.03.2016564.85 Кб41Kopia_Laboratornaya_1_Programmir__Avtosokhrane (1).docx
#
06.03.20163.28 Mб129Kovalev_Karaseva_Multilingvisticheskie_tekhnologii.doc
#
28.04.2019491.4 Кб17kpzs.docx
#
17.03.2015387.58 Кб23Kramida_Otchety_1_2.doc
#
06.03.20161.14 Mб112Kuklina_Kireeva2007.doc
#
06.03.20161.92 Mб49Kursach_BD.docx
#
17.03.2015147.46 Кб24kursovaya_menedzhment 4 семестр.doc