Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2064

.pdf
Скачиваний:
6
Добавлен:
07.01.2021
Размер:
2.87 Mб
Скачать

где νj – значение частоты, соответствующее экстремуму функции F* ( i ); х – ширина окна интегрирования. Речевому сигналу ставится в соответствие массив вещественных чисел – атрибутов реализации голосового пароля.

Во время ввода парольного слова (автографа) снимаются координаты положения пера на планшете и давление пера на планшет (рис.2.9). Затем строится пространство признаков:

признаки, извлекаемые из функции скорости пера на планшете;

амплитуды первых 15-ти гармоник (гармоник с самой низкой частотой) данной функции, полученные в результате быстрого преобразования Фурье после написания парольного слова;

признаки, извлекаемые из функции давления пера на планшет;

амплитуды первых 15-ти гармоник (гармоник с самой низкой частотой) данной функции, полученные в результате быстрого преобразования Фурье после написании парольного слова;

массив коэффициентов корреляции между функциями координат положения пера от времени, функцией давления и их производными.

Давление

Время

Рис.2.9. График функции давления пера на планшет

При наборе парольной фразы на клавиатуре признаками являются массив времён удержаний клавиш и массив пауз между их нажатиями. Атрибутами реализации, в данном случае будут

51

элементы этих массивов.

Рис.2.10. Значения пауз между нажатиями (а) и времени нажатия клавиш

(б) при наборе фразы «прошу разрешить доступ к информации»

Регистрация пользователя производится на сервере: пользователь записывает парольную фразу через микрофон, расписывается на планшете и вводит пароль на клавиатуре 30 раз, после чего создается эталон пользователя по каждому из признаков. Принимается гипотеза о том, что значения атрибутов всех признаков распределены по нормальному закону (проверяется при создании эталонов критерием χ-квадрат Пирсона). Эталон состоит из атрибутов, каждый атрибут представляет собой пару чисел: математическое ожидание и среднеквадратическое отклонение.

Решение о легальности пользователя (соответствии представленой реализации какому-либо из эталонов) принимается по модифицированной формуле Байеса (с контролем приращения вероятностей гипотез):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

*

 

 

 

P*

(H

i

/ A) P(A/ H

)

 

 

 

 

 

 

j 1

 

 

 

 

i

 

 

Pj

(Hi

/ A) Pj 1

(Hi

/ A)

 

 

 

 

 

 

 

 

 

 

 

n

P*

 

(H

 

/ A) P(A/ H

)

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

j 1

 

 

 

 

i

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

где Wj вес j-го атрибута.

Pj* 1(Hi / A) Wj ,

Условные вероятности на каждом шаге для каждой гипотезы определяются исходя из плотности распределения признаков (рис.

52

2.11).

Пространство эталонов разбивается на пересекающиеся подклассы с помощью алгоритма нечеткого вывода.

Рис. 2.11. Пример графика формирования гипотез по Байесу с ограничением

приращения вероятностей (1-8 пользователи)

Для разбиения на категории эталонов используются наиболее стабильные признаки: коэффициент корреляции между функциями y и dx положения пера на планшете, общее время набора парольной фразы на клавиатуре, а также количество переходов через ноль функции автокорреляции речевого сигнала. Атрибуты эталонов по этим признакам преобразовываются в нечеткие множества с функцией принадлежности: Mi(r)= Pi(r)/Pi(m(r)), где r – значение признака (коэффициента корреляции между функциями y и dx положения пера на планшете, общее время набора парольной фразы на клавиатуре, количество переходов через ноль функции автокорреляции); Pi(r) – функция плотности распределения признака для i-го пользователя; mi(r) математическое ожидание признака, принадлежащее параметру эталона пользователя. Затем все атрибуты эталонов, используемые на следующих этапах идентификации, преобразуются по формуле A*i,j = =Ai,j∙Mi(r) , где Ai,j – функция плотности распределения, сформированная j-м атрибутом эталона i-го пользователя.

При добавлении/удалении очередного эталона признаки взвешеваются по информативности (каждому атрибуту, в

53

зависимости от степени пересечения функций плотностей вероятности, присваевается вес wi, что влияет на ход идентификации в последующем). Вычисление площадей пересечения функций плотностей вероятности осуществляется методом численного интегрирования.

Рис. 2.12. Плотности распределений коэффициентов корреляции между функциями x и dy, преобразованные

в функции принадлежности (1-8 пользователи)

Для разграничения “своих” и “чужих” (легальных и нелегальных) пользователей используется модифицированный метод Хемминга с границами интервалов, вычисляемых по формулам: min(vj)=m(vj)-t(N,(1–P1))·s(vj), mах(vj)=m(vj)+t(N,(1–

P1))·s(vj), где N – число использованных при обучении реализаций, P1 заданное значение вероятности ошибок первого рода; t(N,(1– P1)) – коэффициенты Стьюдента; vi i-й атрибут эталонов. Степень принадлежности значения атрибута реализации интервалу является действительным числом и принадлежит отрезку [0;1].

Тестирование описанного механизма идентификации проводилось следующим образом: в базе данных находились эталоны шестидесяти пользователей; каждый зарегистрированный пользователь производил десять попыток входа в систему; десять незарегистрированных пользователей производили по сто попыток входа. Комплекс показал следющие результаты:

54

вероятность ошибки первого рода составляет 0,03 с достоверностью 0,979;

вероятность ошибки второго рода составляет 0,001 с достоверностью 0,988.

Использование трёх независимых типов динамических

признаков позволило повысить вероятность правильной идентификации по сравнению с результатами, полученными при использовании каждого типа признаков в отдельности.

Задача

1. На тепловых изображениях иногда обнаруживаются локальные пятна. Установлено два источника появления пятен: класс A1 и класс A2. Причем оба класса образов встречаются одинаково часто.

Измерения отношения продольных размеров пятен к поперечным (признак x1), проведенные на изображениях, и последующая обработка результатов измерения позволили сделать

вывод, что параметр (признак x1)

распределен по нормальному

закону

с

математическим

ожиданием

mx1 / А2

1

и

среднеквадратичным отклонением

x1

/ A2 0,19

для

второго

класса и

mx1 / A1 1,21, x1 / A2 0,25

для первого. Установлено

также, что

распределение коэффициентов корреляции

x2

AiH

между изменением оптической плотности по сечению изображения образа и импульсом прямоугольной формы протяженностью, равной длительности этого образа, также подчиняются

нормальному

закону

с

параметрами

mx2 / A2

0,5,

x2 / A2 0,12;

mx2 / A1 0,72,

x2 / A1 0,1.

 

 

Требуется, обнаружив пятно на тепловом изображении

очередного снимка, установить,

относится ли оно к классу A1 или

классу

A2,

если результаты

измерений параметров

пятна:

x1 1,07,

x2 0,57.

 

 

 

 

Решение

Вероятность отнесения образа i-му классу по результату измерения j-го признака

55

p A / x

 

 

 

1

 

 

 

 

x

j

m

xj

/ A 2

 

 

 

 

 

 

exp

 

 

 

 

i

.

(2.11)

 

 

 

 

 

/ A

 

 

2 2 / A

 

 

2

 

 

 

i

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xj

i

 

 

 

 

xj

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Подставляя в это выражение значения параметров каждого из классов и пользуясь выражением (23), получаем следующие результаты.

При x1 1,07 вероятность принадлежности дефекта к первому классу равна 0,411, ко второму – 0,598. Аналогичные результаты для второго признака x2 : 0,313 и 0,687. Если вероятности, полученные для первого признака, использовать в качестве априорных при расчетах по второму признаку, то p(A1/x2) 0,24; p A2 /x2 0,76. У нас есть все основания принять решение, что пятно на тепловом снимке относится ко второму классу.

3. МЕТОДЫ ПЕРВИЧНОЙ ОБРАБОТКИ СИГНАЛОВ

Понятия вероятности ложной тревоги и пропуска объекта pпр

связаны между собой. Очевидно, величина pпо 1 pпр есть вероятность правильного обнаружения. Всегда существует потребность уменьшить уровень ошибок первого pлm и второго pпр рода, т.е. повысить надежность обнаружения. Выбор оптимального порога принятия решений может не дать желаемого результата. В таких случаях прибегают к дополнительной (первичной) обработке регистрируемых сигналов, позволяющей улучшить характеристики обнаружения в целом.

По существу методы первичной обработки сигналов позволяют повысить отношение сигнал/шум на входе решающего устройства. Надежность обнаружения непосредственно связана с отношением сигнал/шум. Действительно, вероятности ложной тревоги и правильного обнаружения задаются выражениями:

 

 

1

 

 

 

 

2

 

 

 

 

 

 

 

 

 

pлm p Bш dB

 

 

exp

 

 

Bш

 

(3.1)

 

 

 

2

 

2 B

 

dB;

B

П

B

 

 

 

 

2 B

 

 

П

 

 

 

 

 

 

 

 

 

 

 

 

56

 

 

 

 

 

 

 

BП / Bc

 

 

 

 

1

 

 

 

 

2

 

 

 

 

 

 

 

 

 

pпо p Bш

ѓўBc dB

 

 

 

 

 

 

 

Bш ѓўBc

 

 

 

 

 

exp

 

2ѓР2

 

 

dB . (3.2)

BП

 

BП

2

 

B

 

 

 

B

 

Нормальный закон распределения вероятностей симметричен относительного среднего. Поэтому выражение (3.1) можно переписать в виде

BП

pлm 0,5 P Bш dB,

0

а при замене переменной

z B/

2 B

представить его

через

функцию Лапласа

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

x

 

 

 

 

 

 

 

 

 

Ф х

 

exp z2 dz, т.е.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

Bc

 

BП

 

 

 

 

 

 

 

 

 

p

 

 

 

 

 

 

 

 

 

 

 

лm

 

 

 

 

0,5

 

 

 

(3.3)

1 Ф

 

B

 

.

 

2

 

 

 

 

 

 

 

Bс

 

Аналогичным образом преобразуется выражение для вероятности правильного обнаружения

 

 

1

 

 

 

 

Bc

 

BП

 

 

 

 

 

 

 

pпо

1 Ф

 

0,5

 

 

 

 

 

 

 

 

.

(3.4)

 

B

 

 

 

 

 

2

 

 

 

 

ΔBc

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сомножитель Bc / B в (3.3) и (3.4) есть ни что иное, как отношение сигнал/шум. Диапазон изменения члена ограничен: 0 BП / Bc 1.

Вероятности pпо и pлm функционально связаны между собой.

Графики pпо f (pлт) при различных Bc / B изображены на рис. 3.1.

57

Рис. 3.1. Рабочие характеристики приемного устройства

В технической литературе они называются рабочими характеристиками приемного устройства. Точки на графиках, соответствующие значениям BП / Bc 0; 0,5; 1, лежат на прямых

pлт 0,5,

pпо 1 pлт , pпо 0,5.

Асимптотическим выражением

рабочей

характеристики при

Bc / B 0 служит прямая

pпо pлт .

Основной вывод, который следует сделать из анализа кривых на рис. 3.1, состоит в том, что повышение вероятности правильного обнаружения ведет к увеличению вероятности ложной тревоги. При заданной вероятности pлт повысить вероятность pпо можно за счет увеличения отношения сигнал/шум. Для решения этой задачи разработаны методы первичной обработки сигналов. Среди них наиболее общий характер имеет метод накопления.

Чтобы обнаружить слабо освещенный объект, мы неосознанно увеличиваем время наблюдения. Человек для повышения надежности обнаружения использует принцип накопления

информации.

 

 

Пусть на шум Вш

наложен сигнал Вс , занимающий

некоторую область x. Если в этой области взять

m отсчетов и

просуммировать их, то итоговый результат запишется в виде

m

m

 

Bu Bш

Вс i m Bc Вш i .

(3.5)

i 1

i 1

 

Первый член (3.5) представляет собой полезный сигнал на входе решающего устройства. Случайная величина Вш i характеризует интенсивность видоизмененного шума (помехи).

58

Отношение сигнал/шум на входе

решающего устройства

запишется так:

 

Bc / B u m Bc / D ( Вш)i ,

где D – дисперсия суммы отсчетов шумового процесса. Если Вш i

некоррелированы, то

Bc / B u m Bc /

D Bш i

.

 

i

Отсчеты Вш i – мгновенные значения одного и того же случайного процесса Вш х имеют одинаковое распределение. Поэтому

D Bш i B2

 

Bc / B u

 

Bc / B .

,

m

i

 

 

 

 

Отношение сигнал/шум на

входе решающего устройства

увеличилось в m раз по сравнению с отношением сигнал/шум на входе накопителя. В соответствии с данными на рис. 3.1 возросла и надежность обнаружения.

Теоретически описанным способом можно обнаружить сколь угодно слабый сигнал, если имеются условия для его реализации. Но обеспечиваемый при этом выигрыш в отношении сигнал/шум дается не даром. В лучшем случае для повышения Bc / B в два раза время экспозиции должно возрасти в четыре раза (в соответствии с законом m ).

Описанный принцип увеличения отношения сигнал/шум применим и в случае сигнала произвольной формы, если значения отсчетов не одинаковы. Действительно,

1

Вu Bш Bc i m m Bci Bш i m Bc Bш i ,

где Bc – среднее значение отсчетов сигнала. Тогда

Bc / B u

 

 

 

 

m

Bc B .

59

Если снять условие независимости величин Bш i , то эффект

от применения процедуры накопления снизится. В случае стопроцентной корреляции отсчетов помех какого-либо увеличения отношения сигнал/шум получить нельзя.

Если же просуммировать несколько телевизионных (рентгенотелевизионных) кадров одного и того же изображения объекта, отношение сигнал/помеха на итоговом изображении будет выше, чем на его составляющих – слагаемых. Это обусловлено, прежде всего, тем, что собственные шумы телевизионного канала характеризуются ограниченным интервалом корреляции, и межкадровая корреляция помех будет меньше единицы. Таким образом, использование принципа накопления в телевизионных системах преследует цель борьбы с собственными аппаратурными шумами.

Изложенным качественным соображениям можно дать количественную оценку. В теории вероятностей доказывается, что

дисперсия суммы зависимых случайных величин

выражается в

виде

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

Bшi

 

,

D

Bшi

M Bшi

M Bш2i

Bшk

i

 

i

 

i

i k

 

 

 

(3.6)

 

 

 

 

 

 

 

 

 

где M – знак математического ожидания, вторая сумма берется по всем i k. Введение разности k i позволяет представить её в более удобном для анализа виде:

BшiBшk

 

m-1

2 Bшi Bш i 2 m Bш Bш , (3.7)

i k

i

-1

где произведение

Bш Bш

означает пару значений, порядковые

номера которых отличаются на . Подставляя (3.7) в (3.6) , получаем

60

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]