Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа

..pdf
Скачиваний:
5
Добавлен:
12.11.2023
Размер:
12.16 Mб
Скачать

5.3. Аффинное преобразование изображений

131

Предположим, что две системы координат (5.9) связаны равенства­ ми О —Р = (vi, V2)SOA(^O) и (ец е2) = (vi, v2)/XiS(a), где /л > 0. Тогда для всех р и в выполняется

L (0 ,e i,e 2, 9,p,t) = L(Р, vi, v2, в + a,pp +

+ so cos(ipo в a), p , t + so sin(-i/>o —в a)), i g l . (5.16)

Вторая система координат имеет следующее свойство: произволвное изображение во второй системе координат имеет ту же форму, как если изображение подвергалось конформному аффинному преобразованию координат (умножению на матрицу pS(a), р, > 0 и переносу на векторстолбец soA(^o) в первой системе координат).

Проблема инвариантности (по отношению к линейным аффинным преобразованиям, аффинным преобразованиям, проективным преобра­ зованиям и пр.) является важнейшей в теории признаков и находит отражение в зарубежных исследованиях [126, 127, 132, 133].

9*

ГЛА ВА 6

ТРИПЛЕТНЫЕ ПРИЗНАКИ РАСПОЗНАВАНИЯ ОБРАЗОВ

6.1. Связь триплетных признаков с признаками, полученными в начальных главах

В настоящей главе так же, как и в главе 5, мы расширяем идеи начальных глав книги. Основная цель нижеследующих рассуждений состоит в том, что мы попытаемся обобщить конструкции некоторых признаков из второй и третьей главы с сохранением их полезных свойств. К таким свойствам относятся: возможности стохастической реализации, возможность параллельных вычислений при формирова­ нии признака, инвариантность к сдвигу и повороту изображения. Ещё одно положительное качество — ясный геометрический смысл — будет пожертвовано в пользу возможности обобщения.

Рассмотрим функционал Т, связанный с трейс-преобразованием. Он каждой функции a(t) вещественной переменной сопоставляет чис­ ло, например

/

о о

\ к

Т а

a(t)dt

(6.1)

— ОО

где к некоторая фиксированная степень, или

 

ОО

 

Т а

|a'(t)| dt.

(6.2)

— ОО

Функционал Т будет применяться и к каждой функции fe,P(t)• Формулы вида (6.1) и (6.2) широко применялись во второй главе книги для выявления признаков распознавания. Формула (6.2), в частности, означает, что подсчитывается число пересечений с границей изобра­ жений. Теперь результат Tfe,p, зависящий от прямой с параметра­ ми (в,р) надо «просуммировать» по всем прямым. Сделаем это в два этапа. На первом этапе понадобится функционал Р, он действует на функцию (3(р), зависящую от вещественной переменной р. Если (при фиксированном угле в) трактовать число Tfe.p как функцию от р, то к ней можно применить функционал Р. Полученная композиция двух

6.1. Связь триплетных признаков

133

функционалов

р о Tfe.p

есть функция от в. Это 27г(или 7г)-периодическая функция. Поэтому понадобится функционал 0 , действующий на 2-7г-периодическую функ­ цию 7 (9).

Итак, при наличии трёх функционалов каждому изображению мож­

но сопоставить число

 

 

 

Признак = 0

о Р о Tfe.p.

(6.3)

Во второй и третьей главах книги

2тг

 

 

 

 

(3(р) dp,

0 О

7 (в)<Ю.

(6.4)

Выражения (6.4) взяты не произвольно, а на основе теоремы об единственности инвариантной меры на множестве прямых. Для дости­ жения независимости признаков распознавания от поворотов и пере­ мещений изображений объектов мы используем композицию функцио­ налов 0 о Р представляющую собой интегрирование Tfe.p по инвари­ антной мере множества прямых. Такая процедура вычисления признака и дала нам возможность не вводить в явном виде трейс-преобразование в первых главах книги.

Представляет интерес вопрос, единственный ли это путь — с по­ мощью интегрирования по инвариантной мере получать признаки рас­ познавания, не зависящие от перемещений и поворотов изображений. Если выбрать другие функционалы Т, Р и 0 , получатся ли другие новые признаки. Заметим, что выражения вида (6.1) и (6.2) тоже вы­ бирались не произвольно. Они обоснованны формулами стохастической геометрии, ибо мы интересовались в первых главах лишь признаками, имеющими определённую геометрическую интерпретацию.

Итак, выдвигается новая задача для исследования — искать признаки распознавания в виде композиции трёх функционалов:

П(F) = © о Р о Т (F о Ь(в, р, t)).

Большинство из проанализированных формул стохастической гео­ метрии укладывается в такую форму - подобная структура представ­ ляется перспективной. Но, вместе с тем, поскольку наша цель — эффективное различие изображений объектов — априори, известный геометрический смысл признака теряет свою значимость. Более того, мы сами вправе придавать новый смысл тем признакам, которые будут работать. Далее мы должны найти альтернативу интегрированию по инвариантной мере при выборе функционалов Р и 0 , обеспечивая в тоже время независимость признака от перемещений поворотов изоб­ ражений объектов.

Существование такой возможности можно пояснить на следующем примере. Пусть в результате трейс-преобразования изображения полу­ чена трейс-матрица вида, представленного на рис. 5.1. Элемент матри­ цы ij будет соответствовать значению T(l(6 j, pi), F). Таким образом,

6.1. Связь триплетных признаков

135

диапазона). Параметр р изменяется в интервале от —100 до 100. Здесь рассматриваются два варианта функционала Т.

1.Суммарная длина всех отрезков, которые изображение «высе­ кает» из сканирующей прямой. Таким образом, можем назвать этот вариант функционалом Радона (Radon).

2.Максимальная длина из всех отрезков сканирующей прямой, порождённых изображением (Мах д).

Диаметральные функционалы. Функционал Р мы назвали диа­ метральным. Он применяется к столбцам трейс-матрицы. Здесь рас­ сматриваются три его варианта.

1.Первый вариант называется «Norm». Он является стандартной

нормой Р h

h2 ).

2.Второй вариант называется «Мах». Он определяется максимумом функций.

3.Третий вариант называется «Mid». Он представляет собой стан-

дартный центр тяжести, вычисляемый по формуле Р h

Круговые функционалы. Функционал © мы назвали круговым функционалом. Он применяется к 27г-периодическим функциям. Здесь рассматриваются три его варианта.

1. Первый вариант называется «Log». Он вычисляется по формуле 0 = | In |h(0 ) + 1 | dO, интегрирование распространяется на весь диапа­

зон изменения в : [0,27г].

2. Второй вариант называется «Integ». Он вычисляется по формуле Qh = | h(6 ) dO, интегрирование распространяется на весь диапазон

изменения в : [0,27г].

3. Третий вариант называется «Нагт2». Он является амплитудой второй гармоники.

Компьютерный эксперимент. Изображения и функционалы, пере­ численные выше, тестировались и результаты представлены в табл. 6.1 . Она содержит 16 триплетных признаков, получаемых для каждого из изображений. Нам не известно, что эти признаки означают (хотя апостериорный анализ и мог бы придать некоторым из них содер­ жательную интерпретацию). Однако эксперимент показал, что они различают изображения. В следующем параграфе доказано, что эти признаки не зависимы от смещения и поворотов изображений.

Каждый элемент в табл. 6.1 был вычислен в следующие три стадии.

Рассмотрим пример:

Цифра «6»

и набор функционалов (Т, Р, ©) =

= (Max д, Max, Log).

Во-первых,

функционал Т породил трейс-

трансформанту (см. рис. 6.2). Она изменяется в интервале 0 ...112 .

Она выполнена как полутоновое изображение на

рис. 6.2.

Мы

можем видеть, что трейс-трансформанта

является

изображением

на

цилиндре (необходимо соединить левый и правый края)

или

на

листе Мёбиуса (необходимо разрезать

рис. 6.2 по

вертикальной

136

 

Гл. 6.

Триплетные признаки распознавания образов

 

 

 

 

 

 

 

 

 

Т а б л и ц а 6.1

T

 

 

 

 

Radon

 

 

 

P

 

Norm

Norm

Norm

M ax

M ax

M ax

Mid

Mid

0

 

Log

Integ

Harm

Log

Integ

Harm

Integ

Harm

Цифра

«1»

38,5

2909

925

26,7

473

150

- 7 ,6

2,41

Цифра

«2»

40,5

3973

1264

28,7

618

196

- 6 ,7

2,15

Цифра

«3»

40,8

4131

1314

28,8

614

195

- 1 1 ,7

3,73

Цифра

«4»

38,9

3098

986

27,2

502

160

- 1 8 ,7

5,94

Цифра

«5»

40,6

3991

1270

28,0

547

174

- 8 ,0

2,54

Цифра «6»

41,7

4757

1514

29,0

631

200

9,1

2,92

Цифра

«7»

39,9

3596

1144

28,3

596

189

- 3 5 ,6

11,34

Рамка

 

43,5

6396

2035

29,5

695

221

0,9

0,28

Квадрат F

46,3

9993

3181

31,7

978

311

0,0

0,00

Круг

 

45,0

8038

2558

30,9

851

270

- 0 ,6

0,21

Эллипс

 

41,6

4760

1515

28,3

580

184

0,0

0,00

Квадрат T

42,9

5770

1836

29,5

685

218

- 3 ,7

1,16

T

 

 

 

 

M ax g

 

 

 

P

 

Norm

Norm

Norm

M ax

M ax

M ax

Mid

Mid

0

 

Log

Integ

Harm

Log

Integ

Harm

Integ

Harm

Цифра

«1»

37,8

2673

851

26,2

444

141

- 5 ,7

1,80

Цифра

«2»

38,8

3091

984

28,1

566

180

- 3 ,7

1,17

Цифра

«3»

38,6

2956

941

27,4

492

156

-5,2

1,68

Цифра

«4»

37,6

2554

813

26,1

436

139

-2 1 ,8

6,95

Цифра

«5»

38,5

2886

918

27,1

465

148

- 9 ,7

3,07

Цифра

«6»

39,7

3465

1102

28,6

593

189

14,1

4,51

Цифра

«7»

38,8

3073

978

27,5

537

170

-30,4

9,68

Рамка

 

41,9

4990

1588

29,2

667

212

1,7

0,55

Квадрат F

46,3

9993

3181

31,7

978

311

0,0

0,00

Круг

 

44,9

8026

2554

30,9

851

270

-0,6

0,21

Эллипс

 

41,6

4743

1510

28,3

581

184

0,0

0,00

Квадрат T

42,9

5749

1830

29,5

685

218

-3,6

1,14

т о л ь к о

138

Гл. 6. Триплетные признаки распознавания образов

формулировки, данные ниже, имеют смысл. В частности, множества функций, на которых определяются функционалы Т, Р и ©, инвари­ антны по отношению к переносам изображений функции. Это значит, что если функция / ( • ) принадлежит такому множеству, то функция /( • + а) принадлежит этому множеству для любых а.

Предположим, что мы имеем изображение в плоскости, описан­ ное функцией F . Предположим также, что функционалы Т, Р и © удовлетворяют условиям, приведенным выше. Для системы коорди­ нат (0 i,e 2) введем функцию / , которая также характеризует изоб­ ражение:

) = F ( L ( O , e i , e 2,0,p,t)),

где ву р и t произвольные числа, и f(9,p,t) — значение функции изображения в ориентированной прямой линии с полярными парамет­ рами в и р в точке с аффинным параметром t. Фиксируя параметры в и ру параметр в, соответственно можем получить две функции

g[9,p) = Tf[e,p,t), 1г(в) = Рд(вур).

(6.6)

Функция h является 27г-периодической. Применение функциона­ ла © к функции h дает число, которое может служить признаком изображения. Он назван нами триплетным признаком. Таким образом, получен признак П(F) в системе координат (О ,e i,e 2) или в более расширенном обозначении

П(F) = П(0, ei, е2, ©, Р, Т, F) = © о Р о Т (F о /).

(6.7)

Можно исследовать инвариантность признаков изображения в фор­ ме (6.7), т. е. среди признаков в форме (6.7) можно найти признаки, не зависящие от аффинных преобразований изображения. Нашей непо­ средственной целью является нахождение условий, которые нужно бы­ ло бы наложить на функционалы ©, Р и Т для обеспечения инвариант­ ности этих признаков. Несколько признаков в форме (6.7) можно одно­ временно использовать для распознавания изображения. Некоторые из них не обязательно инвариантны. Такие признаки могут обеспечивать вспомогательные данные для конструирования инвариантных призна­ ков. Ниже мы покажем, что признаки (6.7) можно использовать не только для распознавания изображений, но также для идентификации преобразования, отображающего эталонное изображение в данное.

В целом, следует подчеркнуть, что дальнейшее исследование трейспреобразования изображений и триплетных признаков распознавания ведётся по двум направлениям: математическому и программному.

Математической задачей является поиск общей формы функционалов с заданными свойствами (например, инвариантностью или сенситивностью по отношению к группе движений и линейным деформациям изображений объектов) для того, чтобы из них можно было формиро­ вать на компьютере признаки с заданными свойствами. Тем самым ком­

6.1. Связь триплетных признаков

139

пьютер сможет генерировать большое число новых признаков, свойства которых будут заранее заданы в программах во время вычислений. Это позволит переложить на компьютер весь процесс создания, подбора и настройки системы во время решения конкретной задачи распозна­ вания. Данная математическая задача в значительной мере решена, но для каждого нового набора свойств функционалов нужно провести отдельное математическое исследование.

Важной математической задачей является исследование способ­ ности трейс-преобразования осуществлять нелинейную фильтрацию изображений с целью уменьшения их зашумлённости, сегментации, сглаживания и других видов предварительной обработки изображений. С теоретической точки зрения тот факт, что фильтрация изображений осуществляется в той же технике, что и формирование триплетных признаков, очень важен, поскольку даёт решающие предпосылки для создания общей теории формирования признаков и предварительной обработки изображений с позиций стохастической геометрии и функ­ ционального анализа. В практическом плане он также важен, посколь­ ку позволяет объединить процедуру предобработки изображений с фор­ мированием признаков в одном такте работы сканирующей системы. Это ведёт к повышению быстродействия распознающих систем (см. главу 8).

В перечень математических задач следует включить исследование трейс-преобразования и метода триплетных признаков при сканирова­ нии со случайными параметрами. На практике существует обширный класс задач, где распознавание совмещено с задачей поиска объектов. Развитие метода триплетных признаков на сканирование со случай­ ными параметрами даёт выигрыш в быстродействии распознавания и повышает интеллектуальность распознающих систем при решении подобных задач (глава 12).

Получаемые в данной теории признаки могут быть, как правило, рассчитаны параллельными алгоритмами. В связи с этим осуществле­ ны исследования возможности применения процессоров с многоядерной архитектурой с целью акселерации вычисления признаков.

Программная часть работы направлена на воплощение теоретиче­ ских результатов по всем перечисленным проблемам. Кроме того, при программировании решается целый ряд самостоятельных проблем, та­ ких как оптимизация вычислительных процессов с целью уменьшения использования ресурсов (памяти и времени).

Далее, программная часть работы имеет самостоятельную исследо­ вательскую задачу по накоплению опыта работы с триплетными при­ знаками. Дело в том, что генерируемые триплетные признаки не имеют известного заранее геометрического или физического смысла, так как они получены теоретическим путём. Поэтому нужна большая работа по накоплению статистики, чтобы знать, каким образом триплетные признаки «реагируют» на изображения, которые человек описывает неформально, терминами «гладкий», «неровный», «контрастный», “ло­ маный», «мягкий», «геометричный» и т.д.

140

Гл. 6. Триплетные признаки распознавания образов

Часть работы носит сложный, комплексный характер и включает в неразрывном единстве математическую и программную стороны. Сюда относятся исследования теоретических и компьютерных методов генерации признаков, анализ погрешностей вычисления триплетных признаков, распознавание образов (см. главу 7).

6.2.Триплетные признаки, инвариантные

каффинным преобразованиям изображений

Враспознавании образов обычно востребованы и представляют ин­ терес признаки, инвариантные по отношению к группе движений и ли­ нейным деформациям изображений. Это объясняется необходимостью достижения независимости результатов распознавания от поворотов,

перемещений и линейных деформаций объектов.

Вместе с тем, для ряда практически важных задач: аэрокосмиче­ ских исследований, в робототехнике для точного позиционирования инструмента — важны не только независимость распознавания от пово­ ротов, перемещений и линейных деформаций объектов, но и определе­ ние параметров движений и деформаций. Для достижения этих целей необходимо поставить задачу разработки признаков, сенситивных по отношению к этим преобразованиям, позволяющих определить в явном виде параметры преобразований.

В настоящем параграфе даётся обобщение этой задачи — реша­ ется задача формирования триплетных признаков, инвариантных и сенситивных по отношению к аффинным преобразованиям изоб­ ражений. Для этого исследуются свойства функционалов, образующих композицию в формуле триплетных признаков.

Для демонстрации возможностей триплетных признаков в фор­ ме (6.7) при распознавании мы сформулируем теоремы, которые позво­ лят нам конструировать инвариантные признаки. Теоремы В и С — частные случаи более общих утверждений с более усложненными формулировками.

Теорема А. Предположим, что

1) функционал T(u(t)) не зависит от аффинных сохраняющих на­ правление изменений переменной t, т. е.

Т (u(at + b)) = T(w(t)) для всех а > 0 и всех чисел Ь;

2) функционал P(tt(p)) не зависит от аффинных сохраняющих на­ правление изменений переменной р, т. е.

Р (и(ар + b)) = Р(«(/>)) для всех а > 0 и всех чисел Ь;

3) функционал ©(«(#)) не зависит от возрастающих гладких обра­ тимых изменений переменной в на окружности S 1, т. е.

0(«(р(0))) = ©(«(*))