Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математическое и программное обеспечение устройств с программируемой логикой -- Фахми С.Ш., Соколов.pdf
Скачиваний:
72
Добавлен:
04.11.2020
Размер:
2.25 Mб
Скачать

• при кодировании обычно первоначально выделяются блоки размером 32×32 пикселя. Это удобно для стандартизации их обработки и способствует помехоустойчивости алгоритма, поскольку возможные искажения при передаче или хранении влияют только на небольшую часть изображения. Для подготовительного кодирования используется достаточно изощренный алгоритм, обеспечивающий увеличение количества нулей (здесь рассматривается детально). На конечном этапе применяется арифметическое кодирование.

Вцелом JPEG-2000 способен обеспечить почти двукратное увеличение сжатияспотерямипосравнениюсJPEG.Вчастисжатиябезпотерьоннестоль эффективен и проигрывает специализированным решениям (в частности JPEG-LS), однако сама такая возможность выгодно отличает его от предыдущего стандарта.

Важным достоинством JPEG-2000 является возможность выбирать режимы сжатия для разных зон изображения, а также помехоустойчивость. Кроме того, он гораздо лучше сжимает изображения, созданные в компьютерных редакторах, и изображения документов. Снижение качества изображения проявляется в его сглаживании («замыливании»), а при сильном сжатии – в появлении ряби в окрестностях резких границ. Главным недостатком является низкая скорость сжатия.

2.2. Пространственные методы обработки сигналов

Всвязи с огромным объемом видеоданных, в частности для передачи, обработки и анализа спутниковых снимков, коллекций, ассоциативного поиска в базах аудио- и видеоданных по семантическому содержанию возникла необходимость в адаптивно-динамической структуризации (АДС) [27], [28]. Поскольку основной целью является не столько представление видеоинформации, сколько последующий семантический анализ, возникает необходимость перейти от стандартных форматов передачи и хранения данных к специфическим формам, ориентированным на решение конкретных проблем.

Информационные показатели качества системы обработки сигналов изображений взаимосвязаны: «Оптимизацию видеокодека надо выполнить минимум по трем параметрам: по битовой скорости, искажению и вычислительной сложности. Все они влияют друг на друга. Например, оптимизация соотношенияскорость/искажениедостигаетсязасчетповышениясложности кодирования. "Быстрые" алгоритмы оценки движения часто имеют низкую

35

вычислительную сложность за счет снижения эффективности кодирования

ит. д. Эффективность и сложность кодирования являются настоящими антиподами» [26].

Важнейшимаспектомсозданияустройствобработкинепрерывныхисточников сообщений при реализации их и в аппаратном и/или программном виде является их сложность. Самую большую сложность от компьютерных систем потребовали системы обработки и представления изображений, так как обработка в реальном времени нестационарных непрерывных изображений характеризуется предельными значениями быстродействия вычислений и скорости передачи информации по каналам связи и емкости памяти.

Современный уровень полупроводниковой технологии, позволяющий размещать на одном кристалле более миллиарда вентилей (с возможностью реализовывать на кристалле одновременно процессоры, аналоговые блоки, цифровую и программируемую логику и т. д.) определил революционные изменения в микроэлектронике и в целом индустрии вычислительной техники и радиоэлектроники. Противоречие между желательностью и возможностями применения СБИС в специализированных устройствах (в частности в системах обработки видеоинформации) вызвало к жизни концепцию программирования структур. Благодаря программированию структур в электронной промышленности произошла универсализация схем, и появился новый подход в проектировании на системном уровне, заключающийся в повторном использовании сложно-функциональных блоков (СФ-блоков) при проектировании видеосистем на кристалле [2], [4].

Взависимости от типа решаемой задачи виды структуризации и их программная реализация опираются на выявление параметрических оценок для критерияε-тождественности[29].Сточкизрениярассмотренныхранеетеорий

иметодов семантические составляющие информационного объекта проявляются через итерационный процесс АДС.

Вработе [29] отмечено: «АДС изображения позволяет организовать се- мантико-ассоциативные связи между "именем" и индексом того или иного выделенного фрагмента и сформировать семантико-ассоциативные составляющие информационного объекта. Для этого подхода несущественна размерность сигнала, и в этом смысле безразлично, рассматривается ли аудиосигнал, изображение или любая другая n-мерная функция пространственновременных параметров. Поэтому преобразования, используемые для изображений, имеют смысл и в приложении к аудиосигналам».

36

Исследование и развитие пространственных методов обработки сигналов без перехода в спектральную область и разработка алгоритмов структуризации объектов изображений позволило решить две важнейшие задачи:

преобразование исходного изображения в семантико-структурирован- ные списки объектов изображений;

получение высокой степени сжатия засчет выявления опорных точек на этапекодированияивосстановлениярезультирующегоизображениясиспользованием триангуляции на этапе декодирования.

В качестве пространственного метода кодирования и декодирования изображений рассматривается алгоритмна основе выделения и представления множества опорных точек изображения в виде одномерного динамического массива [30]:

пространственно-рекурсивное разбиение на полигоны различной формы и размера на этапе кодирования;

построение регулярных и нерегулярных триангуляционных сеток по взаимосвязанным соседним опорным точкам;

аппроксимация на этапе декодирования из условия сохранения признаков требуемых объектов в виде набора опорных точек (формы или контуры) в соответствующих полигонах;

исследования информационных показателей качества для выявления взаимосвязи скорости передачи со сложностью устройств кодирования изображений по опорным точкам.

Алгоритм кодирования изображений по опорным точкам. Исходное изображение разбивается на фрагменты (часто называемые полигонами) одинакового размера и формы (рис. 2.8).

Фрагменты изображения должны нести на себе определенную семантическуюнагрузку. Построеннаяструктурадолжнабытьрекурсивно-иерархиче- ской для возможности быстрого поиска и ассоциативной идентификации фрагментов различных уровней с их семантическими отношениями и заданными свойствами изображения.

С этой целью используется преобразование изображения как совокупности двумерных пикселов, предварительно представленного в компьютере в виде одного из стандартных форматов хранения изображений, во внутреннее компьютерное представление динамической структурой данных (ДСД).

37

l =0

l =1

l =2

 

 

l =3– уровень разбиения

Деление на 2

Деление на 4

Деление на 3

Исходное изображение

а

б

в

 

 

 

 

г

 

 

 

 

д

 

 

 

 

 

 

 

 

 

Рис. 2.8. Иллюстрация метода кодирования изображения разбиением на два, три и четыре полигона

Различают возможное деление изображения на два, три и на четыре полигона.

Описание алгоритма кодирования по опорным точкам. Исходное изображение разбивается на определенные полигоны различной формы и площади (квадраты, прямоугольники, треугольники). Далее процедура разбиения повторяется для каждого вновь полученного полигона ri до тех пор, пока раз-

мах по яркости элементов в пределах полигона v не будут превышать заданного порога ρ. Далее в каждом полигоне выполняется поиск одной (или нескольких) опорной точки ОТ. Сжатие изображений осуществляется представлениемОТ,полученныхврезультатерекурсивногоразбиенияобластей,ввиде пирамиды (рис. 2.9).

В зависимости от заданной точности и требуемого коэффициента сжатия определяется необходимое количества ОТ.

На этапе декодирования ОТ соединяются в треугольники и далее восстановление результирующего изображения осуществляется в аппроксимации яркостей триангуляционной сетки (рис. 2. 10). Основные достоинства триангуляции на этапе декодирования заключаются в следующем:

38

 

 

Начало

 

Прием, задание ρ и

 

разбиение изображения

 

1

Последний полигон?

Конец

NP?

 

 

Анализ текущего

 

 

полигона

 

1

v >ρ?

 

 

Разбиение и формирование

Поиск ОТ и формирование

новых полигонов

 

сжатого массива

 

 

 

Поиск ОТ и формирование

 

 

 

сжатого массива

Передача

Рис. 2.9. Схема алгоритмов кодирования по ОТ

Начало

Прием сжатого массива

ОТ

Последняя ОТ?

NP?

 

0

 

Поиск соседних

Аппроксимация по яркости

ОТ

ОТ и восстановление

 

изображения

Триангуляция

Конец

ОТ

Рис. 2.10. Схема алгоритмов декодирования по ОТ

39

процесс декодирования естественным образом подстраивается под данные там, где опорные точки разрежены, треугольники крупнее, а где есть сгущение – мельче (рис. 2.8);

число треугольников не превышает удвоенного числа опорных точек;

у прямоугольной сетки для адекватного отображения достаточно много изменчивых поверхностей; необходимо сильно измельчать сетку, что требует больших вычислительных мощностей на этапе восстановления результирующего изображения и ведет к образованию неустойчивости. Этот недостаток отсутствует в случае треугольной сетки.

Регулярностьпирамидальныхструктурпозволяетсоздаватьэффективные видеосистемы обработки изображений из-за возможности распараллеливания алгоритмов. Развитие пирамидально-рекурсивных методов сдерживалось несколькими факторами:

не разработан адекватный аппарат оперирования с данными, представленными в таком виде;

нерешенными остаются многие вопросы реализации пирамидальных представлений на существующих ЭВМ как параллельного, так и последовательно типа;

отсутствие четкого определения понятия полезной информации (опорные точки на исходном изображении) и критерия разбиения.

Особый интерес к алгоритмам триангуляции определяется тем, что они используются во многих процедурах машинной графики, таких как формирование поверхностей, закраска, удаление невидимых частей, отсечение.

Приведем пример создания полусферы, проиллюстрировав этапы рендеринга. Полигональная область представляется совокупностью треугольников. При этом важно достаточно точно аппроксимировать внешний контур.

Любаяповерхностьможетбытьаппроксимированаснеобходимойточностью сеткой треугольников. Точность аппроксимации определяется количеством треугольников (т. е. числом опорных точек) и способом их выбора [31]. Для качественной визуализации объекта, находящегося вблизи точки наблюдения, требуется учесть во много раз больше треугольников, чем в ситуации, когда тот же объект расположен на удалении. Даже достаточно грубая сетка полезна на практике, так как методы сглаживания, применяемые в процессе отображения, могут значительно улучшить представление о кривизне поверхности.

40