Лекция ¹4

Тема: “Обработка изображений, автоматически считанных с документации”

4.1. Общие сведения

Обработка изображений представляет собой многоэтапный процесс информационного преобразования, в ходе которого осуществляется последовательный переход от одной формы описания к другой.

В качестве дискретной первичной формы будем рассматривать черно-белую мозаику, получаемую в памяти ЭВМ.

Большая часть изображений черно-белых документов строится с помощью одних и тех же изобразительных средств(линий, символов),поэтому имеет смысл выделить специально этап обработки для получения описания отрезков линий. Они задаются координатами его концов и кодов символов с указанием координат их расположения на поле изображения.

Результирующая форма для универсального этапа, которую мы назовем дискретной вторичной формой, состоит из списка отрезков и списка символов.

Запись первого списка состоит из полей, предназначенных для задания координат концов отрезков.

Запись второго списка служит для координатной привязки символа к полю документа и указания кода символа.

Универсальный этап обработки должен обеспечить решение двух задач:

- отделение символов,

- разделение несимвольной части изображения на отдельные элементарные отрезки.

Указанные задачи являются разнородными, поэтому перед их решением целесообразно разложить изображение на символьную и несимвольную части. Каждая из частей подвергается специализированной обработке.

Рассмотрим задачу отделения символов.

4.2. Отделение символов в дискретной первичной форме

Предварительно определим понятие символа.

Назовем группой единиц множество единиц в одной строке матрицы, не разделенной нулями. Две группы единиц, лежащие в соседних строках изображения, с координатами концов по оси абсцисс a, b и c, d называются связными, если справедливо хотя бы одно из соотношений:

a Ü c Ü b;

a Ü d Ü b;

c - 1 = b;

d + 1 = a.

На рис.9.a приведены примеры связных групп единиц, а на рис. 9.б - несвязных. Под символом будем понимать множество связных групп единиц, для которых минимальный охватывающий их прямоугольник имеет размеры, принадлежащие интервалам размеров символов по высоте и ширине (рис.10 ). Подобное определение символа создает риск отделения части несимвольной информации.

Сущность задачи отделения символов из исходной матрицы I, описывающей изображение в дискретной первичной форме, сводится к нахождению в исходной матрице фрагмента, который содержит символы. Далее каждый такой фрагмент переписывается в отдельный кадр. Кадр представляет собой двоичную матрицу, размеры которой должны быть не меньше максимальных размеров символов. Затем, содержимое этих матриц анализируется в блоке распознавания.