Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика ВСЕ ТЕМЫ ЗАКОНСПЕКТИРОВАТЬ.docx
Скачиваний:
16
Добавлен:
23.11.2019
Размер:
4.94 Mб
Скачать

II. Сканирование и распознавание документа

Сканер -- устройство для преобразования графической информации в цифровой формат. Кроме обработки фотографий и рисунков его часто используют (в комплекте со специальным программным обеспечением) для получения электронной версии печатных документов.

Основные характеристики сканера

К основными характеристиками сканера относятся оптическое разрешение, глубина цвета и диапазон оптических плотностей

  • Оптическое разрешение

Измеряется в точках на дюйм (dots per inch, dpi). Чем больше разрешение у сканера, тем больше информации об оригинале может быть введено в компьютер и подвергнуто дальнейшей обработке.

  • Глубина цвета

Эта характеристика обозначает количество цветов, которое способен распознать сканер. Большинство компьютерных приложений, исключая профессиональные графические пакеты, работают с 24 битным представлением (16.77 миллионов оттенков цвета). У сканеров эта характеристика, как правило, выше -- 36 бит.

  • Динамический диапазон (диапазон оптических плотностей)

Оптическая плотность -- это характеристика оригинала, равная десятичному логарифму отношения света падающего на оригинал, к свету отраженному (или прошедшему -- для прозрачных оригиналов). Минимально возможное значение 0.0 D -- идеально белый (прозрачный) оригинал. Значение 4.0 D на практике соответствует абсолютно черному (непрозрачному) оригиналу. Динамический диапазон сканера характеризует, какой диапазон оптических плотностей оригинала сканер может распознать, не потеряв оттенки ни в светах, ни в тенях оригинала.

Типы сканеров

Планшетные. Один из наиболее удобных сканеров. Внешне напоминает "копировальный" аппарат: имеет съемную (открывающуюся) верхнюю крышку. Удобен для сканирования, как фотографий, так и текста.

Листовые. Предназначены для тех, кто работает с материалами на отдельных листах. Занимают очень мало места на рабочем столе.

Слайд - сканеры. Предназначены для сканирования слайдов и пленок.

Ручные. Область применения ручных сканеров ограничена. В основном используются для сканирования небольших картинок, например из книги, или журнала.

Наличие сканера и программ распознавания текста (OCR) позволяет решить проблему ввода в ПК больших объемов текстовой информации, различных данных. На переднем крае этой технологии - распознавание рукописного текста (например, FineReader ).

Применение сканера возможно для ввода в компьютер различных карт и чертежей. Специальные программы, - трассировщики "повторяют" (обрисовывают) контуры сканируемых чертежей и создают легко масштабируемые "цифровые" изображения.

III. Основные методы сканирования документа

Применяя сканер можно получать "электронные" изображения, а также использовать его для преобразования текста, напечатанного на бумаге в "текст пригодный для редактирования". Для этого необходимо соответствующее ПО - необходима программа распознавания текста (OCR) - например FineReader .

Принцип действия таких программ следующий: сканируется фотография текста, затем методом сравнения множества образцов, черно-белая фотография (читай: картинка текста) преобразуется в "обычный текст", такой, если бы вы его напечатали с клавиатуры. Пользователю остается только сохранить текст на диске или скопировать его через буфер обмена в любой текстовый редактор. FineReader автоматически распознает разные участки текста: текст как таковой, картинку (рисунок), таблицу и так называемые "нераспознаваемые" блоки.

Процесс ввода документов в компьютер состоит из четырех этапов: сканирование, распознавание, проверка и сохранение результатов распознавания (не в режиме мастера эти этапы можно выполнить, последовательно нажимая кнопки Открыть/Сканировать, Распознать, Проверить, Сохранить). Начните с выбора четкого и контрастного оригинала. Определитесь с устройством вывода. Подготовка материалов для печати в типографии, печати на принтере или размещение в сети Интернет требует использования различных параметров сканирования. Для изображений, сканируемых для размещения на Web-страницах, разрешения 100 dpi (или даже меньшего) будет достаточно. При сканировании с целью распознавания текста целесообразно установить разрешение около 300 dpi, а для остальных целей -- максимально возможное. Расположите оригинал ровно или под необходимым углом.

Выберите режим сканирования. Различают следующие режимы сканирования:

  • Black&White (черно-белый) - предназначен для сканирования текстов и контурных рисунков.

  • Gray (серый) - 256 оттенков серого цвета. Используйте этот режим для сканирования черно-белых фотографий, или если у вас не цветной принтер.

  • Color (цветной) - для получения цветных картинок и фотографий.

Кнопка "preview" или “prescan” предназначена для пробного сканирования. Позволяет увидеть положение текста или картинки и задать с помощью специального "пунктирного" прямоугольника (рамки) область сканирования. Произведите предварительное сканирование и отметьте только ту часть изображения или тектса, которую хотите получить в цифровом виде. Это сэкономит время и дисковое пространство.

В результате сканирования появится окно Изображение, содержащее "фотографию" страницы. Затем программа попросит Вас установить параметры распознавания и приступит к распознаванию изображения, одновременно анализируя его. Обработанные участки изображения закрашиваются голубым цветом. Результат распознавания Вы увидите в окне Текст. В этом же окне Вы можете проверить и отредактировать распознанный текст. Возможно, вам придется исправить ошибки в тексте, так как точность распознавания FineReader около 92- 97 %. Следуя далее указаниям Мастера Scan&Read, Вы можете либо передать распознанный текст в выбранное Вами приложение или сохранить его на диск, либо продолжить обработку следующих изображений.

Для получения хорошего результата сканирования полезно придерживаться следующих рекомендаций.

  • Маленькие по размеру (3х4см) фотографии всегда сканируйте с наибольшим разрешением, так как возможно картинку придется увеличивать.

  • Если вы работаете с изображениями, предназначенными только для вывода на экран ПК, применяйте разрешение 75 - 150 dpi. Этого вполне достаточно (разрешение экрана примерно 72 -96 dpi).

  • Для "хорошего" текста (белая бумага, качественная печать) достаточно разрешения 200 dpi. Газетные статьи и текст, отпечатанный на матричном принтере, сканируйте с разрешением 300 - 400 dpi.

  • Сократить размер файла с картинкой можно используя меньшее количество цветов. Для этого преобразуйте ее в формат "Optimized 256 color". Хороший результат получается при сохранении файла с расширением *.JPG.

  • Не стоит выбирать разрешение сканирования выше, чем может выдать имеющийся принтер, картинка от этого лучше не станет, да и работа с большим по объему файлом будет происходить гораздо медленнее.