Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

savinkin_yue_razrabotka-intellektualnoy-sistemy-avtomatizacii-cifrovogo-dokumentooborota-na-osnove-algoritmov-op_47138

.pdf
Скачиваний:
13
Добавлен:
14.01.2018
Размер:
8.44 Mб
Скачать

Обработка гибких форм;

Можно получить унифицированный доступ к документам и формам, которые хранятся в разных источниках, благодаря экспорту OLE DB;

Возможность обработки бумажных и электронных форм посредством eFormDesigner;

Можно устанавливать и обновлять рабочие станции удаленно с помощью

Active Directory.

2.1.2 Преимущества системы

Мощное технологическое ядро и большое количество дополнительных модулей дает возможность обработки большого количества форм и документов,

которые включают в себя декларации, анкеты и заявки. Продукты компании ABBYY

в настоящее время используют банки, страховые компании, юридические фирмы,

маркетинговые агентства, правительственные и образовательные учреждения во всем мире.

2.1.3 Недостатки системы

Среди недостатков этой версии можно выделить:

Достаточно старый продукт (2005 год выпуска) – можно найти аналоги с улучшенными функциями;

Не поддерживается на современных компьютерах и операционных системах;

Нет возможности приобретения и официального использования.

2.2 ABBYY FlexiCapture

Продукт предназначается для решения потоковых данных и документов. С

помощью данной программы можно автоматизировать извлечение информации из документов в бумажной форме и сохранять данные в информационных системах

6

предприятий и организаций. Крупные корпорации, правительственные структуры и образовательные учреждения смогут использовать ее для автоматизации процесса ввода данных в системы информации, при этом уменьшить время обработки документов и улучшить качество обслуживания клиентов.

2.2.1 Преимущества системы

Среди достоинств программы можно выделить следующее [2]:

Наличие единого центра ввода для любого типа документа. Не обязательно прибегать к ручному вводу; можно извлекать данные для их использования в будущем в системах информации предприятий, осуществлять конвертацию документов;

Автоматическая идентификация и обработка документов без настройки дополнительных модулей. Чтобы программа могла сама классифицировать документы, достаточно произвести одноразовую настройку перед началом;

Существует возможность двух типов установки: локальной и сетевой, который характеризуются полной совместимостью друг с другом, что для малого и среднего бизнеса помогает сэкономить на автоматизации ввода. Графическая среда, работающая на интуитивном уровне, не требует специальных знаний и навыком в программировании;

Система также включает функции предварительной сортировки, клавиатурного набора и последующей ручной проверки, которые сокращают затраты на ручном вводе данных, внедрении и настройке;

Внедрена система самообучения, что в дополнении с широким набором инструментов позволяет сразу приступать к работе;

Благодаря кластеру обеспечивается непрерывная функциональность процесса,

доступности и сохранность всей информации даже в случаях самого серьезного отказа оборудования;

Создание гибкого описания в автоматическом режиме. Система способна определять тип документа, а также информации, которую необходимо извлечь;

7

Продукт оснащен мощным набором инструментов, которые максимизируют интеграцию процесса ввода данных в деятельность организации. Стандартные настройки могут изменяться и дополняться посредством штатных настроек и скриптов;

Большой спектр возможностей для удаленной работы. Оснащена веб-станцией ввода, которая начинают обработку документов сразу после из поступления в компанию;

Можно установить режим для конфиденциальной проверки данных в документах;

Существует возможность настройки пользовательского интерфейса станции верификации;

Улучшенная архитектура позволяет обрабатывать большое количество страниц. Сервер имеет возможность использования производительности сразу нескольких процессоров;

Благодаря поддержке MAPI и POP3 можно обрабатывать изображения,

отправленные посредством e-mail;

2.2.2 Недостатки системы

Кроме вышеперечисленных достоинств, можно отметить и некоторые

недостатки продукта:

Программный интерфейс приложения, которые предполагает самостоятельную разработку окружения;

Высокая стоимость лицензии.

2.3 Congictive technologies Е1 Евфрат

Данная система является одним из самых мощных инструментов для автоматизации процессов в бизнесе, а также оптимизации оборота документов любых типов и размеров. Продукт характеризуется эффективным решением задач не только в ограниченой структуре (канцелярия, отдел, департамент), но и в территориально

8

отдаленных организациях со сложным схематическим потоком информации.

Систему можно настраивать по требованию регламента, положения и инструкции по работе с документом, который разрабатывает и применяет организация. Е1 Евфрат занимает лидирующую позицию в таких классах систем как DMS, BPM, ECM.

2.3.1 Преимущества системы

Данная система обладает такими преимуществами[3]:

Комплексной автоматизации полного цикла оборота документов и процессов бизнеса;

Удобный и простой интерфейс, который не требует определенных знаний в программировании;

Можно интегрировать с MS SQL и СУБД Postgre;

Удобной системой внедрения и изменения настроек;

Графический редактор прохождения маршрута документами достаточно простой;

Существует возможность создания форм документов любых сложностей без навыком программирования;

Высокоскоростной работой;

Управление правами доступности на уровне документа и его разделов;

Соответствием Российских требований безопасности информации;

Система передач прав и назначения заместителей обладает гибкостью;

Полной интеграцией с Microsoft Office, 1С, Excel;

Протокол http (https) позволяет работать удаленно;

Можно регистрировать документы, полученные из внешних источников

(включая e-mail);

Уникальными алгоритмами распознавания и сжатия формата PDF.

Максимально быстрое внедрение системы

9

Благодаря методике Draw&Run обеспечивается сверхбыстрое внедрение системы автоматизации процессов. Эта методика предполагает интерактивное взаимодействие клиента и специалиста по внедрению програмного продукта в инфраструктуру предприятия. Можно воспользоваться и уже имеющемися альбомами форм, маршрутов и отчетов, которые содержат итоги реализации проекта по внедрению системы Евфрат в компаниях и отраслях различных масштабов и географического местоположения. Это помогает адаптироваться к потребностям клиента в реальном времени.

Применяемая методика позволяет ввести систему в автоматический режим в опытное использование в течении 5-ти дней (если сравнивать с корпоративным программным обеспечением, можно заметить огромную разницу, так как ПО может внедряться до полугода).

2.3.2 Недостатки системы

Среди недостатков продукта системы Е1 можно отметить лишь его высокую стоимость

В результате анализа существующих программных комплексов, было принято решение разработать свою систему, не содержащую имеющихся недостатков, и легко внедряемую в существующую инфраструктуру предприятия.

10

3 Подготовка технического задания на объект

разработки/исследования;

Основное требования заказчика - ускорение ввода данных анкет абитуриентов в систему CRM подсистему LMS EDUAPP (1 день), отсутствие перемещения бумажных копий документов между филиалами компании.

Ключевыми задачами проекта является разработка автоматизированного рабочего места для дизайнера анкет, систему полуавтоматического распознавания анкет с возможностью коррекции ошибок распознавания, подсистемы интеграции в существующую инфраструктуру, которая позволит создать замкнутый цикл автоматизации документооборота.

В ходе практики на предприятии было разработано, согласовано и принято техническое задание ( см. Приложение 1. Техническое задание )

11

4 Разработка методов решения поставленных задач

В ходе практики были разработаны: программа–конструктор анкет и прототип системы распознавания анкет.

При создании программы – конструктора анкет были применены и внедрены несколько нетривиальных подходов, методик и технических особенностей, как:

4.1 Генерация уникального идентификатора каждой анкеты

для дальнейшей прозрачной привязки к личному кабинету

пользователя

Под данным идентификатором понимается текст, который при последующих операциях будет преобразован в QR код и будет размещен в правом верхнем углу каждой анкеты. Введение данной классификации анкет позволит определить информацию из названия данного документа. Генерация уникального идентификатора каждой анкеты так же необходима для программного использования.

Данная информация будет считана системой обработки данных для правильной систематизации считываемой информации.

В качестве уникального идентификатора для каждой из анкет был выбран следующий комплекс информации:

Название мероприятия;

Дата проведения мероприятия;

Количество анкет в данном тираже;

Текущий номер анкеты.

Эта информация позволит: использовать ссылку на объект сканирования после импорта в систему (например, для быстрого нахождения страницы в опубликованном в Системе PDF файле), а также для внутренних сервисных целей (проверка целостности всего тиража анкет и нахождение текущего номера анкеты)

12

Для сохранности информации, и возможности ее передачи независимо от файла

– шаблона анкеты, весь этот комплекс информации должен быть внесен в каждую анкету в таком виде, который не будет отвлекать от заполнения самой анкеты. Для достижения этой цели было решено использовать нанесение уникального QR кода на каждую из анкет.

4.2 Генерация и нанесение QR кода с сервисной информацией

и уникальным идентификатором анкеты

Генерация QR производится при помощи свободной библиотеки ZXing [4].

Нанесение этих кодов на анкету производится в автоматическом режиме таким образом, чтобы информация в этом коде менялась в зависимости от текущей страницы. Это необходимо для того, чтобы на этапе распознавания анкеты автоматическая система смогла точно определить номер страницы и общее количество страниц.

Местоположение и внешний вид кода можно увидеть на Рис. 1.Рис. 1.

Размещение QR-кода на примере анкеты

Нанесение идентификационных QR кодов на документы - достаточно молодая технология, однако поддержка таких решиний уже интегрирована во многие системы автоматизации документооборота, например системы семейства “1C”. В этой системе, внедренная маркировка документов QR-кодом выполняется на базе нового национального стандарта ГОСТ Р 56042-2014 [5], утвержденого приказом Росстандарта РФ. Этот документ введен в действие с 1 сентября 2014 г.

QR-код, который будет поддерживать система, имеет максимальную емкость,

равную 4296 символов. Текстовая информация, записанная внутри QR-кода, может храниться в кодировке Win1251 или KIO8-R. Считать QR-код можно через любой аппаратный или программный инструмент, распознающий QR-коды международного образца.

13

Применение QR-кода позволит удобно и компактно закодировать необходимую информацию, содержащуюся в документе, и быстро считать ее техническими средствами при распознавании.

Рис. 1. Размещение QR-кода на примере анкеты

14

4.3 Автоматическое добавление логотипа и сервисной

информации

Для облегчения систематизации анкет необходимо также наличие обычного текста на каждой анкете. Таким образом, вместе с нанесением QR-кода на анкету дополнительно наносится логотип и название текущего мероприятия. Технически,

печатное название содержит ту же информацию, что и QR код, но эта информация не нуждается в обработке внешними считывающими устройствами. Данное внедрение необходимо для упрощения процесса оборота анкет работниками организации.

Текст, содержащий данную информацию, будет располагаться на верхнем колонтитуле и фактически будет являться шапкой каждой анкеты. Это является одним из самых эффективных способов для обобщения и считывания содержащейся информации. Основная информация, собранная в одной строке, призвана ускорить процесс оборота данных и упрощает работу оператора.

Пример нанесенной информации можно увидеть ниже:

Рис. 2. Место нанесения логотипа и информация о мероприятии

4.4 Загрузка и парсинг файла шаблона распознавания анкеты

Для корректной работы системы распознавания анкет необходимо использовать файл-шаблон анкеты.

Файл - шаблон анекты содержит всю необходимую информацию об анкете, а

именно:

Список всех полей и их координат

Параметры анкеты ( дублирование данных с qr кода )

15