- •Міністерство надзвичайних ситуацій україни
- •Кафедра вищої математики та інформаційних технологій
- •1. Способи подання інформації
- •1.1. Способи подання десяткових чисел
- •1.2. Способи подання тексту
- •1.3. Способи подання зображень
- •1.4. Способи подання звуку
- •2. Сканування та розпізнування документів
- •3. Робота з програмою FineReader
- •Міністерство надзвичайних ситуацій україни
- •Кафедра вищої математики та інформаційних технологій
- •1. Загальні відомості про презентації та пакет демонстраційної графіки PowerPoint
- •2. Створення презентацій
- •3. Використання презентацій
- •Міністерство надзвичайних ситуацій україни
- •Кафедра вищої математики та інформаційних технологій
- •Лекція 5.3. Комп’ютерні мережі
- •1. Загальні відомості про комп’ютерні мережі
- •2. Апаратні засоби комп’ютерних мереж
- •3. Мережне програмне забезпечення
- •Міністерство надзвичайних ситуацій україни
- •Кафедра вищої математики та інформаційних технологій
- •Лекція 5.4. Глобальна комп'ютерна мережа Інтернет
- •1. Поняття та загальна схема побудови мережі Інтернет
- •2. Система адрес у мережі Інтернет
- •3. Основні сервіси Інтернет
- •4. Робота в мережі Інтернет
1.4. Способи подання звуку
Основні параметри звукових хвиль – частота та амплітуда коливань. Від частоти залежить тон звуку, а від амплітуди – сила звуку. З метою зберігання та обробки неперервного звуку у комп’ютері його необхідно попередньо представити у дискретній формі. Цей процес називається оцифровкою звуку.
Для оцифровки звуку значення його амплітуди записують через певні проміжки часу, що є дискретизацією звуку в часі. Кожне значення амплітуди указують наближено у вигляді певного рівня – це є квантуванням звуку. В цілому весь цей процес називають імпульсно-кодовою модуляцією. При цьому звук виявляється записаним у вигляді послідовності чисел, кожне з яких означає рівень амплітуди звуку в певний момент часу.
2. Сканування та розпізнування документів
Перетворенням документу в електронну форму називається його автоматичне перенесення з паперового носія в пам’ять комп’ютера. При цьому може використовуватись або спосіб подання текстових даних, або спосіб подання зображень. За рахунок цього досягаються наступні цілі:
вдосконалення способу зберігання документу;
можливість передачі документу комп’ютерною мережею;
автоматизація перекладу документу на іншу мову;
спрощення створення копій документу;
можливість редагування документу.
Для перетворення документу в електронну форму слід виконати дві основні операції: сканування і розпізнування.
Внаслідок сканування створюється графічний образ паперового документу. Основний фізичний принцип сканування – документ освітлюється і відбите світло сприймається світлочутливими елементами. Кожний світлочутливий елемент утворює окрему точку у загальному зображенні документу. Таким чином утворюється растрове зображення документу.
Для сканування потрібний прилад, який називається сканером. Існують наступні різновиди сканерів:
1). Ручний сканер. Його переміщують вздовж документа вручну. Недоліки: потрібні декілька проходів, нерівномірний рух. Як наслідок – низька якість.
2). Листовий сканер. В процесі сканування паперовий документ протягується, як у принтері. Недолік: можна сканувати тільки окремі аркуші.
3). Планшетний сканер. При цьому документ кладуть під кришку, блок сканування переміщується автоматично.
Внаслідок розпізнування графічне подання документу перетворюється у текстове. Завдяки цьому значно зменшується обсяг даних. Сам документ при цьому стає доступним для автоматичного перекладу та редагування.
Для розпізнування використовується спеціальне програмне забезпечення. Найбільш популярною програмою на даний момент є програма FineReader розробки фірми ABBYY.
3. Робота з програмою FineReader
Програма FineReader є комплексною. Під її управлінням здійснюються чотири основні операції з перетворення друкованого документу в електронну форму:
сканування,
сегментування,
розпізнування,
перевірка.
В процесі сканування програма FineReader безпосередньо керує використовуваним сканером. Найбільш поширена схема управління сканером називається протоколом TWAIN32. Діалогове вікно управління процесом сканування залежить від типу сканера. В цьому вікні визначаються параметри сканування, зокрема область сканування, формат виведення, розподільча здатність тощо. Внаслідок сканування утворюється графічний образ документа.
Сегментація полягає у підготовці графічного образу до розпізнування. При цьому весь графічний образ має бути розподілений на чотири види сегментів: текст, таблиця, зображення і штрих-код. Кожний з цих сегментів, за винятком зображень, розпізнається за своїм алгоритмом. Сегментація виконується у напівавтоматичному режимі. Це означає, що програма самостійно пропонує перший варіант сегментації, який надалі можна редагувати.
Процес розпізнування здійснюється автоматично і полягає у послідовному перегляді графічних образів та перетворенні їх у текстову форму подання. Попередньо має бути встановлена мова тексту. Слова тексту, які через дефекти документу розпізнати не вдалось, виділяються кольором.
В процесі перевірки аналізується правопис розпізнаного тексту. При цьому для слів, які не вдалось розпізнати однозначно пропонуються варіанти розпізнування.
Розпізнаний документ слід зберегти для того, щоб перенести його в інші програми з метою редагування (наприклад, у Word). Це пов’язано з тим, що документ практично ніколи не розпізнається ідеально і тому вимагає редагування.