Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Трев_Lecture.DOC
Скачиваний:
4
Добавлен:
26.08.2019
Размер:
1.23 Mб
Скачать

3.2.Формат pdf

Формат PDF (Portable Document Format) - переносний формат документів, розроблений компанією Adobe Systems, використовується як основа для створення електронних видань у середовищі програмного пакету Adobe Acrobat. Формат PDF - це файловий текстової формат, призначений для представлення публікацій чи інших документів на будь-якій апаратній платформі й у будь-якому операційному середовищі. PDF-файл містить PDF-публікацію і спеціальні дані.

PDF-публікація (документ) містить одну чи більше сторінок. Кожна сторінка може включати будь-які компоненти електронного видання: текст, графіку й ілюстрації, анімацію, відео- і аудіо інформацію в апаратно-незалежному форматі, у вигляді так званого сто­рінкового опису (page description). PDF-публікація може також містити інформацію, що забезпечує навігацію в гіпертекстовій електронній публікації.

Крім того, публікація містить версію специфікації PDF, що використовується в конкретному файлі, і інформацію про розташування структури файлу.

Формат PDF представляє текст і графіку, використовуючи модель формування зображень мови програмування смуг PostScript. Графічними об'єктами можуть бути тексти і форми публікацій, векторні і растрові зображення і т.д. Графічні об'єкти можуть бути будь-якого кольору.

Оператори створення сторінок PDF подібні операторам мови PostScript. Головна відмінність полягає в тому, що PDF не програмна мова, вона не містить процедур, змінних і т.п.

Характерними рисами PDF-файлу є:

  • PDF-файл може містити об'єкти, подібні до гіпертекстових посилань, доступні тільки при інтерактивному перегляді;

  • для спрощення процесу опису сторінок PDF не використовує конструкції програмних мов;

  • PDF створює визначену структуру файлу, що дає змогу програмним додаткам мати доступ до будь-якої частини документа;

  • PDF-файл містить інформацію про розміри шрифту і т.п.;

  • PDF-файл не може бути прямо перетворений у PostScript-публікацію для друку;

  • PDF-файл будується або на основі 7-бітовому ASCII-файлі, або на базі бінарного файлу. Якщо це ASCII-файл, у ньому використовуються тільки друковані символи 7-бітового ASCII-коду, пробіл, табуляція, повернення каретки і перехід рядка. У випадку бінарного файлу можуть бути використані всі символи 8-бітового коду. Вважається, що ASCII-код - найбільш зручний для переносу вид кодування.

Для зменшення розміру файлу PDF використовує різні методи стиснення зображень:

  • JPEG - для повноколірних ілюстрацій і зображень у градаціях сірої шкали;

  • CCITT - для чорно-білих зображень;

  • LZW - для компресії і декомпресії текстового матеріалу.

Усі ці методи оперують із двійковими даними, що потім можуть бути закодовані в коді ASCII. Для забезпечення незалежності від шрифтів PDF-файл містить опис для кожного шрифту, використаного в публікації. Опис включає назву, кегль (розмір) і стиль шрифту. У режимі перегляду публікації, якщо шрифт, використаний у документі, доступний, то він використовується. Якщо недоступний, то заміняється на подібний з тим же кеглем і іншими характеристиками. Деякі шрифти можуть вбудовуватися в PDF-публікацію.

Для прямого пошуку будь-якої сторінки файлу PDF-файл містить спеціальну таблицю посилань. Таблиця розміщається наприкінці файлу і сприяє зменшенню часу пошуку і виводу сторінки в PDF-публікації, тому що забезпечує незалежність часу пошуку від загальної кількості сторінок у документі.