Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
мультимедіа-конспект лекцій.doc
Скачиваний:
54
Добавлен:
10.11.2019
Размер:
3.14 Mб
Скачать

Тема2: Складові систем мультимедіа: текст

Ввід тексту в комп’ютер здійснюється одним з наступних способів:

  • ввід вручну з клавіатури за допомогою системи підготовки текстів - текстового процесора (word processor) або настільної видавничої системи;

  • для вводу вже надрукованого тексту - застосування сканера разом з програмами розпізнавання тексту;

  • використання систем розпізнавання мови.

2.1 Формати текстових файлів

  • American Standard Code for Information Interchange ASCII (.txt). Формат текстових файлів, розроблений Американським інститутом стандартів (American National StandardsInstitute)- ANSI. Підтримується всіма операційними системами і всіма програмами. Являє собою текстовий файл в DOS-кодуванні.

  • ANSI (.txt). Формат текстових файлів в кодуванні ANSI (для кодової сторінки Microsoft Windows).

  • MsWord for Windows (.doc). Формат файлів, розроблений корпорацією Microsoft. Підтримується MsWord та іншими текстовими процесорами. Існує формат для MsWord 6.0/95 та відмінний від нього формат MsWord97/2000, що використовує Unicode-кодування.

  • Rich Text Format (.rtf). Формат документів, розроблений корпорацією Microsoft. Підтримується програмами для MSDOS та більшістю текстових процесорів. Він зберігає вихідне форматування документів, а також стилі зображення символів. Крім текстової інформації файли цього формату можуть містити графічні рисунки з різними параметрами. Підтримує 256 кольорів. Не підтримує стиснення. Не містить макросів, чим запобігає переносу відповідних вірусів. Використовується в основному для обміну форматованими текстовими даними між різними платформами та аплікаціями. Добре пакується архіваторами.

  • Hiper Text Markup Language HTML (.htm, .html). Мова розмітки гіпертекстових документів. Всі сторінки, розташовані в Internet (WWW) створені за допомогою цієї спеціальної мови. HTML-документи являють собою ASCII-файли, доступні для перегляду та редагування в будь-якому текстовому редакторі. Відмінністю від звичайного текстового файлу є те, що в HTML-документах присутні спеціальні команди - теги, які визначають правила форматування документа. Додаючи теги до звичайного тексту можна примусити програму перегляду (браузер) відображати цей текст певним чином і розміщувати на сторінці зображення. За допомогою Java-скриптів можна розширювати можливості HTML, розміщуючи на сторінці аплети.

  • Portable Document Format PDF (.pdf). Цей формат збереження документів, розроблений фірмою Adobe, претендує на роль відкритого типографського стандарту для Web. Він розглядається як альтернатива HTML. Недоліком HTML є те, що документи, переведені в HTML звичайно не зберігають первинний формат. З іншого боку, у випадку використання формату PDF, можна бути впевненим, що користувачі побачать публікацію саме такою, якою вона була створена. Формат PDF незамінний, якщо потрібно отримати точну копію необхідного документа.

  • Standard Generalized Markup Language SGML (.sgml) - стандартна мова узагальненої розмітки. Являє собою інструментальний набір механізмів створення структурованих документів, розмічених за допомогою дескрипторів (тегів). У порівнянні з HTML він забезпечує більш гнучкі та різнобічні можливості форматування у Web. Однак SGML відрізняється і підвищеною складністю, тому як більш простий засіб застосовується PDF. Потужність SGML полягає в його міжплатформеному структурному підході до опису вмісту документів. Фактично, SGML є метамовою, тобто призначений для опису мов розмітки, що використовуються при створенні документів.

  • Extensible Markup Language XML (.xml) - розширювана мова розмітки. Це спрощена версія мови SGML, що з’явилась у відповідь на обмеження HTML. Ця мова створена як компроміс між простотою HTML та гнучкістю SGML.