Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Obrobka_dokumentiv.doc
Скачиваний:
1
Добавлен:
04.09.2019
Размер:
276.48 Кб
Скачать

О бробка документів

У даній лекції розглядаються формати текстових файлів, кодування російського тексту. Описуються редактори KEdit, KWrite, McEdit. Показані прийоми роботи з Emacs, MS Word, StarWriter, Netscape Composer, KLYX.

Однією з найбільш поширених функцій сучасного персонального комп'ютера є підготовка всіляких текстових документів. У цих лекціях розглядаються програмні продукти, що функціонують в MS Windows і ОС Linux і призначені для роботи з текстами. Ми ознайомимося з принципами створення і редагування як простих, так і складніших документів.

Розрізняють дві основні групи програм підготовки текстових документів: текстові редактори і текстові процесори.

Текстовими редакторами, в основному, називають програми, що створюють текстові файли без елементів форматування (тобто що не дозволяють виділяти частини тексту різними шрифтами і гарнітурами). Редактори такого роду незамінні при створенні текстів комп'ютерних програм.

Текстові процесори уміють форматувати текст, вставляти в документ графіку і інші об'єкти, що не відносяться до класичного поняття "тексту". Слід зазначити умовність такого поділу – різноманітність програм для обробки тексту дозволяє знайти редактор з будь-яким набором функцій.

Деякі текстові процесори є так званими WYSIWYG-редакторами. Назва отримана по перших буквах фрази What You See Is What You Get – те, що ти бачиш, є те, що ти отримаєш. Коли говорять, що це WYSIWYG-редактор, то гарантують повну відповідність зовнішнього вигляду документа на екрані комп'ютера і його друкованій копії. До редакторів такого типу відносяться Word і StarWriter.

Деякі сучасні редактори підтримують концепцію "майже" WYSIWYG. Вигляд документу на екрані при цьому трохи відрізняється від того, як виглядатиме надрукований документ, але робиться це спеціально з метою ефективнішого використання робочого вікна документа. Прикладами "майже" WYSIWYG-редакторів є Netscape Composer і KLyX.

Формати текстових файлів

Текстові файли – найбільш поширений тип даних на комп'ютерному світі. Існують декілька проблем, пов'язаних з текстовими файлами. Перша – надзвичайно велика кількість символів, потрібних для підтримки різних мов. Американські програмісти для роботи з 128 символами використовують набір символів US ASCII (американський стандартний код для обміну інформацією). Для підтримки інших мов частенько не вистачає і 256 символів, тому зараз здійснюється поступовий перехід до кодування Unicode, в якому для зберігання одного символу відводиться вже два байти (тобто є можливість закодувати 65 536 різних символів).

Друга проблема полягає в тому, що люди хочуть, аби роздруковувані документи містили графіки, діаграми, примітки, заголовки і аби при цьому використовувалися різні шрифти. Документи, поширювані в Інтернет (онлайнові документи), можуть містити мультиплікацію, посилання на різні мережеві ресурси і звуковий супровід.

Багато текстових файлів передаються у вигляді простого тексту (plain text). Простий текст складно зробити привабливим і легко читаним, оскільки в ньому немає шрифтів різних зображень, графіки, заголовків, підзаголовків і так далі. Ці додаткові особливості носять назву розмітки тексту (markup).

Кажучи про розмітку тексту, виділяють поняття фізичної і логічної розмітки. При використанні фізичної розмітки тексту вказується точний вигляд кожного фрагменту. Наприклад, "центрований текст, 14-м кеглем, жирний, гарнітура Times". При логічній розмітці вказується логічне значення даного фрагменту, наприклад, "це заголовок глави". Ці два способи розмітки призначаються, як правило, для використання в різних ситуаціях. Для того, щоб роздрукувати текст на принтері, необхідно використовувати фізичну розмітку. Мають бути прийняті рішення про розмір полів і абзацних відступів. Ранні версії текстових процесорів використовували лише фізичний тип розмітки. При цьому для кожного фрагменту вказувався шрифт, розмір і стиль.

При обміні інформацією з іншими людьми фізичне оформлення тексту накладає ряд обмежень, особливо для онлайнових документів. Розмір екрану, роздільна здатність, шрифти різні для різних систем. Із-за цих причин все частіше використовується логічне оформлення тексту. В деяких випадках логічне оформлення практично необхідне: при створенні електронних документів типу сторінок WWW або при створенні і публікації об'ємних праць, таких як книги.

Для збереження розмітки документів при передачі текстової інформації від машини до машини застосовують різні способи. Текстові процесори і видавничі системи використовують спеціально розроблені формати файлів, що містять не лише текст, але й інформацію про те, як він має бути оформлений. Основна проблема тут в несумісності таких форматів, хоча найбільш складні програми зазвичай можуть читати файли у форматах програм-конкурентів. Прикладами такого підходу є текстові процесори Word і StarWriter.

При іншому підході безпосередньо в текст документу вставляються спеціальні команди розмітки. Навіть якщо у вас немає програмного забезпечення, що підтримує такий формат, ви все ж зумієте в ньому розібратися. Існує немало способів подібного представлення розмітки тексту, у тому числі:

HyperText Markup Language (HTML), що використовується в World Wide Web;

TEX і LaTeX, що користуються популярністю в багатьох академічних видань, а також в математиків, фізиків, хіміків і навіть музикантів.

Прикладами програм, які дозволяють розмітити текст так само, служать Netscape Composer і LYX (KLyX).

Файли, створені різними редакторами, частенько мають унікальні розширення, що дозволяють, не заглядаючи всередину документу, здогадатися про способи розмітки тексту. Так файли, створені редакторами підготовки plain-тексту, часто мають розширення .txt, а підготовлені в редакторові Lyx – .lyx. Текстовий процесор Word за умовчанням створює файли у форматі MS Word (розширення .doc), але підтримує і інші формати, наприклад RTF (розширення .rtf). Документи, що містять команди розмітки мовою HTML, мають розширення .html або .htm.

Вочевидь, що неможливо перерахувати всі текстові редактори. Багато хто з них "заточений" під ту або іншу специфічну діяльність. У списку, розглянутому нижче, представлена лише невелика частина текстових редакторів.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]