Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции_1 курс_ИТ_34 ч.doc
Скачиваний:
9
Добавлен:
15.09.2019
Размер:
974.85 Кб
Скачать

Ietf утвердил несколько rfc по вариантам кодировки koi-8:

RFC1489 - KOI8-R

RFC2319 - KOI8-U

RFC1345 - ISO-IR-111 (с ошибкой в определении основного диапазона)

Iana зарегистрировала их в своём списке.

Стандарт RFC 1489 предписывает наличие графических символов «рамок» (псевдографики), однако это требование выполняется довольно редко.

В Microsoft Windows KOI8-R присвоен код страницы 20866, KOI8-U — 21866.

Нижняя часть таблицы кодировки (латиница) полностью соответствует кодировке ASCII.

В приведённых таблицах числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.

Кодировка KOI8-R (русская)

ISO 8859

Iso 8859 — семейство ascii-совместимых кодовых страниц, разработанное совместными усилиями iso и iec. По состоянию на 2006 год это семейство состояло из 15-ти кодовых страниц.

Общая информация

Поскольку кодировки ISO 8859 разрабатывались как средства для обмена информацией, а не как средства обеспечения высококачественной типографики, то в них не включены такие символы, как парные кавычки, тире различной длины, лигатуры и т. п. (хотя там всё же присутствуют такие символы как неразрывный пробел и символ мягкого переноса). Зато довольно много места (область 0x80—0x9F) зарезервировано под «верхние управляющие символы», предназначенные для управления терминалами.

Поскольку различные страницы ISO 8859 разрабатывались совместно, они обладают некоторой взаимной совместимостью. Например, все семь символов расширенной латиницы, используемые в немецком языке, стоят на одинаковых позициях во всех кодовых страницах, включающих эти символы. Страницы Latin-1—Latin-4 обладают ещё большей степенью совместимости: каждый символ, представленный в любых двух из этих страниц, стоит в них на одинаковых позициях.

Применение

Кодировки серии ISO 8859 применяются главным образом на юниксоподобных системах, а также для кодирования веб-страниц (поскольку большинство веб-серверов используют UNIX).

В системах Microsoft Windows используются кодировки Windows, некоторые из которых совместимы с ISO 8859, но включают больше графических символов за счёт использования области 0x80—0x9F.

Части ISO 8859

ISO 8859-1 (Latin-1)

Расширенная латиница, включающая символы большинства западноевропейских языков (английский, датский, ирландский, исландский, испанский, итальянский, немецкий, норвежский, португальский, ретороманский, фарерский, шведский, шотландский (гэльский) и частично голландский, финский, французский), а также некоторых восточноевропейских (албанский) и африканских языков (африкаанс, суахили). В Latin-1 отсутствуют знак евро и заглавная буква Ÿ. Эта кодовая страница считается кодировкой по умолчанию для HTML-документов и сообщений электронной почты. Также этой кодовой странице соответствуют первые 256 символов Юникода.

ISO 8859-2 (Latin-2)

Расширенная латиница, включающая символы центральноевропейских и восточноевропейских языков (боснийский, венгерский, польский, словацкий, словенский, хорватский, чешский). В Latin-2, как и в Latin-1, отсутствуют знак евро.

ISO 8859-3 (Latin-3)

Расширенная латиница, включающая символы южноевропейских языков (мальтийский, турецкий и эсперанто).

ISO 8859-4 (Latin-4)

Расширенная латиница, включающая символы североевропейских языков (гренландский, эстонский, латвийский, литовский и саамские языки).

ISO 8859-5 (Latin/Cyrillic)

Кириллица, включающая символы славянских языков (белорусский, болгарский, македонский, русский, сербский и частично украинский).

ISO 8859-6 (Latin/Arabic)

Символы, используемые в арабском языке. Символы других языков с письмом на основе арабского не поддерживаются. Для корректного отображения текста в кодировке ISO 8859-6 требуется поддержка двунаправленного письма и контекстно-зависимых форм символов.

ISO 8859-7 (Latin/Greek)

Символы современного греческого языка. Может использоваться также для записи древнегреческих текстов в монотонической орфографии.

ISO 8859-8 (Latin/Hebrew)

Символы современного иврита. Используется в двух вариантах: с логическим порядком следования символов (требует поддержки двунаправленного письма) и с визуальным порядком следования символов.

ISO 8859-9 (Latin-5)

Вариант Latin-1, в котором редко используемые символы исландского языка заменены на турецкие. Используется для турецкого и курдского языков.

ISO 8859-10 (Latin-6)

Вариант Latin-4, более удобный для скандинавских языков.

ISO 8859-11 (Latin/Thai)

Символы тайского языка.

ISO 8859-12 (Latin/Devanagari)

Символы письма деванагари. В 1997 работа над ISO 8859-12 была официально прекращена, и эта кодировка так и не была принята как стандарт.

ISO 8859-13 (Latin-7)

Вариант Latin-4, более удобный для балтийских языков.

ISO 8859-14 (Latin-8)

Расширенная латиница, включающая символы кельтских языков, таких как шотландский (гэльский) и бретонский.

ISO 8859-15 (Latin-9)

Вариант Latin-1, в котором редко используемые символы заменены на необходимые для полной поддержки финского, французского и эстонского языков. Кроме того, в Latin-9 был добавлен знак евро.

ISO 8859-16 (Latin-10)

Расширенная латиница, включающая символы южноевропейских и восточноевропейских (албанский, венгерский, итальянский, польский, румынский, словенский, хорватский), а также некоторых западноевропейских языков (ирландский в новой орфографии, немецкий, финский, французский). Как и в Latin-9, в Latin-10 был добавлен знак евро.

Архиваторы

В настоящее время формат ZIP, наряду с приобретающим популярность RAR, считается стандартом для многих приложений, включающих функции сжатия, резервного копирования и обмена данными.

Наряду со множеством утилит, работающих с ZIP-файлами из командной строки, в середине 1990-х годов появились и графические программы для работы с ними. Одной из самых популярных стала WinZip.

На текущий момент существует множество алгоритмов компрессии, выигрывающих у ZIP и в скорости, и в компрессии, и в количестве предоставляемых дополнительных возможностей. Несмотря на это, он по прежнему является популярным методом сжатия данных.

Множество конкурирующих архиваторов, помимо своего собственного, также поддерживают формат ZIP. Этот способ сжатия также широко используется в других программах и даже в некоторых форматах файлов.

К сожалению, архиватор ZIP не позволяет разбить сжимаемый файл на несколько томов (частей). Это бывает необходимо для записи архива на носители небольшого объёма (дискеты, CD-R). Например, очень популярные архиваторы 7z и RAR дают такую возможность.

Программа kzip является экстремальным по степени сжатия упаковщиком в формат ZIP и применяется людьми, привязанными к zip-формату (например, для публикации программного обеспечения в вебе или Java-разработчиками).

1 Информатика: Учебник. Под ред. Макаровой Н. В. М.: Финансы и статистика, 2000.

2 Акулов О. А., Медведьев Н. В. Информатика: базовый курс. М.: Омега-Л, 2006

3 Лесничая И.Г. Информатика и информационные технологии. Учебное пособие. М.: Издательство Эксмо, 2007

4 Акулов О. А., Медведьев Н. В. Информатика: базовый курс. М.: Омега-Л, 2006

5 Информатика: Учебник. Под ред. Макаровой Н. В. М.: Финансы и статистика, 2000.

6 Информатика: Учебник. Под ред. Макаровой Н. В. М.: Финансы и статистика, 2000.

7 Акулов О. А., Медведьев Н. В. Информатика: базовый курс. М.: Омега-Л, 2006.

8 Информатика: Учебник. Под ред. Макаровой Н. В. М.: Финансы и статистика, 2000.

9 Дорот В. А., Новиков Ф. Н. Толковый словарь современной компьютерной лексики. 2-е изд. СПб.: BHV, 2001.

10 Акулов О. А., Медведьев Н. В. Информатика: базовый курс. М.: Омега-Л, 2006.

11 Попов В.Б. Основы компьютерных технологий. М. : Финансы и статистика, 2002.

12 Дорот В.А., Новиков Ф. Н. Толковый словарь современной компьютерной лексики. 2-е изд. СПб.: BHV, 2001.

13 Акулов О.А., Медведьев Н.В. Информатика: базовый курс. М.: Омега-Л, 2006.

76