Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3 Об SGML и HTML.doc
Скачиваний:
2
Добавлен:
22.11.2019
Размер:
330.75 Кб
Скачать

5.4 Неотображаемые символы

Средство просмотра может быть не в состоянии отобразить все символы в документе, например, потому, что средство просмотра испытывает недостаток подходящих шрифтов, символ имеет значение, которое не может быть выражено во внутренних символьных кодировках средства просмотра и т.п.

В силу того, что имеется много различных предметов, которые не могут быть выполнены в данном случае, конкретный документ не предписывает никакого особого поведения. В зависимости от разработки, неотображаемые символы также могут быть обработаны основной системой отображения, а не собственным приложением. При отсутствии более сложного поведения, например, специально приспособленного для нужд особых языков сценариев, мы рекомендуем следующее поведение для средств просмотра:

  1. Использовать ясно видимый, но ненавязчивый механизм для сообщения пользователю об ошибках отсутствия ресурсов.

  2. Если отсутствуют символы, представляемые использованием их числовых представлений, следует использовать шестнадцатеричную (не десятичную) форму, так как эта форма используется в стандартах наборов символов.

6 Основные типы данных html

Содержание

  1. Информация о регистре

  2. Основные типы SGML

  3. Текстовые строки

  4. URI-ли

  5. Цвета

    1. Примечание об использовании цветов

  6. Длины

  7. Типы содержания (типы MIME)

  8. Языковые коды

  9. Символьные кодировки

  10. Одиночные символы

  11. Дата и время

  12. Типы связей

  13. Описатели среды

  14. Данные сценариев

  15. Данные таблиц стилей

  16. Фреймовые целевые имена

Данный раздел спецификации описывает основные типы данных, которые могут быть использованы в содержании элементов или значениях атрибутов.

Вводную информацию относительно чтения HTML DTD, можно получить в "Учебнике по SGML".

6.1 Информация о регистре

Каждое описание атрибута включает информацию относительно того, чувствительно к регистру его значение или нет. Информация о регистре представлена следующими ключами:

CS

Означает, что значение чувствительно к регистру (то есть: средства просмотра интерпретируют "а" и "А" по-разному).

CI

Означает, что значение не чувствительно к регистру (то есть: средства просмотра воспринимают "а" и "А" как один и тот же символ).

CN

Означает, что значение не подразумевает смены регистров (например, потому, что это число или символ из алфавита документа).

CA

Означает, что описание элемента или атрибута само дает информацию о регистре.

CT

Означает, что необходимо проконсультироваться в описании типа с целью получения более детальной информации относительно чувствительности к регистру.

Если значением атрибута является список, ключи применяются к каждому значению в списке, если не указано иное.

6.2 Основные типы sgml

"Декларация типа документа" определяет синтаксис содержания элемента и значения атрибута HTML, используя лексемы SGML (например: PCDATA, CDATA, NAME, ID, и т.п.). Их полное описание смотрите в [ISO8879]. Ниже приведена обобщенная информация о ключах:

  • CDATA -- это последовательность символов из алфавита документа и она может включать символьные объекты. Средства просмотра должны интерпретировать значение атрибута как следующее:

    • Заменить символьный объект символом,

    • Игнорировать символы перевода строки,

    • Заменить каждый символ возврата каретки или табуляции одним символом пробела.

Средства просмотра могут игнорировать директивы и оставлять пустое пространство в значении атрибута CDATA (например: "   myval   " может быть интерпретировано как "myval"). Авторам не следует объявлять значения атрибутов с директивами или оставленным пустым пространством.

Для некоторых атрибутов HTML 4.0 со значением атрибута CDATA, спецификация налагает дальнейшее принуждение на установку правильных значений для атрибута, которое не может быть выражено при помощи DTD.

Несмотря на то, что элементы STYLE и SCRIPT используют CDATA для их моделей данных, для этих элементов атрибут CDATA должен по-разному обрабатываться средствами просмотра. Разметка и объекты должны обрабатываться, как простой текст и передаваться приложению "как есть". Первое расположение последовательности символов "</" (разделитель, открывающий заключительный тег) обрабатывается как ограничивающий содержание атрибута. В реальных документах это будет завершающим тегом для элемента.

  • Лексемы ID и NAME должны начинаться с любой буквы ([A-Z, a-z]) и могут продолжаться любым числом букв, цифр ([0-9]), символов тире ("-"), символов подчеркивания ("_"), знаков двоеточия (":") и точек (".").

  • IDREF и IDREFS ссылаются на лексемы ID, определенные другими атрибутами. IDREF -- отдельная лексема, а IDREFS -- список лексем, разделенных пробелами.

  • Лексема NUMBER должна содержать по крайней мере, одну цифру ([0-9]).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]