- •3.1 Введение в sgml
- •3.2 Конструкции sgml используемые в html
- •3.2.1 Элементы
- •3.2.2 Атрибуты
- •3.2.3 Указатели символов
- •3.2.4 Коментарии
- •3.3 Как читать dtd для html
- •3.3.1 Коментарии в dtd
- •3.3.2 Определения параметрических сущностей
- •3.3.3 Объявления элементов
- •Определения модели содержания
- •3.3.4 Объявления атрибутов
- •Сущности dtd в определениях атрибутов
- •Булевы атрибуты
- •4 Согласования: требования и рекомендации
- •4.1 Определения
- •4.3 Тип содержания "text/html"
- •5 Представление документа html
- •5.1 Набор символов документа
- •5.2 Символьные кодировки
- •5.2.1 Выбор кодировки
- •Примечание о специфических кодировках
- •5.2.2 Указание символьной кодировки
- •5.3 Символьные ссылки
- •5.3.1 Числовые символьные ссылки
- •5.3.2 Символьные сущностные ссылки
- •5.4 Неотображаемые символы
- •6 Основные типы данных html
- •6.1 Информация о регистре
- •6.2 Основные типы sgml
- •6.3 Текстовые строки
- •6.5 Цвета
- •6.5.1 Примечание об использовании цветов.
- •6.6 Длины
- •6.7 Типы содержания (типы mime)
- •6.8 Языковые коды
- •6.9 Символьные кодировки
- •6.10 Одиночные символы
- •6.11 Дата и Время
- •6.12 Типы связей
- •6.13 Описатели среды
- •6.14 Данные сценариев
- •6.15 Данные таблиц стилей
- •6.16 Фреймовые целевые имена
3.2.2 Атрибуты
Элементы могут иметь связанные с ними свойства, называемые атрибутами. Последние могут принимать значения (по умолчанию или как указано авторами или сценариями). Пары атрибут/значение приводятся перед конечным уголком ">" начального ярлыка элемента. Произвольное количество (законных) пар атрибут/значение, разделенных пробелами, может быть указано в начальном ярлыке элемента. Эти пары могут быть расположены в любом порядке.
В данном примере, атрибут id указан для элемента H1:
<H1 id="section1">
This is an identified heading thanks to the id attribute
(Этот заголовок идентифицирован при помощи атрибута id)
</H1>
По умолчанию SGML требует чтобы все значения атрибутов были заключены либо в двойные кавычки (десятиричный ASCII код 34) или одиночные кавычки (десятиричный ASCII код 39). Одиночные кавычки могут встречатся внутри значений атрибытов которые ограничены двойными кавычками и наоборот. Авторы могут так-же использовать численные указатели символов для представления двойных кавычек (") и одиночных кавычек ('). Для двойных кавычек авторы могут еще использовать указатель символьной сущности ".
В определенных случаях авторы могут указывать значение атрибута без кавычек. В этих случаях значение атрибута может содержать только [латинские] буквы (от a до z и от A до Z), цифры (от 0 до 9), черточки (десятиричный ASCII код 45), и точки (десятиричный ASCII код 46). Мы советуем использовать кавычки даже в тех случаях когда их можно опустить.
Имена атрибутов всегда нечуствительны к регистру
Бообще говоря, значения атрибутов нечуствительны к регистру. Определение каждого атрибута в справочном пособии указывает чуствительно ли его значение к регистру.
Все атрибуты определенные в настоящей спецификации перечислены в указателе атрибутов.
3.2.3 Указатели символов
Символьные ссылки представляют собой численные или буквенные имена для символов которые могут включатся в документ на HTML. Они полезны для указания на редко встречающиеся символы или символы которые трудно или невозможно ввести при помощи програмного обеспечения используемого автором. Вам будут встречатся символьные ссылки повсеместно на протяжении данного документа; они начинаются со знака "&" и заканчиваются точкой с запятой (;). Наиболее распространенные примеры включают:
"<" представляет знак <.
">" представляет знак >.
""" представляет двойную кавычку (").
"å" (в десятиричной системе) представляет букву "a" с кружочком сверху.
"И" (в десятиричной системе) представляет кирилическую заглавную букву "I" (И).
"水" (в шеснадцатиричной системе) представляет китайский иероглиф для слова "вода".
Мы подробно обсудим символьные ссылки HTML в разделе о наборе символов документа на HTML. Спецификация содержит также список символьных ссылок которые могут встречатся в документах на HTML версии 4.0.
3.2.4 Коментарии
HTML comments have the following syntax:
<!-- Это коментарий -->
<!-- и это тоже коментарий,
который занимает более одной строки -->
Пробелы не допускаются между открывающим ограничителем разметки ("<!") и ограничителем начала коментария ("--"), но они допускаются между ограничителем конца коментария ("--") и закрывающим ограничителем разметки (">"). Распростаненная ошыбка возникает при попытке вставить несколько черточек вподряд ("---") внутрь коментария. Авторы должны избегать использования двух или более примыкающих черточек внутри коментариев.
Информация возникающая между коментариями не несет специального значения (например, символьные ссылки не интерпретируются как таковые).