Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекція 2.doc
Скачиваний:
7
Добавлен:
18.02.2016
Размер:
345.6 Кб
Скачать

Визначення імен у xml

ПРАВИЛО. При визначенні імен елементів у документі XML необхідно дотримуватися таких правил:

  • Ім'я елемента повинне починатися з букви, знаку підкреслення ( _ ) або двокрапки (:).

  • Після першого символу в імені елемента можуть бути букви, цифри, знаки перенесення (–), знаки підкреслення ( _ ), крапка або двокрапка (:).

  • Імена елементів не можуть починатися з букв XML або варіацій на цю тему, оскільки всі подібні імена захищені правами на інтелектуальну власність консорціуму W3C.

Декларації xml

Відомо, що добре оформлені документи без проблем відображуються будь-яким парсером. Хоча парсер розуміє, що відображуваний документ є XML-документом, гарним тоном вважається вказувати, що це документ XML.

Деякі парсери вимагають наявність в документі відповідного рядка декларації XML, який має такий вигляд:

<? xml version=“1.0” ?>.

Оголошення XML-документа може містити також оголошення кодування (encoding declaration), яке вказує на форму символів і оголошення самостійності документа (standalone declaration ).

Повний рядок декларації виглядає так

<?xml version= “1.0” encoding=“.” standalone=“.”?>.

Значення атрибута encoding містить кодування символів документа, а значення атрибута standalone – вказує, чи є даний документ самостійним і може набувати значення yes або no.

ЗАУВАЖЕННЯ. З використанням параметра encoding оголошення XML, наприклад, для роботи в Windows з кирилицею, буде мати вигляд:

<?xml version=”1.0” encoding=”Windows-1251”?>

Додавання коментарів

Коментарі в XML додаються так як і в HTML.

<!-- це коментар -->.

Правильні екзмпляри xml

У XML, разом з концепцією «добре оформленого документа», розглядається концепція «дійсного або валідного документа XML».

Правильний документ гарантує цілісність структури даних. Завдяки цьому значно спрощується доставка і обмін даними, які коректуються параметрами XSLT.

Для визначення правильності документа необхідно:

  1. Визначити використання тільки заданого набору дескрипторів.

  2. Перевірити, щоб порядок проходження елементів і їх атрибутів повністю відповідав змісту документа або певним правилам.

Іншими словами, в XML-документі має бути правильно реалізована схема документа, що визначає його структуру.

Як правильно визначити структуру. Повернемося, наприклад, до створення XML документа для інструкції по миттю машини. Документ XML добре оформлений, але з погляду правильності він надлишковий (на кожну складову відводиться два елементи). Логічно було б використовувати один елемент з атрибутом

<items quantity= “.”>.

А XML-код виглядатиме так:

<?xml version= “1.0” encoding= “windows-1251”>

<!--Це XML код інструкції-->

<directions>

<title>Інструкція, як помити машину</title>

<ingredients>

<items quantity= “50 л”>Вода</items>

<items quantity= “0,5 л”>Шампунь</items>

<items quantity= “0,3 л”>Віск</items>

</ingredients>

<instrument>

<items quantity= “1 шт.”>Відро</items>

<items quantity= “1 шт.” >Мочалка </items>

<items quantity= “2 шт.” >Лоскут для полірування</items>

</instrument>

<actions> Машину обполоснути водою, потім нанести піну і залишити на 5 хвилин. Піну змити. Нанести на поверхню кузова віск, витерти корпус машини

</actions>

</directions>.

Рисунок 5 – Приклад документа

  1. Контроль типів даних.

Контроль типів даних досягається завдяки використанню відповідної схеми.

Дані XML документа, які використовуються при обміні, повинні використовувати один формат, для запобігання плутанини.

Наприклад, дата може бути оформлена в одному з таких форматів:

mmddyy yyddmm

ddmmyy yymmdd.

Існує декілька підходів до контролю типів даних. Пізніше розглянемо технології XDR і DTD.

До наступних типів даних може буде потрібна перевірка правильності. Необхідність перевірки залежить від того, обмін якою інформацією здійснюється.

Тип даних

Опис

Boolean

Логічний тип, значення ІСТИНА / БРЕХНЯ

Char

Один символ

String

Рядок символів

Float

Дійсні числа

Int

Цілі числа

Date

Дата у форматі YYYY-DD-MM

Time

Час у форматі HH-MM-SS

Id

Текст, унікальним чином ідентифікуючий елемент

Idref

Посилання на ідентифікатор

Enumeration

Послідовність значень, з якої можна вибрати будь-яке значення.

  1. Здійснити контроль цілісності даних для забезпечення оптимального обміну інформацією через Web за допомогою транзакцій.

Якщо мова йде про перевірку правильності оформлення документа, то мова йде не про представлення даних, а про структуру даних.

У ЧОМУ ПОЛЯГАЄ ВІДМІННІСТЬ СТРУКТУРИ ДОКУМЕНТА ВІД СТРУКТУРИ ДАНИХ?

Структура документа дозволяє читачеві швидко зрозуміти, в якому саме вигляді подав інформацію автор документа.

Структури даних вказують шлях комп’ютерного застосування даних, які містяться в різних контейнерах цілого документа. У структурі даних не міститься визначення важливості одного компонента документа по відношенню до іншого. Всі компоненти рівні.

Парсер – це програма (у специфікації консорціуму W3C називається обробником XML), яка інтерпретує символ за символом. Існує два типи парсерів:

  • перевіряють форматування документів, тобто їх відповідність синтаксичним правилам;

  • спочатку перевіряють форматування документа, а потім їх відповідність всім обмеженням, вказаним у пов'язаних з ним документах.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]