Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
calimera_guidlines_ukrainian.pdf
Скачиваний:
10
Добавлен:
12.05.2015
Размер:
3.23 Mб
Скачать

Посібник Calimera

Збереження у цифровому форматі

ПЕРЕЛІК ПИТАНЬ

Рекомендація включає наступні питання: Відбір Технології збереження

Технології емуляції Переміщення даних Автентичність Зберігання Консервація

Дії у надзвичайних ситуаціях Формати Носії Стандарти

Архівація всесвітньої мережі і доменів Наслідки для персоналу Адміністративні та юридичні наслідки

СТРАТЕГІЧНІ ПИТАННЯ

Назад до переліку

"Об'єми інформації зростають беспрецедентними темпами. За рік, ми вже створюємо більше інформації ніж створили за весь період, з тих пір як злізли з дерев. Більшість цієї інформації лише цифрова, тобто така що не має матеріального відображення. Це робить її ще більш недовговічною. Документ XML, наприклад, створюється в той час як ви його переглядаєте. То як же Ви зберігаєте його?" (Ульріх Кампффмейєр, директор PROJECT CONSULT, Німеччина) [1].

ЄС визнає, що тривалий доступ як до цифрових, так і до аналогових ресурсів є критичним у досягненні цілі зробити Європу “самою конкурентноздатною, динамічною, та такою, що ґрунтується на знаннях, економікою; у світі” [2]. Організація ERPANET (Зберігання Електронних Ресурсів та Мережа Доступу) була створена, щоб звернути увагу на проблеми цифрового зберігання [3].

Цифрові матеріали - “природно цифрові”, чи конвертовані в цифровий формат, знаходяться під загрозою старіння технологій та псування їх фізичних властивостей. Мета зберігання ресурсів полягає в тому, що вони залишилися доступними для теперішніх і майбутніх поколінь. У випадку цифрових ресурсів додаткові проблеми (в порівнянні зі зберіганням традиційних аналогових матеріалів) включають:

Посібник Calimera

219

Збереження у цифровому форматі

технологічне старіння, зазвичай розглядається, як найбільша технічна загроза забезпеченню безперервного доступу. Швидкість змін в технології, означає, що часовий період, на протязі якого має бути виконана дія, триває лише декілька років, можливо лише 2 – 5, на відміну від десятиліть або навіть століть для традиційних матеріалів;

недовговічність деяких носіїв даних для зберігання цифрової інформації. Вони швидко псуються, хоч зовні непомітно ніяких пошкоджень;

легкість, з якою можуть бути внесені зміни. Це означає, що можуть виникнути проблеми з наданням довготривалої гарантії оригінальності;

динамічний характер деяких “природно цифрових” матеріалів. Це означає, що їх треба постійно оновлювати. Таке використання технології дуже ефективне для того, щоб постійно забезпечувати сучасну інформацію, карти і т.д., але створює проблеми щодо можливості порівняння даних в різні періоди часу;

життєвий цикл вебсайту. Середня, встановлена тривалість існування вебсайту, приблизно 44 дні. Це схоже на проблему швидкоплинності в аналоговому світі. Потрібно знайти способи збору та зберігання важливих вебсайтів і відбору прикладів усіх інших вебсайтів;

питання оригіналів. Потрібно піклуватись про зберігання аналогових оригіналів, цифрових матеріалів. Однак, у “природно цифрових” матеріалів немає ніяких аналогових еквівалентів, щоб відновити їх – якщо вони загубляться, то вони будуть втрачені назавжди. Наприклад, перша телеграма, відіслана будь-коли, в 1844 році, була збережена в аналоговому форматі і була переведена в цифровий формат; перше повідомлення електронною поштою, відіслане в 1971 році, було втрачене.

Проблеми зберігання потрібно розглядати, як невід’ємну частину організації цифрового процесу, створюючи цифрову копію як аналогової одиниці, так і “природно цифрової” одиниці. Важливо документувати та записувати всі технологічні процедури, що призвели до створення цифрової одиниці, і більшість критичної інформації може бути отримано лише в момент створення. Витрати та наслідки при відсутності такої стратегії зберігання можуть бути великими. Ретроспективне зберігання, якщо воно взагалі можливе, скоріш за все, буде дорого коштувати. Хоча методи такі як цифрова археологія (спасіння цифрових ресурсів, які стали недоступними) існують, вони не завжди успішні. Втрата доступу до зростаючого за обсягом матеріалу, наявного лише в цифровому форматі, могла б мати серйозні наслідки для наступних поколінь. Щоб скоротити ризик втрати можна вдатись до таких запобіжних заходів:

зберігання в стійкому контрольованому середовищі;

проведення регулярних циклів оновлення;

створення резервних копій (за умови їх ліцензування/отримання авторських прав);

встановлення відповідних процедур поводження з ними;

використання стандартних форматів і засобів зберігання.

Так само як технічна стратегія, важлива і організаційна стратегія, для того щоб забезпечити ресурси, штат працівників і час для того, що має бути безперервним процесом. ERPANET опублікував корисні поради [4].

Посібник Calimera

220

Збереження у цифровому форматі

Деякі заклади, особливо невеликі, можуть доручити (за контрактом) виконання всього процесу зберігання чи зберігання цифрових матеріалів третім особам. Це також вимагатиме ретельного планування. Для отримання інструкцій стосовно проблемам, які потребують вирішення, див. Данкан Сімпсон: Замовлення послуг по цифровому зберіганню: інформаційний рекламний проспект та контрольний список послуг. Коаліція Цифрового Зберігання, жовтень 2004 [5].

РЕКОМЕНДАЦІЇ З ПОЗИТИВНОЇ ПРАКТИКИ Назад до переліку

Способи забезпечення довгострокового доступу повинні бути визначені на стадії планування, коли ресурси переводяться в цифровий формат (див. розділ Digitisation), або на стадії створення, у випадку з “природно цифровими” матеріалами. Корисно було б розробити стратегію "життєвого циклу", яка б включала процес створення даних, тактику доступу і процедури зберігання, і яка була б розроблена і готова до застосування перед захопленням будь-яких зображень.

Відбір Назад до переліку

Ключове рішення, яке має бути прийняте, стосується відбору, тобто які ресурси виправдовують зберігання. Не всі матеріали можуть або потрібно зберігати назавжди; деякі взагалі не треба зберігати, інші потрібно зберігати на деякий або взагалі на невизначений час. Якщо будь-який експонат традиційної колекції не буде відібрано для зберігання, це не означає, що його буде обов’язково втрачено, але в цифровому середовищі таке рішення, майже точно, буде небезпечним. У випадку з “природно цифровими” матеріалами, бажано скрізь, де можливо, залучати до рішення про відбір, тих, хто їх створив. У випадку існування декількох версій, потрібно вирішити, яка саме версія найкраща для зберігання, або чи потрібно відібрати для зберігання декілька версій. Відбір зразків динамічних ресурсів, на відміну від намагання зберігати кожні зміни, може бути найпрактичнішим способом. Прийняття таких рішень як можливо раніше, допоможе намітити цілі щодо збереження найцінніших матеріалів.

Як тільки відбір матеріалу проведено, потрібно розробити відповідну технічну стратегію, наприклад, технологію зберігання, технологію емуляції, або переміщення даних.

Технології збереження

Назад до переліку

Ця стратегія дуже ризикована. Вона являє собою зберігання первинного програмного забезпечення (і можливо технічного забезпечення), яке використовувалось для створення та доступу до інформації. Вона також включає зберігання та підтримку як оригінальних операційних систем і технічних засобів, так і продовження навчання працівників, оскільки їм потрібні будуть навички для постійного управління системами. Довготривалі витрати не можливо оцінити. Ця технологія, скоріш за все буде надто дорогою і непрактичною для невеликих закладів (окрім дуже великих з дуже важливими колекціями), хоча питання співпраці з іншими закладами, щодо утримання такого обладнання "в складчину" може бути розглянуте. Незручність цієї стратегії полягає в наступному: застаріння; зношування, через деякий час, програмного та

Посібник Calimera

221

Збереження у цифровому форматі

технічного забезпечення; зникнення через деякий час, технічної підтримки; розташування обладнання „в складчину” на певній відстані від цифрових ресурсів, що ускладнює доступ до нього місцевих користувачів. Зберігання технології – на справді не найкраща можливість для невеликих місцевих закладів.

Технології емуляції Назад до переліку

Цей процес залучає методи, що розвиваються, з метою наслідування застарілих систем на комп’ютерах майбутніх поколінь. В наш час цей процес коштовний і технічно складний. До того ж кожного разу буде потрібна переробка кожного разу як тільки з’явиться нова технологічна платформа. Таким чином, ця технологія може бути розцінена як рішення проблеми довгострокового зберігання можливо глобально важливого матеріалу, що знаходиться у великих національних закладах, де емуляція може мати місце на більш чи менш безперервній основі. Додаткова проблема може полягати в потребі звернення за авторськими правами (див. рекомендації з законодавчих та юридичних питань).

Переміщення даних Назад до переліку

Цей процес представляє собою копіювання даних з технічного/програмного забезпечення одного покоління на більш нове, таким чином зберігаючи їх в сучасному форматі, якщо постійно йде в ногу зі змінами в технології. Це – мабуть найпростіший та найчастіше використовуваний метод, не дивлячись на можливість втрати даних в процесі переміщення. При цьому зберігається інтелектуальний вміст первинних даних, але первинні особливості і вигляд можуть бути втрачені. Якщо їх збереження важливе, то, скоріш за все, доведеться застосувати технології зберігання або емуляцію. Витяг (відбірка) метаданих – важлива стадія стратегії переміщення, для того щоб гарантувати довготривале використання ресурсів, в разі якщо трапляться будь-які зміни чи втрата функціональності, оскільки витяг відбувається послідовно. В цьому випадку зберігання метаданих, тобто опис програмного та технічного забезпечення і вимог керування цифровими даними, забезпечить суттєву інформацію.

Оновлення даних пов’язане з переміщенням. Це - процес копіювання даних з одного пристрою чи копії цифрових носіїв на інший, такого ж типу, що допомагає утримувати дані в гарному стані, поки їх не перенесуть на інші носії.

Можна було б розглянути питання копіювання даних на носії старіших поколінь, а саме аналогових. У випадку ресурсів, що переведені в цифровий формат з аналогових оригіналів було б доцільно зберігати оригінали. Також можливо зберігати “природно цифрові” матеріали в аналоговому форматі на зразок паперу, мікроплівки, або нікелеві диски, але такі засоби підходять в обмеженій кількості випадків на зразок друку цифрового документу. Це не підходить для все більш і більш складних вебсайтів і т.д., де втрата функціональності зменшила б повноцінність ресурсів.

Інша можливість, яку можна було б розглянути, це зберігання моментальних знімків екранів систем, віртуальних виставок або творчих робіт (особливо,

Посібник Calimera

222

Збереження у цифровому форматі

“природно цифрових”). Це забезпечує запис системи у вигляді цифрового файлу зображення, який скоріш за все пакуватиметься у сенсі довгострокового зберігання.

Автентичність (див. також рекомендації з безпеки) Назад до переліку Вибір стратегії зберігання буде залежати від того, наскільки автентичним буде збережений об'єкт. Немає загальноприйнятного визначення автентичності, але в широкому розумінні це означає, що копія має бути схожа на оригінал настільки, наскільки це можливо, і зв’язки між документами і об’єктами повинні бути збережені, з метою інтерпретації. У випадку з аналоговими записами є можливість прослідкувати шлях досягнення рішення, дослідивши відношення між документами; історики переконані, що, із швидким зростанням кількості записів, доступними лише в цифровому форматі, майбутні покоління втратять таку можливість.

В аналоговому світі предмет, що зберіається, зазвичай є оригіналом, хоча можуть створюватись копії, щоб захистити його від пошкоджень під час використання та обробки і т.д. В цифровому світі, одиниця, що зберігається, вже буде копією, оскільки не існує ніяких фізичних відповідників. Оскільки така цифрова копія залежить від технології доступу, через деякий час її буде неодноразово змінено, щоб забезпечити до неї доступ черех нові технології. Тому, вирішальним є зберігання метаданих разом з нею, щоб встановити її автентичність, а метадані, в ідеалі, повинні створюватись разом з інформацією. (Для обговорення питань пов’язаних з автентичністю та зберіганням див.

Цілісність та автентичність цифрових об’єктів культурної спадщини. Серпень 2002.)[6]

Збереження (див. також рекомендації з оцифрування) Назад до переліку Потрібно буде розробити стратегії зберігання, як в оперативному, так і в автономному режимах. Робочі файли, що безперервно використовуються, потрібно буде зберігати в оперативному режимі, на серверах. Файли-еталони краще всього зберігати автономно, оскільки їх використовують не так часто. Зберігання оригіналів аналогових об’єктів та первинних текстів також важливе, тому потрібно розробити зв’язки з ними.

Зберігання в оперативному режимі – дуже легко внести хаос на носії декількома версіями документів та іншими непотрібними матеріалами. Тому було б корисно мати план, який:

°дозволить зрозуміти, які матеріали повинні бути доступні в оперативному, які – в напівоперативному, і які – в автономному режимі;

°встановити строки знищення матеріалів певної категорії, що зберігаються в оперативному режимі;

°встановити строки перегляду матеріалів, що зберігаються в оперативному режимі.

За умови зберігання в автономному режимі треба приймати до уваги проблему деградації носіїв. Однак, незважаючи на його недовговічність, якщо порівняти, наприклад, з папером, більшість носіїв даних переживе технічне та програмне забезпечення, яке буде потрібне для їх використання. За останні 30 років засоби зберігання пройшли шлях розвитку від перфокарт до DVD, через відео касети, дискети та CD-ROM диски, але важко знайти

Посібник Calimera

223

Збереження у цифровому форматі

технологію, щоб відтворити дані, збережені на ранніх носіях. Зберігання не може бути єдиним завданням на всі часи, але повинно бути частиною безперервного процесу. Питання, які потрібно розглянути включають:

°Стан навколишнього середовища – гарний стан навколишнього

середовища збільшить тривалість життя цифрових носіїв даних, та допоможе запобігти пошкодженню даних. Коливання температури та вологості, як вважають, діють з більшою руйнівною силою, ніж підтримання постійного їх рівня, навіть набагато нижчого за ідеальний. Див. інструкції BS 4783 (Зберігання, транспортування та обслуговування носіїв, що використовуються для обробки даних та зберігання інформації) [7];

°архівні носії – бажано вибрати архівні носії найкращої якості. Доступна

велика кількість цифрових носіїв даних, включаючи компакт диски (СD-R), DVD-R диски, DАТ цифрові аудіо-касети та DLT плівки для цифрового запису з послідовним доступом. Цифрові зображення мають бути збережені, на накопичувачах з одноразовим записом і багаторазовим зчитуванням (WORM), які дозволяють часто переглядати файли і не потребують їх переписування. TASI (Технічна Консультаційна Служба по роботі з Зображеннями) пропонує поради щодо CD-R та DVD-R дисків [8]. Федеральне Управління Безпеки Інформаційної техніки (BSI) пропонує поради по стандартам для архівних носіїв [9];

°архівні копії – потрібно зробити і завжди зберігати в різних місцях, хоча б

дві архівні копії. Якщо можливо, потрібно зберігати декілька копій на різних носіях даних. Копії, створені шляхом використання різного програмного забезпечення, і/або програмного забезпечення, що можна порівняти, або придбане у різних постачальників, допоможуть захистити дані від ушкоджень в наслідок нестабільної роботи програмного забезпечення або вірусів;

°оновлення носіїв – корисно було б мати план, щодо оновлення або переміщення архівних копій на нові носії в певні строки, наприклад

в межах мінімального строку придатності носія, зазначеного постачальником;

коли встановлено нові пристрої для зберігання;

коли перевірка контролю якості розкриває істотні нерегулярні помилки чи помилки читання в ресурсі даних;

°перевірка якості – процедура перевірки якості повинна включати:

періодичну перевірку всіх носіїв на можливість читання;

використання кількості біт/байт або інших контрольних сум для порівняння з оригіналами, щоб забезпечити автентичність та цілісність матеріалів після оновлення носіїв;

реєстрація всіх проведених дій.

Консервація Назад до переліку

В аналоговому світі, зберігання – це термін, що використовується для визначення дій, які взагалі гарантують зберігання та довготривале існування матеріалів (обережне поводження, безпечна упаковка під час транспортування, контроль навколишнього середовища і т.д.), а консервація – це окремий аспект дій, який включає певне активне втручання, тобто ремонт або реставрацію. У

Посібник Calimera 224 Збереження у цифровому форматі

випадку з цифровими ресурсами, частіше використовують термін „зберігання”, хоча активні заходи по збереженню могли б бути необхідні час від часу; наприклад, деякі пошкоджені носії можна відремонтувати.

Дії у надзвичайних ситуаціях та управління ризиками Назад до переліку

Завжди потрібно мати план на випадок надзвичайної ситуації. Він повинен включати такі заходи:

створення архівних копій всіх важливих цифрових матеріалів, щойно вони придбані чи створені;

використання стандартних носіїв та форматів;

зберігання архівних копій на місці та поза ним – в регіонах, де існує небезпека стихійного лиха (повені), зовнішні копії повинні знаходитись на безпечній відстані;

інструктаж персоналу щодо дій в разі надзвичайної ситуації;

наявність стратегії управління ризиками. ERPANET опублікував набір засобів для повідомлення про ризики. [10]

Формати Назад до переліку

Вимоги до формату файлу для архівації ті ж самі, що й до створення файлів (див. (див. рекомендації з оцифрування). Бажано:

використовувати відкритий стандарт формату файлу, а не запатентований, щоб захистити його від старіння;

використовувати формат файлу, що може підтримувати додавання метаданих;

не застосовувати жодну компресію, щоб запобігти втраті даних, формати файлів, що не втрачають дані - це TIFF (Теговий Формат Файла Зображення) [11], що є найкращим, але якщо йдеться про збереження вільного місця, то PNG (Портативна Мережева Графіка) [12], що може стати альтернативним форматом без втрат.

Ті ж самі загальні правила стосуються збереження аудіовізуальних форматів (див. також рекомендації з мультимедійних послуг), але величезну проблему створюють цифрові засоби телерадіомовлення. Основна частина телебачення зараз створюється в цифровому форматі. Обов’язково потрібно залучити тих, хто створює програми та журналістів до проблеми створення стратегії їх зберігання. Телевізійні компанії типу Нідерландського інституту звуку та зображення [13] працюють на розробками стратегій зберігання сотень тисяч годин матеріалів телерадіопередач автентичним способом.

ERPANET пропонує наступні формати файлів для зберігання [14]:

Текстові документи: звичайні ASCII [15], PDF [16], XML [17], TIFF [11];

Графічні документи: TIFF [11], JPEG2000 [18];

Аудіовізуальні документи: WAV [19], BWF [20], MPEG [21].

Через велику кількість та різноманітність доступних форматів, інформацію про них збирають в реєстрах форматів файлів, таких як Британський Національний Архів PRONOM [22]. Місцеві заклади, можливо, повинні звертатись за порадами до регіональних та національних професійних асоціацій, щодо того, які формати є найбільш доцільними.

Посібник Calimera

225

Збереження у цифровому форматі

Носії (див. також зберігання) Назад до переліку

Як вже згадувалось, для архівації бажано вибирати носії найкращої якості. Є велика кількість цифрових носіїв даних, у т. ч. компакт диски (СD-R), DVD-R диски, цифрові аудіо-касети (DАТ) та плівки для цифрового запису з послідовним доступом (DLT). Цифрові зображення мають бути збережені на накопичувачах з одноразовим записом і багаторазовим зчитуванням (WORM), які дозволяють часто переглядати файли і виключають їх перезапис. TASI (Технічна Консультаційна Служба по роботі з Зображеннями) пропонує свої поради [8].

Стандарти (див. також рекомендації з оцифрування) Назад до переліку Під час архівації цифрових матеріалів бажано дотримуватись відкритих стандартів. Оскільки вони не прикріплені до певного технічного/програмного забезпечення, вони допомагають запобігати технологічному старінню. Існують стандарти для різних аспектів зберігання цифрової інформації. Наприклад:

стандарти функціональної сумісності – надають можливість зв’язку між різними системами. Приклади включають ISO 23950:1998 Інформація і документація – Пошук Інформації (Z39.50) - Визначення сервісу прикладних програм та специфікація протоколу [23], а також CIMI (Консорціум Комп’ютерного обміну інформацією музеїв) Профіль: Z39.50 Профіль програм для інформації культурної спадщини [24];

стандарти кодування ресурсів (див. також рекомендації з опису ресурсів та виявлення і пошуку) - вони визначають формати для різних типів цифрової інформації. Дотримання цього типу стандартів дозволяє суміщати дані в широкому діапазоні систем. Приклади включають стандарти для:

форматів опису сторінки, наприклад PostScript [25], Портативний Формат Документу (PDF) [16];

графічні формати, наприклад Теговий Формат Файла Зображення (TIFF) [11], Формат Графічного Обміну (GIF) [26];

формати структурованої інформації, наприклад Стандартна Загальна Мова Розмітки (SGML) [27], Розширена Мова Розмітки (XML) [17];

формат рухомих зображень та аудіо, наприклад WAV [19], (BWF) [20], MPEG [21];

стандарти ідентифікації ресурсів (див. також рекомендації з опису ресурсів та виявлення і пошуку) – вони забезпечують спосіб унікальної ідентифікації цифрових матеріалів, з метою гарантування довгострокового та надійного доступу до них, якщо вони доступні в Інтернеті, навіть якщо їх місцеположення зміниться. URL (Уніфікований Покажчик Ресурсу) може змінюватись. Приклади постійних ідентифікаторів включають URN (Універсальні Імена Ресурсів) [28], DOI (Цифрові Ідентифікатори Об’єкта) [29], PURL (Постійні уніфіковані покажчики ресурсу) [30], Handles [31] та ARK (Архівні Ключі Ресурсу) [32];

Стандарти опису ресурсів (див. також рекомендації з виявлення і пошуку) – вони можуть полегшити ефективне виявлення ресурсів. Приклади: AACR2 [33] та Dublin Core [34]. Існує також група стандартів, які відносяться до синтаксису метаданих, типу MARC (Машинно-зчитуваний каталог) [35] та EAD (Кодований Архівний Опис) [36]. Консорціум Всесвітньої Мережі (W3C) [37] в

Посібник Calimera

226

Збереження у цифровому форматі

даний момент приймає участь в розвитку стандарту на опис ресурсу (RDF) [38], який забезпечить інфраструктуру, для підтримки співіснування різних видів метаданих, або "схем", і одним з таких прикладів є Dublin Core;

Стандарти архівації даних – забезпечують довгострокове збереження та доступ до цифрової інформації. Відкрита Архівна Інформаційна Система (OAIS) Рекомендована Модель (ISO 14721:2003 Розміщення даних та системи передачі інформації – Відкрита Архівна Інформаційна Система – рекомендована модель) – є прикладом. [39];

Стандарти оперативного обліку – вони забезпечують інструкції щодо того, як створювати стратегії, процедури та методи оперативного обліку. Головні приклади ISO 15489 Інформація та документація – Оперативний облік [40] та ISO/TS 23081-1:2004 Інформація та документація - Оперативний облік - Метадані оперативного обліку - Частина 1: Принципи [41].

Також бажано дотримуватись стандартних форматів і носіїв. Просто використання стандартних форматів файлів та стандартних носіїв матиме велике значення для гарантії безпеки цифрових колекцій. Технічна Консультаційна Служба по роботі з Зображеннями (TASI) [42] та Digital Preservation Coalition [43] пропонують корисні поради відносно обох питань, а також див. рекомендації з оцифрування. Федеральне Управління Безпеки Інформаційної техніки (BSI) пропонує поради щодо стандартів для архівних носіїв [9].

Різні проекти працюють над розробкою стандартів для цифрової архівації, у т.ч.: InterPARES [44], Project Prism [45], DAVID [46] та VERS [47].

У 2003 р. національними бібліотеками Австралії, Канади, Данії, Фінляндії, Франції, Ісландії, Італії, Норвегії, Швеції, Великобританії та США було створено International Internet Preservation Consortium [48] з метою збереження Інтернету для майбутніх поколінь. Для досягнення цього, цей Консорціум має на меті розвивати загальні засоби, методи та стандарти. Також створено робочі групи, для розробки цього питання.

Архівація всесвітньої мережі і доменів Назад до переліку

Постійне розширення Світової Мережі та її динамічний і ефемерний характер призводять до створення проектів, ціллю яких є захопити, зберегти та зробити цю інформацію доступною протягом тривалого періоду. Декілька країн — Канада, Данія, Нова Зеландія, Норвегія, Південна Африка та Великобританія прийняли закони, з метою поширення дію положення про обов'язковий примірник на цифрові публікації. Деякі національні бібліотеки Австрії, Чеської Республіки, Данії, Фінляндії, Франції, Німеччини, Литви, Нідерландів, Норвегії, Швеції та Великобританії починають створювати національний архів мережі, застосовуючи при цьому різноманітні підходи, наприклад:

Вибіркова архівація статичних ресурсів мережі, тобто, ресурси, які не змінюються, або не містять інтерактивних або динамічних елементів, архівуються вибірково. Данія, Канада та Японія - основні представники такого підходу;

Вибіркова архівація статичних і динамічних ресурсів мережі. Австралія – єдина країна, яка архівує у такий спосіб;

Посібник Calimera

227

Збереження у цифровому форматі

Збір всього домену, тобто намагання автоматично зібрати всю мережеву область країни, при цьому використовуються програми-роботи і мінімум людського втручання. Швеція, Фінляндія, Ісландія та Норвегія використовують такий підхід;

Поєднання вибіркового підходу та збору всього домену. Національна бібліотека Франції намагається створити програму-робота, щоб архівувати як вибірково, так і автоматично ресурси, які, можливо, будуть цінними для дослідження;

Архівація, що базується на угодах про співпрацю з комерційними видавцями. Національна Бібліотека Нідерландів (Koninklijke Bibliotheek) розробила технічну інфраструктуру та організаційні стосунки з комерційними видавцями, у т. ч. Elsevier Science тa Blackwell Publishing, для того, щоб архівувати, зберігати та забезпечувати обмежений доступ до повної цифрової інформації цих видавців. Національна Бібліотека Франції також визнала потребу співпраці з видавцями для створення сховища "глибокої мережі", яке знаходиться поза досяжністю механізмів пошуку, і містить велику кількість контенту мережі.

Більша частина діяльності з архівації мережі досі перебуває на експериментальній стадії. Список організацій, які здійснювали пілотні проекти та експерименти, представлено на сайті Austrian On-Line Archive [49]. На вебсайті Internet Archive США [див. посилання] та вебсайті Національної Бібліотеки Австралії [50] також є інформація про інші проекти. Нещодавній проект, розпочатий в червні 2004 р. - Британський Консорціум Архівації Мережі http://www.webarchive.org.uk/ (див. посилання), що працює над проектом розвитку пробної моделі для вибіркової архівації британських вебсайтів, використовуючи PANDAS (Цифрові Системи Архівації PANDORA), розроблені PANDORA (Зберігання та Доступ до Мережевих Документальних Ресурсів Австралії) (див. посилання). Для детальної інформації про аналіз здійсненності див. Майкл Дей: Збір та зберігання Всесвітньої Мережі. 2003 р. . [51].

Наслідки для персоналу Назад до переліку

Через швидкі зміни в технологіях навички працівників потрібно буде постійно вдосконалювати, і навчання під час роботи буде найпрактичнішим підходом при купівлі нового обладнання та програм. Можливо, працівникам потрібно буде працювати з персоналом з інших відділів, на зразок корпоративних відділів інформаційних технологій. Співпраця з іншими закладами, у т. ч. відрядження, може бути хорошим способом поділитись навичками.

Адміністративні та юридичні наслідки Назад до переліку

Цифрові записи та документи також потребують управління, як і аналогові ресурси, з метою гарантування того, що вони розміщені на правильному рівні зберігання в певний час і можуть бути знайдені за вимогою. Бажано використовувати електронну систему керування записами (див. рекомендації з Керування контентом і контекстом).

Багато країн мають законодавство про свободу переглядати інформацією будь-якої дати, і процедурами управління записами стає ще

інформації, що дає людям право тому володіння навичками та більш необхідним на місцях.

Посібник Calimera

228

Збереження у цифровому форматі

Державні органи можуть бути зобов’язані законом публікувати певні типи інформації, але індивідуальні запити щодо іншої інформації потрібно буде розглядати, як правило, протягом короткого періоду (20 днів у Великобританії.) В світлі цього законодавства, зберігання у цифровому форматі дуже важливе і повинно ретельно контролюватися, щоб забезпечити законність записів будьякого розпорядження, записами або їх зміни. (Див. юридичні і правові питання.)

Правові питання треба розглянути, перш ніж створювати копії для зберігання (див. рекомендації з юридичних та правових питань).

ПЛАНИ НА МАЙБУТНЄ

Назад до переліку

 

 

Все більше і більше інформації, включаючи урядову інформацію та академічні дослідження, створюється в цифровому форматі. Якщо не докласти істотних зусиль для зберігання та забезпечення довгострокового доступу до цих цифрових ресурсів, більша частина нашої спадщини та інтелектуальних активів починаючи з кінця 20 століття буде втрачена. Необхідно розробити міжнародні та національні стратегії та систему фінансування, щоб спрямувати їх на вирішення цієї проблеми.

Хоча, якщо не буде впевненості в тому, що стратегії зберігання працюватимуть, зростання цифрових послуг може уповільнитись, і вся економічна, соціальна та освітня користь буде втрачена.

Уряди повинні затвердити національні стратегії, які б пов’язували законодавство і фінансування, з метою забезпечення дозволу депозитним бібліотекам та національним архівам збирати цифрові ресурси так само як і традиційні матеріали.

До законів про авторське право та ліцензування потрібно включити пункт, який дозволить створення копій для зберігання.

Незалежно від того, як ретельно зберігається цифровий матеріал, зміни технологій можуть перетворити його на непотріб. Дослідження стратегій зберігання повинно іти в ногу зі швидкими змінами технологій. В ідеалі, рішення для зберігання повинні створюватись паралельно із створенням нових носіїв і форматів.

Музеї, бібліотеки та архіви повинні фінансувати та проводити експертизу для зберігання цифрових ресурсів з таким же піклуванням про них, як і про традиційні матеріали. Однак, їм потрібно включитись в цей процес, якомога раніше. Аналогові ресурси можна зберігати вже після їх створення, що неможливо у випадку цифрових ресурсів. Необхідно співпрацювати з винахідниками та авторами, аби гарантувати, що короткий проміжок часу, коли дія відбулася, не втрачено.

Такі дослідження, як Постійне Зберігання Об’єкту (методика, яка гарантує, що електронні записи залишаються доступними, з автоматичним описом. В такий

Посібник Calimera

229

Збереження у цифровому форматі

спосіб вони стають незалежними від певного технічного та програмного забезпечення, над цим працюють Архіви електронних документів Національної адміністрації архівів США (ERA)) може, зрештою, розробити систему, яка працюватиме сотні років [52].

Для забезпечення сумісності та тривалого користування потрібні міжнародні стандарти і специфікації, визначені структури, метадані та взаємозамінні формати.

ДОВІДКОВА ІНФОРМАЦІЯ

Назад до переліку

 

 

[1]Лише співпраця може врятувати нас. Інтерв’ю з Ульріхом Кампфмейером, директором PROJECT CONSULT, Німеччина Joost van Kasteren в Зберігання та автентичність цифрових об’єктів культурної спадщини. Digicult Thematic Випуск 1, Серпень 2002, с.20. http://www.digicult.info/downloads/thematic_issue_1_final.pdf

[2]Рада Європи в Лісабоні 23 тa 24 березня 2000

http://ue.eu.int/ueDocs/cms_Data/docs/pressData/en/ec/00100-r1.en0.htm

[3]Ross, Seamus: The Role of ERPANET in Supporting Digital Curation and Preservation in Europe in D-Lib Magazine, vol. 10.no. 7/8, July/August 2004 (Сімус Росс: Роль ERPANET в підтримці цифрового керування та зберігання в Європі, журнал D-Lib Magazine, том 10. № 7/8, липень/серпень 2004). http://www.dlib.org/dlib/july04/ross/07ross.html#3

[4]ERPANET Digital Preservation Policy Tool. 2003. (Засоби Стратегії Цифрового Зберігання)http://www.erpanet.org/guidance/docs/ERPANETPolicyTool.pdf

[5]Для отримання інструкцій по проблемам, які потребують вирішення, див. Данкан Сімпсон: Замовлення послуг щодо цифрового зберігання: інформаційний рекламний проспект та контрольний список послуг. Коаліція Цифрового Зберігання, жовтень 2004 http://www.dpconline.org/graphics/guides/index.html#outsourcing

[6]Зберігання та автентичність цифрових об’єктів культурної спадщини,

Серпень 2002. http://www.digicult.info/downloads/thematic_issue_1_final.pdf

[7]BS 4783, ч. 1 - 8: Зберігання, транспортування та обслуговування носіїв, що використовуються для обробки даних та зберігання інформації. British Standards institution, 1988-94. http://bsonline.techindex.co.uk/BSI2/Dir1/SitePage.asp?LS=&PgID=0080&LR=&LD= &Src=&Dest=&Last=&SessID=L7DJXCTA2DNQ9P5136AP3DQLQB1587G2&MSCSID= &ErrID=&SessStat=&Parent=&Child=&PCount=0&LogStat=&URLData=&SEARCH_ID =MMKD47V26JXN9HPLP0494ULBXK6GC735&SEARCH_TYPE=SRCH_TYP_QCK

Посібник Calimera

230

Збереження у цифровому форматі

[8]TASI (Технічна Консультаційна Служба по роботі з Зображеннями):

Використання CD-R тa DVD-R для цифрового зберігання http://www.tasi.ac.uk/advice/delivering/cdr-dvdr.html

[9]Федеральне Управління Безпеки Інформаційної техніки (BSI): S 4.169

Використання належних носіїв архівації носіїв. Жовтень 2003. http://www.bsi.de/gshb/english/s/s04169.html

[10]ERPANET Risk Communication Tool. 2003. (довідник управління ризиками) http://www.erpanet.org/guidance/docs/ERPANETRiskTool.pdf

[11]TIFF (Теговий Формат Файла Зображення)

http://www.itu.int/itudoc/itu-t/com16/tiff-fx/docs/tiff6.pdf

[12]PNG (Портативна Мережева Графіка) http://www.w3.org/TR/PNG/

[13]Нідерландський інститут звуку та зображення

http://www.geheugenvannederland.nl/gvnNL/handler.cfm/event/onpage/pageID/8FA E9963-0FAB-4112-BF19-325991A23477/collectionid/A1C3C760-1070-49C8-9257- A9AF9FB858BB

[14]ERPANET: Формати Файлів для Зберігання, Австрійська Національна Бібліотека, Відень, 10-11 травня 2004р. http://www.erpanet.org/events/2004/vienna/erpaTrainingWien_BriefingPaper_v02.p df

[15]ASCII http://www.asciitable.com/

[16]Портативний Формат Документів Adobe

http://www.adobe.com/products/acrobat/adobepdf.html

[17]XML (Розширена Мова Розмітки) http://www.w3.org/XML/

[18]JPEG 2000 http://www.jpeg.org/jpeg2000/

[19]Інформація про формат WAV є на вебсайті компанії Microsoft http://www.microsoft.com

[20]BWF (Broadcast Wave Format) http://www.sr.se/utveckling/tu/bwf/

[21]MPEG http://www.sr.se/utveckling/tu/bwf/

[22]Національні архіви. PRONOM http://www.records.pro.gov.uk/pronom

[23]ISO 23950:1998 Інформація і документація – Пошук Інформації (Z39.50) - Визначення сервісу прикладних програм та специфікація протоколу http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=27446

Посібник Calimera

231

Збереження у цифровому форматі

[24]Консорціум Комп’ютерного обміну інформацією музеїв Профіль: Z39.50 Додатковий профіль Інформації Культурної Спадщини Application. Випуск 1.0, березень 1, 1998 http://www.cimi.org/old_site/downloads/ProfileFinalMar98/cimiprofile1.htm#Forewar d

[25]Adobe PostScript 3

http://www.adobe.com/products/postscript/main.html

[26] GIF (Формат Графічного Обміну) http://astronomy.swin.edu.au/~pbourke/dataformats/gif/

[27]ISO 8879:1986 Обробка інформації – Текстові та офісні системи -- SGML – (Стандартна Загальна Мова Розмітки) http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=16387

[28]URN (Універсальні Імена Ресурсів) http://www.ietf.org/rfc/rfc1737.txt

[29]DOI Цифрові Ідентифікатори Об’єкта http://www.doi.org/hb.html

[30]PURL (Постійні уніфіковані покажчики ресурсу) http://purl.oclc.org/

[31]Handles http://www.handle.net/introduction.html

[32]ARK (Архівні Ключі Ресурса) http://www.cdlib.org/inside/diglib/ark/

[33]Англо-американські правила каталогізації http://www.aacr2.org/

[34]Ініціатива метаданих Dublin Core http://dublincore.org/

[35]MARC Машинно-читаний каталог

http://www.loc.gov/marc/index.html

[36]EAD Кодований Архівний Опис http://www.loc.gov/ead/

[37]W3C Консорціум Всесвітньої Мережі http://www.w3.org/

[38]RDF (стандарт на опис ресурсу) http://www.w3.org/RDF/

[39]ISO Стандарти архівації – огляд

http://ssdoo.gsfc.nasa.gov/nost/isoas/

ISO 14721:2003 Розміщення даних та системи передачі інформації – Відкрита Архівна Інформаційна Система – рекомендована модель http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=24683& ICS1=49&ICS2=140&ICS3

Для перегляду моделі дивись Trusted Digital Repositories: Attributes and Responsibilities. An RLG-OCLC Report. RLG, May 2002. http://www.rlg.org/longterm/repositories.pdf

Посібник Calimera

232

Збереження у цифровому форматі

[40] ISO 15489 Інформація та документація – Оперативний облік http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=31908& ICS1=1&ICS2=140&ICS3=20

тa http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=35845& ICS1=1&ICS2=140&ICS3=20

[41]ISO/TS 23081-1:2004 Інформація та документація - Оперативний облік - Метадані оперативного обліку - Частина 1: Принципи http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=36627& ICS1=1&ICS2=140&ICS3=20

[42]Технічна Консультаційна Служба по роботі з Зображеннями (TASI) http://www.tasi.ac.uk/index.html

[43]Коаліція Цифрового Зберігання http://www.dpconline.org/graphics/

[44]InterPARES http://www.interpares.org

[45]Проект корнельського університету Prism: Цілісність інформації в розподілених цифрових бібліотеках http://www.prism.cornell.edu/Default.htm

[46]DAVID (Digitale Archivering in Vlaamse Instellingen en Diensten)

http://www.antwerpen.be/david/website/nl/index2.htm

[47] VERS (Електронна архівна система Victoria) http://www.prov.vic.gov.au/vers/standards/pros9907/99-7-2s2.htm

[48]IIPC (Міжнародний Консорціум Зберігання Інтернет) http://netpreserve.org/about/mission.php

[49]Мережевий Архів Австралії: Архівація Мережі – Бібліографія http://www.ifs.tuwien.ac.at/~aola/links/WebArchiving.html

[50]Національна Бібліотека Австралії http://www.nla.gov.au/padi/topics/92.html

[51]Майкл Дей: Збір та зберігання Всесвітньої Мережі. 2003.

http://www.jisc.ac.uk/uploaded_documents/archiving_feasibility.pdf

[52] Створення архівів майбутнього: досягнення у збереженні електронних записів у Національній адміністрації архівів. Кеннет Тібодо, журнал "D-Lib", лютий 2001 р., том 7 номер 2. http://www.dlib.org/dlib/february01/thibodeau/02thibodeau.html

 

ПОСИЛАННЯ

Назад до переліку

 

 

 

Міжнародні

 

 

 

 

 

Посібник Calimera

233

Збереження у цифровому форматі

Міжнародний Консорціум Зберігання Інтернету

Національні бібліотеки Австралії, Канади, Данії, Фінляндії, Франції, Ісландії, Італії, Норвегії, Швеції, Великобританії (UK), Бібліотека Конгресу (США) та Інтернет Архів (США) співпрацюють для винайдення способів зібрання та зберігання глобальної інформації Інтернет. Вони досліджують такі складні питання, як пошук в "Глибокій Мережі", наприклад Інтернет газети, медіа файли з безперервним рухом, матеріали веб-камер, інтерактивні медіа та Інтернет матеріали всіх видів, накопичені в базах даних. http://netpreserve.org/about/mission.php

SEPIA (Охорона та Збереження Доступу до Європейських Фотографічних Зображень)

Цей проект, заснований ЄС, проводить дослідження цифрового зберігання фотографічних матеріалів. http://www.knaw.nl/ecpa/sepia/workinggroups/wp4/digitisation.html

Вірменія

Університет менеджменту Gladzor

Консервація та збереження цифрового контенту, включаючи системи, що забезпечують довгострокове зберігання (архівне збереження), підтримка запитів користувачів і публікація контенту новими шляхами, тобто за потребою, підтримка індивідуальних користувачів або груп та створення серій CD. http://www.gladzor.am

Австралія

Національна Бібліотека Австралії

PANDORA (Зберігання та Доступ до Мережевих Документальних Ресурсів Австралії).

Вибірковий архів, безкоштовно доступний громадськості через мережу. http://pandora.nla.gov.au/index.html/

Австрія

Австрійський Архів в Оперативному Режимі(AOLA)

Проект створений Австрійською Національною Бібліотекою (OeNB) тa Департаментом Технологій Програмного Забезпечення (IFS) в Технічному Університеті у Відні для створення архіву Австрійської Мережі Інтернет. Документи будуть зібрані з певними часовими проміжками, щоб фіксувати моментальний стан Австрійської Мережі. http://www.ifs.tuwien.ac.at/~aola/

Хорватія

Цифрова колекція з краєзнавства в міській бібліотеці Slavonski

Це був пілотний проект головною метою якого було збереження краєзнавчих колекцій в бібліотеці Slavonski Brod. Застосовано програмне забезпечення для

Посібник Calimera

234

Збереження у цифровому форматі

створення цифрових бібліотек Greenstone (http://www.greenstone.org), ПО з відкритим кодом. http://www.gksb.hr/gsdl/cgi-bin/library.exe?a=p&p=about&c=brod&l=hr&w=iso- 8859-2

Teuta

Декілька інтегрованих баз даних за темою культурного надбання вміщують описи монументів, історичних будівель, історичних місцевостей Хорватії, забезпечені відповідною документацією, мають колекцію зображень. (http://www.h-r-z.hr/).

Чеська Республіка

Національні архіви (в минулому Державні Центральні Архіви)

Дослідження з проблем зберігання, обробки та доступу до оцифрованих документів запроваджені спеціалістами відділу управління архівами міністерства внутрішніх справ Чехії Research та Чеського технічного університету в Празі (факультет електронної інженерії). http://www.mvcr.cz/archivy; http://www.nacr.cz

Slovacke muzeum, Uherske Hradiste

Кожний об'єкт описаний та сфотографований перед консервацією і після неї з метою створення цифрового фото архіву. До кожного фото створено паперову та цифрову картку в комп'ютері, що буде дуже корисним для дослідників. http://www.slovackemuzeum.cz

ВебАрхів

Проект, що проводиться Національною Бібліотекою Чеської Республіки у співпраці з Центром Інформаційних Технологій тa Факультетом Інформатики Університету Masaryk у м. Брно за фінансової підтримки Міністерства Культури, для каталогізації оперативних публікації та занесення таких записів до Чеської Національної Бібліографічної бази даних, та для збереження публікацій в депозитній системі, щоб забезпечити до них довготривалий доступ. http://www.webarchiv.cz/index-e.html

Данія

Проект Netarchive.dk

Цей об’єднаний експериментальний проект, що включає Королівську Бібліотеку, Державну та Університетську Бібліотеки та Центр Дослідження Інтернету, зараз на другій стадії розвитку. Було випробувано три методи збору матеріалу: автоматичний "snapshot (фіксація моментального стану)" збір, "вибірковий" збір, та збір " в залежності від події". http://www.netarchive.dk/index-en.htm

Фінляндія

SÄHKE-проект

Основний напрямок — довготермінове збереження матеріалів створених системами керування записами. http://www.narc.fi/sahke/

Посібник Calimera

235

Збереження у цифровому форматі

Німеччина

Проект DEPOSIT.DDB.DE

Німецька Бібліотека зберігає публікації в оперативному режимі тa ретро оцифровані публікації на цьому архівному сервері, який є частиною депозитної системи для забезпечення довготривалого доступу до цифрових публікацій. http://deposit.ddb.de/index_e.htm

Македонія

MAIIS - Архівна Інтегрована Інформаційна Система Македонії

Одна з частин програми оцифрування у поєднанні з консервацією. Система для автоматичного регулювання атмосфери складається з 3 підсистем: теплової та охолодження, підтримки вологості повітря та автоматичного регулювання атмосфери. http://www.arhiv.gov.mk

Нідерланди

Проект Archipol

Проект Archipol включає архівацію вебсайтів створених політичними партіями Нідерландів. Ціллю проекту є забезпечення доступу до архіву в режимі он-лайн. http://www.archipol.nl/project/

Проект e-Depot

Koninklijke Bibliotheek (Національна Бібліотека Нідерландів) створила e-Depot для архівації публікацій Голландських видавців, та проводить досліди щодо методів забезпечення довготривалого доступу. http://www.kb.nl/kb/resources/frameset_kb.html?/kb/pr/pers/pers2002/elsevieren.html

Нова Зеландія

Національна Бібліотека Нової Зеландії

Цифрова Система Зберігання.

Акт Національної Бібліотеки Нової Зеландії 2003 року розширює забезпечення легального депозиту, щоб охопити електронний матеріал. Цифрова система зберігання Національної Бібліотеки Нової Зеландії збиратиме та зберігатиме цифрові об’єкти як в оперативному, так і в автономному режимі, включаючи вебсайти, друковані роботи, зображення тa матеріали на CD дисках, дискетах та ін.. http://www.natlib.govt.nz/

Норвегія

Проект Digitalt radioarkiv (Цифровий Радіо Архів)

Проект Digitalt radioarkiv - спільна спроба Національної Бібліотеки Норвегії та Радіо Корпорації Норвегії (NRK) оцифрувати історичний радіоархів Радіо Корпорації Норвегії, який налічує 40,000 годин передач радіомовлення, з метою забезпечення його довготривалого зберігання. http://www.nb.no/html/radioarkiv_nordland.html

Посібник Calimera

236

Збереження у цифровому форматі

Цифрове сховище Національної бібліотеки Норвегії

NLN зберігає велику колекцію цифрових документів, оцифрованих та створених в цифровому форматі, які потребують довгострокового зберігання. Для підтримки цифрової колекції довгий термін NLN і запровадила цей Цифровий Репозитарію (DR). Ядром DR є диск та система збереження на магнітному носії загальним обсягом 100 TB. Усі об'єкти ідентифіковані через URN і повинні мати метадані для пошуку. (До цих пір у стадії розробки — адреси веб сайту немає.)

Проект Paradigma

Проект Національної Бібліотеки Норвегії для дослідження способів збору та зберігання у цифровому форматі культурної спадщини Норвегії для майбутніх поколінь. http://www.nb.no/paradigma/eng_index.html

Росія

Проект консервації унікальних фотодокументів і широкого доступу до оригінальних джерел CSACPPD Санкт-Петербург

Проект для консервації фотографічних ресурсів в Центральному Державному Архіві Кіно, Фото та Фонографічних документів. http://www.photoarchive.spb.ru

Сербія

Бази даних мультимедія для Історичного Музею Сербії – IMUS

База даних мультимедія (цифрові зображення, анімація, відео і звукові кліпи) це головний напрямок роботи експертів музею. http://www.nasasrbija.co.yu/esnaf/esnaf_3.htm

Швеція

Проект Kulturarw3

Проект Національної Бібліотеки Швеції, Шведський Мережевий Архів електронних документів охоплює періодичні видання, електронні газети та журнали, статичні документи такі як тексти в електронних архівах та динамічні з каналами зв’язку. http://www.kb.se/kw3/ENG/Default.htm

Великобританія

Інформаційна служба з питань мистецтва та гуманітарних наук

Цей центр цифрової архівації для мистецтва та гуманітарних наук у сфері середньої та вищої освіти розробив поради та рекомендації з проблемам зберігання.

http://ahds.ac.uk

Консорціум Архівації Мережі Великобританії

6 закладів Великобританії співпрацюють над проектом розробки моделі для випробування вибіркової архівації вебсайтів Великобританії. http://www.webarchive.org.uk/

США

Посібник Calimera 237 Збереження у цифровому форматі

Інтернет Архів

Інтернет Архів створює цифрову бібліотеку вебсайтів та інших артефактів культури в цифровому форматі. http://www.archive.org/about/about.php

Minerva (Картографія Інтернету Віртуальний Архів Електронних Ресурсів)

Проект Бібліотеки Конгресу спрямований на збір тематичного суспільного змісту мережі. http://www.loc.gov/minerva/

Національна Програма Інфраструктури Цифрової Інформації та Зберігання (NDIIPP)

Бібліотека Конгресу очолює цю ризиковану справу по багатосекторній архівації Інтернету, яка буде координувати існуючі програми дослідження цифрової архівації як в громадському так і приватному секторі США, для того щоб зменшити копіювання, розподілити відповідальність та поділитись знаннями і досвідом. http://www.digitalpreservation.gov/

Назад до змісту

Посібник Calimera

238

Збереження у цифровому форматі

Посібник Calimera

Опис ресурсів

ПЕРЕЛІК ПИТАНЬ

Питання, розглянуті у цій рекомендації: Можливість взаємодії Метадані Галузеві стандарти метаданих

Описи рівня колекцій Термінологія Онтології Ідентифікація об'єкта

Примітка: Зрозуміло, що установи почнуть працювати з новими технологіями опису ресурсів з різних стартових позицій, і більшості із них потрібно буде застосувати поступовий підхід для його виконання. Ці інструкції можна використати для підтримки та забезпечення об’єднаних систем управління, допомоги підрядчикам та консультантам. Інформацію про деякі з технологій, які використовуються для опису ресурсів, можна знайти в розділі Основні технології та інфраструктура.

СТРАТЕГІЧНІ ПИТАННЯ

Назад до переліку

Бібліотеки вже давно працюють в мережевому інформаційному середовищі, а зараз до цього процесу прєднуються музеї та архіви. Поява мережі ІНТЕРНЕТ означає, що музеї, бібліотеки та архіви можуть зараз мати доступ до зростаючої кількості розосередженої цифрової інформації, наявної у мережі. Суспільство знань, довічне навчання та прискорення імпульсу до взаємодії з центральним урядом через електронні засоби, полегшують доступ до інформації, важливість якої для всіх громадян постійно зростає.

Багато установ також створюють цифровий контент самостійно: власні Вебсторінки, новий мультимедійний контент за рахунок фінансування спеціальних програм оцифрування (див. рекомендації з оцифрування). Необхідно зрозуміти, як описати цей новий контент так, щоб взаємодія з іншим цифровим контентом та пошук були легкими для користувача.

Технології та стандарти в цій сфері постійно оновлюється і продовжують змінюватись і розвиватись з часом. Заклади повинні знати про поточний стан справ, щоб уникнути застосування застарілих технологій та стандартів.

Установи повинінні розуміти проблеми, планувати роботу, обирати пріоритети. Це є особливо важливим коли закуповують нові системи або вповноважують провести розробки зовнішніх консультантів/підрядчиків.

Посібник Calimera

239

Опис ресурсів

РЕКОМЕНДАЦІЇ З ПОЗИТИВНОЇ ПРАКТИКИ

Назад до переліку

Інформацію про технології, які використовуються для опису ресурсів, можна знайти в розділі "Основні технології та інфраструктура".

Функціональна сумісність Назад до переліку

Функціональна сумісність цифрового контенту означає, що він має якості для широкого використання та передачі даних у різних мережах, системах і організаціях, та бути якомога довговічнішим. Шлях досягнення цього пролягає через стандарти – кодифіковані правила та рекомендації зі створення, опису та управління цифровими ресурсами (див. статтю Винахід Колеса в журналі D-Lib Magazine, січень 2002, для отримання додаткової інформації [1]). Важливо використовувати стандарти для опису так, щоб користувачі могли легше шукати та знаходити інформацію у різних джерелах – каталогах, відомствах (музеї, бібліотеки та архіви), серед різних типів ресурсів (книги, документи, музейні експонати, аудіовізуальні носії), через різні канали доставки (комп’ютери, інтерактивне телебачення, мобільні телефони, кишенькові пристрої) та різними мовами. (Див. рекомендації з виявлення та пошук.)

Метадані Назад до переліку

Метадані іноді визначають, як "структуровану інформацію про дані", але зараз цей термін використовується стосовно даних машинної обробки, які описують ресурси різних типів та застосовуються для підтримки низки операцій.

Фахівці у галузі культурної спадщини та інформації створюють метадані постійно разом з керуванням колекціями. Наприклад, запис в каталозі бібліотеки - це метадані, які описують певну книгу, тож елементи метаданих, пов’язані з цією книгою могли б включати: автора, назву, видавця, дату, ISBN (Стандартний Міжнародний Номер Книги), номер класифікації і т.д. Дані, пов’язані з експонатом в музеї, могли б включати назву експонату, короткий опис, спосіб придбання, дату, місцезнаходження і т.д. Дані, пов’язані з архівним документом, могли б включати довідковий код, назву, автора, дату, і т.д., а радіопередачі — назву, опис змісту, автора, журналіста, мову, дату, і т. д. Усі бібліотеки, музеї та архіви мають каталоги, але вони структурно відрізняються, оскільки характер та значення відношень між описаними ресурсами різні, наприклад в каталозі бібліотеки, запис рівня заголовку – зазвичай найголовніший, у порівнянні із записами, пов’язаними з копіями у філіях бібліотеки; каталог архіву рідко описує кілька копій одиниць зберігання, а опікується різними типами відношень між ресурсами (наприклад, ящик може бути зареєстрований на одному рівні, а вміст ящика описаний індивідуально і пов’язаний з записом про ящик в ієрархічній структурі); каталог музею може описувати індивідуальні предмети чи з багатьох частин, але такі дані зазвичай дуже відрізняються від даних в каталогах архівів та бібліотек.

Все більше метаданих включають в цифрові системи. Таким чином метадані, пов’язані з веб-сторінками включають назву, автора, тему, опис і т.і. Метадані вийшли на передній план як засоби підвищення ефективності та

Посібник Calimera

240

Опис ресурсів

результативності пошуку цифрових ресурсів у мережі через прийняття постійної структури для опису вебсайтів та інших цифрових ресурсів. На вебсайті TASI (Технічна консультаційна служба з питань зображень) розміщено корисну початкову інформацію з прикладами.[2].

Метадані іноді класифікуються згідно з функціями, які вони мають підтримувати. На практиці, індивідуальні схеми метаданих часто підтримують різноманітні функції і частково поєднуються з наступними категоріями:

Описові метадані – описують ресурси і полегшують отримання об’єкта. Вони необхідні при створенні описів декількох класів ресурсів, що включають:

°фізичні об’єкти які були переведені в цифрову форму;

°цифрові об’єкти, створені протягом процесу оцифрування і зберігаються як “цифрові оригінали”;

°цифрові об’єкти створені з “цифрових оригіналів” для використання користувачами у мережі;

°нові ресурси що створені шляхом використання цих цифрових об’єктів;

°набори з будь-яких вище згаданих.

Існує багато різноманітних типів описових метаданих, Marc та Dublin Core є можливо найбільш відомими:

°Marc, або Машинозчитувана Каталогізація [3], є бібліографічною схемою метаданих, якою керує Бібліотека Конгресу. Сучасна версія MАRC 21;

° Набір Meтаданих Dublin Core [4] це простий стандарт метаданих, розроблений з метою підтримки та виявлення ресурсів. Історично цей стандарт був створений для опису “документоподібних об’єктів”, але його використання було розширено з метою включення інших класів ресурсів. Поради щодо застосування Dublin Core: дивіться Використання Dublin Core Діани Хілман [5]. Дивіться також Електронний Каліфорнійський архів рекомендацій з позитивної практики для цифрових об’єктів (OAC BPG DO), Версія 1.1. [6].

Метадані Зберігання (див. також рекомендації з Зберігання у цифровому форматі) – для підтримки зберігання та архівації. У червні 2003 р. OCLC (Онлайновий Комп’ютерний Бібліотечний Центр) and RLG (Група Наукових Бібліотек) зібрали Робочу Групу "Метадані Зберігання: Стратегії Реалізації (PREMIS), щоб зосередитися на практичних аспектах реалізації зберігання метаданих в цифрових системах зберігання [7]. Більшість проектів використовують:

°RLG, встановлено 16 основних елементів метаданих, з метою підтримки зберігання [8];

°Модель Посилання для Відкритого Архівного Інформаційного Обслуговування (OAIS), структура високого рівня, яка описує функції, залучені до процесу збереження інформації, з вимогами підтримки цих функцій [9].

°Для більш детальної інформації про зберігання метаданих дивіться

Забезпечення Зберігання Метаданих в Цифрових Системах Брайн Ф. Лавои [10]; і Зберігання Метаданих Майкла Дея [11].

Посібник Calimera

241

Опис ресурсів

Адміністративні Метадані – створенні для управління цифровими ресурсами і надання інформації про їх створення та будь-які обмеження користування. Можуть включати:

°технічні метадані — описують технічні характеристики які включають комп’ютерне/програмне забезпечення, яке використовується при їх створенні, формати, стандарти і т.д. (дивіться приклад NISO (Національна Організація Інформаційних Стандартів [США] (:Інформаційний Словник – Технічні Метадані для Цифрових Нерухомих Зображень [12]);

°метадані джерела, описують оригінальний об’єкт, з якого цифровий об’єкт був створений;

°метадані цифрового походження описують історію дій, виконаних з цифровим об’єктом з того часу, як його було створено, або переведено в цифровий формат

°метадані права, описують права інтелектуальної власності на ресурси або будь-які обмеження в користувані чи ліцензійні угоди. (Див. посилання Проект Indecs [13].)

Структурні Метадані – описують логічні або фізичні відносини між частинами складного об’єкта. Наприклад, фізична книга – це один об’єкт, який складається з послідовних сторінок. Переведення книги в цифровий формат, може складатися з одного цифрового зображення на сторінку, це робить оцифровану книгу частиною складного об’єкта, а інформація про послідовність сторінок є необхідною для користування:

°Стандарти кодування і передачі метаданих (METS) [14] забезпечують зашифрований формат для описових, адміністративних і структурних метаданих, та призначені для підтримки управління цифровими об’єктами та їх передачі, а також обміну цифровими об’єктами у різних системах;

°the IMS Content Packaging Specification [15] визначає методи опису, структури і організації складних навчальних ресурсів.

Інші категорії метаданих включають:

°Освітні метадані – допомагають пошуку ресурсів в освітніх закладах та в керованих і віртуальних навчальних середовищах; наприклад, оцінки студентів по предметам, або опис навчальної дисципліни. Основним стандартом опису навчальних ресурсів є IEEE Learning Object Metadata standard [16]. Дивіться вебсайт IMS [17] і вебсайт CETIS [18], щоб отримати більше інформації;

°Геопросторові Метадані – застосовують для користування цифровими картами і Геоінформаційними Системами. В січні 2003 р. вийшов стандарт геоінформаційних метаданих ISO 19115:2003 [19]

Галузеві стандарти метаданих

Назад до переліку

Були розроблені для обслуговування конкретних областей, наприклад:

Архіви зазвичай використовують ISAD(G) (загальний міжнародний стандарт архівного опису) [20] для метаданих, які описують архівні матеріали і ISAAR (CPF) (міжнародний стандарт архівного запису для корпоративних організацій, осіб і сімей), друге видання 2004 [21], для метаданих опису контексту створення матеріалів. Для передачі таких описів електронними засобами існують Визначення Типу Документа (DTD) EAD (Кодований

Посібник Calimera

242

Опис ресурсів

Архівний Опис) [22], який зараз широко використовується у всій Європі , і EAC (Кодований Архівний Контекст) [23], ще в процесі розробки http://www.library.yale.edu/eac/. Довідкові сторінки EAD [24] містять посилання на подальшу інформацію.

Музеї – Міжнародний комітет з документації Міжнародної ради музеїв (ICOMCIDOC) [25] надає інформацію про стандарти та метадані для музеїв, включаючи посилання, наприклад, на CIDOC-CRM (Модель концептуальної довітки), яку обрали багато музеїв. Співтовариство музеїв створило стандарти SPECTRUM [26] і CDWA (категорії для опису творів мистецтва) [27]. SPECTRUM не має безкоштовного доступу в мережі Інтернет, але вебсайт MDA (Асоціації Документації Музеїв Великобританія) має корисний проспект з резюме для деяких розділів SPECTRUM [28].

Бібліотеки IFLA створила всебічний вказівник на джерела метаданих для цифрових бібліотек [29].

Уряд GILS або Урядова Служба Пошуку Інформації/Глобальна Служба

Пошуку Інформації [30] використовується для урядової інформації, хоча нещодавно багато урядів надавали перевагу Dublin Core. Ініціатива, щодо Метаданих Dublin Core (DCMI) створила Урядову Робочу Групу [31]. Багато урядів, наприклад Австралія, Канада, Данія, Фінляндія, Ірландія, Нова Зеландія і Великобританія, створили рекомендації щодо Dublin Core є обов'язковими для організацій державного сектора. (Дивись e-gif (Електронна Урядова Мережа з питань Структурної Співпраці) [32] і e-gms (Електронні Урядові Стандарти Метаданих) [33] створені Відділом з питань електронного урядування Великобританії [34] ). Перша версія e-gms була основана на Dublin Core, в той час, як друга і третя перейшли на покращений варіант Dublin Core з деяким додатковими елементами управління документом.

Установи культури повинні знати вимоги громадських і галузевих стандартів метаданих. Прийняті схеми метаданих мають бути повністю задокументовані в усіх проектах. Ця документація повинна включати детальні рекомендації із створення каталогів з описом елементів метаданих, і як ці елементи повинні використовуватися для опису типів ресурсів, створених і керованих цим проектом. Такий принцип необхідний навіть коли використовується стандартна схема метаданих, щоб пояснити, як така схема має бути застосована в специфічному контексті проекту.

Для сприяння виявленню своїх ресурсів цілим рядом інших програм та служб, установи повинні мати змогу створювати описові метадані щодо кожного предмета, шляхом використання Dublin Core Metadata Element Set (DCMES) [35] в його простій (без застосування кваліфікаторів) формі. DCMES визначає п’ятнадцять елементів, для підтримки простого міждоменного визначення ресурсів: Назва, Автор, Тема, Опис, Видавець, Співавтор, Дата, Тип, Формат, Ідентифікатор, Джерело, Мова, Відношення, Охоплення і Права. Це – мінімальні вимоги, в практичному сенсі і є простими метаданими DC, які в свою чергу можуть бути частиною більшого (складного) набору метаданих.

Для підтримки досліджень в сфері культурної спадщини, проекти повинні також розглядати забезпечення описових метаданих по кожному предмету відповідно

Посібник Calimera

243

Опис ресурсів

до схеми DC.Culture [36]. Проекти повинні розкривати зміст будь-яких додаткових вимог для описових метаданих, і мають, в свою чергу, охопити та зберегти додаткові описові метадані.

Описи рівня колекцій (CLD) Назад до переліку

В спільних проектах також буде доцільно розглядати використання метаданих опису рівня колекцій, щоб описати ознаки організацій - учасниць (можливості, рівень, глибину, мову і т.д.). Більш детальне пояснення дивіться, наприклад, UKOLN Collection Description Focus [37] для інформації стосовно використання CLDs в Великобританії, Minerva : Deliverable D3.1: Каталоги, виявлення цифрового контенту і проблеми багатомовності. Доповідь про аналіз існуючого контенту [38].

Опис рівня колекцій не повинен обмежуватися спільними проектами. Опис зібрань предметів може бути корисним в багатьох різноманітних контекстах. Навіть в межах ресурсів однієї установи або проекту він може бути корисним. (Див. метод виявлення ресурсів, описаний в JISC Функціональна Модель Архітектури Інформаційного Середовища [39].) Цифровий ресурс створюється не в ізоляції, а як частина цифрової колееції, і повинен розглядатися в контексті колекції її розвитку. Дійсно, самі колекції розглядаються, як компоненти, навколо яких можна побудувати багато різноманітних типів цифрових послуг.

Колекції повинні бути описані таким чином, щоб користувач міг знайти важливі характеристики колекції, і таким чином колекції можуть бути інтегровані у більш широкій мережі існуючих цифрових колекцій та в цифрових службах, що працюють з цими колекціями.

Музеї, бібліотеки і архіви повинні вивчати ініціативи щодо кращого оприлюднення і виявлення колекцій, в межах програм, громад, галузей або регіонів, про національні або міжнародні каталоги цифрових матеріалів і цифрового культурного контенту, і повинні бути готові до надання метаданих для таких послуг.

Для опису колекції, звичайно необхідно прийняти відповідну схему метаданих. Приклади:

Програма Підтримки дослідження Бібліотек (RSLP): Схема Опису Колекції [40];

Схема опису рівня колекції Minerva D3.2 [41];

новий Dublin Core Collection Description Application Profile [42].

Термінологія Назад до переліку

Якщо користувачі в змозі виконати корисний пошук у розосереджених базах даних, тоді виробники таких даних повинні вводити значення в елементи метаданих на постійній основі.

Визнані багатомовні термінологічні джерела повинні використовуватися, з метою забезпечення значень для елементів метаданних, де це можливо. Якщо не доступна жодна стандартна термінологія, повинна бути запроваджена

Посібник Calimera

244

Опис ресурсів

локальна термінологія. Де локальна термінологія розгорнута, інформація про термінологію та її складові терміни повинна бути загальнодоступною.

Використання термінології в записах метаданих, стандартне або проектноспеціфічне, повинне бути однозначно відображено в записах метаданих.

Записи метаданих рівня колекції можуть застосовувати термінологію, яка була рекомендована для використання схеми опису рівнів колекції Minerva. [41].

Контрольовані словники, тезауруси і головні файли

Щоб гарантувати послідовність, краще приймати і потім використовувати для індексації схеми шифрування, які можна ідентифікувати, або контрольовані словники. Гарний приклад Library of Congress Subject Headings [43].

Тезаурус – це контрольований словник, де терміни розташовані в ієрархічному порядку, який показує взаємовідносини в більш широкому або вузькому значенні, відповідність або часткову відповідність, і де терміни виділяються або не виділяються (на синонімічному рівні). Вони також типово включають примітки та іншу корисну інформацію.

Існує два стандарти ISO для тезауруса: ISO 2788, 1986 Вказівки щодо створення і розвитку одномовного тезауруса [44], та ISO 5964, 1985 Вказівки щодо створення і розвитку багатомовного тезауруса [45]. Ведеться робота з перегляду обох цих стандартів. Новий стандарт, BS 8723: Структуровані словники для пошуку інформації - посібник, планується видати (див. рекомендації з багатомовності.)

Сайт музею Гетті робить доступним кілька тезаурусів, у т. ч.: тезаурус з мистецтва та архітектури Гетті [46] та тезаурус географічних назв Гетті [47].

Прикладом головного файлу є ISAAR (CPF) Міжнародний стандартний запис архівного органу для корпоративних організацій, осіб та сімей, друге видання, 2004 [21] видане Міжнародною Радою по Архівам.

Трауготт Кох видав хороший перелік словників, тезаурусів та схем класифікації [48]. TASI (Тезнічна Консультаційна Служба по роботі з Зображеннями)

Контроль за своєю мовою – посилання на словники метаданих [49] надає зв'язки з більш, ніж 60 джерелами словників.

Онтології Назад до переліку

Онтологія може бути описана як формальний опис об’єктів і їх взаємозв’язків (Див. рекомендації з осн. технологій та інфраструктури, де також описано семантичний веб та RDF.)

Ідентифікація об'єкта Назад до переліку

Головна причина, чому люди присвоюють унікальні ідентифікатори ресурсам, полягає в тому, що вони, як і інші, можуть однозначно посилатися на ресурси. Тому вони повинні покластися на унікальність їх ідентифікаторів (це значить, що один і той же ідентифікатор не може присвоюватися іншому ресурсу) і їх

Посібник Calimera 245 Опис ресурсів

постійність (це значить, що він продовжує ідентифікувати цей ресурс, і як довго це може продовжуватися, можливо, залежить від контексту і характеру ресурсу). Це також може бути вимогою, щоб ідентифікатор міг надавати доступ до ресурсу і т.і., це означає, що ідентифікатор може бути “присвоєний” за допомогою сервісу, що стосується поточного місцезнаходженя ресурсу.

Приклади постійних унікальних ідентифікаторів:

DOI (Ідентифікатори Цифрових Об’єктів) [50];

URN (Універсальні імена ресурсів) [51];

PURL (Постійні універсальні ідентифікатори ресурсів) [52];

Handles [53];

ARK (Ключі архівних ресурсів) [54].

Пол Мілер написав легкозрозумілу статтю, у якій пояснює унікальні ідентифікатори (Мілер, Пол: Я – і назва, і число. Аріадна, видано 24, 21t червня 2000 [55]. Міжнародна Рада Музеїв (ICOM) надрукувала Міжнародні рекомендації для Інформації про музейні експонати: Інформаційні Категорії CIDOC [56] в 1995. (див. також рекомендації з збереження у цифровому форматі.)

ПЛАНИ НА МАЙБУТНЄ

Назад до переліку

У майбутньому люди будуть оточені розумними, чутливими та надійними машинами, здатними реагувати, як особистості. Ряд технологій, описаних у цій рекомендації, вже існують, але їх повноцінна взаємодія наразі є лише уявною. Зрештою вони впливатимуть на усі сторони життя — на дім, школи, готелі, машини, літаки. Такий вплив на заклади культури буде дуже далекосяжним.

Оскільки потужність комп’ютерних систем зростає, більше інформації може зберігатися, наприклад, метадані можуть описувати кілька мільйонів об’єктів. Це зробить доступними величезні спільні каталоги

Це дасть можливість зберігати більш складні описи, щоб затосувати, наприклад, друге видання стандарту Асоціації Документації Музеїв для даних музею, який має сотні записів. Є перспектива розвивати метадані в сфері культури від статичних структурованих даних каталогу до складних текстових описів, включаючи тлумачення об’єктів або реакції на них.

ДОВІДКОВА ІНФОРМАЦІЯ

Назад до переліку

[1]Гіл, Тоні і Мілер, Пол: Новий винахід Колеса? Стандарти, Можливість взаємодії і Цифровий Культурний Контент . D-Lib Журнал, Том 8 Номер 1, січень 2002. http://www.dlib.org/dlib/january02/gill/01gill.html

[2]TASI (Технічна Консультативна Служба по роботі з Зображеннями): Метадані і Цифрові Зображення. 2002-2004 http://www.tasi.ac.uk/advice/delivering/metadata.html

Посібник Calimera

246

Опис ресурсів

[3]Машинозчитувана Каталогізація (MARC): MARC 21 http://www.loc.gov/marc/

[4]Елементи Метаданих Dublin Core , Версія 1.1 http://dublincore.org/documents/dces/

Українською мовою — http://www.library.kr.ua/dc/dcmi1_1u.html

[4A] Волохін, Олег: Опис цифрових ресурсів Інтернет. Дублінське ядро метаданих. 2003

http://library.kr.ua/dc/DC_Volokhin.pdf

[5]Хілман, Діана: Використання Dublin Core. 2003.

http://dublincore.org/documents/usageguide/

[6] Електронний Каліфорнійський Архів Кращий Практичних принципів для Цифрових Об’єктів (OAC BPG DO), Версія 1.0, підготовлена і підтримана Електронна Архівна Каліфорнійська Робоча Група, січень 2004. http://www.cdlib.org/inside/projects/oac/bpgdo/

[7]PREMIS (Метадані зберігання: стратегії виконання) http://www.oclc.org/research/projects/pmwg/

[8]RLG набір з 16 основних елементів метаданих, щоб підтримувати збереження http://www.rlg.org/preserv/presmeta.html

[9]Довідкова модель для відкритих архівно-інформаційних служб (OAIS) http://ssdoo.gsfc.nasa.gov/nost/isoas/

[10]Лавоі, Брайн Ф.: Впровадження Метаданих в Системи цифрового збереження: Діяльність PREMIS в журналі D-Lib , квітень 2004, Том 10 Номер 4. ISSN 1082-9873

http://www.dlib.org/dlib/april04/lavoie/04lavoie.html

[11]Дей, Майкл: Збереження Метаданих. Черновий варіант глави був надрукований в: Г. E. Горман і Данієль Г. Дорнер (eds.), Метадані прикладних задач і управління, Міжнародна Щорічної книги Управління Бібліотек і Інформації, 2003-2004, Лондон: Facet Publishing, 2004, ст. 253-273. ISBN 1- 85604-474-2 (Facet Публікація); ISBN 0-8108-4980-1 (Scarecrow Press). http://www.ukoln.ac.uk/metadata/publications/iylim-2003/

[12]NISO Z39.87-2002 AIIM 20-2002 Інформаційний Словник – технічні метадані для Цифрових Нерухомих Зображень http://www.niso.org/standards/resources/Z39_87_trial_use.pdf

[13]Проект Indecs http://www.indecs.org/

[14]Стандарт Кодування і Передачі Метаданих (METS)

http://www.loc.gov/standards/mets/

Посібник Calimera

247

Опис ресурсів

[15]IMS технічні вимоги lо упаковки контенту http://www.imsproject.org/content/packaging/

[16]IEEE вивчення стандарту метаданих об’єкту http://ltsc.ieee.org/wg12/par1484-12-1.html

[17]Консорціум глобального навчання IMS http://www.imsproject.org/

[18]CETIS (Центр стандартів взаємодії освітніх технологій) http://www.cetis.ac.uk/

[19]ISO 19115:2003 Географічна Інформація – Метадані

http://www.iso.ch/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=26020&I CS1=35&ICS2=240&ICS3=70

[20]Міжнародний Стандарт для Архівного Опису (Загальний) (МСАО(З). Друге Видання http://www.ica.org/biblio/isad_g_2e.pdf

[21]ISAAR (CPF) (Міжнародний стандартний архівний запис для корпоративних організацій, юридичних осіб та сімей), 2-е вид. 2004 р. http://www.ica.org/biblio.php?pdocid=144

[22]EAD (Кодований Архівний Опис) http://www.loc.gov/ead/

[23]EAC (Кодований Архівний Зміст) http://www.library.yale.edu/eac/

[24]Довідкові сторінки EAD – метадані

http://www.iath.virginia.edu/ead/metadata.html

[25]Міжнародний Комітет для Документації Міжнародної Ради Музеїв (ICOMCIDOC): Документація Музею : Стандарти і Принципи http://www.willpowerinfo.myby.co.uk/cidoc/stand3st.htm

CIDOC CRM (CIDOC модель концептуальної довідки) http://cidoc.ics.forth.gr/index.html

[26]SPECTRUM, стандарт музейної документації Великобританії, 2-е вид. http://www.mda.org.uk/spectrum.htm

[27]Науково-Дослідницький Інститут Getty, Категорії для Опису Творів Мистецтва (CDWA) http://www.getty.edu/research/conducting_research/standards/cdwa/

[28]Великобританія mda (Асоціація Музейної Документації) проспекти http://www.mda.org.uk/facts.htm

[29]Цифрові Бібліотеки IFLA: ресурси метаданих

http://www.ifla.org/II/metadata.htm

Посібник Calimera

248

Опис ресурсів

[30]GILS (Урядова Служба Пошуку Інформації/Глобальна Служба Пошуку Інформації) http://www.gils.net/about.html

[31]Ініціатива Метаданих Dublin Core (DCMI): Урядова Робоча Група. http://dublincore.org/groups/government/

[32]e-gif (мережа взаємодії електронного урядування)

http://www.govtalk.gov.uk/schemasstandards/egif.asp

[33]e-gms (стандарт метаданих електронного урядування) http://www.govtalk.gov.uk/schemasstandards/metadata.asp

[34]Підрозділ "e-Government" Великобританії

http://e-government.cabinetoffice.gov.uk/Home/Homepage/fs/en

[35]Набір елементів метаданих Dublin Core (DCMES) http://dublincore.org/documents/dces/

[36]DC.Culture http://www.minervaeurope.org/DC.Culture.htm

[37]UKOLN Collection Description Focus http://www.ukoln.ac.uk/cd-focus/

[38]Minerva: Deliverable D3.1: Каталоги, виявлення оцифрованого контенту та питання багатомовності: доповідь з аналізом наявного контенту http://www.minervaeurope.org/intranet/reports/D3_1.pdf;

[39]JISC Функціональна Модель Архітектури Інформаційного Оточення http://www.ukoln.ac.uk/distributed-systems/jisc-ie/arch/functional-model/.

[40]Програма підтримки досліджень бібліотек (RSLP) Схема Опису Колекцій http://www.ukoln.ac.uk/metadata/rslp/

[41]Minerva: Deliverable D3.2: Каталоги, виявлення оцифрованого контенту та питання багатомовності: Дослідження придатності звичайної платформи http://www.minervaeurope.org/intranet/reports/D3_2.pdf

[42]Профіль програм опису колекцій Dublin Core

http://www.ukoln.ac.uk/metadata/dcmi/collection-application-profile/2004-08-20/

[43]Суб’єктні заголовки бібліотеки Конгресу http://www.loc.gov/catdir/cpso/lcco/lcco.html

[44]ISO 2788, 1986 Вказівки щодо організації і розробки одномовних тезаурусів http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=7776

[45]ISO 5964, 1985 Вказівки щодо організації і розробки багатомовних тезаурусів http://www.iso.ch/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=12159

Посібник Calimera

249

Опис ресурсів

[46] Тезаурус з мистецтва та архітектури Гетті http://www.getty.edu/research/conducting_research/vocabularies/aat/

[47] Тезаурус географічних назв Гетті http://www.getty.edu/research/conducting_research/vocabularies/tgn/

[48]Керовані словники, тезауруси та системи класифакації, наявні у WWW. DC Subject. Укладено T. Кохом.

http://www.lub.lu.se/metadata/subject-help.html.

[49]TASI (Технічна Консультативна Служба по роботі з Зображеннями):

Контроль за своєю мовою – посилання на словники метаданих. http://www.tasi.ac.uk/resources/vocabs.html

[50]DOI (Ідентифікатори Цифрових Об’єктів) http://www.doi.org/

[51]URN (Універсальні імена ресурсів) http://www.ietf.org/rfc/rfc1737.txt

[52]PURL (Постійні універсальні ідентифікатори ресурсів) http://purl.oclc.org/

[53]Handles http://www.handle.net/introduction.html

[54]ARKs (Ключі архівних ресурсів) http://www.cdlib.org/inside/diglib/ark/

[55]Мілер, Пол: Я – і назва, і число. Аріадна, видано 24, 21t червня 2000. http://www.ariadne.ac.uk/issue24/metadata/intro.html

[56]Міжнародний документаційний комітет Міжнародної ради музеїв (ICOMCIDOC): Міжнародні рекомендації для Інформації про музейні експонати: Інформаційні Категорії CIDOC

http://www.willpowerinfo.myby.co.uk/cidoc/guide/

 

ПОСИЛАННЯ

Назад до переліку

 

 

 

Міжнародні

SEPIA (Збереження для доступу фотографічних зображень у Європі)

Цей проект, що фінансувався ЄС, розробив модель та програмний засіб з відкритим кодом (SEPIADES) для опису та каталогізації аналогових та цифрових фотографій. http://www.knaw.nl/ecpa/sepia/workinggroups/wp5/cataloguing.html

MICHAEL (Багатомовний культурний реєстр Європи)

Проект визначає стандарти опису рівня колекцій цифрових ресурсів культурої спадщини. Буде забезпечено сервіс з виявлення онлайнових ресурсів, який почне працювати у 2005-2006 рр.

http://www.michael-culture.irg/index.html

Чеська Республіка

Посібник Calimera

250

Опис ресурсів

ProMuS (Prohlizec muzejnich sbirek)

ProMuS розроблено для збереження музейних та інших колекцій в Інтернет. Система базується на PHP скриптах та базі даних SQL. Установа може визначити яким шляхом дані будуть представлені користувачеві. Потрібні незначні навички у html/програмуванні. Дані та структура таблиць експортується через текстовий файл і це надає можливість експортувати дані майже з будь-яких джерел. Є можливість додавати зображення. http://www.mzm.cz/promus

Норвегія

Detektor

Анатований предметний довідник ресурсів Інтернет з можливостями пошуку, матеріал відібрано та оцінено бібліотекарями публічної бібліотеки Осло. Технічне рішення від компанії Linux Communications AS, база данихa MySQL запущена на сервері Linux. Довідник вміщує ресурси Інтернет на норвезьській, дацькій, шведській, англійській мовах. Елементи Dublin Core використовуються для опису ресурсів. http://detektor.deichman.no/

Samkatalog for privatarkiv

База даних в Інтернет яка надає доступ до інформації про записи в каталогах архівів по всій країні. Архівні описи здійснено в норвезьському стандарті опису даних для архівів на базі програмного забезпечення Asta. http://www.riksarkivet.no/samkat/

URN-генератор

Норвезьські URN це новий сервіс Національної бібліотеки Норвегії. URN (Універсальне Ім’я Ресурсу) надає можливість ідентифікувати документи Інтернет. URN присвоєний документу є унікальним і не не змінюється до тих пір поки не зміниться інтелектуальний контент. Він ніколи не повторюється. URN можна використовувати для пошуку в різний спосіб. http://www.nb.no/html/standardnummerering.html

Польща

MONA

725,000 музейних об’єктів (музейних експонатів) з античних часів до сучасності описані за допомогою стандарту CIMI. Файл стандарту також вміщує результати досліджень отримані за допомогою спеціальних методів консервації (хімічних, біологічних, біофізичних). http://www.mnw.art.pl

Росія

Музейні колекції Росії

Унікальність цього проекту полягає в комплексному підході до створення музейної багатоцільової інформаційної системи. Наявність мережі забезпечує можливості персоналу обмінюватись інформацією та об’єднуватись для створення тезаурусів. http://www.collections.spb.ru

Посібник Calimera

251

Опис ресурсів

Сербія та Монтенегро

CKP – Центральний морський каталог Монтенегро

Сучасна база даних бібліотечних та архівних матеріалів, пов’язаниз з мореплавством в цілому та зокрема з затокою Boka Kotorska, від давніх часів до останніх публікацій які зберігаються в усіх типах бібліотек та архівах: державних, церковних, приватних.

http://www.dacg.cg.yu; http://www.matf.bg.ac.yu/iak

Іспанія

Перепис архівів та фондів Андалузії : CENSARA and CENFOCOA

Інформація про місцеві архіви та колекції культурної спадщини надана працівниками архівів за допомогою веб форм. Є можливість пошуку через Інтернет. Інновація полягає в тому, що це перший проект в регіоні, адаптований до міжнародного стандарту ISAD-G. http://www.juntadeandalucia.es/cultura/aga

Fichero de Autoridades de Aragón

Мета цього кооперативного, архівного проекту — створення авторитетного файлу який включає осіб, родини, колективні імена та місцевості. Партнери мають можливість завантажувати та оновлювати авторитетні записи через приеднану базу даних. http://www.anabad.org/gtaa/

Великобританія

Access to Archives (доступ до архівів)

База даних A2A містить каталоги з описами архівних зібрань, що зберігаються в Англії 352 архівними установами та іншими сховищами записів. http://www.a2a.org.uk/default.asp

Україна

Кіровоградська обласна універсальна наукова бібліотека ім.Д.Чижевського: Проект Дублінське ядро метаданих

Ця онлайн-програма дозволяє каталогізатору редагувати метадані Дублінського ядра (Dublin Core metadata) сторінок Інтернет з наступним конвертуванням до бібліографічного формату UNIMARC (UKRMARC) та зберігати запис у форматі ISO-2709. У тому випадку, коли сторінка Інтернет не вміщує метаданих Dublin Core - Редактор-Конвертор створить їх із можливих супутніх даних. Доступно трьома мовами: українською, російською та англійською.

http://library.kr.ua/dc/ http://www.library.kr.ua/dc/dcproje.html; http://www.library.kr.ua/dc/dcedituni.html

Мислене древо: український інформаційний ресурс для освіти і науки

"Мислене древо" – універсальна ієрархічна база даних, розроблена в Інституті пам’яткоохоронних досліджень Міністерства культури і мистецтв України і

Посібник Calimera

252

Опис ресурсів

орієнтована на побудову баз даних у гуманітарній сфері. Програма підтримує візуальне представлення дерева даних, у вершинах якого може зберігатись інформація у вигляді звичайного і форматованого (RTF) текстів, бітових та векторних зображень, звукових та відеофайлів. Програма підтримує різноманітні можливості обробки цих даних, а також імпорт/експорт даних в/із інших програм. http://www.myslenedrevo.com.ua

Назад до змісту

Посібник Calimera

253

Опис ресурсів

Посібник Calimera

Виявлення і пошук

ПЕРЕЛІК ПИТАНЬ

У цій рекомендації висвітлено наступні питання: Можливість взаємодії Пошукові системи Перелік рекомендованих сайтів Шлюзи, вузли і портали Перехресний пошук Масиви Пошук зображень Збір

Семантичний Веб

СТРАТЕГІЧНІ ПИТАННЯ

Назад до переліку

Бібліотеки вже довго працюють в мережевому інформаційному середовищі, останнім часом до них все більше і більше приєднуються архіви та музеї. Поява Інтернету означає, що навіть найменший музей, філія бібліотеки чи філія архіву тепер можуть мати доступ до розосередженої цифрової інформації. Суспільство знань, довічне навчання і зростаючий рух у напрямку взаємодії з центральним урядом через електронні засоби роблять вільний доступ до інформації все важливішим для всіх громадян.

Багато установ також створюють новий цифровий контент самостійно – власні веб-сторінки або нові мультімедійні контенти, які іноді фінансуються/підтримуються спеціальними цифровими програмами (дивіться рекомендації з оцифрування і бізнес-моделей). Вони повинні розуміти, як зробити цей новий контент доступним для пошуку та для користувачів, а також привести його у форму, за якої він би міг взаємодіяти з іншим цифровим контентом. Це в більшій мірі залежить від опису контенту, тому вищезазначені рекомендації мають бути розглянуті в комплексі з рекомендаціями, наданими в розділі Опис ресурсів.

Дослідження та епізодичні дані показують, що більшість людей використовують пошукові системи (такі як Google) для пошуку інформації, і таким чином втрачається великий об’єм інформації, відомої як “Deep Web” (“Глибокий Веб”), яка включає бази даних бібліотек, архівів і музеїв. Вказану проблему зараз намагаються розв’язати за допомогою пошукових систем, тому музеї, архіви та бібліотеки повинні контролювати їх діяльність.

Посібник Calimera

254

Виявлення і пошук

Технології і стандарти в цій сфері будуть продовжувати змінюватися і розвиватися. Установи мають знати про поточний стан справ, для уникнення застосування невідповідних або застарілих технологій і стандартів.

Установам потрібно розуміти ці проблеми для того, щоб вміти планувати і виділяти пріоритети в своїй роботі, особливо коли вони забезпечують нові системи або замовляють роботу у консультантів/підрядників. Для більш детальної інформації дивіться Проблеми в процесі інформаційного пошуку і моделюванні мови, Джеймс Ален [1].

РЕКОМЕНДАЦІЇ З ПОЗИТИВНОЇ ПРАКТИКИ Назад до переліку

Виявлення і пошук інформації залежать від того, як вони описані. Ці принципи повинні бути розглянуті в поєднанні з рекомендаціями, наданими в розділі Опис ресурсів, де розглянуті такі теми як метадані, термінологія (словники та тезауруси), ідентифікатори об’єктів. Багато технологій, що використовуються при дослідженні та пошуку, описані в розділі Основні технології та інфраструктури.

Можливість Взаємодії Назад до переліку

В сфері цифрового контенту, взаємодія означає можливість повторного доступу, портативність, наприклад через різноманітні мережі, системи і організації, і слугувати якнайдовше. Шлях до досягнення цієї мети полягає через стандарти – закодовані правила і принципи створення і управління цифровими джерелами (в пошуках детальної інформації дивіться Новий Винахід Колеса? Стандарти, Взаємодія Мереж і Цифровий Культурний Контент, автори Тону Гіл і Пол Мілер [2].) Можливість пошуку і отримання інформації з різноманітних джерел – через різноманітні каталоги, різноманітні області (музеї, бібліотеки і архіви) і через різноманітні види джерел (книги, документи, музейні артефакти) залежить від здатності взаємодії мереж. Це сфера, де є можливість працювати з іншими організаціями, наприклад коледжами, університетами тощо, що забезпечують кращий доступ до джерел інформації. (дивіться Co-operation and partnership Співпраця та партнерство). Зазвичай партнери погоджуються зробити свої послуги доступними іншим користувачам, забезпечити спільний доступ до каталогів, створювати єдині каталоги, тощо. (Термін каталог використовується тут в найширшому сенсі, включаючи опис ресурсів музеїв і архівів.)

Є два відомі підходи до виявлення: індексація змісту джерела, індексація метаданих, що описують джерело (метадані можуть бути створені людиною або автоматично або шляхом поєднання двох способів). Вимоги до взаємодії, і отже подальші рекомендації, можуть бути різні, в залежності від механізму, який буде використовувати контент-провайдер.

Пошукові системи Назад до переліку

Каталог - це ключ до фондів бібліотек чи архівів. Музеї також документують свої фонди, хоча їх каталоги можуть бути недоступними для користувачів як, наприклад, каталоги бібліотек і архівів. Проте, більшість бібліотек і архівів зараз пропонують доступ до Інтернету своїм користувачам так само, як і

Посібник Calimera 255 Виявлення і пошук

більшість музеїв. Вони повинні знайти способи допомогти відкрити ці мереві ресурси для своїх користувачів. Найлегший спосіб - це вказати користувачу на одну з багатьох доступних пошукових систем. Основні види:

Системи Free text (пошук вільного тексту), пошук за ключовими словами, наприклад Altavista [3], Google [4];

Системи Index/directory based Індекс-пошук, коли користувач працює шляхом послідовного натискання пунктів меню, таким чином звужуючи пошук Yahoo [5];

Системи Meta/Multi Мета/Мульти пошук, пошук здійснюється більш ніж одним пошуковим пристроєм ixquick [6];.

Системи Natural language “Природна мова”, пошук здійснюється після

введення питання Ask Jeeves [7].

Розрізняють також предметно-специфічний пошук і персоналізований пошук.

Google (і інші вільні текстові пошукові пристрої) функціонують використовуючи “робот”, який згідно з гіперсилками на веб сторінках шукає оригінальний текст, складають індекси того тексту, і починають пошук, згідно з цими індексами. Цінність таких пошукових програм полягає, в основному, в вище згадуваних алгоритмах, за якими дані класифікуються у вікні з результатами пошуку, добре відома послуга Google, алгоритм Page Rank заснований на кількості посилань на сторінку. Для впевненості, що ресурси в Google є доступними, контент провайдер має приймати до уваги такі фактори як (не повний перелік):

Роботу потрібен “відправний пункт”, відштовхуючись від якого він зможе слідувати посиланням;

Робот повинен отримати доступ до сторінок для їх індексації – або до самого джерела або документу, який описує джерело – через HTTP (Гіпертекстовий Hypertext Протокол) [8], ті сторінки, які будуть проіндексовані не повинні бути сховані позаду ідентифікованих викликів і так далі. Також деякі роботи не обробляють URL, які містять параметри;

сторінки URL повинні бути проіндексовані таким чином, що коли користувач йде за посиланням, то в результаті він отримає ту ж саму сторінку, що була проіндексована;

Сторінки повинні містити прості метадані, які використовує пошукова система у вікні відображення результатів пошуку (назва, опис, ключові слова, тощо);

навіть якщо сторінка доступна для індексації, її рейтинг у списку результатів залежить від алгоритмів, як-то Google’s Page Rank [9] і якщо на сторінку мало посилань, то і рейтинг її буде невисоким.

З іншого боку треба враховувати, що виявлення ресурсів на основі метаданих може бути проблематичним за рахунок різних підходів до індексування між контент-провайдером, що створює метадані для збору або перехресного пошуку з однієї сторони та провайдером пошукової системи з іншого, при цьому застосовуються різні застереження.

Контент-провайдер та провайдер сервісу мають узгодити (неповний список):

використання транспортних протоколів для обміну повідомленнями;

мова запитів;

схеми метаданих;

Посібник Calimera

256

Виявлення і пошук

питання прав інтелектуальної власності (як сервіс-провайдер використовує/представляє записи метаданих);

питання ідентифікації/авторизації.

Також якість обслуговування може залежати від якості і послідовності записів метаданих, наданих контент-провайдерами.

Деякі пошукові системи також запроваджують альтернативні шляхи пошуку, включаючи “простий пошук”, коли користувач вводить ключові слова, і “складний пошук”, де в процесі пошуку можна використовувати такі засоби, як Булева логіка, усічення тощо. Останній звичайно дає кращий результат. Інші приклади пошукових систем включають Google Directory [4], що дозволяють пошук за темою, і Google Local [4], які здійснюють пошук місцевої інформації (в наш час тільки в Сполучених Штатах і Канаді, але існують плани розширити цю послугу).

Для повного переліку пошукових систем всіх видів і більш детальної інформації про пошукові системи, включаючи методи пошуку, дивіться веб сторінку Філа Брадлі [10] і Огляд пошукових систем [11]. Ці сайти дають інформацію про пошук у мережі, аналіз індустрії пошукових систем і допомагають власникам сайтів покращити знаходжуваність в мережі.

Списки рекомендованих сайтів Назад до переліку

Установи можуть допомогати своїм клієнтам, пропонуючи їм список корисних вебсайтів. Зазвичай, вони перевіряються на відповідність певним критеріям (Проект Desire створив корисну главу про якість та оцінку в Довіднику Інформаційних Порталів [12]). RDN (Пошукова Дослідницька Мережа) [13] гарний приклад цього. Однак, підтримувати і модернізувати такий список може бути дуже важко. Установи культури мають співпрацювати у напрямку створення і підтримки таких зв’язків. Connexion, Інтегрована каталогізована послуга від OCLC [14], - гарний приклад ініціативи для створення опису вебсторінок. (дивіться також портали.)

Шлюзи, вузли і портали Назад до переліку

Відмінність між шлюзами, вузлами і порталами доволі незрозуміла, але типовий шлюз або вузол складаються з наборів анотованих посилань на інші вебсайти, які збираються компіляторами шлюзів. Користувачу можуть надаватись меню, які переносять їх із загальних до більш специфічних термінів. Такі сайти надзвичайно корисні для дослідника, оскільки заощаджують час, який потрібно було б витратити на “гортання” сторінок вебсайтів з конкретної предметі в пошуках потрібної інформації. Однак, Портали звичайно об’єднують актуальний контент описаних джерел, використовуючи технології, такі як збір, перехресний пошук або метапошук і представляють його в єдиній формі користувачу. Вони також можуть надавати інші послуги, такі як відвідування магазину через мережу.

Усі шлюзи та портали перелічити неможливо, але ось приклади:

Загальні – Yahoo [15], ряд меню, який охоплює Інтернет в цілому;

Посібник Calimera

257

Виявлення і пошук

Урядові - Directgov [16], перелік вебсайтів уряду Великобританії у тематичному та алфавітному порядку; Premier Ministre [17], вхід до представництв французького уряду;

Академічні – Мережа пошуку ресурсів (RDN) [13], призначена для підтримки

потреб сфери освіти Великобританії. RDN фактично є мережею окремих тематичних шлюзів або вузлів, кожен з яких присвячено певній темі. Подальшу розробку здійснює Subject Portals Project (SPP) [18]; ARL Scholars Portal Project [19], який має на меті надання програм для науковців для забезпечення єдиної точки входу у мережу для пошуку ресурсів високоякісної інформації та, наскільки це можливо, надання інформаційних та супутніх послуг безпосередньо на стіл користувача; Infomine: Зібрання наукових інтернет-ресурсів [20];

Музеї - 24 Hour Museum [21]; Dutch Museums Portal [22]; Latvian Museum Portal [23];

Бібліотеки - UNESCO libraries portal [24]; Librarians’ Index to the Internet [25];

Архіви - UNESCO archives portal [26]; Портал національних архівів Британії [27]; A2A (доступ до архівів) [28], англійське відгалуження UK Archives Network;

Culture [29], культурний портал Євокомісії;

Other - Infobel [30], посилання на онлайнові телефонні довідники.

Є спеціалізоване програмне забезпечення для підтримки розвитку і зберігання тематичних шлюзів, наприклад, ROADS (Організація і виявлення ресурсів у сервісах на основі тематики) [31]. Комерційні компанії також пропонують програмне забезпечення порталів, наприклад Vignette [32], SAP Portal [33], Plumtree [34], ZPORTAL [35] і т. д. Деякі установи культури створюють власні шлюзи і портали – наприклад, для підтримки “кластерів”, громадських інформаційних послуг та підтримки навчання.

Перехресний пошук Назад до переліку

Перехресний пошук дозволяє одночасний пошук у кількох базах даних. З перехресним пошуком між доменами користувачі можуть отримувати доступ до великих зібрань інформаційних ресурсів через один пошуковий інтерфейс. Наприклад, користувач може шукати книги, архівні записи та інформацію про громади та музейні експонати за одну пошукову операцію за темою, що його цікавить. Це можна зробити наступними способами:

Експортувати усю інформацію в нові бази даних використовуючи наприклад SOAP [36] або Harvest. Включає експортування всіх існуючих даних в певний визначений формат так, щоб він міг бути завантажений в одну центральну базу даних. Можливі певні труднощі, наприклад:

°отримання згоди від власника/менеджера кожного ресурсу;

°робота з кількома постачальниками різних систем;

°відмінності у структурі даних, особливо у роботі з ресурсами з різних доменів (див. рекомендації з опису ресурсів);

°організація регулярного оновлення.

розподілений пошук. Має на увазі залишення баз даних, як вони є, і надання єдиної пошукової системи, наприклад, з використанням протоколу пошуку Z39.50. Труднощі з цією системою виникають в основному через різні

Посібник Calimera

258

Виявлення і пошук

структури даних, поля та ін., особливо при включенні локально створених громадських баз даних тощо;

об’єднання баз даних для перехресного пошуку через спільний портал. Проблеми з цим знову виникають через структури даних тому, що вони рідко мають багато спільних полів для пошуку.

Перехресний пошук полегшується, якщо:

усі провайдери сервера Z39.50 користуються спільним профілем (наприклад, Bath Profile [37]);

усі домени використовують Dublin Core для приведення різноманітних метаданих до єдиної структури (у т. ч. для локально створених громадських баз даних, де немає прийнятого стандарту на опис та зберігання даних; Marc 21 [38] має такий стандарт, але він не широко застосовується; проект CASP [39] рекомендує Dublin Core).

Z39.50 – міжнародний протокол пошуку (ISO 23950:1998 [40]), який дозволяє здійснювати пошук у (звичайно віддалених) неоднорідних базах даних та отримання даних через єдиний інтерфейс користувача. Z39.50 визначає стандартний спосіб, у який два комп’ютери з’єднуються та розподіляють інформацію. Призначений для підтримки пошуку і видачі інформації – повнотекстових документів, бібліографічних даних, зображень і мультимедіа, він базується на архітектурі “клієнт-сервер” і є повністю функціональним через Інтернет. Він дозволяє користувачам здійснювати пошук у кількох каталогах або інших базах даних за одну операцію пошуку. Примітка: поки розвиваються мови запитів XML, Z39.50 може бути преференційним протоколом пошуку для систем, що пропонують складний розподілений пошук.

SRW (Пошуковий Веб-сервіс) визначає веб-сервіс для пошуку у базах даних, що містять метадані та об’єкти, як текстові, так і не текстові. Ініціатива SRW базується на Z39.50 та веб-технологіях [41].

Масиви Назад до переліку

Масив – група баз даних, що мають спільні характеристики, наприклад, група каталогів Z39.50 з перехресним пошуком групи організацій, типово – групи музеїв, бібліотек та/або архівів. Важливим елементом таких масивів є шлюз або портал, який надає користувачам можливість одночасного пошуку по усім каталогам та/або базам даних усіх організацій-учасниць. Динамічні масиви – спосіб автоматичної генерації різних міні-масивів для перехресного пошуку, іншими словами, механізм для допомоги користувачу у навігації у великому розосередженому масиві. Наприклад, можна шукати лише у каталогах, які більше присвячені конкретній темі. Щоб досягти цього, масив повинен мати єдиний профіль, до якого можна привести різні профілі, якими користуються члени консорціуму. Для підтримки такої діяльності було розроблено низку профілів, наприклад, Bath Profile [37] та ONE-2 Profile [42]. Ліцензування та захист авторських прав різних електронних ресурсів, що надаються через масив, може бути проблематичним.

Шлюзи, портали та масиви – усі вони можуть бути використані для підтримки навчання та таких інформаційних послуг, як громадська інформація.

Посібник Calimera 259 Виявлення і пошук

Пошук зображень Назад до переліку

Свого часу пошук зображень здійснювався за текстовими дескрипторами або класифікаційними кодами, які у деяких випадках підтримували програми текстового пошуку, розроблені або пристосовані спеціально для роботи з зображеннями. AAT Гетті (Тезаурус з мистецтва та архітектури) [43] складається з 120,000 термінів для опису об’єктів, текстових матеріалів, зображень, архітектури та матеріалів культурної спадщини. Зображення можна також класифікувати, використовуючи такі системи, як ICONCLASS [44] для товрів мистецтва і музейних експонатів, а Соціальна Історя та Індустріальна Класифікація – для музейних зображень [45].

Все більше сучасних систем мають можливість шукати зображення, не описані вербально. CBIR (Пошук зображень на основі контенту) не використовує індексацію ключових слів. Скоріш за все, зображення розшукується за характеристиками самого зображення, як-то колір, текстура або форма тощо, наприклад, пляжна сцена має бути синьою зверху та жовтою – знизу. Технічна дискусія щодо різних типів CBIR: див. Ікінс, Джон П. та Грем, Маргарет Е.:

Пошук зображень на основі контенту: звіт до програми JISC Technology Applications [46]. Є комерційні системи CBIR, наприклад система IBM QBIC (Запит за змістом зображення) [47], у якій зображення описується ділянками кольору і форми, а пошукові програми виконують пошук зображень, підходящих за описом. Не потрібно говорити, що саме зображено. Для демонстрації QBIC див. вебсайт Hermitage Museum (див. посилання.) BT Exact розробив прототип системи під назвою Shopping Garden [48], яка використовує інтерактивні техніки перегляду, показуючи користувачу набір зображень та відстежуючи зазначені користувачем преференції для пошуку необхідного йому зображення.

Поради з пошуку зображень: Пошук цифрових зображень. TASI (Технічна консультаційна служба з питань зображень) Порадник, 2002 [49].

Збір Назад до переліку

Програми збору – це засоби зібрання інформації метаданих із списку наперед визначених веб-джерел, наприклад вебсайтів організацій. В проекті Seamless (див. посилання), програма збору створює файл-індекс, у якому система здійснює пошук у відповідь на запит користувача. Потім результати інтегруються з результатами пошуків Z39.50 і видаються користувачу у вигляді простого “хітліста”. Натисканням на будь-який результат відкривається вебсайт (для зібраних записів) або запис бази даних (для записів Z39.50).

Ініціатива відкритих архівів (OAI) [50] - спільне підприємство, метою якого є полегшення знаходження інформації у мережі через розробку і застосування стандартів функціональної сумісності. OAI розробила простий протокол (Протокол OAI для Збору Метаданих, OAI-PMH [51]) який підтримує регулярний збір записів метаданих однієї служби іншою службою. Широке застосування OAI-PMH у сфері культури є успішним для розширення виявлення ресурсів через тематичні шлюзи та мережі пошуку ресурсів, наприклад RDN (Мережа пошуку ресурсів) у Великобританії. Одна з причин успіху – це те, що OAI-PMH є досить легкою у впровадженні для установ культури, які мають веб-сервери, оскільки

Посібник Calimera

260

Виявлення і пошук

вона базується на загальних основних стандартах мережі (HTTP, XML і XML схемах). Операції, що їх підтримує OAI-PMH, дозволяють установам культури діяти у якості провайдера даних і дають можливість сервіс-провайдеру замовляти копії усіх їх записів метаданих, або деяких записів метаданих, наприклад, тих, що були змінені з певної дати. Культурні установи можуть розглядати надання своїх метаданих для збору, встановлюючи сумісні з OAI бази метаданих. Обов’язкова мінімальна вимога для OAI-PMH – некваліфікований Dublin Core, але установи культури повинні розглядати впровадження схеми DC.Culture для підтримки виявлення ресурсів. Установи, які впроваджують бази метаданих на основі OAI, повинні розглядати включення формулювання прав у свої метадані, гарантуючи наявність прав власності у їх метаданих. Докладніше див. Фулонно, Мюріел (ed.): Ініціатива Відкритих Архівів– Протоколи для Збору Метаданих: практика установ культурної спадщини. Вересень 2003 [52], і вебсайт UKOLN FAQ [53].

Ініціатива Відкритих Архівів полегшить розвиток цифрових бібліотек для культурної спадщини, які об’єднують культурний контент установ, що зберігають пам’ять людства, та додають послуги для нової аудиторії. Можливо, вона приведе до розвитку спільнот провайдерів даних, які матимуть спільні стандарти, джерела термінології, контент та послуги.

Семантичний Веб (див. рекомендації з основних технологій та

інфраструктури) Назад до переліку

Семантичний Веб – це бачення, описане в журналі Scientific American у травні 2001 р. [54]. Тіма Бернс-Лі, Директор Консорціуму Всесвітньої Мережі (W3C) наголосив, що “Семантичний Веб – це мережа даних, дещо схожа на глобальну базу даних. Вона базується на ідеї, що ‘мета WWW - бути корисною не тільки для спілкування людей, але також щоб машини мали змогу брати участь в цьому процесі і допомагати”. Але Семантичний Веб має пройти довгий шлях, щоб ця мрія здійснилася. Він буде будуватися частинами, людьми з різноманітними інтересами. Реальну силу Семантичного Вебу буде реалізовано, коли люди створять багато програм, що будуть збирати контент у Мережі з різноманітних джерел, обробляти інформацію і обмінюватися результатами з іншими програмами. Семантичний Веб дозволяє вираження і представлення описової інформації у такій формі, коли прикладні програми використатимуть її ефективніше, ніж зараз. Зокрема, вона дозволяє вираження/представлення типів зв’язків, що існують між джерелами, у такій формі, яку зможуть обробляти прикладні програми. Наприклад, якщо хтось планує свято, він міг би шукати і збирати мапи, списки готелів, прогноз погоди, місця, які можна відвідати і т.д. Тоді можна розробити маршрут, вибрати готель і зробити усі необхідні замовлення. Програма Семантичного Вебу змогла б встановити зв’язки між усіма розрізненими частинами інформації і утворити єдиний пакет набагато швидше, ніж це зробив би турагент – людина. Це залежить від подальшого розвитку онтологій, таких як RDF [55], DAML+OIL [56] і OWL [57]. Детальний опис і обговорення Семантичного Вебу можна знайти у документі DigiCULT До семантичного Вебу для ресурсів спадщини [58].

В своєму наступному кроці, Семантичний Веб вийде за межі віртуального простору і пошириться у фізичному світі. Перспектива з’єднаної з мережею

Посібник Calimera 261 Виявлення і пошук

мікрохвильової печі, яка консультується з вебсайтом виробника замороженої їжі щодо кращого способу її приготування, за аналогією, може бути поширена на послуги, що надаються бібліотеками, архівами і музеями. Віртуальна картина може, наприклад, проконсультуватися з місцевим музеєм або мистецькою галереєю щодо найбільш підходящої картини, яку можна показати, а з віртуальною публічною бібліотекою – для завантаження супроводжуючої картину біографії в електронному вигляді, у відповідь на простий голосовий запит.

ПЛАНИ НА МАЙБУТНЄ

Назад до переліку

Дослідження і епізодичні докази свідчать, що більшість людей використовують такі пошукові системи, як Google, для пошуку інформації, і так втрачають велику кількість інформації, відому як “Deep Web” (глибинний Веб), яка включає бази даних бібліотек, архівів і музеїв. Вважається, що “Deep Web” в 500 разів більший, ніж поверхнева Мережа. В установах спадщини потрібно знайти спосіб роботи з основними пошуковими системами для індексації, або “видобування”, цих ресурсів так, щоб полегшити пошук інформації. Пошукові системи зараз починають звертатися до цієї проблеми – дивіться приклад Програма отримання контенту Yahoo [59], яка дозволяє контент-провайдерам, за передплату, робити їх власні бази даних доступними для пошуку; і Пошуковий пристрій Google [60], який є доступним по ліцензії для установ і дозволяє їм зробити доступними для пошуку свої вебсайти і корпоративні локальні мережі, використовуючи пошукову технологію Google. Громадська служба пошуку Google [61] дозволяє освітнім установам і неприбутковим організаціям користуватися безкоштовно всесвітньою системою “SiteSearch”, яка дозволяє користувачам здійснювати пошук на вебсайтах установ, а також безкоштовним “WebSearch”, який дозволяє користувачам здійснювати пошук в Інтернеті з вебсайтів установ.

Маловірогідно, що люди, які звикли до пошуку інформації в Інтернеті, знову відвідуватимуть музеї, бібліотеки і архіви, щоб задавати питання особисто, хоча дійсно вони будуть відвідувати їх з іншою метою. Отже, потрібно знайти шляхи, щоб використовувати навички професіоналів у галузі спадщини, для додання цінності пошуку інформації в епоху цифрових технологій. Бібліотекарі, архіваріуси та доглядачі кваліфіковано надають довідкову інформацію та формулюють відповіді згідно з конкретними потребами користувачів. Необхідні дослідження в розвитку технологій, які дозволять цим професіоналам стати онлайновими інформаційними посередниками.

У майбутньому ми побачимо плоди великої кількості розробок у сфері пошуку інформації, які зроблять теперішні системи примітивними. Складні персоналізовані роботи-агенти, що постійно здійснюватимуть пошук в Інтернеті, який було спеціально створено для полегшення пошуку з допомогою метаданих, керованих словників та унікальних ідентифікаторів. Вони знаходитимуть саме те, що хочуть їх користувачі, тому що вони знають їх пошукові звички, і вони робитимуть це, поки користувачі займаються чимось іншим. Вони не видаватимуть зайву інформацію і не пропустять важливої інформації, де б вона не була.

Посібник Calimera

262

Виявлення і пошук

Портативні бездротові пристрої стають широко розповсюдженими. В майбутньому люди сподіваються, що матимуть змогу запитувати інформацію використовуючи простий текст, можливо навіть популярну текстову мову, і отримувати відповіді на свої мобільні пристрої, де б вони не знаходилися у світі. Наприклад, хтось, прибуваючи в іноземний аеропорт, може запитати не уточнену корисну інформацію, і базуючись на профілі користувача, отримати посилає інформацію про громадський транспорт, таксі або прокат авто, прийнятні умови проживання, ресторани, місця для відвідування, розваги та ін.

Міжмовний пошук інформації має стати реальністю такою мірою, щоб запит однією мовою дозволяв би пошук у зібраннях іншими мовами та видачу відповіді мовою запиту.

ДОВІДКОВА ІНФОРМАЦІЯ

Назад до переліку

[1]Аллен, Джеймс, ed.: Проблеми пошуку інформації та моделювання мови. Доповідь на симпозіумі з питань пошуку інформації, Університет Масачучсетсу, Амхерст, вересень 2002. У форумі SIGIR, весна 2003, том. 37, №. 1. http://www.sigir.org/

[2]Гілл, Тоні та Міллер, Пол. Новий Винахід Колеса? Стандарти, Взаємодія і Цифровий Культурний Контент. Журнал D-Lib, том 8, номер 1, січень 2002 р. http://www.dlib.org/dlib/january02/gill/01gill.html

[3]Altavista http://www.altavista.com/

[4]Google http://www.google.com/ Для інформації про пошукові засоби, у т. ч. Google Directory та Google Local див. Google Guide http://www.googleguide.com/index.html

[5]Yahoo http://www.yahoo.com/

[6]ixquick http://www.ixquick.com/

[7]Ask Jeeves http://www.ask.co.uk/

[8]HTTP (Протокол передачі гіпертексту) http://www.w3.org/Protocols/

[9]Google’s Page Rank http://www.google.com/technology/

[10]Сайт Філа Бредлі (Phil Bradley's Website) http://www.philb.com/

[11]Огляд пошукових систем http://searchenginewatch.com.

[12]Довідник інформаційних шлюзів

http://www.desire.org/handbook/2-1.html)

[13] RDN (Мережа пошуку ресурсів) http://www.rdn.ac.uk/

Посібник Calimera

263

Виявлення і пошук

[14]Connexion: Інтегрована служба каталогів http://www.oclc.org/connexion/

[15]Yahoo http://www.yahoo.com/

[16]Directgov http://www.direct.gov.uk/

[17]Premier Ministre http://www.premier-ministre.gouv.fr/

[18]Проект тематичних порталів (SPP) http://www.portal.ac.uk/spp

[19]Проект “Учнівський портал” ARL (Асоціації наукових бібліотек) http://www.arl.org/access/scholarsportal/

[20]Infomine: Зібрання навчальних ресурсів Інтернету

http://infomine.ucr.edu/

[21]Цілодобовий музей (The 24 Hour Museum) http://www.24hourmuseum.org.uk/

[22]Портал голландських музеїв http://museum.klup.nl/

[23]Латвійський портал музеїв http://www.muzeji.lv/guide/links_e.html

[24]Бібліотечний портал ЮНЕСКО

http://portal.unesco.org/ci/ev.php?URL_ID=6513&URL_DO=DO_TOPIC&URL_SECTI ON=201&reload=1094470296

[25]Інтернет – покажчик для бібліотекаря http://lii.org/

[26]Архівний портал ЮНЕСКО

http://portal.unesco.org/ci/ev.php?URL_ID=5761&URL_DO=DO_TOPIC&URL_SECTI ON=201&reload=1036514637

[27]Портал національних архівів Великобританії http://www.portal.nationalarchives.gov.uk/portal/

[28]A2A (доступ до архівів) http://www.a2a.org.uk/

[29]Культура – Єврокомісія

European culture portal http://europa.eu.int/comm/culture/index_en.htm

[30]Infobel http://www.infobel.com/teldir/

[31]ROADS (Організація та виявлення у службах на основі тематики) http://www.ukoln.ac.uk/metadata/roads/what/

[32]Vignette http://www.vignette.com/

[33]SAP Portal http://www.sapportals.com/index.aspx

Посібник Calimera

264

Виявлення і пошук

[34]Plumtree http://www.plumtree.com/,

[35]ZPORTAL http://www.fdusa.com/products/zportal.html

[36]SOAP

http://www.ws-i.org/Profiles/SimpleSoapBindingProfile-1.0-2004-08-24.html

[37]Bath profile http://www.collectionscanada.ca/bath/tp-bath2-e.htm

[38]Marc 21 http://www.loc.gov/marc/community/eccihome.html

[39]Проект CASP (Community Advice, Seamless Portals)

http://egov.vic.gov.au/pdfs/casp-v1.0-draft-Feb2002.pdf

[40]ISO 23950:1998 Інформація і документація – Пошук інформації (Z39.50) – Визначення програми-сервісу та специфікація протоколу http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=27446

[41]SRW (Пошуковий веб-сервіс) визначає веб-сервіс для пошуку у базах даних, які містять метадані та об’єкти, як текстові, так і не текстові. Ініціатива SRW базується на Z39.50 та веб-технологіях. http://www.loc.gov/z3950/agency/zing/srw/

[42]Профіль ONE-2 http://www.one-2.org/

[43]The Getty’s AAT (Тезаурус мистецтва та архітектури)

http://www.getty.edu/research/conducting_research/vocabularies/aat/

[44]ICONCLASS http://www.iconclass.nl/index.html

[45]Соціальна історія та промислова класифікація для музейних експонатів. Соціальна історія та промислова класифікація (SHIC2) (2-е вид.). MDA (Асоціація документації музеїв Великобританії).

(докладніше див. http://www.mda.org.uk/keytexts.htm .)

[46]Ікінс, Джон П. та Грем, Маргарет Е.: Пошук зображень на основі контенту: звіт до програми JISC Technology Applications. січень 1999 р. http://www.unn.ac.uk/iidr/report.html

[47]QBIC (Запит за змістом зображення) http://wwwqbic.almaden.ibm.com/

[48]ShoppingGarden

http://www.btexact.com/whatsnew/newsreleases?doc=42974)

[49] Пошук цифрових зображень. TASI (Технічна консультаційна алужба з питань зображень) Порадник, 2002. http://www.tasi.ac.uk/advice/using/srchandret.html

Посібник Calimera

265

Виявлення і пошук

[50]Ініціатива відкритих архівів (OAI) http://www.openarchives.org/

[51]Протокол OAI для збору метаданих

http://www.openarchives.org/OAI/openarchivesprotocol.html

[52]Фулонно, Мюріел (ed.): Ініціатива Відкритих Архівів– Протоколи для Збору Метаданих: практика установ культурної спадщини. Вересень 2003 р. http://www.oaforum.org/otherfiles/oaf_d48_cser3_foullonneau.pdf

[53]Архітектура інформаційного середовища JISC: OAI FAQ. UKOLN.

http://www.ukoln.ac.uk/distributed-systems/jisc-ie/arch/faq/oai/

[54]Бернерс-Лі, Тім; Хендлер, Джеймс та Лассіла, Ора: Семантичний Веб: нова форма контенту мережі, значима для комп’ютерів, розпочне революцію нових можливостей. У журналі “Scientific American”, травень 2001 р. http://www.sciam.com/article.cfm?articleID=00048144-10D2-1C70- 84A9809EC588EF21

[55]Структура опису ресурсів (RDF) http://www.w3.org/RDF/

[56]DAML+OIL http://www.daml.org/about.html

[57]OWL Огляд мови Веб-онтології

http://www.w3.org/TR/owl-features/

[58]До семантичного Вебу для ресурсів спадщини. DigiCULT Тематичний випуск 3, травень 2003 р. ISBN 3-902448-008. http://www.digicult.info/pages/Themiss.php

[59]Yahoo: програма отримання контенту

http://docs.yahoo.com/docs/pr/release1144.html

[60] Пошуковий пристрій Google http://www.google.com/appliance/features.html

[61] Громадська служба пошуку Google http://www.google.com/services/websearch.html

 

ПОСИЛАННЯ

Назад до переліку

 

 

 

Бельгія

Webwijzer (Web Путівник)

Цей путівник допомагає користувачам бібліотеки в пошуках якісних веб-сайтів. http://www.vcob.be/servlet/be.coi.gw.servlet.MainServlet/standard/?toDo=open&id= 2158

Хорватія

Culturenet.hr

Посібник Calimera

266

Виявлення і пошук

Портал з питань культури ініційований в 2003 р. Міністерством культури Хорватії та Інститутом Відкритого Суспільства Хорватії. Для того, щоб поєднати ресурси культури з різних організацій, асоціацій, інститутів та проектів. http://www.culturenet.hr/v1/english/index.asp

Чеська Республіка

CES (Centralni evidence sbirek)

CES – це єдиний каталог для всіх музейних колекцій Чеської Республіки.

Надає можливість знайти матеріал та його місцезнаходження, можливості повнотекстового пошуку.

http://www.mkcr.cz/ces/

Музей Словацький

З будь-якого міста в світі можна подивитись колекцію маленької спеціалізованої музейної бібліотеки.

http://knihovna.slovackemuzeum.cz

Данія

Цифрова бібліотека, Публічна бібліотека Аарус. Бібліографічна база даних в Інтернеті, яка пропонує відкритий доступ до 9 млн. книг, компакт-дисків, відео, книг, що розмовляють. Матеріали можна замовити через систему публічних бібліотек в он-лайні.

http://www.bibliotek.dk

Фінляндія

ELEF: Southern Savo

Мета проекту зробити легким пошук даних через створення регіональної бази даних і сервісної мережі.

http://www.elka.fi/

Німеччина

Virtuelles Bücherregal NRW (Virtual Book Shelve North Rhineland-Westphalia)

Конвертує данні каталогів в HTML сторінки, розміщує їх на сервер для пошуку. http://kirke.hbz-nrw.de/dcb/virkiv/

Греція

Argo (Арго)

Арго – середовище, що допомагає відкрити доступ до джерел бібліографічної інформації, доступних як у Греції, так як і за кордоном, з простим, середнім і кваліфікованим пошуком. Дає доступ до бази даних, виготовлених або розміщених EKT (Національним Центром Документації), бібліотечних каталогів центрів історичних досліджень і закордонних археологічних шкіл та установ, розташованих у Греції, бібліотечних каталогів грецьких університетів і технічних

Посібник Calimera

267

Виявлення і пошук

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]