Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ПосибникДИСНаливайкоКРогПДФ-1.pdf
Скачиваний:
46
Добавлен:
01.05.2015
Размер:
3.32 Mб
Скачать

ПосібникДІСНаливайко

комісія

України

Питання для контролю знань:

1.Поняття системи державного управління.

2.Складові ефективності системи державного управління.

3.Структура складових ефективності.

4.Взаємодія громадян і організацій з органом державної влади.

5.Ефективність взаємодії між органами влади.

6.Електронний документообіг і діловодство.

7.Автоматизація діловодства.

Література: 1, 2, 3,4, 5, 7, 8, 9, 10,11.

Тема 7. Автоматизовані документальні інформаційно-пошукові системи

Ключові поняття: пошук, інформаційний пошук, інформаційна пошукова система, засоби організації інформації в інформаційнопошукових системах, пошукова мова .

Вивчення теоретичного матеріалу пропонується за таким планом:

1.Основні поняття інформаційного пошуку.

1.1.Об‘єкти та засоби інформаційного пошуку.

1.2.Пошукові інформаційні системи.

1.3.Класифікація ІПС.

2.Автоматизовані інформаційно-пошукові системи.

2.1.Методи і засоби організації пошуку в АІПС.

2.2.Структура АІПС.

2.3.Класифікація АІПС за основними ознаками.

2.4.Інформаційно-пошукові системи в Інтернет.

2.5.Ноу-хау в Українському просторі інформаційно-пошукових

систем.

3.Українська науково-навчальна телекомунікаційна мережа «УРАН».

63

ПосібникДІСНаливайко

Основні поняття інформаційного пошуку Об’єкти та засоби інформаційного пошуку

Пошук інформації − завдання, яке вирішує людство вже багато століть. У міру зростання обсягу інформаційних ресурсів, потенційно доступних одній людині (наприклад, відвідувачу бібліотеки), були вироблені все більш витончені і досконалі пошукові засоби і прийоми, що дозволяють знайти необхідний документ.

Дослідження з методів пошуку інформації публікуються в наукових журналах. У нашій країні - в журналі «Наукова та технічна інформація» (НТІ), у США - в Journal of American Society of Information Systems (JASIS).

Інформаційний пошук (ІП) - велика міждисциплінарна область науки, яка стоїть на перетині когнітивної психології, інформатики, інформаційного дизайну, лінгвістики, семіотики, бібліотечної справи, та статистики.

Інформаційний пошук (ІП) (англ. - Information retrieval) − наука про пошук неструктурованої документальної інформації. Особливо це відноситься до пошуку інформації в документах, пошук самих документів, добуття метаданих з документів, пошуку тексту, зображень, відео та звуку у локальних реляційних базах даних, у гіпертекстових базах даних, таких, як Інтернет та локальні інтранет.

Об’єкт ІП - текстова інформація (графічна, аудіо, відео), яка представлена у формі різних документів.

ЗІП пов‘язані проблеми:

розсилки інформації (information routing);

сортування інформації (information filtering);

упорядкування (класифікація) інформації (information categorization);

відбору інформації (information extraction).

Для інформаційного пошуку розробляють:

алгоритми інформаційного пошуку (retrieval algorithms);

підходи інформаційного пошуку(retrieval approaches);

стратегії інформаційного пошуку (retrieval strategies). Для його здійснення створюють:

методи інформаційного пошуку (retrieval utilities);

64

ПосібникДІСНаливайко

засоби інформаційного пошуку (information retrieval systems);

комп‘ютерні пошукові програми (search engines).

До проблем інформаційного пошуку належать питання:

представлення даних, інформації, знань (data, information, knowledge);

представлення інформації в сучасних інформаційних сховищах (representation of information);

багатомовний інформаційний пошук (cross-language information retrieval);

одночасний інформаційний пошук (parallel information retrieval);

розподілений інформаційний пошук (distributed information retrieval);

суспільний інформаційний пошук (social information retrieval)

Напрям «інформаційний пошук» відносять до проблем:

застосовної (прикладної) лінгвістики (applied linguistics);

обробки природної мови (natural language processing);

Завдання інформаційного пошуку це − знаходження відповідних

(до пошукового запиту) інформаційних об‘єктів або документів серед доступного для пошуку матеріалу.

Мова ІП інформаційний запит (query), який може містити слова, фрази чи речення або їх комбінацію. Переважна більшість пошукових систем орієнтована на роботу з пошуковими термінами − словами або словосполученнями, які пошукова система розпізнає як одне ціле.

Для здійснення інформаційного пошуку потрібно мати збірку інформаційних об‘єктів (бібліотека, комп‘ютерні файли) і систему (алгоритм або програму) яка здійснює пошук. Для здійснення інформаційного пошуку користувач (людина або інформаційна система) формує інформаційний запит (information query).

Результат інформаційного пошуку − список документів який укладається згідно з певним принципом. Такий список називають впорядкованим (ranked list, ranked results).

Стратегія інформаційного пошуку - алгоритм, який,

переглядаючи набір документів (Д1, ..., Дn), встановлює їх відповідність до пошукового запиту (ПЗ). Оскільки пошуковий

65

ПосібникДІСНаливайко

термін зустрічається в документах різну кількість разів, можна говорити про різну ступінь відповідності до пошукового запиту.

Цей алгоритм обчислює коефіцієнт відповідності (similarity coefficient) (КВ) для кожного документа КВ(ПЗ, Дi), де 1 ≤ i ≤ n.

Стратегії ІП визначають ступінь подібності документів, що розглядаються, до пошукового запиту. Ступінь подібності визначається згідно з робочою гіпотезою: чим частіше пошуковий термін зустрічається в документі, тим «відповіднішим» є цей документ до пошукового запиту.

Стратегії інформаційного пошуку розробляються не тільки для визначення відповідності, але і для вирішення проблем, які пов‘язані з неоднозначністю мови: один і той самий термін може позначати різні концепти (ключ в механіці означає зовсім не те, що в шифруванні), один і той же концепт може позначатись різними термінами (обласний центр Львівської області має назву Львів і Місто Лева).

Стадії інформаційного пошуку:

-з використанням векторно-просторового представлення (vector space model);

-пошук імовірності появи пошукового терміну в документі

(probabilistic retrieval);

-з побудовою мовної моделі для кожного документа (language models);

-з побудовою мережі припущень, яка використовується для встановлення відповідності документа до пошукового запиту

(inference network);

-з Булевим індексуванням, коли кожному пошуковому терміну присвоюється своя «вага», що потім враховується при побудові впорядкованих списків документів (Boolean indexing);

-з використанням непроявленого семантичного індексування

(latent semantic indexing);

-з побудовою нейромереж (neural networks);

-з використанням продуктивних алгоритмів, коли початковий пошуковий запит «еволюційно» видозмінюється (genetic algorithms);

-з використанням нечітких множин, коли документа ставиться у відповідність нечітка множина (fuzzy set retrieval).

66

ПосібникДІСНаливайко

Пошукові інформаційні системи

Виходячи з наданого визначення інформаційного пошуку та його основних понять автоматизовані системи інформаційного пошуку справедливо можливо віднести до класу автоматизованих документальних інформаційних систем (АДІС).

Пошукова система переглядає всі доступні інформаційні одиниці (документи) зі збірки і відбирає документи відповідні до інформаційного запиту.

Оскільки реальні пошукові системи знаходять не всі відповідні документи, говорять про точність пошукових систем (system accuracy).

Результат роботи пошукової системи список відібраних документів (retrieved documents list), серед яких є відповідні до запиту документи (relevant documents). Для ідеальної пошукової системи список відібраних документів та відповідних документів повинні збігатися. В реальних пошукових системах в списках відібраних документів знаходяться і невідповідні до запиту документи. Тому говорять про ефективність пошукових систем.

Ефективність пошукових систем оцінюється двома параметрами: пошукова відповідність (precision) та пошукова якісь

(recall).

Пошукова відповідність визначає частку відповідних документів серед відібраних на запит. Пошукова відповідність визначає якість отриманого результату інформаційного пошуку.

Пошукова якість визначає частку отриманих системою відповідних до запиту документів серед загального числа відповідних до запиту документів у збірці. Загальне число відповідних до запиту документів завжди є невідомим і може бути встановлене лише при повному перегляді збірки людиною. Крім того, роботу пошукових систем оцінюють швидкодією - часом, за який отримують список відповідних до запиту документів.

Класифікація ІПС

Інформаційно-пошукові системи (ІПС) − це різновид автоматизованих інформаційних систем, в яких завершальна обробка даних не передбачається.

Ці системи призначені для пошуку текстів (документів, їх частин, фактографічних записів) у сховищах (базах даних) за

67

ПосібникДІСНаливайко

формальними характеристиками.

За першою ознакою ІПС діляться на документальні,

фактографічні, логічні і комплексні.

Документальні ІПС на інформаційні запити видають адреси зберігання пошукових образів, оригінали і копії документів з необхідною інформацією.

Фактографічні ІПС у відповідь на введені в них інформаційні запити безпосередньо видають відповідні фактичні дані (структурний склад, формули, характеристики матеріалів і т.п.).

Логічні ІПС видають на запит не лише введену раніше інформацію, але, якщо необхідно, виконують логічну переробку цієї інформації для одержання нової, що явно в систему не вводилась.

Комплексні ІПС містять сукупність елементів документальних, фактографічних і логічних ІПС.

За режимом пошуку ІПС діляться на системи:

-ті, що працюють в режимі вибіркового розподілу інформації, тобто за постійними інформаційними запитами в масивах постійно поповнюваних документів;

-ретроспективного пошуку за разовими змінними запитами абонентів з пошуком документів з даної тематики в масивах.

За типом інформаційно-пошукової мови ІПС класифікуються на системи з природними (людськими) і інформаційними мовами. Інформаційно-пошукові мови − це синтетично створені мови для ідентифікації і пошуку документів за запитом (наприклад, дескрипторна мова).

За критерієм відповідності, тобто сукупністю правил визначення ступеня формальної відповідності між ПОД (ПОД − виражений у термінах мови ІПС основний зміст документа, що займає значно менше машинної пам‘яті від повного змісту документа) і пошуковим розпорядженням ПР (ПР − виражений у термінах ІПС пошуковий запит), ІПС поділяються на системи з використанням логічних схем (І, ЧИ, НЕ); з використанням аналітичних функцій (статистичні і векторні критерії); з використанням «вагових» функцій чи коефіцієнтів; з аналізом критерію відповідності на збіг чи часткове входження (пошукового розпорядження в ПОД).

За ступенем автоматизації ІПС класифікуються на системи:

68

Автоматизована пошукова система - on- line-служба (програмноапаратний комплекс з webінтерфейсом), що надає можливість пошуку інформації в Інтернеті.

ПосібникДІСНаливайко

-з автоматичною класифікацією масивів (формування в ПОД породження класів за мітками, на основі асоціативних зв‘язків між термінами в ПОД);

-з автоматичним пошуком для сортування і порівняння ПОД з пошуковим розпорядженням;

-з автоматичним індексуванням для автоматизації процесів згортання при реферуванні, анотуванні, виборі ключових слів та ін.;

-з автоматичною видачею різновидів інформації

(бібліографічних описів, ПОД, копій документів);

-системи з автоматичним управлінням (при наявності зворотного зв‘язку і зміни режимів пошуку в ІПС).

Автоматизовані інформаційно-пошукові системи

У просторіччі під пошуковою системою розуміють web-сайт, на котрому розміщено інтерфейс (фронт-енд) системи. Програмною частиною пошукової системи є

пошукова машина (пошуковий рушій) - комплекс програм, що забезпечує функціональність

пошукової системи і, зазвичай, є комерційною таємницею компанії-розробника пошукової системи.

Більшість пошукових систем шукають інформацію на сайтах Всесвітньої мережі, але існують також системи, здатні шукати файли на ftp-серверах, товари в інтернет-магазинах, а також інформацію в групах новин Usenet.

Індексація в пошукових системах сайтів здійснюється пошуковим роботом.

Автоматизовані системи ІП використовують для зменшення так званого «інформаційного перевантаження».

Багато користувачів, університетів та публічних бібліотек використовують системи ІП для полегшення доступу до книжок, журналів та інших документів.

Найвідомішим прикладом систем ІП можна назвати пошукові системи в Інтернеті.

69

ПосібникДІСНаливайко

Методи і засоби організації пошуку в АІПС

У роботі ІПС можна виділити два основних етапи:

-перший − збір і зберігання інформації;

-другий − пошук і видача інформації користувачам.

ІПС відрізняються одна від одної за багатьма ознаками, але при вирішенні задач збору, зберігання і видачі інформації ІПС мають такі спільні процедури:

-аналіз документів та їх добір;

-створення пошукового образу документів (ПОД);

-запис документів та їх пошукових образів на прийняті носії;

-зберігання документів і ПОД;

-аналіз запитів;

-видача документів користувачам.

Як уже зазначалося, на основі ІПМ використовують два основних режими чи методи організації пошуку:

-з вибірковим розподілом інформації;

-з ретроспективним пошуком.

При цьому застосовують різні мовні засоби, залежно від категорії користувачів і можливостей мов.

В ІПС використовують мови:

-що забезпечують тільки можливості запитів, тобто виведення даних на екран чи друк в необхідному форматі;

-комплексні мови запитів-обновлень, що як більш розвинені мови дозволяють формулювати запити, які стосуються декількох взаємозв‘язаних записів і дозволяють поновляти дані так же легко, як і формулювати запити;

-генератори звітів, що дозволяють вибирати необхідні дані і форматувати їх у вигляді потрібних форм документів;

-графічні мови, що дозволяють виводити інформацію у вигляді різних графіків і діаграм та інших зображувальних засобів.

При створенні ІПС неминуче виникає потреба у створенні тезаурусу системи, тобто набору спеціальних термінів для кодування понять та зв‘язків між ними.

Тезаурус дозволяє виражати зміст документів та запитів формалізованою інформаційною мовою.

Найбільш поширеними в сучасних АІПС є тезауруси з використанням мов дескрипторного типу, на відміну від тезаурусів

70

ПосібникДІСНаливайко

з мовами класифікаційного типу, що використовуються, наприклад, в бібліотечно-бібліографічній класифікації з фіксованим обмеженим списком слів і словосполучень.

Дескрипторами можуть бути окремі слова або словосполучення із групи синонімічних чи близьких за значенням слів, що використовуються в системі для контрольованого індексування (кодування) змісту документів і запитів встановленням відповідності між текстом документа і набором ключових дескрипторів.

Структура АІПС

Цілі і задачі користувачів Структуру людино-

машинної ІПС можна подати у

вигляді схеми (рис. 22).

Потреби Рішення

 

 

 

Творці та користувачі інформації

 

 

 

Рис. 22. Схема

 

 

 

людино-машинного

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

інформаційного пошуку

 

 

 

Запити і

Відповіді

 

 

 

 

 

 

 

 

 

 

документи

 

 

Кожна

ІПС

має загальну

 

 

 

 

 

 

 

 

 

 

 

 

функціонально-структурну

 

 

 

 

Інформаційний пошук

схему,

якою

визначаються

 

 

 

 

усі процеси, що відбуваються

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

з документами (рис. 23).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Привласне

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ння адреси

 

Сховище

 

 

 

Індексуван

 

ЗАПИТ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

документа

 

документ

 

 

 

ня запиту

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Аналіз

 

 

 

 

Індексуван

 

Сховище

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ня

 

 

 

 

Порівнянн

 

 

 

 

документа

 

 

 

документа

 

ПОД

 

 

 

 

я

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сховище

 

 

 

 

 

ВІДПОВІ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Документи

 

 

 

 

Аналіз

 

 

 

 

Підготовк

 

 

 

 

 

 

 

 

 

 

 

 

 

 

документа

 

копій

 

 

 

а відповіді

 

ДЬ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 23. Загальна функціонально-структурна схема ІПС

71

ПосібникДІСНаливайко

На вході в систему документи, що надходять, аналізуються і відбираються. Їм і їх копіям присвоюються адреси, за якими вони надсилаються на зберігання. Крім того, на відібрані документи складаються їх пошукові образи (ПОД) (переважно вручну), що направляються в сховище ПОД.

Створення ПОД полягає в семантичному аналізі основного змісту документа та описі його мовою ІПС.

Процес створення ПОД і ПР ще називають індексуванням. Документи, їх копії і пошукові образи не тільки знаходяться в

різних сховищах, але можуть розміщуватися і на різних носіях (паперових, магнітних, оптичних і т. ін.).

У сучасних ІПС копії документів і їх ПОД переважно розміщуються на магнітних і лазерних носіях у відповідних базах даних. Видозмінюються в конкретних умовах і принципи роботи ІПС.

Класифікація АІПС за основними ознаками

ІПС можна класифікувати за такими ознаками:

-принципом дії;

-принципами організації;

-родом виконуваних операцій;

-режимом пошуку;

-типом інформаційно-пошукової мови (ІПМ);

-типом критерію відповідності;

-ступенем автоматизації.

За принципом дії :

1.Пошукові каталоги.

2.Рейтингові системи.

3.Індексні бази даних.

За принципами організації:

1.Професійні системи.

2.Системи агрегатори.

3.Автономні інформаційно-пошукові системи (бази даних).

4.АІПС наукових видань.

5.Електронні бібліотеки наукових товариств.

6.Репозитарії бібліотечних консорціумів та університетів, а також системи, які підтримують концепцію відкритого доступу до інформації.

72

ПосібникДІСНаливайко

7.Бібліотечні ІПС, web-портали бібліотек, інформаційних центрів та організацій.

8.Спеціалізовані системи пошуку інформації в Інтернеті.

Професійні системи:

-об‘єднують велику кількість баз даних різного типу;

-пропонують широкий спектр послуг і велику кількість окремих інформаційних продуктів;

-детально документовані;

-мають міцні пошукові функції, вбудовані можливості інформаційно-пошукових мов командного типу;

-пропонують вбудовані функції статистичного аналізу: можливості аналітичної, бібліометричної и статистичної обробки інформаційно-пошукового масиву документів;

-мають засоби організації процедур інформаційно-пошукового пошуку і протоколювання сесій роботи із системою;

-мають власні системи доставки електронних документів і пропонують можливість надати будь-який документ у повному тексті;

-є платними і пропонують користувачам декілька фінансових моделей оплати послуг;

-робота з такими системами потребує високого рівня професійної підготовки в області інформаційного пошуку.

Представники:

-DIALOG-DataStar;

-STN International;

-Questel-Orbit;

-Lexis-Nexis® та ін.

Українські представники

-АТ «Центр економічних комп'ютерних програм ФОЛИО»;

-ИНФО-Бухгалтер; ТОО «Информатик»;

-Інфін-бухгалтерія; Аудиторська компанія «Інфін»;

-Суперменджер; Фірма «Ланкс»;

-AUBI; Фірма «Острім»;

-ABACUS; АТ «ОМЕГА».

-1С Бухгалтерія.

Системи агрегатори:

-пропонують доступ до колекцій електронних публікацій різних видавців у рамках єдиного пошукового інтерфейсу із

73

ПосібникДІСНаливайко

застосуванням власних систем індексування та електронних тезаурусів;

-завжди пропонують повний перелік доступних видань із зазначенням доступних номерів, ембарго-періоду, наявності та формату повного тексту публікації;

-пошук можливий за ключовими словами, за автором, назвою джерела, датою публікації та іншими інформаційними полями, як правило, є дещо обмеженим порівняно з професійними системами;

-простий пошуковий інтерфейс є інтуїтивно зрозумілим;

-не потребують спеціальної професійної підготовки в області інформаційного пошуку;

-доступ здійснюється на платній основі за передплатою;

-є можливість підписки на обрані колекції в межах однієї

системи.

Представники:

-EBSCOhost®;

-ProQuest;

-Gale;

-EastView та ін.

Автономні інформаційно-пошукові системи (бази даних):

-окремий інформаційний продукт − база даних;

-автономний пошуковий web-інтерфейс;

-може бути предметно-орієнтована чи полі тематична;

-як правило, реферативно-бібліографічна або фактографічна база даних;

-мають потужні пошукові функції;

-вбудовані електронні тезауруси та предметні покажчики;

-пропонують вбудовані функції статистичного аналізу: можливості аналітичної, бібліометричної та статистичної обробки інформаційно-пошукового масиву документів;

-переважно потребують оплати за використання.

Представники:

-Scopus;

-Web of Science ®;

-Inspec;

-Embase та ін.

АІПС наукових видань:

74

ПосібникДІСНаливайко

-пропонують доступ тільки до своїх видань;

-часто доступні архіви з першого номера журналу;

-як правило, можливий безплатний пошук з отриманням бібліографічно-реферативного опису публікації, ;

-отримання повного тексту статті потребує або разової оплати, або угоди про передплату доступу;

-з рекламною метою окремі номери журналів або окремі статті пропонуються у вільному доступі;

-особливістю подібних систем є наявність ще не опублікованих статей, тобто статей запланованих до публікації

(prepublishing);

-відсутність ембарго-періоду.

Представники:

-Elsevier;

-Springer;

-Blackwell;

-Kluver;

-Taylor & Francis;

-Wiley;

-Cambridge University Press;

-Oxford University Press та ін.

Електронні бібліотеки наукових товариств:

-подібні до пошукових систем видавництв наукової періодики;

-передбачають окрему систему послуг та умов доступу для членів наукового товариства;

-у рамках таких систем поєднуються видання різних видавцівпартнерів наукових товариств;

-крім періодичних видань присутні збірки електронних

публікацій матеріалів конференцій, симпозіумів, семінарів тощо.

Представники:

-IEEE Xplore Digital Library;

-АCM (Association for Computing Machinery).

Репозитарії бібліотечних консорціумів та університетів, а також системи, які підтримують концепцію відкритого доступу до інформації:

75

ПосібникДІСНаливайко

-як інформаційно-пошукові системи пропонують доступ до повних текстів різноманітних видів електронних публікацій, а саме:

опубліковані в наукових періодичних виданнях статті;

препринти;

огляди;

матеріали презентацій;

тексти лекцій;

методичні видання;

звіти про наукові дослідження;

автореферати дисертацій;

інші види документів.

-діяльність таких систем відповідає принципам міжнародної ініціативи відкритого доступу до інформації;

-переважна більшість матеріалів розміщена в таких архівах авторами добровільно;

-пошук та отримання документів здійснюється безплатно;

-важливою ознакою цінності подібних систем є визначення організаційної бази, що забезпечує її функціонування протягом тривалого часу (університет, наукова установа, громадське об‘єднання тощо) ;

-існують інституційні репозитарії, які поєднують публікації авторів не за організаційною приналежністю, а за тематикою діяльності чи досліджень;

-кількість таких систем зростає з кожним днем;

-існують спеціальні каталоги. які дають змогу ознайомитися з майже повним їх переліком на таких сайтах, як ROAR http://roar.eprints.org/index.php, проте це один з більше ніж 20

незалежних реєстрів репозитаріїв.

Представники:

-ArXiv.org;

-Organic;

-Eprint;

-CiteSeer.IST;

-DOAJ та ін.

Бібліотечні ІПС, web-портали бібліотек, інформаційних центрів та організацій:

-містять масиви документів, що є в колекції установи;

76

ПосібникДІСНаливайко

-мають значення для визначення наявності публікації в конкретному регіоні або установі;

-як правило, функціонально доповнюються системами замовлення та доставки копій документів на платній основі.

Представники:

-Бібліотека конгресу США (Library of Congress) – http://www.loc.org;

-Науково-технічна бібліотека Гановера - http://www.tib.unihannover.de/en/;

-Національна бібліотека ім. В. І. Вернадського − http://www.nbuv.gov.ua;

-Наукова бібліотека Національного університету «Києво-

Могилянська академія» − http://www.library.ukma.kiev.ua;

-Глобальна бібліотечна мережа WorldCat - www.worldcat.org.

Спеціалізовані системи пошуку інформації в Інтернет

-користувач обирає подібну систему виходячи з критеріїв результативності пошуку, зручності інтерфейсу тощо−

-немає достатньої інформації про принципи комплектування інформаційних ресурсів таких систем−

-безплатні представники цієї групи систем є, переважно, бетаверсіями (експериментальними версіями) −

-швидко змінюються−

-фрагментарно документовані−

-потребують періодичної переоцінки.

Представники:

-Scirus;

-PubMed;

-ScholarGoogle;

-Windows Live Academic Search;

-ScienceResearch.com;

-IngentaConnect;

-InfoTrieve та ін.

Інформаційно-пошукові системи в Інтернет

Цілеспрямований пошук у величезній кількості текстових документів неможливий без спеціалізованих пошукових систем, що можна розділити на дві групи: категоричні та iндексацiйнi.

77

ПосібникДІСНаливайко

Основу категоричних пошукових систем складають віртуальні бібліотеки, тобто web-сторінки, присвячені якійсь тематиці, зі стислим описом джерел інформації, та гіперпосилань на них. Зі зростанням кількості посилань на одній сторінці з'являється необхідність її поділу або, інакше кажучи, введення нових підтем або категорій. У результаті розвитку такої системи з'являється деревоподібна структура каталогів, підкаталогів тощо. Іноді всередині каталогу за певними критеріями відбираються кращі посилання за темою.

Убудь-якому випадку такими пошуковими системами найкраще користуватися при початковому, «широкому» ознайомленні за необхідною тематикою.

Удійсності ефективною пошукову систему може зробити тільки Ваш власний запит. Правило полягає в тому, щоб вибрати декілька слів або готові фрази, які зустрічаються обов'язково в потрібному Вам тексті, i задати ключові слова пошуковій системі для одночасного пошуку, тобто зв'язати їх функцією «i».

Після одержання списку посилань треба провести їх найпростіший аналіз перед тим, як робити подальші кроки. Якщо на екрані наводиться початковий текст документа, то аналізу необхідно піддати URL гіперпосилання.

Основні правила:

-адреси WWW з розширенням com належать комерційним організаціям i можливість вільного надання ресурсів, крім цін на продукцію i мінімальне ознайомлення, дуже невелика;

-довгі посилання найчастіше говорять про недовговічність ресурсу й непростий доступ до нього.

Основні критерії ефективності пошукової системи це:

-повнота відображення її бази в інформаційному полі, що змінюється дуже швидко;

-періодичність відновлення документів i можливість самостійного виявлення нових серверів;

-багатомовність пошукових систем iз урахуванням лінгвістичних особливостей.

З цих причин ідеальним повинне бути сполучення категоричних та індексаційних систем, наприклад, таких систем, як: Google − електронна адреса − рис. 24, Яндекс − електронна адреса − рис. 25, Мета − електронна адреса − рис. 26, Rambler − електронна адреса

78

ПосібникДІСНаливайко

− рис. 27, Апорт − електронна адреса − www.aport.ru; Openweb − електронна адреса −www.openweb.ru.

Рис. 24. (goohle.com.ua)

Рис. 25. (yandex.ua)

Рис. 26. (meta.ua)

Рис. 27. (rambler.ru)

Багатомовна пошукова система

Google − має величезні

можливості в галузі пошуку. Загальна кількість проіндексованих сторінок перевищує два мільярди. Добір документів можна проводити на більш ніж шістдесяти мовах.

Українські пошукові системи:

-uaport.net/ − загальний тематичний каталог містить близько 20 напрямів, регіональний − усі області України. Ресурси, які відносяться до найбільш популярних тем, згруповані в окремі розділи. Сильною стороною UAport є пошук новин - спеціальний робот декілька раз в день сканує сайти новин, що дозволяє отримувати свіжі новини із різних джерел;

-http://meta.ua − МЕТА здійснює пошук по українським серверам, а також серверам з українською тематикою у всьому світі. Область пошуку додатково обмежується однією або декількома регіональними підрубриками. Важлива унікальна особливість Мети - підтримка пошуку з урахуванням правопису української мови;

79

ПосібникДІСНаливайко

-http://www.uaport.net/UAcatalog/ − перевагою TopPing є нова мета-пошукова машина МетаPing, яка дозволяє виконувати пошук по декільком ІПС одночасно;

-http://www.goldbook.dp.ua/ - (Золота книга) − каталог каталогів,

пошукових та рейтингових систем України, РФ і країн СНД. Усього ресурс містить 259 каталогів;

-http://www.lotco.mksat.net/dir/www/links_directories_ukrainian_ru.html (Лот) −

посилання на основні каталоги ресурсів Інтернет України, країн СНД і міжнародні.

Метапошукова система для учнів та професорів

Метапошукова система PDF Science Search (PDFSS)

розташована на сайті «Хаос. Нелинейная динамика» http://chaos.in.ua/; забезпечує пошук PDF-файлів, які знаходяться на web-ресурсах в режимі відкритого доступу. Процедура пошуку побудована на використанні технологій провідних пошукових систем: Google, Яндекс, Рамблер.

Основна ідея системи − знайти прямі посилання лише на реальні, вільно доступні PDF-документи, не подразнюючи нервову систему користувача зайвими переходами на посилання на документи, які вимагають оплати, які пропонують зареєструватися або посилання на опис, а не на сам документ.

Цільова аудиторія системи PDFSS - школярі, студенти, аспіранти, інженери, викладачі, науковці. Система створена в

ElVisti.

Російські пошукові системи:

-http://www.rambler.ru/ − пошукова система містить інформацію про більш ніж 12 мільйонів документів, розташованих на серверах країн СНД і Росії.

Rambler опускає при пошуку стоп-слова: прийменники, частки, артиклі. Якщо ж ці елементи входять до складу фрази, то їх потрібно узяти в лапки;

-http://www.aport.ru/ − одна з кращих російськомовних пошукових систем. Перевагою Апорту є англо-російський і російсько-англійський переклад у режимі online запитів і пошуків результату, завдяки чому можна вести пошук у російських ресурсах Інтернет, навіть не знаючи російської мови.

80

ПосібникДІСНаливайко

-http://www.yandex.ru/ − найбільша пошукова машина російської частини Інтернет: кількість проіндексованих документів наближається до 56 млн. Пошук враховує усі форми слова за правилами російської мови, у тому числі відмінки і дієвідміни.

-http://animapoisk.narod.ru/ − Аnimapoisk. На цій сторінці подано список універсальних пошукових систем і каталогів, які не мають певної тематики. Сайти в таблиці розташовуються в порядку спадання індексу популярності − сукупного покажчика, що розраховується на основі індексу цитування даної системи іншими та її відвідуваністю.

Англомовні пошукові системи:

-http://www.yahoo.com/ − англомовна пошукова система має найбільш розвинену структуру каталогів і різних сервісів. Сотні тисяч різних Інтернет-ресурсів впорядковуються вручну за 14 основними рубриками, кожна з який має кілька підрубрик з більш вузькою тематикою;

-http://www.lycos.com/ − до складу Lycos входять величезна база даних з числом URL вище за 66 млн. Ця пошукова система (англомовна) містить різноманітну цікаву інформацію, у тому числі новини, огляди вузлів, посилання на популярні вузли, карти міст, а також засоби для пошуку адрес різних осіб і пошуку webзображень і звукових кліпів;

-http://www.altavista.com/ − англомовна пошукова система містить близько 550 млн. індексованих сторінок. Аlta Vista відрізняється потужними можливостями пошуку. Наприклад, можна відібрати тільки відеоролики, тільки звукові файли чи зображення. Якщо при написанні ключового слова користувач припустився граматичної помилки, портал підбирає схоже слово і видає за ним посилання;

-http://www.hotbot.com/ − це база даних, що містить близько 54 млн. документів, індексованих за новим текстом, і один з найбільш повних (англомовних) пошукових механізмів;

-http://www.infoseek.com/ − англомовна база даних пошукового механізму Infoseek складається з 1,5 млн. сторінок, індексованих за повним текстом. Відповіді впорядковуються по двох показниках: наскільки часто зустрічається на сторінці слово чи фраза, а також у якому місці;

81

ПосібникДІСНаливайко

-http://www.webcrawler.com/ − WebCrawler пропонує 15

категорій змісту, і, клацнувши мишею на одній з них, можна знайти кілька підкатегорій з короткими анотаціями англійською мовою безлічі цікавих вузлів. Можна відразу зв'язатися з одним з таких вузлів чи продовжити пошук вузлів, що містять інформацію з потрібної теми;

-http://www.excite.com/ − Excite вигідно відрізняється від інших пошукових вузлів тим, що дозволяє вести пошук англійською мовою в службах новин і публікує огляди web-сторінок. База даних цього вузла складається з більш ніж 50 млн. сторінок з індексацією за повним текстом.

Ноу-хау в Українському просторі інформаційно-пошукових систем

В українському сегменті Інтернету з'явилась нова пошукова система «Шукалка», створена з абсолютного «нуля» в Україні українськими програмістами та дизайнерами. Вона докорінно змінює філософію пошуку та бачення на пошукові системи. Це легка сучасна та досконала пошукова система з орієнтиром на національний сегмент Інтернету. Проект «Я Обираю Українське» став офіційним партнером нової пошукової системи «Шукалка»

(рис. 28).

Рис. 28. Головна сторінка ІПС «Шукалка» «Шукалка» − українська пошукова система. В основу проекту

лягла ідея пошукової системи, яка відповідала б усім сучасним вимогам, а також могла називатися «українською національною пошуковою системою».

82

ПосібникДІСНаливайко

Ідея проекту − це не просто створення рядової пошукової системи, як Яндекс і Google, а набагато більше – створення пошукової системи, яка б презентувала Україну в області інтернеттехнологій з кращого боку.

Ідея створення проекту «Шукалка» з'явилася з того, що у нашої країни немає своєї національної пошукової системи, яка могла б гідно її представляти на IT-ринку.

Протягом розробки доводилося стикатися з різними труднощами здебільшого технічного характеру; на щастя, вони вже позаду, тому в принципі згадувати вже особливо нічого.

Головною відмінністю пошукового проекту "Шукалка" від

інших пошукових систем є те, що вона повністю розроблена в Україні і являється першою в світі соціально відповідальною пошуковою системою, що стосується технічних переваг, наприклад, голосового пошуку або пошуку по твітеру.

«Шукалка» − це соціально-орієнтована пошукова система, яка буде передавати 30% свого прибутку в дитячі будинки України, підтверджуючи що вона створена для України і українського народу.

Головна ідея − це створення безпрецедентної пошукової системи, в якій користувачі самі будуть зацікавлені, тому що вона, в свою чергу, працює на них і на майбутнє нашої країни.

Подальший розвиток проекту − вийти у майбутньому на лідируючі позиції на вітчизняному ринку, створення центру розвитку інтернет-технологій.

Огляд АІПС державних установ України

Назва АІПС

Адміністратор

 

Абоненти

Інтегрована інформаційно-

Адміністрація

 

Адміністрація

телекомунікаційна система «Гарт»

державної

 

державної прикордонної

 

прикордонної

 

служби України та інші

 

служби України

 

установи

Єдиний інтегрований

Мінфін

 

 

інформаційно-аналітичний центр

 

 

 

на базі інформаційних ресурсів

 

 

 

Мінфіну, Державної податкової

 

 

 

адміністрації, Держмитслужби,

 

 

 

Державного казначейства,

 

 

 

Мінекономіки, МВС,

 

 

 

Національного банку

 

 

 

 

 

83

ПосібникДІСНаливайко

Автоматизовані інформаційно-

 

 

пошукові системи (АІПС) УДАІ

УДАІ ГУ-УМВС

ДАІ

ГУ-УМВС:

 

 

- АІПС «Адмінпрактика» (облік

 

 

порушень Правил дорожнього

 

 

руху)

 

 

- АІПС «ДТП» (облік та аналіз

 

 

дорожньо-транспортних пригод)

 

 

- АІПС «Водій» (облік результатів

 

 

складання іспитів на право

 

 

керування транспортних засобів та

 

 

виданих посвідчень водія)

 

 

- АІПС «Дорога» (облік та

 

 

опрацювання інформації про стан

 

 

доріг та їх обладнання)

 

 

- АІПС «Спецвантаж» (облік

 

 

маршрутів перевезення

 

 

небезпечних, великовагових та

 

 

великогабаритних вантажів)

 

 

- АІПС "ОКА" - забезпечення

 

 

обліку бланків довідок-рахунків,

 

 

актів прийому-передачі

 

 

транспортних засобів, номерних

 

 

знаків для разових поїздок

 

 

«Транзит», контролю їх

 

 

використання суб‘єктами

 

 

господарювання. Дана система -

 

 

мережа закритого типу, що поєднує

 

 

в собі web-інтерфейс для

 

 

службового використання, АРМи

 

 

для посадових осіб та користувачів

 

 

суб'єктів господарювання. Доступ

 

 

до системи можливий за умови

 

 

наявності електронного цифрового

 

 

підпису

 

 

Інтегрована інформаційно-

 

 

пошукова система «Армор»

 

 

Інформаційні підсистеми:

 

 

- АІС «Особа»;

 

Органи та підрозділи

- АІС «Дактилоскопічні обліки»;

МВС

Міністерства

 

 

внутрішніх справ

- АІС «Нерозкриті злочини»;

 

 

України

Система «АРМОР» (об‘єднує 19

 

 

 

комп‘ютерних інформаційних

 

 

підсистем.

 

 

84