Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Міжнародна інформація.doc
Скачиваний:
25
Добавлен:
17.11.2018
Размер:
1.88 Mб
Скачать

3.22. Пошук інформації в Інтернеті

Обсяги і темпи росту Веб-ресурсів вражають уяву. Швид­кий і інтенсивний розвиток Інтернету породив ряд пара­доксів, основний з яких такий: експонентний ріст обсягів інформації в Інтернеті приводить одночасно і до ускладнення пошуку дійсно необхідної інформації, і все більшої актуаль­ності цього процесу. Іншими словами, даних усе більше, а знайти їх все складніше.

Зараз навіть за самих витончених методів побудови пошу­кових запросів могутні пошукові системи видають часом сотні, а іноді і тисячі посилань. У цих випадках високий рівень інформаційного «шуму» (тобто документів, формально реле-вантних, але не відповідних інформаційним потребам користу­вача) знижує ефективність наявних механізмів пошуку.

Цілком резонно виникає питання, як конкретному кори­стувачу знайти і відібрати в мережі необхідні дані?

Існує кілька тактичних підходів.

Перший з них умовно називається «серфінгом».

Зачепивши одну з Веб-сторінок, адреса якої була відома, можна пройти по посиланням з цієї сторінки на будь-яку глибину, намагаючись задовольнити свої інформаційні по­треби. Варіант досить розповсюджений, однак його навряд чи можна вважати оптимальним.

Другий підхід, прийнято називати «браузингом».

Це розширення серфінгу в тім сенсі, що користувач ви­користовує Інтернет каталог, як стартову сторінку, тобто один з Веб-серверів, на якому представлена класифікація мережевих ресурсів і знаходяться відповідні гіпертекс-тові посилання.

Третій підхід складається у використанні мережевих інформаційно-пошукових систем.

Інформаційно-пошуковою системою називається про­грама, що дозволяє швидко знайти потрібну інформацію в базі даних.

У цьому випадку користувач може самостійно з клавіату­ри свого комп'ютера вводити запити в інтерактивному ре­жимі, аналізувати результати пошуку, здійснювати перехо­ди до необхідних ресурсів.

Саме третій підхід, тобто виявлення необхідних відомо­стей в Інтернеті за допомогою спеціальних пошукових за­собів, найкращий для знаходження необхідних даних у мережі. У рамках цього підходу для запобігання інфор­маційного шуму широке поширення одержала практика зву­ження області пошуку до деякого прийнятного рівня шляхом підключення різних фільтрів на стадії побудови запиту. З цією метою, як правило, використовуються багаторівневі те­матичні класифікатори. Деякі системи дозволяють користу­вачеві задавати додаткові параметри — діапазони дат доку­ментів, доменні імена посилань і т. і. За установки такого ро­ду фільтрів, пошук здійснюється на підмножині документів, що задовольняють заданим умовам. Як і за другого підходу (але не так явно), проблема полягає в тому, що класифікатори будуються розробниками пошукових систем, відповідно до їх суб'єктивних представлень про приналежність конкретного документа до певної рубрики, що далеко не завжди збігається з представленнями користз'вача.

3.23. Запит для інформаційно-пошукових систем

При виконанні пошуку в Інтернеті центральним завдан­ням користувача є побудова запиту.

1.  Практично у всіх інформаційно-пошукових системах застосовується метод ключових слів. А саме, відбираються документи, що містять (або ж не містять) слова, зазначені в запиті, або їх визначені сполучення. При цьому найчастіше практично неможливо зафіксувати семантичні характеристики документа, але саме вони, у кінцевому рахунку, визна­чають його істінну релевантність. Наприклад, у документі, присвяченому шаховій темі, саме слово «шахи» може бути відсутнім, зате воно може фігурувати як метафора в політичному  памфлеті.   Навіть  проблема  синонімів  (з  погляду комп'ютера  «футболіст»  і  «гравець у футбол»  є різними інформаційними елементами) ефективно вирішується далеко не у всіх інформаційно-пошукових системах. У той же час, за запитом «коза» користувач цілком може одержати посилання з зоології, з сільського господарства, з історії мафії («Коза Ностра»), а також на роман Д. Дефо «Робінзон Крузо» у повному обсязі.

2. Крім проблеми інформаційного шуму, важливу роль у технології пошуку відіграє повнота інформації.

Практика показує, що за допомогою однієї пошукової си­стеми можна знайти не більш третини розміщених у Веб-про-сторі документів. Причому, як це на перший погляд не пара­доксально, російський і український сегменти Веб-простору представлені на пошукових серверах значно повніше, що по­яснюється їх відносно невеликими інформаційними обсяга­ми і наповненням.