Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пушкар_Сібілєв_Метод. рек. до лаб. раб._Вступ д...doc
Скачиваний:
28
Добавлен:
11.11.2019
Размер:
2.01 Mб
Скачать

Лабораторна робота №2 Робота в глобальній мережі Інтернет. Основи пошуку інформації

Мета роботи – придбання навичок пошуку інформації в глобальній мережі Інтернет.

Дане лабораторне заняття забезпечує напрацювання таких умінь:

здійснювати роботу в глобальній мережі Інтернет;

проводити пошук інформації;

здійснювати добір інформації відповідно до теми навчального проекту.

Указані вміння надають можливість вирішення наступних задач:

здійснення пошуку інформації відповідно до заданих критеріїв;

використання різноманітних засобів пошуку інформації з використанням спеціалізованих пошукових систем;

обґрунтування вибору інформації відповідно до поставленої практичної задачі.

Хід роботи.

1. Знайомство з основами теорії пошукових систем.

Пошук інформації – завдання, що людство вирішує вже багато століть. По мірі зростання обсягу інформаційних ресурсів, потенційно доступній одній людині, були вироблені все більш досконалі пошукові засоби й прийоми, що дозволяють знайти необхідний документ. Всі знайдені за багато років засоби й прийоми пошуку інформації є доступними та ефективними й при пошуку інформації в Інтернет. Бібліотеки використовують, в основному, три види каталогів: алфавітні, систематичні й предметні. Інформаційно-пошукові системи (ІПС) Інтернет, при всій їх зовнішній розмаїтості, також попадають в один із цих класів.

У загальному випадку автор створює документ. А у людини, що шукає інформацію, виникає інформаційна потреба:

Інформаційна потреба часто не може бути точно виражена словами, і виражається тільки в оцінці документів, що переглядаються – підходить або не підходить. В теорії інформаційного пошуку замість слова «підходить» використовують термін «пертинентний документ», а замість «не підходить» – «не пертинентний» (від англійського «pertinent» - «відноситься до справи, підходить по суті»). Суб'єктивна мета інформаційного пошуку – знайти всі пертинентні й тільки пертинентні документи.

Але ця мета є недосяжною. Людина часто може оцінити пертинентність документа тільки в порівнянні з іншими документами. Ці документи називаються «шум». Занадто великий шум ускладнює виділення пертинентних документів, занадто малий – не дає впевненості в тому, що знайдено достатню кількість пертинентних документів. Практика показує, що коли кількість непертинентних документів лежить в інтервалі від 10% до 30%, людина, що здійснює пошук, почуває себе комфортно, не гублячись у морі шуму й вважає, що кількість знайдених документів є задовільною.

Коли документів багато, використовується інформаційно-пошукова система (ІПС). У цьому випадку інформаційна потреба повинна бути виражена засобами, які «розуміє» ІПС – повинен бути сформульований запит.

Запит рідко може точно виразити інформаційну потребу. Однак багато ІПС з різних причин не можуть визначити, чи відповідає той або інший документ запиту. Ступінь відповідності документа запиту називається релевантністю. Релевантний документ може виявитися непертинентним і навпаки.

2. Вивчення видів інформаційно-пошукових систем.

Класифікаційні інформаційно-пошукові системи

У класифікаційних ІПС використовується ієрархічна (деревоподібна) організація інформації, що називається класифікатором. Розділи класифікатора називаються рубриками. Класифікатор розробляється й удосконалюється колективом авторів. Потім його використовує інший колектив фахівців, що називаються систематизаторами. Систематизатори, знаючи класифікатор, читають документи й приписують їм класифікаційні індекси, що вказують, яким розділам класифікатора ці документи відповідають.

Класичний приклад класифікаційної ІПС – Yahoo (www.yahoo.com). Класифікаційні ІПС мають ряд специфічних недоліків. Сама розробка класифікатора пов'язана з оцінкою відносної важливості різних областей людської діяльності. Наприклад, порівнюючи класифікатори багатьох ІПС Інтернет (таких, як Yahoo, Excite, Look Smart), можна помітити, що в багатьох з них немає розділу «Наука». Будь-яка оцінка є соціальною дією; вона пов'язана з суспільством, культурою, соціальною групою, до яких належить людина, що виносить оцінку. Тому класифікатори, створені різними колективами в різних країнах, можуть мати досить різний ступінь корисності пошуку інформації – все залежить від того, хто й що шукає.

Таким чином, при здійсненні пошуку інформації за допомогою класифікаційних ІПС виникає необхідність взаємодії з іншими культурами – культурами авторів, творців класифікаторів і систематизаторів.

Бібліографи, розуміючи, що читачі не завжди глибоко вивчають класифікації, покладені в основу систематичних каталогів, виробили два прийоми, що полегшують життя читачам. Ці прийоми звуться «відсилання» і «посилання», і обидва вони застосовуються розробниками класифікаційних ІПС в Інтернет.

Ці прийоми використовуються в ситуації, коли документ може бути віднесений до одного з декількох розділів класифікатора, а особа, що здійснює пошук (пошуковик), може не знати, до якого саме розділу.

Відсилання використовується тоді, коли творці класифікатора й систематизатори можуть прийняти чітке рішення про віднесення документа до одного з розділів класифікатора, а пошуковик з певною ймовірністю в пошуках цього документа прийде в інший розділ. Тоді в цьому іншому розділі міститься відсилання («Див.») у той розділ класифікатора, у якому дійсно розміщена інформація про документи даного типу.

Наприклад, інформація про карти країн може бути розміщена в розділах «Наука-Географія-Країна», «Економіка-Географія-Країна» або «Довідники-Карти-Країна». Приймається рішення, що карти країн містяться в другий розділ – «Економіка-Географія-Країна»; тоді в інші два розділи вставляють відсилання на нього. Цей прийом активно використовується в ІПС Yahoo (знаком @).

Посилання («Див. також») використовується в менш однозначній ситуації, коли навіть творці класифікатора й систематизатори не в змозі прийняти чітке рішення про віднесення документів до певного розділу класифікатора. В ІПС Інтернет посилання приймає різноманітні форми («Relevant servers», «Схожі документи» і т.п.).

Класифікаційних ІПС в Інтернет багато. Великі класифікаційні ІПС (американська Yahoo, європейська Yellow Web, російські Созвездие Интернет та Ау) використовують допоміжні словникові ІПС по власних рубриках. Інші класифікаційні ІПС просто існують разом з ІПС словникового типу (Excite, Lycos, Infoseek).

Словникові інформаційно-пошукові системи

Культурні проблеми, пов'язані з використанням класифікаційних ІПС, привели до створення ІПС словникового типу, з узагальненою англомовною назвою search engines. Основна ідея словникової ІПС – створити словник зі слів, що зустрічаються в документах Інтернет, у якому для кожного слова буде зберігатися список документів, з яких узяте дане слово. Якщо пошук слів у такому словнику виконується швидко, то можна відмовитися від послуг розробників класифікаторів і від послуг систематизаторів, залишаючись один на один з авторами документів.

Незважаючи на безліч слів (і словоформ) у природних мовах, більшість із них уживаються нечасто, що було замічено вченим лінгвістом Ципфом ще наприкінці 40-х років минулого століття. До того ж найбільш уживані слова – це сполучники, прийменники й артиклі, тобто слова, зовсім непотрібні при пошуку інформації. В результаті словник самої великої словникової ІПС Інтернет, Alta Vista, має обсяг лише декілька Гбайт.

Оскільки слова в словнику впорядковані, пошук потрібного слова може виконуватися досить швидко та без послідовного перегляду. А наявність списків документів, у яких зустрічається таке слово, дозволяє ІПС виконувати операції з цими списками – злиття, перетинання або вирахування.

Web-кільця: предметні інформаційно-пошукові системи

Предметна ІПС з точки зору користувача побудована найбільш просто. Шукайте назву потрібного предмета свого інтересу (предметом може бути й щось нематеріальне, наприклад, індійська музика), а з назвою зв'язані списки відповідних ресурсів Інтернет. Це було б особливо зручно, якщо повний перелік предметів був би невеликим.

Так воно й було якийсь час назад. Web-майстри, що займаються одним предметом, почали ставити на своїх серверах посилання на сервери колег, створюючи кільцеві структури посилань:

У червні 1995 р. з'явився сервер www.webring.org, що об’єднав декілька кілець. На даний час на цьому сервері «присутні» більше 46 тис. кілець, які в цілому включають більше півмільйона серверів, тобто середній розмір кільця становить близько 12 серверів. Є, однак, і кільця-гіганти, що містять тисячі серверів. Учасники таких кілець використовують не тільки двосторонні посилання (як показано на малюнку), але й посилання «через сервер» і випадкові посилання, що генеруються програмним образом.

Зрозуміло, що знайти потрібний предмет інтересу тепер непросто. У свою чергу, www.webring.org обзавівся власними допоміжними ІПС – класифікаційною й словниковою, що допомагають знайти назву предмета.

3. Знайомство зі стратегіями інформаційного пошуку.

Дати загальну рекомендацію ефективної стратегії пошуку інформації в Інтернет практично неможливо. Є лише деякі принципи, що дозволяють витрачати менше часу.

Розглянемо наступний приклад. Якщо вам необхідно довідатися, де росте деревоподібна чорниця, то навряд чи ви підете в алфавітний каталог бібліотеки. Можливо, ви знайдете потрібну літературу за допомогою систематичного каталогу. З трохи більшою ймовірністю – за допомогою предметного. Але, швидше за все, жоден з бібліотечних каталогів вам не допоможе. Але якщо ви зайдете в інформаційно-бібліографічний відділ великої бібліотеки, і черговий бібліограф дістане бібліографічний покажчик по чагарничках або якусь схожу книжицю, з якої ви ймовірно й знайдете відповідь на своє питання.

Подібну стратегію можна з успіхом застосовувати і в Інтернет. В ІПС загального призначення можна потонути в тисячах посилань, виданих вам на простий запит. Метою використання універсальної ІПС загального призначення може бути пошук спеціалізованої ІПС, що присвячена тематиці вашого пошуку. Така ІПС може бути розпізнана по наявності слів «інформація (information)», «документ (document)» і т.п. у документах, знайдених за допомогою універсальної ІПС. Але часто спеціалізована ІПС може ховатися на сервері суспільної, професійної або спеціалізованої організації, видавництва.

Іноді доводиться розшукувати кілька інформаційних систем з усе більш вузькою тематикою. Наприклад, при пошуку інформації про продаж судів-суховантажів (з англійської – bulker) запит в Alta Vista (простий пошук):

+bulker* +sale*

дає нульовий результат; запит:

+ship* +sale*

дає тисячі посилань на сторінки, присвячені продажам катерів і яхт. Уважне вивчення декількох перших сторінок списку результатів пошуку показало, що в знайдених текстах часто присутнє слово «marine (морський)». І тут можна згадати, що в англійській мові є слово "maritime", що означає «все морське». Запит:

+maritime +information*

уже серед перших десяти посилань містив посилання на розташовану на www.GeoCities.com інформаційну систему по морській тематиці. Але й у ній інформації про продаж суховантажів не було. Зате була інформація про відправлення суховантажів з портів світу, що включає відомості про власників судів. Багато хто з фірм-власників судів мали у своїй назві слова «ship brokers (торговці судами)». Запит в Alta Vista:

+ship* +broker*

дав величезний список сторінок, серед яких була одна з уже знайомою адресою – www.GeoCities.com. Виявляється, існує спеціалізована ІПС по торговцях судами! Другий знайдений за допомогою такої ІПС торговець містив web-сервер, на якому найшовся підходящий суховантаж.

Цей приклад ілюструє ще один елемент стратегії: читайте знайдені документи в пошуках найбільш точних термінів і зв'язків між термінами. Можливо, ви мислите в зовсім не тих термінах, які використовують автори документів, які ви намагаєтесь знайти (пам’ятайте про культурні розходження).

Третій елемент стратегії: використовуйте декілька ІПС. Якщо ви регулярно займаєтеся пошуком інформації з якоїсь тематики, відзначте ті ІПС, які для вас виявилися найбільш ефективними.

4. Здійсніть пошук за рубрикатором (Yandex) наступної інформації:

1. У категорії «Освіта» знайдіть інформацію про університети міста Харкова.

2. Визначте, які з університетів міста Харкова носять звання «національного».

3. Визначте вищі навчальні заклади на Україні (у країнах СНД), які готують фахівців напряму «Видавничо-поліграфічна справа» або близьких до них спеціальностей.

5. Проведіть пошук інформації за ключовими словами.

Запустіть програму Internet Explorer, у рядку URL-адреса наберіть www.yandex.ru (www.rambler.ru, www.google.ru – або адресу будь-якого іншого пошукового сайту за вашим вибором).

Які місце й дата народження В.Ф. Януковича – президента України?

У якому році була написана картина Айвазовського «Море. Коктебельская бухта»?

Справжнє прізвище Кира Буличева.

У якому році й де народився Мішель Нострадамус?

Назвати режисера фільму «Фредди мертв: последний кошмар» і рік виходу стрічки.

Засновники фірми Honda й рік її створення.

Назвати видавця й розробника гри «Брати пілоти» («Братья пилоты»).

Який король правил Францією під час походу Жанни Д'арк на Орлеан?

Коли й де народився Дж. Р. Толкієн – англійський письменник?

Коли й де народився Володимир Висоцький?

Коли й де відбулися перші закордонні гастролі групи Beatles?

Яка основна область діяльності а) редактора, б) верстальника поліграфічного видання (виключіть пошук вакансій)

Які рішення запропоновані фірмами FUJIFILM і Kodak в області поліграфії (виключіть фотографування й фотоапарати)

6. Здійсніть пошук зображень (відповідний розділ google.ru).

Знайдіть зображення наступних поліграфічних машин:

Heidelberg SM 74

Xerox DocuColor

KOMORI Lithrone

FUJIFILM Celebrant Suite (знайти схему програмного комплексу)

7. Використовуючи інформацію, отриману в результаті виконання пунктів 1 6, скласти звіт з включенням відповідей на питання пунктів 4 5 та зображеннями зразків поліграфічної техніки, наведених в пункті 6.