Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Инф. технологии.docx
Скачиваний:
18
Добавлен:
09.02.2016
Размер:
86.31 Кб
Скачать

10. Технології пошуку інформації в інтернеті

Пошук за адресами URL Найшвидший і надійний вид пошуку інформації в Інтернеті - пошук за адресами URL. Багато хто з них наводяться в друкованих виданнях, спеціальних довідниках, звучать в ефірі популярних радіостанцій і з екранів телевізора. * Тим хто полюбляє телеканалу НТВ без зусиль знайдуть його сайт за адресою www.ntv.ru. Для швидкого доступу до вищеназваних ресурсів досить запустити програму-браузер, наприклад Internet Explorer, і набрати знайомий адресу URL у рядку адреси.

пошукові системи:

В Інтернеті зосереджена величезна кількість документів. Щоб полегшити пошук потрібної інформації, створюються спеціальні пошукові машини.

Пошукові машини - це автоматичні системи, опитувальні сервери, підключені до глобальної мережі, і зберігають у своїй базі інформацію про наявні на серверах даних ..

За спеціальним чином сформульованому запитом поіскoві машини надають інформацію про те, де можна отримати необхідні дані. Як правило, пошукові машини складаються з трьох частин: робота, індексу та програми обробки запиту.

* Робот (Spider, Robot або Bot) - це програма, яка відвідує веб-сторінки і зчитує (повністю або частково) їх вміст. Роботи пошукових систем розрізняються індивідуальної схемою аналізу вмісту веб-сторінки.

* Індекс - це сховище даних, в якому зосереджені копії всіх відвіданих роботами сторінок. Індекси в кожній пошуковій системі розрізняються за обсягом і способом організації, що зберігається. Бази даних провідних пошукових машин хропуть відомості про десятки мільйонів документів, а обсяги їх імдекса становлять сотні гігабайт. Індекси періодично оновлюються і доповнюються, тому результати роботи однієї пошукової машини з одним і тим же запитом можуть різнитися, якщо пошук проводився в різний час.

* Програма обробки запиту - це програма, яка відповідно до запиту користувача «переглядає» індекc на предмет наявності потрібної інформації і повертає посилання на знайдені документи. Безліч посилань на виході системи розподіляється програмою в порядку убування релевантності, тобто від найбільшою мірою відповідності посилання запитом до найменшої.

В даний час найпопулярнішими для російських користувачів Інтернету є три великі пошукові системи індексного типу: Яндекс (www.yandex.ru); Апарат (www.aport.ru); Рамблер (www.rambler.ru). Основними характеристиками пошукових машин є:

* обсяг документів в індексі;

* Частота оновлення інформації; * Інформаційний простір, який охоплює робот пошукової машини, і різноманітність типів документів, про які збирається інформація; * Швидкість обробки запиту; * Критерій визначення релевантності (відповідності знайденого документа пошуковому запиту); * Можливість деталізації та уточнення запиту.

1. Пошук за рубрикатором пошукової системи

Пошукові каталоги являють собою систематизовану колекцію (добірку) посилань на інші ресурси Інтернету. Посилання організовані у вигляді тематичного рубрикатора, що представляє собою ієрархічну структуру, переміщаючись по якій, можна знайти потрібну інформацію. Розглянемо приклад. Припустимо, ви збираєтеся придбати мобільний телефон і хочете порівняти характеристики апаратів різних фірм. Пошук міг би вестися за наступними рубриками каталогу: Яндекс> Каталог> Комп'ютери і зв'язок> Мобільний зв'язок> Мобільні телефони. Отримавши обмежена кількість посилань, можна досить оперативно їх переглянути і вибрати телефон, дослідивши характеристики по фірмах і модифікаціям апаратів.

2. Пошук за ключовими словами Більшість пошукових машин мають можливість пошуку за ключовими словами. Це один з найпоширеніших видів пошуку. Для пошуку за ключовими словами необхідно ввести в спеціальному вікні слово або кілька слів, які слід шукати, і клацнути на кнопці Пошук. Пошукова система знайде у своїй базі і покаже документи, що містять ці слова. Для того щоб зробити пошук більш продуктивним, у всіх пошукових системах існує спеціальна мова формування запитів зі своїм синтаксисом.

Правила формування запиту и пошуковій системі Яндекс:

1. Ключові слова в запиті слід писати малими літерами. Це забезпечить пошук всіх ключових слів, a не тільки тих, які починаються з великої літери. 2. При пошуку враховуються всі форми слова за правилами російської мови, незалежно від форми слова в запиті. 3. Для пошуку стійкого словосполучення слід укласти слова в лапки. 4. Для пошуку по точної словоформі перед словом треба поставити знак оклику.

5. Для пошуку всередині одного речення слова в запиті поділяють прогалиною або знаком "&". Кілька набраних у запиті слів, розділених пробілами, означають, що всі вони повинні входити в одне речення шуканого документа. 6. Якщо ви хочете, щоб були відібрані тільки ті документи, в яких зустрілося кожне слово, вказане в запиті, поставте перед кожним з них знак плюс "+". 7. При пошуку синонімів або близьких за значенням слів між словами можна поставити вертикальну риску "|". 8. Замість одного слова в запиті можна підставити цілий вираз. Для цього його треба взяти в дужки (). 9. Знак "~" (тильда) дозволяє знайти документи з пропозицією, що містить перше слово, але не містять другого.