Організація пошуку інформації в Internet

Значний обсяг наявної інформації в Internet призводить до необхідності використання спеціальних засобів пошуку. Розрізняють індексаційні і категорійні пошукові системи. Перші з них ще називають пошуковими машинами, другі – Web-каталогами.

Пошукова машина – це комплекс програмно-технічних засобів, які забезпечують систематичне скачування вмісту Web-серверів і індексацію наявних в них документів за певними ключовими словами. Спеціальні програми-спайдери (павуки) постійно переглядають Web-вузли, корегуючи власні бази даних. В подальшому з таких баз даних витягаються відповіді на запити користу­вачів. При цьому спеціальне програмне забезпечення виділяє з запиту користувача ключові слова, шукає їх в наявних індексах і пересилає користувачу адреси Web-сторінок, в яких зустрічаються подібні слова або вирази. Таким чином, забезпечується контекстний пошук інформації. Оперативність роботи пошукових машин забезпечується за рахунок швидкодіючої апаратури.

Web-каталог - це віртуальна бібліотека, яка складається з сукупності Web-сторінок, присвячених якійсь тематиці, із стислим описом джерел інформації та гіперпосиланнями на них. Із зростанням кількості посилань на одній сторінці з'являється необхідність її поділу, тобто введення нових підтем або категорій. У результаті розвитку такої системи з'являється деревоподібна структура каталогів, підкаталогів і т.д. Іноді всередині каталогу за певними критеріями відбираються кращі посилання за темою. Таким чином, завдяки Web-каталогам можна вести спрямований пошук необхідних даних по конкретній темі.

Суттєвою особливістю Web-каталогів є те, що вони створюються людьми, а не машинами, тому якість відбору інформації в них значно вища. Вважається, що Web-каталоги краще використовувати, коли не відома точна назва шуканого об’єкта. Коли ж необхідна інформація про конкретний об’єкт (особливо, не зовсім звичний), то пошукова машина це завдання виконає швидше.

Прагнення якомога ширше задовольнити потреби користувача призвело до того, що сучасні пошукові сервери часто поєднують в собі риси індексаційних і категорійних пошукових систем. При зверненні до такого сервера за його ім’ям у вікні відкривається сторінка, що містить каталоги з різних тем (наука, спорт, погода, новини тощо) й елементи для виконання контекстного пошуку. Крім того, пошукові сервери можуть надавати додаткові послуги: електронної пошти, тематичного пошуку зображень, музики, людей, новин тощо (див. приклад на рис. 12.1).

 

Рисунок 12.1 – Головне вікно пошукової системи <Мета>

 

Переглядаючи зміст каталогів, можна вести спрямований пошук необхідних даних. Для ведення контекстного пошуку в спеціальному полі головної сторінки пошукового сервера задається запит: ключові слова для пошуку або їх комбінація. У відповідь на запит пропонується список документів із посиланням на відповідну адресу з короткими фрагментами документа, які містять шукані слова або словосполучення ( див. приклад на рис.12.2).

Як правило, список знайдених документів впорядкований за їх релевантністю. Релевантність документа – це міра того, наскільки точно той або інший документ відповідає критеріям, зазначеним у запиті користувача. Слід зазначити, що однозначних критеріїв встановлення релевантності немає, тому документ, визнаний пошуковою системою найрелевантнішим за формальними ознаками, не завжди є таким на думку користувача.

При проведенні контекстного пошуку слід враховувати, що якість пошуку і кількість знайдених документів залежать не тільки від обсягу бази даних пошукового сервера, але і від конкретного вигляду запиту. Тому слід зважено підходити до формулювання запиту, обираючи найбільш інформативні, загальновживані слова, які з найбільшою ймовірністю можуть бути на шуканих Web-сторінках.

 

Рисунок 12.2 – Контекстний пошук в середовищі пошукової системи Яндекс

 

Найбільш загальні правила конструювання запитів наведені в таблиці 12.1.

 

Таблиця 12.1 – Загальні правила конструювання запитів

 

Вид запиту Приклад Результат пошуку
Слово Комп’ютер Адреси Web-сторінок, на яких згадується дане слово
Кілька слів (словосполучення) Персональний комп’ютер Адреси Web-сторінок, на яких згадуються всі вказані слова. При цьому слова можуть бути розташовані в іншому порядку і не поруч. Деякі пошукові машини виводять сторінки, на яких є хоча б одне з вказаних слів
Словосполу­чення в лапках “ІВМ-сумісний комп’ютер” Адреси Web-сторінок, на яких зустрічається точно таке словосполучення
Кілька слів зі зна­­­­­­ка­­ми “плюс” (+) або “мінус” (-) Текстовий + редактор - Word Адреси Web-сторінок, на яких зустрічаються перше слово і всі слова, перед якими є зна­­­­­­к “плюс”, і не зустрічаються слова, перед якими є зна­­­­­­к “мінус” (у нашому прикладі – текстовий редактор але не Word)
Слово або сло­во­сполучення з використанням символів * R*ambler Адреси Web-сторінок, на яких зустрічаються слова, що розпочинаються на R і закінчуються символами ambler. Такий підхід використовується, коли користувач не впевнений в точному написанні слів

В той же час, слід мати на увазі, що на різних пошукових серверах можуть бути різні правила складання запитів. На Web-сторінці сервера зазвичай є довідка зі складання запиту, з якою доцільно познайомитися перед пошуком.

В багатьох випадках необхідне уточнення умов пошуку можна виконати за допомогою інструмента, який зазвичай називається “розширений пошук” (іноді – складний пошук або щось подібне). Доступ до нього з’являється після проведення простого пошуку і реалізується шляхом вказівки певного ряду уточнюючих параметрів (див. приклад на рис. 12.3).

 

 

Рисунок 12.3 – Розширений пошук в середовищі пошукової системи Google

 








Дата добавления: 2015-08-08; просмотров: 917;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.007 сек.