Поиск в WWW

Эффективная работа с WWW невозможна без мощных систем поиска необходимой информации.

По способу организации поиска и предоставляемым возможностям все средства поиска условно можно разбить на следующие группы:

- Каталоги и специализированные базы данных

- Поисковые и метапоисковые системы.

 

Каталоги в WWW аналогичны систематизированным библиотечным каталогам. Поиск по каталогам состоит в последовательном движении по иерархическому списку ссылок, называемых рубриками или категориями. Двигаясь вниз по детализирующим категориям, можно найти страницы с нужной информацией. На каждой странице, открываемой при движении по каталогу, указывается последовательность просмотренных рубрик, например: Деловой мир: Финансы: Аналитика и т.д.

Все каталоги создаются и поддерживаются в актуальном состоянии вручную соответствующими специалистами (аналогично библиографам). Описание ресурса выполняется либо составителями каталога, либо автором страницы. Учитывая скорость пополнения и изменения информации в Интернете, «ручной» способ ведения каталогов не позволяет адекватно отражать реальное состояние ресурсов Интернет на данную тему.

Имеются каталоги, включающие средства поиска по ключевым словам (как для категорий, так и для страниц). Однако поиск ведется только среди страниц, на которые в данном каталоге имеются ссылки (в ресурсе каталога).

 

Поисковые машины (поисковые серверы, поисковые роботы) дают возможность пользователю по определенным правилам сформулировать требования к необходимой ему информации – создать запрос. После этого поисковая машина автоматически просматривает документы на контролируемых (индексируемых) ею сайтах и отбирает те из них, которые соответствуют запросу (релевантны запросу). В результате поиска создается одна или несколько страниц, содержащих ссылки на релевантные запросу документы. Для каждой такой ссылки обычно указываются также дата создания страницы, объем, степень релевантности запросу, фрагменты текста, характеризующие содержание страницы. Щелчок по такой ссылке загружает нужную страницу. В случае очень большого количества найденных документов можно уточнить запрос и в соответствии с ним повторить поиск, но только среди уже отобранных страниц (поиск в найденном). В ряде поисковых систем можно отметить ссылку на страницу, содержание которой наиболее удовлетворяет потребностям пользователя, и повторить поиск, потребовав искать похожие.

При использовании различных поисковых машин следует иметь в виду, что они принципиально отличаются количеством и составом просматриваемых сайтов, языком запросов, алгоритмами определения степени соответствия документа запросу. Поэтому количество и состав WWW-страниц, отобранных для одного и того же запроса различными машинами поиска, может значительно различаться.

Популярные каталоги и машины поиска

Название Адрес Примечание
Англоязычные
Yahoo! http://www.yahoo.com Поисковая система (возможен поиск на русском языке). Каталог ссылок на ресурсы сети Интернет в разных странах мира
Webcrawler http://www.webcrawler.com  
Google http://www.google.com  
Alta Vista http://www.altavista.com Возможность поиска информации в сети Интернет, включая русскоязычный Интернет
Infoseek http://www.infoseek.com  
Lycos http://www.lycos.com Портал на основе поисковой системы и рубрикатора Интернет-ресурсов. Ссылки на локализованные версии каталога в различных странах мира на английском языке
Excite http://www.excite.com  
HotBot http://www.hotbot.com  
Русскоязычные
Rambler http://www.rambler.ru Первая российская поисковая система. Имеет возможность учета морфологии русского языка.
Яndex http://www.yandex.ru Учет русской морфологии. Подсветка найденных документов, показ контекстов. Параллельный поиск в «Энциклопедиях», «Новостях», «Маркете». Структурирование поиска по разделам каталога и серверам.
Google http://www.Google.com.ru Система поиска информации, включая русскоязычный Интернет. Возможность поиска картинок и новостей в конференциях Usenet
Mail.ru http://www.Mail.ru/  
Апорт http://www.aport.ru Учет русской морфологии. Выделение контекстов найденных слов. Уточнение поиска по разделам каталога и серверам. Поиск с переводом запроса на английский язык и наоборот.
Весь русский Интернет http://www.diamondteam.ru/  
Russian on the Net http://www.ru/  
Weblist http://www.weblist.ru  

 

Метапоисковые (мультипоисковые) системы – сами ничего не ищут, но обращаются за помощью сразу к нескольким поисковым машинам. Каждая из метапоисковых систем имеет свой язык запросов. Сформулированный на этом языке запрос она переводит на язык запросов каждой используемой машины поиска. Далее результаты поиска всеми машинами объединяются и представляются в соответствующей форме. (Дольше по времени).

 

Способы формулировки запросов:

- Естественноязыковой (простой) – задается предложение или набор слов, наиболее полно отражающий предмет поиска, например: социально-экономические показатели развития Украины. Все специальные символы в строке запроса игнорируются.

- Строгий (с языком запроса) – помимо ключевых слов содержатся операторы и дополнительные требования (ограничения на дату создания, указание области поиска – на конкретном сервере или на определенном множестве серверов и т.д.) Требует от пользователя знания синтаксиса языка запросов (операторов и правил их использования).

- Расширенный – разновидность простого поиска, в котором требования, дополняющие список ключевых слов, могут быть указаны путем заполнения полей в специальной форме.

- Специальный – сводится к заполнению полей. Применяется для поиска сайтов организаций, издательств, обществ и т.п.

 

В домашней странице поисковых машин всегда имеется информация о языке запросов. Различия в разных системах незначительны.

 








Дата добавления: 2015-04-15; просмотров: 743;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.005 сек.