Принцип поиска и подачи мате­риала

Многообразие поисковых возможностей в сети может быть представлено как набор средств представления-поиска информации. Поисковые средства сети Интернет можно условно классифициро­вать по 2 признакам:

1) Принцип поиска и подачи материала (каталоги и поисковые машины (serach engines), индексирующие документы по ключевым словам).

2) Охват материала (универсальные, тематические или специ­альные).

Тематические каталоги

Тематические каталоги предусматривают предварительный ана­лиз содержимого документов и отнесение их к одной го нескольких категорий, список которых вы можете просматривать. Например, наиболее популярный тематический каталог Yahoo (www.yahoo.com) представляет Web-узлы в виде иерархической схемы, на вершине которой находятся общие темы, такие как "Ис­кусство" или "Образование", а далее дерево делится на специализи­рованные ветви. Сама тематическая служба Yahoo не предусматри­вает количественных оценок информационного содержимого, но для этого можно использовать дополнительные инструментальные средства данного узла. В других тематических каталогах, например Excite или Net Guide Live, для оценки простоты навигации, качества представления информации привлекаются коллективы аналитиков. Хотя тематические каталоги не могут сравниться по широте охвата с индексом, составленным по ключевым словам, они способны уменьшить вероятность обращения к узлам, не относящимся к делу. Кроме того, в них даются полезные предупреждения: для доступа к тому или иному узлу требуется определенный тип браузера; стра­ницы узла содержат много графической информации или он пред­назначен только для взрослых. Между тем тематические каталоги далеко не совершенны: вы вынуждены полагаться на мнение анали­тика, вследствие чего огромное число узлов может оказаться отне­сенным не к той теме. Многие каталоги предназначены для широ­кой аудитории, и некоторые не вполне понятные рядовым пользова­телям или чрезвычайно экзотические темы в них могут отсутство­вать.

Поисковые машины

Средства или "машины" поиска (search engines) - это специаль­ные программно-технические комплексы, отслеживающие измене­ния информации в Интернет. Принцип их работы таков: они посто­янно обрабатывают и индексируют информацию, находящуюся в Сети, и формируют на основе полученных сведений собственную базу данных.

Поисковые машины делятся на две категории: автономные (AltaVista, Alltheweb, eXcite, InfoSeek, Lycos и т.д.), использующих только собственные ресурсы, и глобальные, так называемые мета-средства (MetaCrawler, SavvySearch, AccuFind, Internet Sleuth, All-in-One.), т.е. машины, проводящие поиск не в самой Сети, а в базах автономных поисковых машин.

Наиболее мощные автономные поисковые машины на сего­дняшний момент-это AltaVista, Alltheweb, Яндекс и Апорт. Каждая из них охватывает не более 20-30% ресурсов Интернета.

Мета-средства являются более высоким уровнем развития поис­ковых средств, предоставляя пользователю возможности использо­вания сразу нескольких автономных поисковых систем и избавляя его от необходимости изучать язык запросов каждого поискового инструмента.

Для предварительного знакомства с темой лучше пользоваться мета-средствами поиска, а затем переходить к более детальному разысканию с помощью автономных машин.

Главным условием успешного поиска является использование правильного инструмента для работы. Системы, основанные на ка­талогах, лучше подходят в тех случаях, когда надо осуществить бы­стрый поиск каких-либо общих тем или Вы гуляете по сети. Не­большие размеры и созданная людьми система упорядочения "мате­риала делает их наиболее пригодными для быстрого нахождения качественной информации. Другим важным элементом успешного поиска является правильно сформулированный вопрос, то есть вла­дение языком запросов, который применяют индексные поисковые машины.

Язык запросов часто использует элементы математической ло­гики. Логическое выражение запроса - это набор слов, разделенных между собой логическими операциями и скобками, необходимыми для указания последовательности действий.

Рассмотрим структуру выражений:

1 .Каждое указанное для поиска слово А понимается как фраза -в тексте документа должно быть слово А. 2.Выражение NOT А по­нимается как фраза: в тексте документа не должно быть слова А.

3.Выражение A OR Б понимается как фраза: в тексте документа должны быть слова или А, или Б, или А и Б одновременно.

4.Выражение A AND Б понимается как фраза: в тексте докумен­та должно быть слово А и слово Б.

5.Выражение A NEAR Б понимается как фраза - в тексте доку­мента слово А должно находится довольно близко от слова Б.

б.Выражение, помещенное в кавычки "А Б С" рассматривается как словосочетание или фраза.

К сожалению, не все поисковые системы поддерживают именно вышеописанную структуру выражений. Многие поисковые машины имеют специфические средства для формирования запросов, о чем обычно сообщается в специальных справочных разделах этих ма­шин.

Большинство пользователей, даже имея в своем распоряжении все перечисленные средства, не ограничивается простым поиском, заданным по умолчанию, и предпочитает фильтровать десятки или сотни документов вручную. Это не всегда целесообразно, хотя и бывает необходимо. Следует, однако, помнить о том, что если на ваш запрос поисковая машина находит несколько тысяч докумен­тов, реально вы сможете получить только первые двести.








Дата добавления: 2016-07-09; просмотров: 914;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.003 сек.