Принцип поиска и подачи материала
Многообразие поисковых возможностей в сети может быть представлено как набор средств представления-поиска информации. Поисковые средства сети Интернет можно условно классифицировать по 2 признакам:
1) Принцип поиска и подачи материала (каталоги и поисковые машины (serach engines), индексирующие документы по ключевым словам).
2) Охват материала (универсальные, тематические или специальные).
Тематические каталоги
Тематические каталоги предусматривают предварительный анализ содержимого документов и отнесение их к одной го нескольких категорий, список которых вы можете просматривать. Например, наиболее популярный тематический каталог Yahoo (www.yahoo.com) представляет Web-узлы в виде иерархической схемы, на вершине которой находятся общие темы, такие как "Искусство" или "Образование", а далее дерево делится на специализированные ветви. Сама тематическая служба Yahoo не предусматривает количественных оценок информационного содержимого, но для этого можно использовать дополнительные инструментальные средства данного узла. В других тематических каталогах, например Excite или Net Guide Live, для оценки простоты навигации, качества представления информации привлекаются коллективы аналитиков. Хотя тематические каталоги не могут сравниться по широте охвата с индексом, составленным по ключевым словам, они способны уменьшить вероятность обращения к узлам, не относящимся к делу. Кроме того, в них даются полезные предупреждения: для доступа к тому или иному узлу требуется определенный тип браузера; страницы узла содержат много графической информации или он предназначен только для взрослых. Между тем тематические каталоги далеко не совершенны: вы вынуждены полагаться на мнение аналитика, вследствие чего огромное число узлов может оказаться отнесенным не к той теме. Многие каталоги предназначены для широкой аудитории, и некоторые не вполне понятные рядовым пользователям или чрезвычайно экзотические темы в них могут отсутствовать.
Поисковые машины
Средства или "машины" поиска (search engines) - это специальные программно-технические комплексы, отслеживающие изменения информации в Интернет. Принцип их работы таков: они постоянно обрабатывают и индексируют информацию, находящуюся в Сети, и формируют на основе полученных сведений собственную базу данных.
Поисковые машины делятся на две категории: автономные (AltaVista, Alltheweb, eXcite, InfoSeek, Lycos и т.д.), использующих только собственные ресурсы, и глобальные, так называемые мета-средства (MetaCrawler, SavvySearch, AccuFind, Internet Sleuth, All-in-One.), т.е. машины, проводящие поиск не в самой Сети, а в базах автономных поисковых машин.
Наиболее мощные автономные поисковые машины на сегодняшний момент-это AltaVista, Alltheweb, Яндекс и Апорт. Каждая из них охватывает не более 20-30% ресурсов Интернета.
Мета-средства являются более высоким уровнем развития поисковых средств, предоставляя пользователю возможности использования сразу нескольких автономных поисковых систем и избавляя его от необходимости изучать язык запросов каждого поискового инструмента.
Для предварительного знакомства с темой лучше пользоваться мета-средствами поиска, а затем переходить к более детальному разысканию с помощью автономных машин.
Главным условием успешного поиска является использование правильного инструмента для работы. Системы, основанные на каталогах, лучше подходят в тех случаях, когда надо осуществить быстрый поиск каких-либо общих тем или Вы гуляете по сети. Небольшие размеры и созданная людьми система упорядочения "материала делает их наиболее пригодными для быстрого нахождения качественной информации. Другим важным элементом успешного поиска является правильно сформулированный вопрос, то есть владение языком запросов, который применяют индексные поисковые машины.
Язык запросов часто использует элементы математической логики. Логическое выражение запроса - это набор слов, разделенных между собой логическими операциями и скобками, необходимыми для указания последовательности действий.
Рассмотрим структуру выражений:
1 .Каждое указанное для поиска слово А понимается как фраза -в тексте документа должно быть слово А. 2.Выражение NOT А понимается как фраза: в тексте документа не должно быть слова А.
3.Выражение A OR Б понимается как фраза: в тексте документа должны быть слова или А, или Б, или А и Б одновременно.
4.Выражение A AND Б понимается как фраза: в тексте документа должно быть слово А и слово Б.
5.Выражение A NEAR Б понимается как фраза - в тексте документа слово А должно находится довольно близко от слова Б.
б.Выражение, помещенное в кавычки "А Б С" рассматривается как словосочетание или фраза.
К сожалению, не все поисковые системы поддерживают именно вышеописанную структуру выражений. Многие поисковые машины имеют специфические средства для формирования запросов, о чем обычно сообщается в специальных справочных разделах этих машин.
Большинство пользователей, даже имея в своем распоряжении все перечисленные средства, не ограничивается простым поиском, заданным по умолчанию, и предпочитает фильтровать десятки или сотни документов вручную. Это не всегда целесообразно, хотя и бывает необходимо. Следует, однако, помнить о том, что если на ваш запрос поисковая машина находит несколько тысяч документов, реально вы сможете получить только первые двести.
Дата добавления: 2016-07-09; просмотров: 914;