Примечание. Не следует составлять слишком сложный запрос, так как в результате может быть не найдено ни одного документа

Не следует составлять слишком сложный запрос, так как в результате может быть не найдено ни одного документа. Оптимальным результатом поиска является 10–20 ссылок, среди которых можно быстро отыскать две-три нужные.

При поступлении запроса от пользователя поисковая машина просматривает всю проиндексированную информацию и выдает соответствующий список документов. Поисковые механизмы на первом месте располагают документы, которые содержат максимум слов из вашего запроса. Найденные ссылки сортируются в зависимости от месторасположения ключевых слов (в заголовке, в начале текста, в первых параграфах) и частоты их появления. Таким образом, в верхней части списка, полученного с помощью поисковой машины, размещены ссылки на сайты, в которых искомые слова встречаются чаще всего. Поэтому основная задача пользователя во время поиска в Интернете – получить список ссылок, которые максимально соответствуют поисковому запросу.

Чрезвычайно важно при поиске информации в Интернете – как можно больше сузить область поиска. Найти нужные сайты возможно только в том случае, если пользователь сумел подобрать в поисковом запросе именно те слова, которые действительно несут основную смысловую нагрузку.

Например, набрав запрос реферат на тему Финансовый анализ в Excel, вы получите всего несколько ссылок, в которых представлена совсем не та информация, которую вы ищете. Дело в том, что поисковая система будет искать страницы, в которых встречаются все эти слова—и слово «реферат», и «на тему», и «финансовый анализ в Excel». Причем, учитывая особенности построения поисковых запросов, последняя фраза будет искаться в точности так, как она была сформулирована. Запрос финансовый анализ в Excel предоставит вам несколько другие результаты.

Не стоит винить поисковую машину в том, что она не нашла нужную информацию – она всего лишь ответила на ваш запрос. Перефразируя известное выражение, можно сказать: «Каков запрос – таков ответ».

В идеале процесс поиска должен выглядеть примерно так. Сначала лучше сформулировать общий запрос и получить результат, в котором следует выделить описания более-менее подходящих ссылок. Затем необходимо добавить к запросу общие ключевые слова, которые есть в описании нужных веб-страниц, и повторить процесс. Если вы все делаете правильно, то каждый запрос должен приближать вас к нужной информации. Вы должны выступать в виде своеобразной обратной связи, с каждым шагом уменьшая несоответствие между необходимой вам информацией и тем, что выдает поисковая система.

Для иллюстрации вышесказанного рассмотрим еще один небольшой пример – представьте себе, что вам необходимо найти расписание поездов, проходящих через Киев. В качестве общего запроса можно так и «спросить» поисковую систему: расписание всех поездов, проходящих через Киев. Однако по такому запросу, например, Яндекс находит лишь расписания поездов, проходящих через Самару, Тернополь, но Киева среди результатов поиска не видно. Это ни в коем случае не означает, что такой информации в базе поисковой системы нет, просто запрос был сформулирован не совсем удачно.

Вы помните, что любая поисковая система старается найти страницы, на которых находится максимальное количество слов из вашего запроса, более того, если эти слова еще следуют друг за другом, то такие страницы будут выведены первыми. Например, если в тексте страницы встречается фраза «расписание всех поездов, проходящих через Самару», то даже при отсутствии фразы «расписание всех поездов, проходящих через Киев» система определит, что они имеют пять общих слов, то есть с большой вероятностью сайт, содержащий эти слова, вам подойдет. Хотя это и не так. Поэтому необходимо откорректировать запрос, убрав из него все ненужное и оставив только то, что точно характеризует необходимую вам информацию. В рассматриваемом примере «словами-паразитами» являются слова «всех», «проходящих» и «через», которые могут встречаться практически на любой странице. Набрав откорректированный запрос расписание поездов Киев, вы получите в точности то, что искали.

У каждой поисковой машины своя уникальная методика поиска, от эффективности которой зависит результативность поисковика, то есть релевантность полученного списка ссылок, и как результат – успех на рынке поисковых машин. Механизм поиска не только хранится в секрете, но и регулярно меняется.

В настоящее время поисковые механизмы ищут документы не только по строгому соответствию введенному запросу. Все поисковые машины, которые работают с русскоязычным текстом, умеют проводить морфологический поиск. Это означает, что программа будет искать формы слов, включенных в поисковый запрос, а также их синонимы. То есть поиск будет касаться не только определенного падежа или числа, но и всей парадигмы слова.

Сегодня многие поисковые машины используют технологии полнотекстового поиска. Этот способ отличается прежде всего тем, что поиск документов в этом случае не зависит от наличия словаря синонимов и форм использованных в запросе слов и позволяет находить документы в тех случаях, когда смысл слова меняется в зависимости от контекста. Второе важное отличие полнотекстовых систем – они работают со всем текстом документа, а не только с ключевыми словами.

Согласно общей классификации, поиск бывает простым, расширенным и сложным.








Дата добавления: 2015-04-05; просмотров: 746;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.004 сек.