Сложный поиск
Сложный поиск предусматривает возможность использования особенностей специального языка поисковых запросов. Хотя для каждой поисковой системы существует свой, уникальный язык запросов, их возможности похожи.
Язык запросов практически каждой поисковой машины содержит операторы двух типов: логические и операторы расстояния.
• Логические операторы определяют включение/исключение из поиска группы слов.
– AND (и) – поиск документов, содержащих все термины, соединенные данным оператором.
– OR (ИЛИ) – текст должен содержать хотя бы один из терминов, соединенных данным оператором.
– NOT (НЕ) – поиск документов, в тексте которых отсутствуют термины, следующие за оператором.
• Операторы расстояния ограничивают порядок следования и расстояния между словами.
– NEAR – второй термин должен находиться от первого на расстоянии, не превышающем определенного количества слов.
– FOLLOWED BY – термины следуют в заданном порядке.
– ADJ – термины, соединенные оператором, являются смежными.
Наряду с этими, наиболее типичными, в язык поисковых запросов могут входить и другие операторы.
В разных поисковых машинах каждому из этих операторов соответствуют свои обозначения. Обычно детальнее узнать о них можно на странице помощи. Ниже я расскажу о некоторых элементах языка поисковых запросов самых популярных поисковых машин. Работу операторов сложного поиска рассмотрим на примерах решения наиболее типичных задач.
• Найденные ссылки должны содержать точную фразу поискового запроса.
Такую фразу следует заключить в кавычки. Это правило справедливо для всех поисковых машин.
• В найденных документах должно быть несколько слов из поискового запроса.
В этом случае удобно применить логический оператор AND (и), использование которого означает одновременный поиск нескольких слов, вошедших в запрос. В «Яндекс» и Rambler этому оператору соответствует знак &, в Google эту функцию выполняет обычный символ +. Таким образом, запись книжный & магазин в строке поиска «Яндекс» или Rambler будет означать поиск сайтов, страницы которых содержат оба слова поискового запроса. В Google вам для этого нужно будет написать книжный + магазин.
• В документе должно быть хотя бы одно слово поискового запроса.
В этом случае необходимо использовать оператор OR (ИЛИ). В поисковых системах Rambler и «Яндекс» ему соответствует символ |, а в Google следует применять знак ~. Запрос аэроплан |самолет|планер|дирижабль|аэростат|вертолет|пепелац, заданный в «Яндекс» или Rambler, позволит найти страницы, где встречается хоть одно из этих слов. При поиске с помощью Google запрос задается так: аэроплан-самолет-планер.
• Одно слово поискового запроса должно обязательно входить в результирующие ссылки.
При работе с «Яндекс» и Rambler перед такими словами нужно поставить знак +. Обратите внимание, что перед этим символом необходимо ставить пробел, а после него – нет. Например, для поиска известной цитаты из «Гамлета» нужно набрать быть +или +не быть.
• Из итогового списка ссылок необходимо исключить документы с определенными словами.
Для этого следует применить логический оператор NOT (НЕ). В «Яндекс» и Google такие слова помечают символом —, в Rambler для этого предназначен знак!. Данный оператор нужно вводить после ключевого слова через пробел и слитно с необязательным словом. Например, запрос карта Парижа – (агентство | тур) позволит найти карту, а не агентства и туры по Франции.
• Слова поискового запроса должны располагаться на определенном расстоянии друг от друга.
В этом случае синтаксис каждой поисковой машины индивидуален. В некоторых поисковых задачах термины могут идти в разном порядке, причем между ними может быть установлен произвольный интервал. Добавив между словами запроса оператор / (n т), вы получите интересующие вас страницы. Если при работе с Яндекс вы введете запрос справочная / (2 4) литература, то будут найдены документы, в которых слово «справочная» удалено от «литература» на два слова влево и на четыре вправо.
Если вы точно знаете не только расстояние, но и порядок слов запроса, в котором они должны идти в тексте интересующих вас страниц, укажите между символом / и числом-расстоянием символ + для прямого порядка слов или – для обратного.
Если вы хотите найти отчество Тургенева, то введите запрос Иван /+2 Тургенев. Будут найдены страницы, где между словами «Иван» и «Тургенев» есть ровно одно слово.
В поисковой машине Rambler значение ограничения контекста можно изменять конструкцией (число, запрос), где число – любое положительное число. Таким образом, по запросу (2, красная армия) будут найдены только те документы, в которых между словами «красная» и «армия» хотя бы раз не стоит ни одного слова (поскольку лишь в случае их непосредственного соседства разница в порядковых номерах меньше двух, то есть равна единице).
Помните, что при построении сложных запросов вас выручат скобки. Например, если вы ищете описание мумие, но не хотите наталкиваться на прайсы интернет-магазинов, можете задать такой запрос: мумие && (лечение | лечебный | болезни)~~(цена | прайс | рубли доллар | фирма | магазин). Будут найдены все страницы, где есть слово «мумие», а также любое из слов «лечение», «лечебный» или «болезни» и нет ни одного из слов, перечисленных после оператора —.
Все слова, которые вы приводите в запросе, по умолчанию ищутся с учетом морфологии. Чтобы отключить ее, введите оператор! перед словом (без пробела).
Например, на запрос! день будут найдены страницы, где слово день встречается только в такой форме.
Если одна или несколько форм слова совпадает с другими словами, могут найдены лишние страницы. Указав нормальную форму слова с помощью оператора!! вы уберете из списка ненужное.
С подробностями использования поискового движка Google можно ознакомиться по адресуhttp://www.google.com.ua/intl/uk/help/refinesearch.html. Страница помощи «Яндекс» размещена по адресуhttp://www.yandex.ru/info/index.html, а поисковую помощь системы Rambler вы найдете здесь:http://www.rambler.ru/doc/help.html.
Дополнительной возможностью является поиск среди обнаруженных страниц. Если ссылок найдено слишком много, то всегда можно добавить к запросу еще одно ключевое слово и повторить поиск.
Дата добавления: 2015-04-05; просмотров: 2320;