Как найти то что ищешь в интернете. Как быстро отыскать значение незнакомого понятия? Правильное составление запроса и критерий

Скачать на Телефон 30.04.2019
Скачать на Телефон

Вы заходите на сайт ПС, а затем вводите нужный Вам запрос в строку поиска. В результате чего получаете приблизительно такой список результатов (практически у всех всё одинаково, поэтому покажу Вам на примере Яндекса):

Результаты располагаются списком, который содержит следующие данные:

1 - Заголовок найденной страницы

2 - Найденные слова в тексте страницы

3 - Адрес сайта

Замечу тут то, что поисковики любят искомые слова "коверкать", т.е. они их преобразуют чтобы было более понятнее. Например существительное могут сделать прилагательным, а глагол наречием и т.д. Сделано это для того, чтобы улучшить поиск.
Некоторые поисковики ещё добавляют всякие иконки и дополнительные страницы на сайте. Это не особо важно и не меняет суть.

Теперь ближе к сути самой статьи.

Предположим, что Вам нужно найти как выращивать герань в саду . Обычно Вы пишите этот запрос напрямую в строку ПС и смотрите результаты:


Выводится список более менее подходящих по смыслу сайтов, которые содержат в себе эти слова. Но как Вы видите, здесь нету искомого и нужного нам содержимого. Поэтому для того, чтобы улучшить качество поиска, рекомендуется сделать следующие действия:
  • Уменьшить количество слов в запросе (например написать герань в саду )
  • Заменить некоторые слова на синонимы (например как сажать герань в саду )
  • Убрать "ненужные слова". Здесь подразумевается то, что нужно выделить ключевые слова в поиске и их оставить (например уход герань сад )

    Так же можете попробовать поискать в других ПС.

    Мало кто знает, но все ПС различают ещё специальные команды для работы.

    Чтобы было понятнее, воспользуюсь примером выше и возьму слова в ковычки "


    Заметили как изменилось всё? Вместо предыдущих 274 тысяч сайтов содержащих более менее похожие ответы, теперь нашлись только 2 (а если точнее, то один) содержащие точный ответ. Думаете чудеса? Нет. Просто мы указали ПС что нам не нужно разбирать наше словосочетание по синонимам и не нужно искать хоть какое-то совпадение слов. Мы ей явно указали что нам нужно точно такая именно фраза и ничего больше.

    И ковычки вовсе не единственный оператор, который можно использовать в ПС.

    Например можно написать url:сайт Windows и тогда поисковик Вам выдаст все страницы на сайте сайт , которые содержат в себе слово Windows .

    Я не буду отбирать хлеб у авторов и разработчиков ПС и не буду показывать, что только на этом сайте есть подробное описание и разбор этих операторов, как делают большинство администраторов сайтов, оставляя в неведении пользователей. Нет! Я дам Вам ссылки на официальные страницы Поисковых Систем, в которых подробно описаны какие используются операторы и как их нужно использовать чтобы Ваш запрос был наиболее удачным.

    А про другие ПС Вы можете узнать у них же. Или напишите в комментариях и я дам ссылку.

    Ну и напоследок хотелось бы добавить общеизвестную фразу: "Кто ищет - тот всегда найдёт".

  • Когда-то, в начале 2000х, был богатый выбор поисковых машин Aport, Rambler, Nigma, Webalta, Mail.ru и другие:

    • Aport - русская поисковая система. Используется с 1995 г.. Часть портала РОЛ. Принадлежит Golden Telecom. При поиске учитываются особенности русского языка. В Русскоязычном интернете с начала 2000-х гг. поисковая система стала резко сдавать позиции, заметно уступая по известности Яндексу и Рамблеру. По богатству языка запросов заметно уступает иным популярным системам.
    • Rambler - интернет-холдинг, включающий в качестве сервисов поисковую систему, рейтинг-классификатор ресурсов русского , информационный портал. Настройки языка поиска: любой, британский, российский, украинский. Учитывается морфология. Одно время поисковая система Рамблер была самой популярной врусскоязычном интернете, однако потом уступила лидерство Яндексу.
    • Yandex - русская система поиска в Интернете и интернет-портал. Поиск Яндекса позволяет искать по Рунету бумаги на русском, белорусском, английском, украинском, немецком и французском языках с учётом морфологии русского и английского языков и близости слов в предложении. Отличительная особенность Яндекса - возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов.
    • Mail.ru - 1 из крупнейших в Русскоязычном интернете бесплатных сервисов электронной почты. Компания работает на рынке под данным именем с 16 окт. 2001г.. До этого момента бренд Mail.ru принадлежал компании Port.ru. В итоге 2006 г. было заключено стратегическое соглашение о предоставлении поискового сервиса, основанного на движке Яндекса.
    • Webalta - Русская поисковая система, находящаяся на стадии публичного тестирования.

    Время показало, кто из поисковых систем может называться лидером.

    Из русско-язычного сегмента смогла идти в ногу со временем лишь Yandex. Зарубежные поисковые системы тоже трансформировались с различной степенью успеха. На первый план вышла корпорация Google.

    По состоянию на 2012 год можно сказать, что используя эти две поисковые системы можно найти русскоязычную информацию в 95-97% случаев. Остальные 3-5% распределены равномерно среди сотен поисковых движков.


    Поэтому есть смысл приглядеться к возможностям Google и Yandex. Легче простого написать в строке поиска Yandex или в строке поиска Google необходимый Вам запрос и поисковая система выдаст большое множество предложений по Вашему запросу. Поисковая машина - Yandex в Русскоязычном интернете способна отыскать нужные Вам веб-страницы, свежие вести, массу разных картинок и видео роликов, энциклопедические познания и массу иной полезной информации.

    Итак, начинаем искать! Благо, тут не нужны какие-то особые познания и отработанные умения. Сформулируйте Ваш , как бы Вы задали его собственному учителю, товарищу или библиотекарю.
    К примеру, "кто самый сильный", "где растут дубы" или "скачать mail агент ". В какой бы падежной форме не употребили Вы слова, поисковая система Yandex и Google будут искать все формы слов: по запросу "дуб", поисковик разыскивает "дуб", "дуба" и иные.

    Yandex-поисковик отлично понимает и односложные запросы, и запросы из некоторого количества слов и своими силами их интерпретирует. Он понимает, когда нужно отыскатьстраницы, где слова запроса находятся рядом, а когда словам просто довольно встретиться в одном документе, чтоб отыскать хорошую страницу с ответом для Вас.


    Как же сформулировать правильный запрос?

    Он как правило должен состоять из некоторого количества слов, так как по одному слову весьма непросто понять, о чем Вы хотите задать вопрос. К примеру, введем в поисковик слово "пол". Вероятно, Вы хотите задать вопрос о поле мужском или женском или же напольном покрытии. По этому запросу Yandex найдет информацию обо всех известных ему полах. Пример понятный - запрос нужно формулировать как возможно четче и уточнять по максимуму.

    Используйте расширенный поиск! Так Вы сможете в максимальной степени сузить круг поиска. А сейчас несколько советов для эффективного и быстрого поиска нужной информации в Yandex. Старайтесь при поиске применять особые знаки. С их помощьювозможно уточнить запрос поиска. А отыскать их возможно на Yandex, нажав в расширенном поиске на ссылку "Памятка по применению языка запросов".

    Для примера приведу несколько этих полезных знаков:
    1. Чтоб отыскать точную фразу или форму слова, используйте кавычки:
    ["зима недаром злится"]
    2. Чтоб исключить слово во фразе из поиска, воспользуйтесь знаком минус. Это слово должно стоять в итоге фразы запроса. М/у словом и знаком не должно быть пробела.
    [схемы вязания крючком -купить]
    3. Чтоб восстановить забытое слово в цитате, воспользуйтесь звездочкой (*). Всю цитату заключите в кавычки, а вместо забытого слова поставьте звездочку.
    ["сжала руки над * вуалью"]
    4. Чтоб отыскать слова, которые обязаны быть в одном предложении, воспользуйтесь знаком с необычным названием "амперсанд" - &. Если соединить слова амперсандом,Yandex выдаст статьи, где эти слова располагаются в одном предложении.
    [Огромной театр & Москва]
    5. Чтоб по запросу отыскать статью или документ с определенным словом, нужно поставить перед этим словом плюс. М/у словом и знаком не должно быть пробела.
    [Памятник Пушкину +площадь]

    Специализированные поисковые системы.

    • Поиск по картинокам
    • Поисковые системы с фильтрами
      • Scandoo: Поиск с проверкой сайтов на наличие вирусов, вредоносных программ
      Поиск по скрытому интернету (часть веб-страниц Всемирной паутины, не индексированная поисковыми системами): Поиск files: Поиск схем и электронных компонентов:
    • Поиск кода (программистам):
    • Поиск вредоносных программ ( , трояны и т.п.):
    • Поиск кряков (специальная программа (либо файл, содержащий инструкции для такой программы), изменяющая некоторые байты в другой программе, выполняемая с целью отключения защиты от копирования, отключение nagscreen"ов или запрещение чтения системного времени) и вареза (термин, обозначающий незаконно распространяемое программное обеспечение)
      • Astalavista Security Group: поиск через все движки «подпольного Интернета»
    • Поиск новостей:
    • Метапоисковые системы:

    Как же поисковые системы ищут информацию?

    Поисковые системы состоят из 5 отдельных программных компонент:

    1. spider (паук): утилита, которая скачивает веб-страницы.
    2. crawler: сканирующий паук, который гуляет по всем ссылкам, найденным на странице.
    3. indexer (индексатор): "слепая" утилита, которая изучает веб-страницы, скаченные пауками.
    4. database (база данных): хранилище скаченных и обработанных страниц.
    5. search engine results engine (система выдачи результатов): извлекает результаты поиска из базы данных.

    Spider : Паук - утилита, которая скачивает веб-страницы. Он работает точно как ваш браузер, когды вы соединяетесь с веб-сайтом и загружаете страницу. Паук не имеет никаких визуальных компонент. То же воздействие (скачивание) вы можете наблюдать, когда просматриваете некоторую страницу и когда выбираете "просмотр HTML-кода" всобственном браузере.
    Crawler : Как и паук скачивает страницы, он может "раздеть" страницу и отыскать все ссылки. Это его задача - определять, куда далее должен идти паук, основываясь на ссылках или отталкиваясь от заблаговременно заданного списка адресов.
    Indexer : Индексатор разбирает страницу на разные ее части и изучает их. Элементы типа заголовков страниц, заголовков, ссылок, текста, структурных элементов, элементов BOLD, ITALIC и иных стилевых частей страницы вычленяются и анализируются.
    Database : База данных - хранилище всех данных, которые поисковая система скачивает иизучает. Это нередко требует больших ресурсов.
    Search Engine Results Engine : Система выдачи результатов решает, какие страницы удовлетворяют запросу пользователя. Это та часть поисковой системы, с который вы имеете дело, осуществляя поиск. Когда пользователь вводит ключевое слово и делает поиск, поисковая система отбирает результаты на основании всегда меняющихся критериев. Алгоритмом называется способ, по которому она принимает решение. Профессиональные оптимизаторы (SEO) время от времени потребляют термин "algos" - это и есть то, о чем мы говорим.

    Основные критерии отбора результатов поиска:

    • Title (заголовок): Есть ли ключевое слово в заголовке?
    • URL (Домен): Есть ли ключевое слово в имени домена или в адресе страницы?
    • Style (стиль): Жирный (STRONG или B), Курсив (EM или I), Заголовки HEAD: если место на странице, где ключевое слово использовано в жирных, курсивных или Hx (H1, H2,...) текстовых заголовках?
    • Density (плотность): Насколько часто ключевое слово употреблено на странице?Число ключевиков сравнительно текста страницы называется плотностью ключевого слова.
    • META (мета данные): Впрочем многие отрицают, некорые поисковые системы до сих пор читают мета ключевые слова (meta keywords ) и мета описания (meta description ).
    • Outbound Links (ссылки наружу): На кого есть ссылки на странице и встречается ли ключевое слово в тесте ссылки?
    • Inbound Links (внешние ссылки): Кто еще в Интернет имеет ссылку на данный интернет-сайт? Каков текст ссылки? Это называется "внестраничный" критерий, таккак автор страницы не во всех случаях может им руководить.
    • Insite Links (ссылки внутри страницы): На какие еще страницы данного ресурса содержит ссылки эта страница?

    Итак, алгоритм поисковой системы учитывает:

    1. Число ключевиков на веб-ресурсе.
    2. Число ключевиков на странице.
    3. Соотношение общего количества слов на веб-ресурсе к количеству ключевиков навеб-ресурсе.
    4. Соотношение общего количества слов на странице к количеству ключевиков на странице.
    5. Индекс цитирования.
    6. Популярность темы.
    7. Количество запросов по конкретному ключевому слову за определённый временнойпромежуток.
    8. Общее число веб-страниц ресурса.
    9. Использование стиля к веб-страницам.
    10. Объём текста ресурса.
    11. Объём ресурса.
    12. Объём любой веб-страницы.
    13. Объём текста любой веб-страницы.
    14. Возраст ресурса.
    15. Наименование URL ресурса (имя домена)
    16. Периодичность обновления информации на веб-ресурсе.
    17. Последнее обновление страниц ресурса.
    18. Количество картинок (рисунков) на веб-ресурсе.
    19. Число мультимедийных файлов.
    20. Наличие замещающих надписей на рисунках (картинках).
    21. Длину (в числе знаков) замещающих надписей рисунков (картинок).
    22. Применение фреймов.
    23. Язык ресурса (российский или заграничный).
    24. Размер шрифта, которым оформлены ключевые слова.
    25. Жирность шрифта ключевиков.
    26. Написаны в разрядку или нет ключевые слова.
    27. Написаны или нет заглавными буквами ключевые слова.
    28. Как далеко от начала веб-страницы находятся ключевые слова.
    29. Стиль заголовков и наименований ключевиков.
    30. Наличие и разбор мета-тэгов.
    31. Содержание и наличие описания и свойств страницы.
    32. Наличие файла "робот".
    33. Географическое месторасположение ресурса.

    Даже если сфера вашей деятельности напрямую не связана с поиском и обработкой , в быту вам все равно не обойтись без них. Самые простые на первый взгляд вещи – скажем, подбор необходимой бытовой техники или поиск редкого клипа любимого исполнителя – могут сопровождаться серьезными трудностями. Вроде бы все правильно написал в поисковой строке, ан нет, не находится! Между тем, есть простые приемы, которые позволяют искать нужные сведения в интернете быстрее и эффективнее. И даже если вы не начнете пользоваться всеми теми, о которых мы сегодня расскажем, все равно вам будет гораздо проще и легче заниматься интернет-серфингом – а ведь именно так и называется поиск информации во всемирной сети.

    Правильно составляйте поисковые запросы

    Это – самый главный и самый эффективный прием при поиске информации в интернете. Поиск по одному слову выдаст несколько миллионов результатов, поиск по двум – уже на порядок меньше, а на запрос из, скажем, четырех или шести слов – всего несколько тысяч, а то и меньше. К тому же чем точнее и грамотнее составлен запрос, тем выше вероятность, что искомый результат обнаружится на первой странице. Кроме того, не забывайте о том, что поисковые системы не всегда могут исправить орфографические ошибки в запросах, а некоторые и за ошибки не считают (например, не видят разницы между –тся и –ться, которая может оказаться принципиальной для поиска). И не игнорируйте заглавные буквы, если не хотите разбираться с лишними результатами. Скажем, запрос по слову «лебедь» выдаст результаты и с информацией о птице, и с данными о покойном генерале Александре Лебеде, а «Лебедь» – в основном о генерале, хотя будут попадаться и упоминания о птице, если слово стояло в начале предложения.

    Используйте как минимум две поисковые системы

    У разных поисковиков несколько разные способы индексации страниц. Поэтому, как правило, даже самые простые поисковые запросы в разных системах приносят разные результаты. Во-первых, то, что не заметила одна поисковая система, может заметить другая – и наоборот. Во-вторых, некоторые результаты в одной системе окажутся на десятой или двадцатой странице, а в другой попадут в первую пятерку. Кроме того, разные поисковые системы по-разному реагируют на частоту употребления слов в запросе, на наличие или отсутствие заглавных букв, на расположение слов запроса в пределах одного документа и даже одного предложения.

    Уточняйте географию запросов


    Для жителей Москвы этот прием менее актуален, чем для всех остальных россиян. Дело в том, что поисковые системы, даже если и учитывают месторасположение компьютера, с которого вводится поисковый запрос, тем не менее, в первую очередь индексируют страницы с наибольшим числом обращений. А такие страницы, как правило, связаны с Москвой, где сосредоточено значительное количество интернет-пользователей, которые к тому же отличаются высокой активностью. Поэтому не надейтесь на то, что поисковая система помнит, где вы живете. Лучше просто добавить в поисковый запрос упоминание о своем городе или области.

    Впрочем, и москвичам не стоит пренебрегать этим приемом. Столица велика, нужные услуги могут оказывать в любом ее месте. Невелико удовольствие раз за разом кликать на результаты поиска и выяснять, что фирма расположена в трех часах езды от дома или офиса. Зато даже простое упоминание района или ближайшей станции метро позволит вывести в первые строчки результатов именно те компании, которые находятся ближе всего.

    Уточняйте предметную область запросов


    В принципе, это то же самое правило, которое касается и географии. Банальное слово «шина» выдаст подавляющее большинство результатов, не имеющих никакого отношения к медицине. А если у пользователя даже автомобиля нет, зато ему завтра сдавать зачет по первой медицинской помощи? Тут-то и стоит вспомнить, что простое дополнение слова «медицина» к слову «шина» уже поможет исключить из результатов большинство автомобильных ссылок и вывести на первые страницы именно шины, которые накладывают в случае переломов.

    То же касается и любых других предметных областей. Как правило, у поисковых систем есть встроенное меню, позволяющее уточнять, что ищет пользователь: картинки, видео, словарные статьи, перевод слова, новостные материалы по своему запросу и так далее. Но и пользователю не стоит лениться: слово «медицинская» к слову «шина» за него не подставит ни одна поисковая система.

    Пользуйтесь расширенным поиском

    Этот совет прямо следует из двух предыдущих, поскольку позволяет не придумывать самому уточняющие слова в запросы, а пользоваться уже разработанной для поиска именно в этой системе структурой. Пренебрегать ею не стоит: программисты поисковых сервисов куда как лучше большинства даже продвинутых пользователей знают, какими алгоритмами пользуются их продукты и как именно они ищут. Поэтому, вводя в поисковик те же «шины», попробуйте детальнее структурировать свой запрос с помощью расширенного поиска.

    Просматривайте хотя бы первые десять страниц результатов


    Почему стоит следовать этому правилу? Потому что на первых страницах будут не только самые релевантные, то есть точнее всего соответствующие запросу, результаты. Там будут результаты, найденные на самых популярных страницах. А это, как правило, страницы и порталы, которые содержат не самую точную, зато лучше всего соответствующую популярным поисковым запросам информацию. Простой пример: результаты поиска по одному-единственному слову в большинстве случаев будет начинаться со ссылки на соответствующую статью в Википедии. И хотя в настоящее время информация из свободной энциклопедии вызывает куда больше доверия, чем лет пять-семь назад, не стоит ограничиваться ею. А, допустим, ссылка на научную работу, детально описывающую именно то, что ищет пользователь, окажется на двенадцатой или двадцать пятой странице – просто потому, что к этому научному порталу обращаются в десятки или сотни раз реже, чем к Википедии.

    Пользуйтесь функцией «Поиск в найденном»

    Этот прием тоже позволяет сужать область поиска за счет уточнения, какие именно, например, шины ищет пользователь. Поиск в найденном поможет быстро устранить подавляющее большинство результатов из смежных или вовсе посторонних областей или из других географических регионов. Нужно только помнить, что и к поиску в найденном применимы все те же вышеперечисленные правила. Кроме того, поиск в найденном позволяет структурировать результаты поиска с учетом уже полученных ссылок и найденной информации, что повышает вероятность нахождения одной-единственной требуемой ссылки.

    Переформулируйте запросы с учетом уже полученных результатов


    Даже беглый просмотр полученных результатов поиска, как правило, показывает, что интересующий вас предмет или понятие разные люди ищут по-разному. Не пренебрегайте их опытом! Самый простой способ – обратить внимание на предлагаемые поисковой системой варианты запросов, когда вы только вводите их в поисковую строку. Даже если воспользоваться последовательно хотя бы пяти такими «автоматическими» вариантами, это уже позволит сделать поиск более эффективным. А если добавить к автоматическим вариантам свои собственные, уточняющие и корректирующие первоначальный запрос, то и подавно.

    Используйте синонимы, ищите по официальным названиям и ключевым фразам

    Прием, напоминающий поиск в найденном, но позволяющий не сузить, а уточнить поиск. Скажем, пользователь ищет информацию о предмете, который более известен под просторечным названием. Тогда, получив информацию о том, как на самом деле официально, а не в разговорной речи, называется объект поиска, можно задать новый, более точный поисковый запрос. Кстати, правило действует и в другую сторону: нередко оказывается, что гораздо больше информации можно найти о предмете, введя в поисковую строку его «народное» название или прозвище, информация о которых нашлась в результате первого .

    Используйте операторы поиска

    Этот совет не случайно стоит последним: он годится скорее продвинутым пользователям и тем, кто в школе хорошо успевал по точным наукам. Поэтому мы даже не будем углубляться в подробное описание всех операторов поиска. Скажем только, что операторы поиска – это специальные знаки типа «+», «-», «~», «|» и так далее, подставляемые в текст запроса. Их использование позволяет включать и исключать из поиска конкретные слова из словосочетания, добиваться, чтобы поисковая машина искала словосочетание в пределах одного предложения или одного документа и так далее. А если читателю интересно побольше об этом узнать – он может ввести в поисковую строку словосочетание «операторы поиска», а потом воспользоваться всеми вышеприведенными советами. Результат гарантирован!

    16.Поиск информации в интернете

    Информация, размещенная во Всемирной сети, исчисляется огромным количеством байт. Для поиска информации во Всемирной сети используются специальные веб-сайты – информационно-поисковые системы. Они позволяют по ключевым словам найти информационные ресурсы, связанные с ключевыми словами. Это может быть текст, содержащий ключевые слова, или графическое изображение одного из ключевых слов. Примерами информационно-поисковых систем являются системы Google и Yandex.

    Поиск информации – одна из самых востребованных на практике задач, которую приходится решать любому пользователю Интернета.

    Существуют три основных способа поиска информации в Интернет:

    1. Указание адреса страницы.

    3. Обращение к поисковой системе (поисковому серверу).

    Способ 1: Указание адреса страницы

    Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ.

    Не стоит забывать возможность поиска по открытой в окне браузера web-странице (Правка-Найти на этой странице…).

    Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу.

    Способ 3: Обращение к поисковой системе

    Пользуясь гипертекстовыми ссылками, можно бесконечно долго путешествовать в информационном пространстве Сети, переходя от одной web-страницы к другой, но если учесть, что в мире созданы многие миллионы web-страниц, то найти на них нужную информацию таким способом вряд ли удастся.

    На помощь приходят специальные поисковые системы (ихеще называют поисковыми машинами). Адреса поисковых серверов хорошо известны всем, кто работает в Интернете. В настоящее время в русскоязычной части Интернет популярны следующие поисковые серверы:Яндекс (yandex.ru), Google (google.ru) и Rambler (rambler.ru

    Поисковая система - веб-сайт, предоставляющий возможность поиска информации в Интернете.

    Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.

    По принципу действия поисковые системы делятся на два типа: поисковые каталоги и поисковые индексы.

    Поисковые каталоги служат для тематического поиска.

    Информация на этих серверах структурирована по темам и подтемам. Имея намерение осветить какую-то узкую тему, нетрудно найти список web-страниц, ей посвященных.

    Катало́г ресурсов в Интернете или каталог интернет-ресурсов или просто интернет-каталог - структурированный набор ссылок на сайты с кратким их описанием.

    Поисковые индексы работают как алфавитные указатели. Клиент задает слово или группу слов, характеризующих его область поиска, - и получает список ссылок на web-страницы, содержащие указанные термины.

    Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, разработанный Мэтью Грэйем из Массачусетского технологического института в 1993.

    Как работает поисковой индекс?

    Поисковые индексы автоматически, при помощи специальных программ(веб-пауков), сканируют страницы Интернета и индексируют их, то есть заносят в свою огромную базу данных.

    Поисковый робот («веб-паук») - программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них (ключевые слова) в базу поисковика. По своей сути паук больше всего напоминает обычный браузер. Он сканирует содержимое страницы, забрасывает его на сервер поисковой машины, которой принадлежит и отправляется по ссылкам на следующие страницы.

    В ответ на запрос, где найти нужную информацию, поисковый сервер возвращает список гиперссылок, ведущих web-страницам, на которых нужная информация имеется или упоминается. Обширность списка может быть любой, в зависимости от содержания запроса.

    http://www.yandex.ru/

    Яндекс - российская система поиска в Сети. Сайт компании, Yandex.ru, был открыт 23 сентября 1997 года. Головной офис компании находится в Москве. У компании есть офисы в Санкт-Петербурге, Екатеринбурге, Одессе и Киеве. Количество сотрудников превышает 700 человек.

    Слово «Яндекс» (состоящее из буквы «Я» и части слова index; обыгран тот факт, что русское местоимение «Я» соответствует английскому «I») придумал Илья Сегалович, один из основателей Яндекса, в настоящий момент занимающий должность технического директора компании.

    Поиск Яндекса позволяет искать по Рунету документы на русском, украинском, белорусском, румынском, английском, немецком и французском языках с учётом морфологии русского и английского языков и близости слов в предложении. Отличительная особенность Яндекса - возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов.

    По умолчанию Яндекс выводит по 10 ссылок на каждой странице выдачи результатов, в настройках результатов поиска можно увеличить размер страницы до 20, 30 или 50 найденных документов.

    Время от времени алгоритмы Яндекса, отвечающие за релевантность выдачи, меняются, что приводит к изменениям в результатах поисковых запросов. В частности, эти изменения направлены против поискового спама, приводящего к нерелевантным результатам по некоторым запросам.

    http://www.google.ru/

    Лидер поисковых машин Интернета, Google занимает более 70 % мирового рынка. Cейчас регистрирует ежедневно около 50 млн поисковых запросов и индексирует более 8 млрд веб-страниц. Google может находить информацию на 115 языках.

    По одной из версий, Google - искажённое написание английского слова googol. «Googol (гугол)» – это математический термин, обозначающий единицу со 100 нулями. Этот термин был придуман Милтоном Сироттой, племянником американского математика Эдварда Каснера, и впервые описан в книге Каснера и Джеймса Ньюмена «Математика и воображение»(Mathematics and the Imagination). Использование этого термина компанией Google отражает задачу организовать огромные объемы информации в Интернете.

    Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д.

    http://www.rambler.ru/

    Rambler Media Group - интернет-холдинг, включающий в качестве сервисов поисковую систему, рейтинг-классификатор ресурсов российского Интернета, информационный портал.

    Rambler создан в 1996 году.

    Поисковая система Рамблер понимает и различает слова русского, английского и украинского языков. По умолчанию поиск ведётся по всем формам слова.

    Проблема поиска во Всемирной паутине не в том, что информации мало, а в том, что ее много. Поиск информации в Интернете - краеугольный камень эффективной работы в Сети. Владение навыками поиска делает Интернет для пользователя полезным как во время работы, так и во время отдыха.
    Для организации поиска в Интернете существуют специализированные службы, называемые поисковыми системами.

    Поисковые системы.

    Поисковые системы - программно-аппаратный комплекс с web -интерфейсом, предоставляющий возможность поиска информации в Интернете.
    Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet. Для поиска информации с помощью поисковой системы пользователь формулирует поисковый запрос. По запросу пользователя поисковая система генерирует страницу результатов поиска. Такая поисковая выдача может сочетать различные типы файлов, например: веб-страницы, изображения, аудиофайлы. Некоторые поисковые системы также извлекают данные из баз данных и каталогов ресурсов в Интернете.
    Цель поисковой системы заключается в том, чтобы находить документы, содержащие либо ключевые слова, либо слова как-либо связанные с ключевыми словами. Поисковая система тем лучше, чем больше документов, релевантных запросу пользователя, она будет возвращать. Результаты поиска могут становиться хуже из-за особенностей алгоритмов. Например, на запрос домашние животные поисковый сервер «Яндекс» (подробнее о нем см. ниже) выдает более 14 000 000 ссылок на страницы, содержащие нужные, на его взгляд, сведения. Однако далеко не все так гладко: при посещении некоторых найденных страниц выясняется, что искомой информации на них недостаточно, а то и вовсе нет.
    Чтобы искать с максимальной результативностью необходимо знать как работают поисковые серверы и правильно составлять запрос на поиск информации.

    Принципы работы поисковых систем

    Поисковые системы работают, храня информацию о многих web -страницах, которые они получают из HTML страниц. Основные составляющие поисковой системы: поисковый робот, индексатор, поисковик. Обычно системы работают поэтапно. Сначала поисковый робот получает контент, затем он просматривает содержимое web -сайтов. Только после этого индексатор генерирует доступный для поиска индекс. Индексатор - это модуль, который анализирует страницу, предварительно разбив её на части, применяя собственные лексические и морфологические алгоритмы.
    В основе работы большинства современных поисковиков лежит индекс цитирования, который вычисляется индексатором в результате анализа ссылок на текущую страницу с других страниц Интернета. Чем их больше, тем выше индекс цитирования анализируемой страницы, тем выше эта страница будет отображена в результатах поиска и тем выше страница будет представлена в списке найденных ресурсов.

    Правила построения поисковых запросов

    Как уже отмечалось, в Интернете существует множество поисковых серверов, отечественных и зарубежных.
    Российские поисковые серверы: Яндекс (www.yandex.ru); Рамблер (www.rambler.ru); Апорт (www.aport.ru) и Gogo (www .gogo .ru ).

    Зарубежные поисковые серверы: Google (www .google .com ); Altavista (www .altavista .com ) и Yahoo ! (www .yahoo .com ).
    Для поиска на русском языке лучше подходят российские серверы, на иностранном - зарубежные, хотя, Google неплохо справляется с поиском на многих языках. Несмотря на заявления многих владельцев поисковых систем, что запросы могут быть написаны практически на языке, который люди используют для общения между собой, это далеко не так. Благодаря внедрению новых языковых технологий поисковые системы стали гораздо лучше понимать пользователя. Поисковики теперь ищут не только запрашиваемое слово, но и его словоформы, что позволяет делать результаты поиска более точными. Например, если в поисковом запросе присутствует слово умный, то его результаты будут содержать не только это слово, но и его производные: умного, умная, а также ум и даже разум. Естественно, страницы со словоформами будут не в числе первых результатов поиска, но элементы искусственного интеллекта налицо. Этот факт полезно учитывать при построении поисковых запросов.
    Следует помнить о том, что поисковые системы при обработке запроса не учитывают регистр символов, а применять знаки препинания в поисковых запросах вовсе не обязательно, так как они также игнорируются поисковыми серверами. Однако при построении сложных расширенных запросов, результаты поиска по которым обычно гораздо ближе к ожидаемым, используют традиционные знаки препинания. Большинство поисковых систем может бороться с опечатками. Если поисковому серверу покажется, что в слове допущена ошибка или опечатка, то он предупредит об этом той же фразой: Быть может, вы искали….

    Cлова для запроса поисковому серверу

    Есть выражение «Машина должна работать, человек - думать», и сказано оно как раз о такой ситуации. Задача пользователя при составлении поискового запроса - выделить ключевые слова, задача поискового сервера - наилучшим образом обработать введенный запрос. Рассмотрим пример, иллюстрирующий типичные ошибки начинающих пользователей при поиске в Интернете. На запрос «Загадки о музыкальных инструментах» поисковик не выдал полезных результатов. Тогда пользователь решает исправить запрос, дополнив его и написав: «Загадки для детей о музыкальных инструментах» - результаты поиска оказались еще хуже предыдущего. Для данного примера неплохим решением явился поиск по ключевому слову «загадки». В Интернете много таких сайтов, а зайдя на сам сайт и немного поискав по его разделам, вполне можно найти интересующую информацию. Сформулируем несколько правил составления запросов:

    • выбирайте только самые важные ключевые слова, касающиеся рассматриваемой темы;
    • слов не должно быть слишком много, но и не слишком мало;
    • при неудовлетворительных результатах поиска, используйте более «мягкие» условия для запроса или попробуйте поискать в другой поисковой системе, т.к. механизмы работы поисковиков неодинаковые, следовательно, результаты также могут различаться.

    Расширенный поиск

    Для обеспечения более эффективного поиска в Интернете поисковые системы предоставляют возможность расширенного поиска, а также поиска с использованием языка запросов. Расширенный поиск - возможность поиска с указанием множества различных параметров. Для этого в поисковиках предусмотрены отдельные страницы, на которых можно задать такие параметры. Принципы работы расширенного поиска похожи у большинства поисковиков.
    Рассмотрим дополнительные возможности поиска на примерах поисковиков Яндекс и Google потому что Яндекс - самый популярный поисковый сервер в русскоязычном Интернете, а Google - самый популярный поисковик в мире. При поиске в Интернете «Яндекс» одним из первых стал учитывать морфологию русского языка, то есть использовать различные формы слова, о чем говорилось выше. Зайдя на сайт www.yandex.ru, пользователь может ввести запрос и тут же получить результаты поиска, а можно использовать ссылку Расширенный поиск, используя пиктограмму , и перейти на соответствующую страницу (см. рисунок ниже), на которой тонко настроить параметры поиска.

    Страница расширенного поиска «Яндекса»

    Рассмотрим дополнительные возможности, которые можно использовать на странице расширенного поиска: указать собственное местоположение (Москва), указать в каком виде должна быть представлена информация (Тип файла), период времени в котором ищем информацию (за сутки, за 2 недели, за месяц, От..До), на каком языке должна быть представлена информация (Русский, Английский Еще), а также можно указать URL -адрес сайта и т.д
    Выбор (Точно как в запросе) указывается поисковику для того, чтобы морфологию слов запроса не изменять, а искать только ту форму слова, которая задана.

    Язык запросов

    Язык запросов - система команд, позволяющая изменять параметры запроса из основной строки поиска с помощью специальных команд. Ориентирован на опытных пользователей.
    Поскольку язык запросов достаточно сложен и объемен, приведем лишь основные его конструкции, которые могут быть наиболее востребованы пользователями. Некоторые команды языка запросов «Яндекса» представлены в таблице.

    Оператор

    Описание

    Синтаксис

    Пример запроса

    Поиск документов, в которых обязательно присутствует выделенное слово.

    Допустимо использовать несколько операторов + в одном запросе.

    "слово 1 +слово 2 "

    Будут найдены документы, в которых обязательно содержатся слова «бульвар» и «Москва» и может присутствовать слово «шолохов».

    Поиск по цитате.

    Поиск документов, содержащих слова запроса в заданной последовательности и форме.

    "слово 1 слово 2 ... слово N "

    Будут найдены документы, содержащие данную цитату.

    Поиск по цитате с пропущенным словом (словами).

    Один оператор * соответствует одному пропущенному слову.

    Внимание! Используется только в составе оператора .

    "слово 1 * слово 2 ... слово N "

    Оператор отделяется пробелами.

    Будут найдены документы, содержащие данную цитату, включая пропущенное слово.

    Будут найдены документы, содержащие данную цитату, включая пропущенные слова.

    Полностью со структурой языка запросов «Яндекса» можно познакомиться на странице Помощи (http://help.yandex.ru/search/?id=481939). Язык поисковых запросов в Google отличается от Яндекса, хотя есть и некоторые общие моменты. Рассмотрите некоторые основные команды этого языка, изучив таблицу (см.ниже)

    Полностью со структурой языка запросов Google можно познакомиться на странице Помощи:



    Рекомендуем почитать

    Наверх