Ли поисковый. Поисковые системы Интернета: Яндекс, Google, Rambler, Yahoo. Состав, функции, принцип работы. Рейтинг: лидеры рынка

Скачать на Телефон 16.03.2019
Скачать на Телефон

Приветствую вас ребята. Скажите мне, сколько у вас отнимает времени на поиск файлов на компьютере. Я думаю, очень много, а тем более если вы ведёте свой блог в интернете или просто фотограф. Файлов в таком случае собирается очень большое количество. Есть несколько способов быстро отыскать нужный файл. Например, вот так или вот так

Это хорошо если ты точно знаешь, что они именно там находятся. А если ищешь нужный файл и точно знаешь, что он есть на компьютере, а где и в какой папке? Ну, просто склероз заходит в гости. И тогда нам в помощь программа FileSearchy. Смотрите её возможности.

Классная программа, сам нею часто пользуюсь и Вам рекомендую.

Выглядит она вот таким образом.В левой части находится поисковая строка, куда Вы должны ввести название потерянного файла. После этого жмёте на кнопку расположенную в самом низу окна программы.

Не пройдёт и пяти секунд как программа прошарит все жёсткие диски и выдаст все файлы у которых в названии есть то слово, которое Вы ввели в поисковике. Видите как программа FileSearchy шустро работает, а если бы вручную начали искать то точно бы не вписались в то время за которое программа справилась.

Так мы ищем все файлы в которых есть совпадение по нашему запросу. А файлов в которых есть одинаковое слово может быть очень много и поэтому нам всё равно придется потерять часть времени. В таком случае программа нам предоставляет расширенный поиск. То есть упрощённый.

Поиск файлов на компьютере по типу

Если нам нужно найти только картинки, значить ищем картинки. Если только папки значит просим у программы показать только найденные папки под тем именем которое мы прописали в поисковике. В общем сортируем. Найдите все файлы, а потом укажите тип файла, выставив галочку.

Так Вы ещё больше сэкономите время. FileSearchy может распознавать такие типы файлов как изображения, аудио, видео, документы, программы и папки.

У FileSearchy есть и другие возможности. Например нам нужны файлы только с диска «D». Под поисковой строкой выставляем галочку напротив пункта «В директории» Искать будем в определённом месте, а не во всей памяти компьютера. Смотрите на изображение, как это делается.

Кстати программа позволяет нам выбрать сразу несколько мест для поиска. Допусти на диске «Е» и в одной из папок на любом другом диске.

Так же можно исключить из поиска некоторые директории (диски или папки). Это значит если Вы ищете на всём компьютере, то те директории которые исключены из поиска просто не будут сканироваться и не появятся в результате выдачи.

Обратите внимание, те папки и диски, которые не сканируются имеют перед буквой диска или названия папки восклицательный знак.

Так что нажав на стрелочку в поиске мы будем знать, что просканируеться, а что программа выкинет из поиска.

Ну, и ещё некоторые возможности этой программы, которые в принципе я очень редко использую. Хотя в некоторых случаях они будут очень полезны.

Поиск файлов в содержимом документа

В параметрах поиска есть пункт «В содержимом» Этот режим поиска больше относится к поиску текстовых документов. Допустим Вы забыли как подписан документ. К примеру, скачали с интернета книгу название которой было на английском или на транслите. Как правильно написать не знаете, но помните какие слова в ней встречались.

И ещё два фильтра которые можно применить, это поиск по дате и размеру. Здесь всё понятно.

Версия которой я пользуюсь.

А у кого нет желания устанавливать программу на компьютер, есть портативная версия похожей программы. Сразу скажу, она не такая привлекательная в плане интерфейса, но зато имеет свои интересные фишки.

Можете узнать о ней и скачать с официального сайта http://www.voidtools.com

Это полезно знать:


всего

Вступление

Мало кто сейчас может представить Интернет без поиска, поисковой выдачи и организующих всё это информационных поисковых систем (ИПС). А ведь еще недавно, вся информация Интернет умещалась в несколько каталогов, название которые еще на слуху (DMOZ, Yahoo).

Сегодня, объем информации в сети Интернет настолько огромный, что уместить её ни в какие каталоги не возможно. Для обработки, хранения информации, организации поиска созданы и продолжают создаваться, мощные программные продукты которые мы называем поисковые системы (ПС). У каждой поисковой системы (поисковика) свои базы данных, свои алгоритмы обработки, поиска, ранжирования и выдачи информации.

Поисковые системы Интернет это

Можно дать следующее академическое определение поисковым системам. Поисковая система это набор программ и технических средств для организации в сети Интернет пользовательского поиска, при котором на текстовой запрос, пользователь получает список релевантных (соответствующих запросу) результатов.

Выдача производится в виде списка ссылок на источник информации с кратким описанием (превью) иногда с фото.

Для первого примера, вспомним мирового лидера поиска «Google» и лидера Рунета поисковик «Яндекс». Кроме этих поисковиков можно назвать еще десяток существующих поисковых систем, о коих поговорим чуть ниже.

Мнение: Поисковые системы Google, Яндекс и другие, не являются генераторами (производителями) контента, а являются агрегаторами (аккумуляторами) контента и в основной массе, чужого контента. Стоит вспомнить, что использование чужого контента для создания собственного трафика и его монетизации, можно характеризовать, как «пиратство», что на деле, конечно же, не происходит.

Рейтинг

  • и Google делят первые два места лидеров: около 49% и 45%.
  • Третье место: Поиск Mail.ru около 3%;
  • Остальные поисковики плавают ниже 1%.

Смотрю статистику по Google Analytics:

  • yandex / organic 40,26 %
  • google / organic 38,93 %
  • mail.ru / organic 0,60 %
  • rambler / organic 0,52 %
  • bing / organic 0,12 %

Статистика неумолима: к поискам Яндекс и обращаются больше всего, и если посчитать, что 3% это хороший результат по сравнению с 45%, то третьим по популярности можно назвать поиск Mail.ru.

В этой связи рассуждения о популярности поисковиков кроме Яндекс и Google, можно отнести к суемудрию, а специальное продвижение сайтов в других поисковиках (не Яндекс и Google), не заслуживающих внимание.

Как работают поисковики

Вопрос, как работают поисковики, такой же общий, как вопрос «какого цвета небо». Если небо синее, то поисковики собирают информацию в интернет, обрабатывают её, ранжируют и отдают по поисковому запросу пользователю.

Теория поиска Интернет гораздо объемнее и в статье её не изложить. Однако основные моменты нам пригодятся:

Поисковые системы Интернет не осуществляют хранение документов, то есть не производят скачивание и выгрузку документов полностью в свои хранилища;

ИПС используют Интернет в качестве децентрализованного хранилища документов. Поисковики периодически обходят Интернет, выбираю нужную, по их алгоритмам, информацию и частично помещая её (информацию) в свою базу данных (Database). Отсюда несколько проблем:

  • ИПС используют для выдаче не всю информацию Интернет, а только часть;
  • Информация интернет часто меняется. Добавляется около 1500 тыс. страниц в день, отсюда возможная «пустая выдача»;
  • Имеется большое количество дублей (дубли контента). К сожалению, у меня нет точных данных по дублям, а встречающаяся цифра в 25% дублей, кажется завышенной;
  • Много рекламы, которую тоже обходят поисковики;
  • «Блуждание» поисковых роботов в сети многократно увеличивает нагрузку не ресурсы (не относится к поисковикам);
  • Большинства сайтов коммерческие (порядка 83%), и имеют малое информативное значение.

По этим и некоторым другим причинам, подавляющее большинство ИПС Интернет используют схему поиска по ключевым словам (search engines), а не классическую схему поиска по классификации информации.

Особенности поиска по ключевым словам

Несмотря на меняющиеся алгоритмы поисковых систем, реклама которых пытается нас убедить, что машины становятся умнее и понятливее, в основу работы поисковых систем лежит поиск по ключевым словам.

Мне нравится такая схема поиска по ключевым словам.

Как видим, работа поисковые системы Интернет основана на поиске новых документов (поисковой робот Spider + Crawler), индексирование обнаруженных документов (Indexer) и выполнение пользовательского запроса (Search Engine Results Engine). В скобках перечислены названия используемых для этих целей поисковых роботов.

Как я сказал, большинство поисковых систем не копируют полные тексты документов в свою базу данных. Для поиска при индексировании документа создается его поисковый образ. Для организации поиска по , робот индексирования создает образ документа по, так называемому, выводящему методу (derived). То есть в образе документа указывается заголовок и набор ключевых слов.

Однако достаточно точно можно утверждать, что все ИПС обращают внимание на следующее:

  • Присутствие ключевого слова в документа;</li><li>Наличие ключа в URL или домене;</li><li>Присутствие ключа в подзаголовке;</li><li>Общее количество ключей на странице (плотность %);</li><li>Присутствие ключей в описании (description);</li><li>Какие ссылки web ведут на эту страницу;</li><li>Какие внутренние ссылки есть на этой странице.</li> </ul><h2><span>Ранжирование страниц </span></h2><p>В завершении теории стоит упомянуть о . Чаще ранжирование страниц выдаче упоминается в контексте релевантности. То есть, поисковики, должны, выстраивать поисковую выдачу по максимально точному соответствию поисковому запросу. Как пишет Яндекс, ничего не должно быть потеряно (полнота выдачи) и ни чего не должно быть найдено лишнего (точность выдачи). Как это получается на практике, вы видите каждый день.</p><h2>Вывод </h2><ul><li>Поисковые системы Интернет это сложные программные продукты, работу которых обеспечивают тысячи специалистов и огромные материальные ресурсы.</li><li>Алгоритмы поисковых систем держатся в секреты, хотя базовые акценты обновлений алгоритмов общедоступны и носят имена собственные.</li><li>Несмотря на разный подход в формировании выдачи, все поисковики базируются на общих принципах индексирования страниц, которые по сей день остаются базовыми для продвижения.</li> </ul><h2><span>Яндекс поисковик </span></h2><p>Популярный поисковик Рунета, который часто становится самым популярным. По статистике 2009 года, Яндекс постоянно обходит 15 миллионов страниц Рунета, перерабатывая 140 тыс. Гб текстовых данных, 1,6 миллиарда <a href="/kak-oformit-tvitter-akkaunt-dlya-kompanii-kakoi-twitter-akkaunt-sozdat-tipy/">уникальных картинок</a> из 2,1 миллиарда картинок всего.</p><p>Создан Яндекс поисковик в 1993 году. Слово Яндекс ничего не означает, хотя принято считать, что это преобразование слова «Index», или словосочетания «yet another indexer». На сегодня Яндекс.Поиск обрабатывает четверть миллиарда запросов в день и если бы был так навязчив, то был бы моим любимым поисковиком.</p><h2>Поиск Яндекс </h2><p>https://yandex.ru/ : Пользовательский поиск Яндекс организован по интернет с учётом региона пользователя. Возможность искать по картинкам, видео, картам, новостям, блогам, товарам и словарям.</p><p><img src='https://i0.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-4.png' align="center" width="100%" loading=lazy></p><p>Для тонкого поиска существует свой язык поиска тут (https://yandex.ru/support/search/query-language/).</p><p><img src='https://i0.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-6.png' width="100%" loading=lazy></p><p>поисковые системы Интернет Яндекс</p><h2>Google поисковик </h2><p>В <a href="/kak-uznat-skrytye-dannye-vkontakte-kak-poluchit-informaciyu-kotoruyu/">поисковике Google</a> поиск организован без тематики (основной поиск) и поиск по разделам: картинки, новости, карты, видео, покупки, книги, авиабилеты, финансы.</p><p><img src='https://i1.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-8.png' align="center" width="100%" loading=lazy></p><p>Есть настройки:</p><p><b>Безопасный поиск. </b> Позволяет блокировать неприемлемый контент и изображения сексуального характера в результатах поиска Google. Эта функция не гарантирует стопроцентную защиту, но скрывает большую часть подобного контента.</p><p><img src='https://i0.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-13.png' align="center" width="100%" loading=lazy></p><p><img src='https://i1.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-9.png' align="center" width="100%" loading=lazy></p><p><b>Настройка количества результатов </b> на странице (по умолчанию 10).</p><p><b>Персональные результаты </b>. Находить в Google ссылки, картинки и видео, которыми с вами поделились ваши друзья в соцсетях.</p><p><b>Выбор региона </b>. По умолчанию текущий регион.</p><p><b>Языки. </b> Можно указать язык поиска.</p><p><b>Расширенный поиск. </b> Позволяет осуществить поиск по расширенным параметрам.</p><p><b>Инструменты. </b> Здесь можно выбрать язык поиска, указать время появления информации, и выбрать точное совпадение или всю выдачу.</p><p><img src='https://i0.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-10.png' width="100%" loading=lazy></p><p>поисковые системы Интернет Google</p><h2>Mail поисковик </h2><p>https://go.mail.ru/. Здесь поиск организован по Интернет (общий поиск), по видео и картинкам. Есть отдельный поиск по приложениям для <a href="/kak-uznat-svoi-balans-iota-na-telefone-kak-uznat-balans-na-yota-s-razlichnyh/">мобильных устройств</a>.</p><p> (<span>https://www.bing.com/?scope=web&FORM=Z9LH </span>). <a href="/asya-250-shema-poiska-obshchie-svedeniya-o-metalloiskatele-instrukciya-po/">Общий поиск</a>, поиск по картинкам, видео, новостям, картам.</p><p><img src='https://i2.wp.com/seojus.ru/wp-content/uploads/2017/12/poiskoviki-Internet-11.png' align="center" width="100%" loading=lazy></p><p><b>Yahoo поиск по-русски </b>. https://ru.search.yahoo.com/ . Чистый поиск без рекламы. Поиск в Интернет, по картинкам и новостям. Выбор время добавления информации.</p><h2>Другие поисковики</h2><ul><li>DuckDuckGo (https://duckduckgo.com/ ) Интеллектуальный поиск.</li><li>Pipl (https://pipl.com/ ) Поиск людей в США.</li><li>Findsounds (<span>http://www.findsounds.com/ 11 Инструментов для анализа релевантности страниц сайта поисковому запросу</span></li> </ul> <p>Лучшие поисковые системы Интернета. Поисковая система интернета<b> – </b>это специальные программы для поиска, установленные на целый комплекс специализированных машин. А по-простому — это тот же сайт с комплексом программ, только на специальной поисковой машине (сервере). Именно при помощи поисковых систем вы находите всю нужную вам информацию. Поисковых систем очень много.</p> <p>1. <span>Что такое поисковая система Интернета </p> <p>2. Популярные поисковые системы нашей страны </p> <p>3. Популярные поисковые системы Зарубежья </p> <p>4. Необычные поисковые системы </p> <p>5. Как правильно искать информацию в Интернете </p> <p>Самые <b>лучшие п </b><b>оисковые системы </b> в нашей стране:</p> <p>http://www.yandex.ru</p> <p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/2-Google.jpg' align="center" width="100%" loading=lazy></p> <p>http://www.google.com</p> <p><img src='https://i2.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/3-Aport.jpg' align="center" width="100%" loading=lazy></p> <p>http://www.aport.ru</p> <p><img src='https://i2.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/4-Rambler.jpg' align="center" width="100%" loading=lazy></p> <p>http://www.rambler.ru/</p> <p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/5-Mail.jpg' align="center" width="100%" loading=lazy></p> <p>http://go.mail.ru</p> <p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/6-Webalta.jpg' align="center" width="100%" loading=lazy></p> <p>http://www.webalta.ru/</p> <p>Самый всеми нелюбимый и навязчивый поисковик.</p> <h3><span><b>Популярные поисковики зарубежья </b> </span></h3> <p>http://www.altavista.com</p> <p>http://www.alltheweb.com</p> <p>http://www. bing.com</p> <p>http://www.google.com<br> http://www.excite.com<br> http://www.lycos.com<br> http://www.mamma.com</p> <p>http://www.yahoo.com</p> <p>http://www.dmoz.com<br> http://www.hotbot.com<br> http://www.dogpile.com<br> http://www.netscape.com<br> http://www.msn.com<br> http://www.webcrawler.com<br> http://www.jayde.com<br> http://www.aol.com<br> http://www.euroseek.com<br> http://www.teoma.com<br> http://www.about.com<br> http://www.ixquick.com<br> http://www.lookle.com<br> http://www.metaeureka.com<br> http://www.searchspot.com<br> http://www.slider.com<br> http://www.allthesites.com<br> http://www.clickey.com<br> http://www.galaxy.com<br> http://brainysearch.com<br> http://www.orura.com</p> <p>У каждой страны существую свои популярные поисковые системы.</p> <h3><span><b>Необычные поисковые системы </b> </span></h3> <ul><li><b><i>DuckDuckGo </i> </b> (https://duckduckgo.com/)- гибридная поисковая система с политикой конфиденциальности пользователя и его поисковых запросов.</li> </ul><p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/7-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy></p> <ul><li><b><i><span>TinEye </i> </b> </span><b><i>(http://tineye.com/) </i> </b>- поисковая система, специализирующаяся на поиске изображений в Интернете. С недавнего времени теряет свою актуальность, после того, как Google ввел такую же функцию в своем поиске по картинкам.</li> </ul><p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/8-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy></p> <ul><li><b><i>Генон </i> </b> (http://www.genon.ru/) - поисковая система, собирающая и создающая контент у себя на сайте.</li> </ul><p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/9-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy></p> <p>Почти в каждой поисковой системе помимо окна поиска расположены <b>ссылки </b> на самые популярные новостные сайты, и сайты определенной тематики.</p> <h3><span><b>Как правильно искать информацию в Интернете </b> </span></h3> <p>В каждой поисковой системе есть свои алгоритмы (правила) поиска информации.</p> <p>Для того, чтобы найти какую-то информацию в Интернете через поисковую систему, необходимо в поле поиска ввести <b>запрос </b>. Если вы введете какое-то одно слово, то вам по этому запросу выдадут тысячи ссылок на сайты, в которых это слово упоминается.</p> <p>Поэтому необходимо вводить как можно более <a href="/gramotnaya-vnutrennyaya-perelinkovka-perelinkovka-v-wordpress-kak/">конкретный запрос</a>, состоящий из двух, трех и более словосочетаний.</p> <p>Давайте рассмотрим пример запроса в поисковой системе <b>Яндекс </b>.</p> <p>Допустим, вы хотите найти информацию по вопросу о покупке компьютера. Если вы напишите в окне поиска одно слово «<b>Компьютер </b>», то вам выдадут 133 млн ответов</p> <p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/10-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy></p> <p>Надо задать более конкретный запрос. Лучше указать какой именно компьютер вы хотите купить и где (в каком городе).</p> <p><img src='https://i1.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/11-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy></p> <p>Тогда уже поисковая система выдаст вам намного меньше ответов на ваш запрос.</p> <p>Поисковой системе совершенно без разницы, какими буквами вы введете запрос – большими или маленькими.</p> <p>Яндекс различает существительные и прилагательные, но совершенно игнорирует окончания.</p> <p>Также ему совершенно безразличны падежи, множественное число и тому подобное.</p> <p>Для того чтобы поиск был более точным, необходимо взять запрос в кавычки или поставить перед словом восклицательный знак.</p> <p><img src='https://i2.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/12-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy></p> <p>А теперь посмотрите на тот же самый запрос, но без восклицательных знаков.</p> <p><img src='https://i0.wp.com/moydrygpk.ru/wp-content/uploads/2013/05/13-Poiskovie-systemi.jpg' align="center" width="100%" loading=lazy></p> <p>Видите разницу? С восклицательными знаками количество ответов не 2 млн, а 186 тыс.</p> <p>Если вы поставите восклицательный знак перед словом с большой буква, то вам выдадут ответы, в которых встречается именно это слово с большой буквы.</p> <p>Если слово в именительном падеже, и вам необходима информация именно по такому слову, и именно так, как вы его написали, то поставьте перед этим словом два восклицательных знака. Например: <b>!!Мяч </b> .</p> <p>Поиск выдаст вам ответы именно по этому слову «<b>Мяч </b> » так, как вы его написали. Не «<b>мячик </b> », не «<b>мячи </b> », и с большой буквы.</p> <p>Если вы напишите словосочетание со словом «<b>на </b> », то Яндекс проигнорирует «<b>на </b> ». Например: «<b>на полке </b> ». Поиск будет производиться только по слову «<b>полка </b> ».</p> <p>Для того, чтобы он его учел и не игнорировал, надо перед словом «<b>на </b> » поставить знак плюса – «<b>+на </b> ».</p> <p>У каждой поисковой системы свой алгоритм поиска, поэтому если вы пользуетесь каким-то определенным поисковиком, и хотите научиться правильно составлять запросы, то надо просто набрать в <a href="/kak-udalit-vsplyvayushchie-podskazki-v-poiske-yandeks-kak-udalit/">поисковой строке</a> «<span><b>правила поиска в </b><b>Google </b> </span>» или «<span><b>правила поиска в Яндекс </b> </span>», перейти по ссылке ответа на ваш запрос и почитать нужную информацию.</p> <br><p>Говорить о том, что в наше время <a href="/struktura-informacionnoi-sistemy-v-gostinichnom-biznese-analiz-informacionnyh/">информационных технологий</a> и бесконечного роста объема данных, доступных как отдельно взятому человеку, так и обществу, существует много проблем с обработкой информации и ее поиском - это уже кощунство. Кто только эту тему не поднимает. И дабы не загружать вас субъективными и, частью, объективными суждениями, почерпнутыми из различных <a href="/vidy-i-osobennosti-ugroz-bezopasnosti-informacionnyh/">информационных источников</a> касательно проблемы, я перейду непосредственно к ее решению. Сегодня поговорим о поиске. То есть о программах и серьезных информационных системах, осуществляющих поиск нужных нам документов и данных.</p><p>Апгрейд «<a href="/java-russkii-yazyk-v-konsoli-pryamaya-konversiya-bytechar-algoritm-poiska-problem-s/">прямого поиска</a>»</p><p>Не так давно, когда деревья были большими, и информации даже в <a href="/lokalnaya-vychislitelnaya-set-lvs-lokalnye-vychislitelnye/">локальной сети</a> предприятия было не так много, любой поиск осуществлялся банальным перебором горстки <a href="/skachennye-faily-yandeks-instrukciya-po-ispolzovaniyu-yandeks-disk-kak/">доступных файлов</a> и последовательной проверкой их названий и содержимого. Такой поиск называется прямым, и программы (утилиты), использующие технологию прямого поиска, традиционно присутствуют во всех <a href="/chto-takoe-operacionnaya-sistema-vidy-operacionnyh-sistem/">операционных системах</a> и инструментальных пакетах. Но, даже мощности современных компьютеров не хватит для быстрого и адекватного поиска в гигантских объемах данных при прямом поиске. Перебор пары сотен документов на диске и поиск в громадной библиотеке и нескольких десятках почтовых ящиков - разные вещи. Поэтому, программы прямого поиска сегодня явно уходят на второй план - если <a href="/pereprodazha-tovarov-s-ebay-kak-biznes-ogranicheniya-pri-prodazhe-tovarov-na-ebay-hotel/">речь идет</a> об универсальных средствах.</p><p>Конечно, в корпоративном секторе такой вид поиска уже давно не востребован. Объемы не те. И, поэтому, уже который год, а в последнее время однозначно, технологии, способные осуществлять быстрый и точный поиск документов <a href="/kakaya-programma-chitaet-format-cr2-chem-otkryt-cr2-ili-poisk-reshenii-po/">различных форматов</a> и из различных источников, более чем актуальны. Не так давно "папа" <a href="/kakoi-samyi-pervyi-vindovs-bill-geits-sozdatel-microsoft-windows/">Microsoft Билл</a> Гейтс, позавидовав, судя по всему, феноменальному успеху Интернет-поисковика Google, на одной из пресс-конференций обнародовал желание софтверного (уже и не только) всячески способствовать, развивать и углублять создание поисковых систем и технологий. Но до создания какой-либо феноменально работающей программы от Microsoft или конкурентоспособного сервера в Интернет пока рано (MSN все равно до Google не дотягивает). Поэтому обратимся к уже <a href="/podklyuchenie-arduino-i-nastroika-kakie-sushchestvuyut-sredy-razrabotki-ide/">существующим разработкам</a>. Индекс, запрос, релевантность</p><p>В основе <a href="/otkrytiya-v-kompyuternyh-tehnologiyah-sovremennye-innovacionnye-tehnologii/">современных технологий</a> лежат два основополагающих процесса. Во-первых, это индексация доступной информации и обработка запроса с последующим выводом результатов. Что касается первого, то любая программа (будь то настольный поисковик, корпоративная информационная система или Интернет поисковый движок) создает свою область поиска. То есть обрабатывает документы и формирует индекс этих документов (организованная структура, в которой содержится информация об обработанных данных). В дальнейшем именно созданный индекс используется для работы - <a href="/chto-nuzhno-sdelat-chtoby-zarabotat-kak-bez-deneg-zarabotat-dengi/">быстрого получения</a> списка нужных документов согласно запросу. Дальнейшее хоть и отнюдь не просто в плане технологии, но зато вполне понятно <a href="/pereiti-na-versiyu-vindovs-7-chto-delat-esli-znachek-rezervacii-obnovleniya-ne/">обычному пользователю</a>. Программа обрабатывает запрос (по ключевому слову-фразе) и выводит список документов, в которых эта ключевая фраза содержится. Так как информация содержится в структурированном индексе, то обработка запроса проходит значительно (в десятки и сотни раз!) быстрее, чем в случае с прямым поиском (выборка документов осуществляется не перебором файлов, а анализом текстовой информации в индексе).</p><p>Найденные документы программа выводит в результирующем списке согласно релевантности - соответствия документа тексту запроса. В <a href="/peredacha-informacii-mozhet-proizvoditsya-razlichnymi-sposobami-tehnika-i/">различных технологиях</a>, конечно, присутствуют различные методы поиска и определения релевантности документа (количество "вхождений" слова и его частота упоминания в документе, соотношение этих параметров к общему количеству слов в документе, расстояние между словами фразы запроса в искомых файлах и так далее). На основе этих параметров определяется "вес" документа и, в зависимости от него тот или иной файл оказывается в списке результатов на определенной позиции. В случае с Интернет-поиском дело обстоит еще сложнее. Ведь в данном случае надо учитывать и множество иных факторов (Page <a href="/pagerank-chto-eto-takoe-i-kak-ego-proverit-pochemu-page-rank-uprazdnili-google-pagerank--/">Rank Google</a> тому пример). Но это тема для отдельной статьи, поэтому Интернет трогать не будем.Обзор поисковиков</p><p>В данном материале рассмотрены возможности нескольких популярных программ поиска, которые могут похвастаться как приличными скоростями, так и неплохим функционалом. Но хвастаться в рекламных проспектах - это одно, а вот выдержать пристальный взгляд эксперта - совсем другое. А экспертов нашлось ни много, ни мало полный офис любителей поковырять софт на предмет его юзабилити. На подопытный компьютер (Athlon 2,2 MHz, с объемом оперативной памяти 1 Гб, 160 гигабайтным IDE <a href="/obzor-programm-dlya-raboty-s-zhestkim-diskom-programmy-dlya-raboty-s/">жестким диском</a> Seagate на 7200 оборотов в минуту и <a href="/samaya-pervaya-operacionnaya-sistema-windows-semeistvo-operacionnyh-sistem-windows-istoriya-operacionn/">системой Windows</a> XP) был установлен набор программ: dtSearch Desktop, Ищейка Проф Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Для тестов была скомпонована текстовая база документов в форматах doc, txt и <a href="/obshchie-svedeniya-o-yazyke-html-kakaya-raznica-mezhdu-tegami-i/">html общим</a> размером ни много, ни мало, а 20 гигабайт. Группа товарищей под руководством вашего покорного слуги тестировала, сравнивала и делилась своими субъективными впечатлениями по каждой софтине. Сводное изложение полученных данных читайте ниже. dtSearch Desktop</p><p>Программа, претендующая, по заявлению разработчиков, на самую быструю, удобную и лучшую поисковую систему. Как, в общем, и все остальные из <a href="/administrirovanie-baz-dannyh-orakl-dlya-nachinayushchih-obzor/">данного обзора</a>. Интерфейс dtSearch довольно прост, но некоторые окна или вкладки несколько перегружены элементами, из-за чего создается впечатления сложности использования. Но на самом деле особых трудностей не возникает. Единственным действительно неприятным моментом является отсутствие поддержки софтиной русского языка (не смотря на то, что искать документы программа может на нескольких языках, интерфейс ее исключительно английский).</p><p>Зато dtSearch одна из немногих программ, которая может индексировать веб-страницы на заданную пользователем "глубину" (правда, с учетом "дозакупки" в комплект адд-она dtSearch Spider). Это кроме поддержки файлов на диске различных <a href="/import-i-eksport-tekstovyh-failov-v-formatah-txt-i-csv-konvertiruem-csv-v-vcard/">текстовых форматов</a> и электронных писем из почтового <a href="/kak-nastroit-novyi-pochtovyi-yashchik-v-outlook-sozdanie-pochtovogo-yashchika-v/">ящика Outlook</a>. В то же время, программа не умеет работать с базами данных, которые являются таким лакомым кусочком для поисковиков из-за больших объемов информации, находящихся в них, и широкого распространения в компаниях, а значит и в корпоративных сетях. Скорость индексирования документов dtSearch оказалась на должном уровне. Забегая вперед, скажу, что эта программа справилась с индексацией заданного объема информации на уровне с другим конкурсантом - iSYS - и поделила с ним второе место в списке самых быстрых систем. Тестовые 20 гигабайт информации dtSearch проиндексировала за 6 часов 13 минут, создав для нужд последующего поиска индекс размером 7.9 Гб.</p><p>Что касается возможностей поиска, то здесь они на должном уровне. Во-первых, в dtSearch присутствует морфологический поиск (поиск слова во всех его морфологических формах). Используя данную возможность, вы освобождаете себя от, скажем, таких раздумий, как "в каком же падеже было употреблено некоторое слово в необходимом мне документе?". Использование морфологического поиска почти всегда оправдано, поэтому должно присутствовать в любом профессиональном поисковике.</p><p>Поиск по звучанию является нестандартной возможностью даже для профессиональных поисковиков. Суть его заключается в том, что программа будет искать слова, которые звучат так же, как введенное вами слово. И что самое приятное, эта функция работает и для русского языка! Например, набирая слово "ухо" в поисковом запросе, вы увидите в результате не только слова "ухо", но и "уха".</p><p>Поиск с коррекцией ошибок - очень важная функция. Применяется для поиска слов, содержащих <a href="/pochemu-vyhodit-sintaksicheskaya-oshibka-sintaksicheskaya-oshibka-na/">синтаксические ошибки</a> - это могут быть как опечатки, так ошибки в документах, полученных при помощи систем распознавания символов, например. Простой пример - вы ищете слово клавиатура. В некотором документе содержится слово "клавиатупа", очевидно, что на самом деле это слово "клавиатура", просто человек при наборе текста опечатался. Так вот, поиск с коррекцией ошибок, это обнаружит и включит документ со словом "клавиатупа" в результат. Также в dtSearch есть настройка, позволяющая определять степень возможных ошибочных символов.</p><p>Поиск с использованием синонимов. Эта возможность использует список синонимов для различных слов. Так, например, введя слово "быстрый", программа также найдет слова "скоростной" и другие, являющиеся синонимами для слова "быстрый", если таковые, конечно, присутствуют в списке синонимов. Готового списка синонимов вместе с программой dtSearch не поставляется, однако есть возможность воспользоваться списками в Интернет (соответственно, требуется подключение, что не всегда удобно), либо можно составить свой список синонимов.</p><p>Кроме перечисленных возможностей, dtSearch может производить поиск с использованием фраз, состоящих из слов, соединенных логическими операциями. Каждому слову в запросе можно устанавливать свой "вес", то есть значимость. Полезная опция - использование словаря, состоящего из не значимых слов для того, чтобы не учитывать их при поиске, однако этот словарь также пуст и его придется заполнять самостоятельно.</p><p>Далее рассмотрим возможности программы при работе в сети. По сути, никаких специфических возможностей для работы с сетью dtSearch не предлагает. Тем не менее, использовать его в сети вполне возможно. Как вариант, можно создать некоторый индекс и положить его в общедоступную (расшаренную) папку. Саму же программу можно установить каждому пользователю на компьютер, либо выложить ее также на папку, открытую для <a href="/disk-d-nedostupen-chto-delat-kak-vosstanovit-dostup-k-papke/">общего доступа</a>, и создать специальным образом ярлыки для каждого пользователя отдельно, используя параметры <a href="/vklyuchenie-komandnoi-stroki-spisok-komand-komandnoi-stroki-zapusk/">командной строки</a>, предназначение которых описано в файле помощи, поставляемым с программой. Также, есть возможность <a href="/programma-dlya-avtomaticheskoi-ustanovki-avtomaticheskaya/">автоматической установки</a> программы в сеть при помощи <a href="/ne-ustanavlivayutsya-msi-faily-windows-7-ne-udaetsya-poluchit-dostup-k/">MSI файла</a>. При этом будут учтены настройки для каждого подключаемого пользователя.</p><p>В общем и целом - неплохая программа из разряда профессиональных поисковиков. Может претендовать на <a href="/kakaya-ocenka-proizvoditelnosti-horoshaya-dlya-vindovs-10-zadachu-etih/">хорошую оценку</a>, однако завоевание доверия и уважения со стороны пользователей может оказаться непростым для dtSearch в силу некоторых факторов (не все гладко с интерфейсом, русские пользователи обделены, нет ярких особенностей для работы с сетью). Что касается непосредственно поиска документов, то накладок с русским текстом у программы не было. Как не было их ни с заявленной морфологией, ни с нечетким поиском. Система вполне адекватно находила нужные документы и по простому запросу в одно слово и по использовании в качестве <a href="/kombinator-klyuchevyh-fraz-servis-podbora-klyuchevyh-slov/">ключевой фразы</a> пары абзацев, какого-либо документа.</p><p>Официальный сайт: <br>Размер дистрибутива: 23 MbИщейка Проф Deluxe</p><p>Исходя из названия, можно догадаться, что поддержка русского языка в этой программе есть. Это уже приятно. Что касается интерфейса, в общем-то, он несколько необычен, но с виду весьма привлекателен. Другое дело - удобство. Весьма спорный критерий, но все же, наверно, многооконное решение - не самый удачный вариант (запрос вводится в одном окне, результат отображается в другом и тому подобное).</p><p>Ищейка использует все те же индексы для осуществления быстрого поиска, однако индексирование проходит значительно медленнее, нежели у других программ. Это весьма странно, особенно учитывая то, что возможности по обработке поисковых запросов у нее весьма слабые, а значит и структура индекса не сложная. Скорее всего, дело тут в неоптимизированных алгоритмах. Эта программа оказалась явным аутсайдером скоростей индексации и поиска: время, затраченное на создание индекса, в шесть раз больше, чем у тех же dtSearch и iSYS. Индексация 20 гигабайт текстов для ищейки вылилась в 38 часов 46 минут работы. А созданная "область поиска" заняла на жестком диске тот же размер, что и исходные данные за небольшим минусом - 19 гигабайт.</p><p>Ищейка может быть представлена как альтернатива стандартному поиску в Windows, на большее она вряд ли способна. О том, что первоочередная задача Ищейки - простейший поиск файлов указывает не только малое количество функций для анализа текста поисковых запросов и расширенный поиск по атрибутам файлов, но даже окно результатов, выдающее прямые ссылки на найденные файлы, а также на папки, содержащие эти файлы. Окно результатов не слишком информативно в том плане, что прочитать весь найденный файл можно, только запустив его, то есть, встроенного просмотрщика файлов у него нет. Зато выдается выдержка из файла, где встретилось искомое слово, в общем, такая схема отображения очень напоминает Интернет поисковики.</p><p>Говоря о конкретных возможностях по обработке поисковых запросов, стоит отметить, что здесь нет такого понятия как "искать текст", максимум, что можно искать - это фраза, хотя бы потому, что здесь нет <a href="/mnogostrochnyi-input-tekstovye-polya-ii-vvod-dannyh-cherez-cikl/">многострочного поля</a> ввода текста. Тем не менее, анализировать можно и введенную фразу и Ищейка предлагает нам здесь стандартный поисковый набор: <a href="/java-matematicheskie-operacii-logicheskie-operatory-operacii-s-chislami-s-plavayushchei/">логические операции</a>, поиск по маске и цитатный поиск... не густо. В программе присутствуют некоторые зачатки морфологического поиска, но, наверно, настолько сырого, что он, скорее, мешает корректной работе (во время тестов было замечено множество накладок с неправильным использованием морфологии).</p><p>Зато программа позволяет указывать при поиске атрибуты файлов (дата документа, имя файла, имя папки), причем в этих запросах также можно использовать тот же поисковый набор. Также, можно осуществлять поиск писем, указывая параметры (От, Тема.... и т.п.).</p><p>Итак, с самим поиском разобрались, чем же еще интересным обладает программа, за что она получила столь многочисленные награды, по информации с официального сайта? Трудно сказать, что в ней такого особенного, скорее всего, интерфейс Ищейки располагает к себе (именно внешне, не говоря о юзабилити).</p><p>Операции с индексами весьма стандартны, приятным моментом является возможность обновления индексов по расписанию. Кроме того, индексы также могут использоваться в сети. С этого момента надо поподробнее.</p><p>Несмотря на примитивность поисковых запросов, программу можно использовать для поиска файлов, поэтому ее применение может быть оправдано в сетях. Хоть и с большой натяжкой, так как в большой сети приоритетной задачей является быстрый поиск данных с использованием сложных поисковых запросов из-за огромного количества информации - а со скоростью поиска и программы явно проблемы. Надо сказать, что работа с сетью у Ищейки продумана, как следует. Специально для этого предназначено <a href="/titanium-bk-ii-vosstanovlenie-otdelnyh-prilozhenii-pri-kopirovanii-udalenie/">отдельное приложение</a> - Ищейка Сервер. Оно работает так же, как и просто Ищейка (поисковой движок у них один), только для документов, размещенных на центральном сервере или на <a href="/setevoi-skaner-obshchih-resursov-windows-nastraivaem-usb-skaner-dlya-skanirovaniya-po/">общих ресурсах</a> в <a href="/ponyatie-korporativnoi-sistemy-i-seti-informacionnye-svyazi-v-korporativnyh/">корпоративной сети</a>. Ищейка Сервер создает новые индексы на общих ресурсах, либо использует ранее созданные. Любой пользователь корпоративной сети может подключиться к Ищейке Сервер и использовать ее для доступа к любому документу (находящемуся в текущем индексе) используя Интернет браузер. Согласитесь, такая схема является крайне удобной: получается, что файлы в собственной сети можно искать таким же образом, как информацию в Интернете через, например, Google.</p><p>Оценивая все преимущества и недостатки этой программы, сам собой напрашивается вывод, что для корпоративных сетей ее возможностей, скорее всего, не хватит (несмотря доже на неплохую организацию работы с сетью), а вот для домашнего компьютера или даже для <a href="/bezopasnost-besprovodnyh-setei-protokoly-bezopasnosti-zashchita/">домашней сети</a> она, в принципе, может и подойти. Хотя ни скорость работы, ни возможности по поиску не внушают оптимизма...</p><p>Официальный сайт на русском языке: <br>Размер дистрибутива: 6 MbGoogle Desktop Search + GDS Enterprise<br><img src='https://i0.wp.com/ixbt.com/soft/images/search-test/gde2.jpg' width="100%" loading=lazy><br></p><p>Конечно, мы не могли обойти стороной такого именитого разработчика. <a href="/izmenenie-akkaunta-google-instrukciya-kak-izmenit-imya-v-akkaunte-google/">Имя Google</a> уже говорит о многом. Народ, годами пользовавшийся мощнейшим Интернет поисковиком, наверняка без единого сомнения решит установить на компьютере именно этот поисковик. Это же подумать: Google на домашнем компьютере! Однако, не поддаваясь на провокации с широко раскрученным брэндом, попробуем трезво, а главное объективно, рассмотреть возможности "настольного" поисковика от Google.</p><p>Первое, что бросается в глаза - отсутствие собственной оболочки для программы. Google Desktop Search по-прежнему находится в окне браузера, соответственно, весь интерфейс настольной версии достался софтине от старшего Интернет-брата. Хорошо это или плохо - спорный вопрос: кому-то по душе минимализм в дизайне этого поисковика, а кому-то хочется видеть полноценное приложение, наполненное всякого рода кнопочками и так далее.</p><p>Что бросается в глаза сразу после дизайна? А то, что этот самый Google Desktop Search начинает индексировать на компьютере все подряд, без всякого на то спроса! И что самое интересное, выбрать пути индексации при помощи Google Desktop Search невозможно. Придется скачать отдельную программку (TweakGDS), которая позволит несколько расширить <a href="/pochemu-plei-market-sletaet-kak-reshit-problemu-so-skachivaniem/">настройки Google</a> Desktop, в том числе и указать необходимые для индексации места. Хотя, пока со всем этим разберешься, стандартный винчестер он уже проиндексирует, так что такая настройка нужна скорее при работе с большими массивами данных, что очень актуально при использовании в корпоративных сетях (<a href="/kak-sozdat-disk-windows-to-go-ne-imeya-versii-enterprise-chto-takoe-windows-to-go/">версии Enterprise</a>). Однако не факт, что после скачивания TweakGDS, ваши проблемы решатся. Ведь для работы ей необходимы Microsoft .<a href="/skachat-programmu-dlya-udaleniya-net-framework-mozhno-li-udalyat-net-framework/">NET Framework</a> и Microsoft Scripting Runtime. Да уж... установку, как и доступ к настройкам, можно было сделать и проще, хотя, наверно разработчиков можно понять: зачем писать что-то новое, когда есть уже готовый поисковик, портировал его на <a href="/kak-sozdat-lokalnuyu-set-mezhdu-dvumya-kompyuterami-sozdaem/">локальный компьютер</a> и пускай пользователь "наслаждается", а известное имя сделает из "этого" очередной шедевр. Да ладно, закончим на этом <a href="/proverit-indeks-citirovaniya-massovaya-proverka-tic-i-pr-liricheskoe/">лирическое отступление</a> и перейдем к поиску.</p><p>Что касается анализа поисковых запросов и выдачи результатов, то здесь все абсолютно идентично Google в Интернет: такая же система отображения результатов, тот же стандартный набор логических операций для поисковых запросов. В общем Google Desktop Search, как и <a href="/kak-vernut-predydushchuyu-versiyu-programmy-na-iphone-proshivka-iphone-ili-kak/">предыдущая программа</a>, предназначен исключительно для поиска файлов - внутреннего просмотрщика этих файлов в нем, разумеется, нет. Количества форматов файлов, поддерживаемых Google Desktop Search, вполне достаточно, а также приятно, что он осуществляет поиск по посещенным Интернет страницам, беря данные из кэша. Скорости поиска и индексирования вполне приемлемые. Правда, для <a href="/vitaya-para-100-mbit-vidy-vitoi-pary-kak-pravilno-vybrat-vituyu-paru-dlya/">домашнего использования</a>. С внушительными 20 гигабайтами <a href="/poisk-po-klyuchevym-slovam-stranice-kak-naiti-i-chto-takoe/">текстов Google</a> Desktop Search справилась за 8 часов 17 минут. Потратить несколько дней на обработку информации из корпоративной сети крупного предприятия не улыбается ни одному сисадмину. Из плюсов: размер создаваемого индекса оказался на уровне (4,5 Гб) с другим поисковиком, протестированном в этом обзоре - SearchInform.</p><p>Большое преимущество (или упущение - решать вам) Google Desktop Search заключается в том, что он поддерживает плагины, которые способны многое переменить к лучшему. Другое дело, что подключение плагинов и их настройка настолько усложняет задачу установки поисковика, что начинаешь задумываться - а надо ли все это, когда можно установить нормальную, <a href="/programma-dlya-sozdaniya-dvd-obraza-desyatka-besplatnyh-programm-dlya/">полноценную программу</a>, в которой уже будет все присутствовать. Ведь для задействования каждой возможности придется устанавливать <a href="/kak-dobavit-novyi-plagin-stranic-facebook-v-wordpress-plaginy-dlya-feisbuka/">новый плагин</a>. Даже для того, чтобы программа могла полноценно работать с архивами, нужна отдельная примочка. Завораживает и прельщает бесплатность всех этих дополнительных модулей. Однако если не брать в расчет десктоповую версию поисковика, то грамотная настройка GDS Enterprise может оказаться вам не под силу - ведь не зря специалисты из Google предлагают свои услуги по настройке их же программного обеспечения для вашей сети всего лишь за 10000$.</p><p>Если же вы все-таки осилите процедуру настройки и установки (или заплатите 10000$ бригаде быстрого реагирования из конторы Google), то поймете, что сложность установки с лихвой компенсируется очень гибкими настройками при использовании в корпоративных сетях. Немаловажным моментом <a href="/prilozhenie-google-ostanovleno-chto-ispravlyaem-oshibku-prilozhenie/">работы Google</a> Desktop в корпоративной сети является использование групповых политик, что дает возможность установить настройки для каждого пользователя.</p><p>Подводя итог, следует сказать, что самое разумное применение для этой программы - домашний или рабочий компьютер. Ведь для обычного компьютера достаточно просто установить программу - остальное она сделает сама (вас даже ни о чем не спросит).</p><p>Тем не менее, Google Desktop Search Enterprise будет приемлема в случаях острой необходимости гибкой настройки сетевой политики для использования поисковика, при этом возможности обработки поисковых запросов будут на втором месте по значимости, а время (или деньги), затраченное на настройку программы, - на первом месте.</p><p>Официальный сайт: <br>Размер дистрибутива вместе с TweakGDS: 1,2 MbCopernic Desktop Search<br><img src='https://i2.wp.com/ixbt.com/soft/images/search-test/copernic.jpg' width="100%" loading=lazy><br></p><p>Щелкните по картинке, чтобы увеличить</p><p>Интерфейс программы вызывает исключительно <a href="/smailik-kappa-iz-simvolov-gid-po-smailikam-kak-v-nih-razobratsya-i-ne-popast-v/">положительные эмоции</a> - все сделано в соответствии с общепринятыми стандартами, ничего лишнего, одним словом <a href="/meizu-m6-dostupnyi-smartfon-s-priyatnym-dizainom-plyusy-i-minusy/">приятный дизайн</a>. Новичку разобраться в интерфейсе Copernic Desktop Search будет очень просто. Хотя, несколько смущает то, что дизайнеры явно создавали интерфейс программы с учетом того, что программа будет работать в стандартной теме оформления Windows XP. При использовании же классической темы, программа смотрится уже не настолько симпатичной. Но это уже скорее дело вкуса.</p><p>При первом же запуске, программа предлагает создать индексы для поиска. Несколько необычным показалось то, что после выбора папок для индексирования, программа не предлагает нажать какую-нибудь кнопку, вроде "Начать индексацию", при этом индексация не начинается автоматически, только потом было замечено, что Copernic пытается начать индексацию во время простоя компьютера. Придется несколько покопаться в опциях программы, чтобы настроить все должным образом. Следует отметить, что здесь представлены довольно <a href="/zapisyvayut-li-sotovye-operatory-razgovory-mozhno-li-zapisyvat/">широкие возможности</a> по настройке <a href="/avtomaticheskaya-zapis-skrinshotov-automatic-screenshotter-avtomaticheskoe/">автоматического создания</a> индекса: встроенный планировщик, возможность индексации во время простоя компьютера, в <a href="/vosproizvedenie-yutub-v-fonovom-rezhime-samyi-dorogoi-sposob-kak-v-android/">фоновом режиме</a>, с низким приоритетом. Индексация проходила не слишком быстро - 10 часов 51 минута - это медленнее, чем в других поисковиках (кроме Ищейки, все же Copernic <a href="/razrabotka-programmnogo-produkta-dlya-bystrogo-sozdaniya-zametok-i/">быстрее разработки</a> iSleuthHound Technologies на порядок.</p><p>Теперь о структуре индекса. В общем, ничего особенного в ней нет. Есть возможность выбора типов файлов, причем, как в обобщенном виде, так и в подробном. То есть изначально вы можете выбрать, что требуется индексировать - Документы, Изображения, Видео, Музыку. На другой же вкладке окна опций будет возможность выбрать конкретно типы файлов по расширению. Дополнительно можно настроить индекс таким образом, чтобы, например, не индексировались картинки, размером менее 16х16 или не индексировались звуковые файлы длиной менее 10 секунд. Помимо индексации файлов из папок, Copernic умеет работать с электронными письмами и контактами из <a href="/pochtovyi-server-yandeks-pop3-server-elektronnoi-pochty-yandeks-nastroika/">адресной книги</a> <a href="/microsoft-outlook-kontakty-upravlenie-kontaktami-v-outlook/">Microsoft Outlook</a> и Microsoft Outlook Express, возможна индексация Избранного и Истории из Internet Explorer.</p><p>Что касается возможностей поиска, то здесь они весьма слабы. Во время тестов даже было выявлено, что программа не ищет документы форматов txt и html на русском языке, позволяя найти их только по заголовкам, а отнюдь не по содержанию. Единственное, что программа предоставляет для повышения эффективности поиска - это использование <a href="/kak-skachat-prilozhenie-v-telefone-programmy-na-telefon-android-nabor/">стандартного набора</a> логических операций, да и то, эта возможность была обнаружена экспериментальным путем, так как документирована она не была. Кстати, со справкой у программы также не все в порядке - она доступна только через Интернет, что, согласитесь, весьма неудобно, да и в сети <a href="/kak-zadat-vopros-po-fotografii-kak-nachat-poisk-po-kartinke-spravochnaya/">справочной информации</a> не слишком много. Видимо, разработчики решили, что простой интерфейс программы не предполагает наличия нормальной справки. Продолжая разговор о возможностях поиска, следует отметить, что, несмотря на слабый анализ запросов, программа предоставляет интересную систему поиска - пользователь может выбрать тип файлов (изображения, видео, музыка и т.п.), ввести поисковый запрос и выбрать атрибуты, присущие именно выбранному типу файлов. Например, для <a href="/skachat-programmu-dlya-montazha-audio-failov-zvukovoi-redaktor/">звуковых файлов</a>, это могут быть значения из mp3 тегов (артист, альбом, дата и т.п.), для изображений, например, можно выбирать их размер (по разрешению), в общем, каждому типу - свои настройки. После осуществления поиска по <a href="/chto-mozhno-uznat-po-stranice-vk-kak-naiti-druzei-v-kontakte-po/">определенному типу</a> файлов, программа выдаст весьма информативный список в окне результатов, причем, если под ваш запрос попали файлы других типов, то вы сможете открыть и их, нажав на определенную ссылку.</p><p>Отдельно стоит упомянуть про окно отображения результатов. Под списком найденных файлов отображается содержимое этих файлов (аналогичная схема часто используется в <a href="/vidy-pochtovyh-klientov-vedushchie-pochtovye-klienty-programmy/">почтовых клиентах</a>). Правда, просмотр текста можно осуществлять лишь в родном формате, а режима отображения plain текста нет, что не всегда удобно, так как открытие документа в этом случае занимает больше времени. Зато, учитывая, что Copernic умеет искать изображения и музыку, здесь есть возможность просмотра и этих <a href="/proshivka-dlya-texet-tm-7854-android-4-2-multimediinye-faily-i-igry-interfeis-ot/">мультимедийных файлов</a>.</p><p>Основные принципы работы этой программы описаны, теперь посмотрим, что Copernic Desktop Search может нам предложить для работы с сетью... В принципе смотреть можно очень долго, но увидеть что-либо вряд ли удастся. Другими словами, эта программа и не задумывалась как сетевая. Copernic Desktop Search - исключительно домашний поисковик.</p><p>Очевидно, что единственное (самое логичное) применение этой программы - домашний компьютер. Здесь она вполне справится со всеми незамысловатыми поисковыми запросами пользователей, состоящими из одного двух слов, найдет нужную информацию, а разделение поиска по типам файлов и поддержка мультимедийных файлов вместе с фоновой индексацией в режиме низкого приоритета вкупе с приятным интерфейсом только придают программе сил для завоевания доверия среди неискушенных пользователей.</p><p>Официальный сайт <br>Размер дистрибутива: 2,6 MbISYS Desktop<br><img src='https://i2.wp.com/ixbt.com/soft/images/search-test/isysresult.jpg' width="100%" loading=lazy><br></p><p>Щелкните по картинке, чтобы увеличить</p><p>Очень мощная программа. По уровню оснащенности всевозможными функциями она находится где-то рядом со следующей в списке системой поиска SearchInform. При этом размер установочного файла более 40Mb! Сложно сказать, что можно было засунуть в такие размеры, ведь тот же SearchInform, с похожей функциональностью занимает 15Mb.</p><p>Процесс установки здесь также не слишком приятен, точнее даже не процесс установки. Еще до скачивания программы вас попросят зарегистрироваться, а иначе - никак. Далее, интерфейс. Сделан он весьма симпатично, ничего лишнего в глаза не бросается, однако - это впечатления человека, уже несколько привыкшего к нему. Разобраться, где и что находится, куда нажимать и где осуществить наконец-то поиск новичку будет непросто. Очень рекомендуется прочитать справку перед началом работы - сэкономите много нервов и времени. Ко всему прочему добавляется также полное отсутствие поддержки русского языка в программе. Нехорошо. Вдобавок, окна здесь не перегружены элементами управления, однако расплатиться за это пришлось многомодульностью и использованием дополнительных окон. Например, запросы для поиска вводятся при помощи запуска одной программы, а управление индексами производится при помощи уже другой программки. Поисковые запросы вводятся здесь также в отдельных, появляющихся окошках. Что лучше - перегруженность интерфейса или повсеместная многооконность - сказать трудно, скорее, это дело вкуса.</p><p>Что касается создания индексов, то программа предоставляет возможности по упрощению процесса установки опций для нового индекса. Эти возможности включают в себя несколько готовых шаблонов для создания индексов по папке "Мои документы", "Почта", "Почта и документы", "<a href="/kak-skopirovat-opredelennye-faily-bez-ierarhii-papok-no-ne/">Определенная папка</a>", "Папка с выбором типов файлов" и др. Такие шаблоны упрощают создание индексов на первом этапе. Утилита для работы с индексами обладает не слишком удачным интерфейсом, отпугивающим некоторой сложностью (это весьма <a href="/windows-10-versii-1703-chto-novogo-v-obnovlenii-creators-update-subektivnaya/">субъективная оценка</a>, по правде говоря), однако, если разобраться, он предоставляет множество <a href="/kak-otkryt-menyu-avtozagruzki-windows-10-parametry-avtozapuska/">полезных опций</a> и в целом его использование особого труда не вызывает. ISYS Desktop умеет индексировать данные из различных источников данных, а также предоставляет множество <a href="/programma-dlya-vosstanovleniya-fleshki-kasperskii-rabota-v-srede-kaspersky/">гибких настроек</a> для такой индексации. Среди дополнительных возможностей по индексированию: поддержка SQL, FTP, TRIM Context, WORLDOX 2002, скрипты. При создании индекса, если вы выбирали пункт "Папка с выбором типов файлов", у вас есть возможность выбрать типы файлов для индексации вручную (по расширению). Надо сказать, что поддерживаемых типов файлов просто огромное количество, однако свой тип (расширение) добавить в <a href="/multifunkcionalnyi-vypadayushchii-spisok-eksel-sozdanie-spiska-iz-sushchestvuyushchego-diapazona-dannyh-uk/">существующий список</a> не удастся. Можно также отметить наличие планировщика индексации. Созданием индекса и обработкой 20 гигабайт информации ISYS Desktop занималась 6 часов 13 минут, в конечном итоге показав неплохое время и размер созданного файла - 7.9 Гб.</p><p>Возможности поиска у этой программы неплохи. То, что используется в ISYS, значительно мощнее <a href="/trend-mikro-internet-sekyuriti-kod-aktivacii-podderzhka-mobilnyh-ustroistv/">обычной поддержки</a> логических операций. Из продвинутых возможностей по поиску программа предлагает использование синонимов, фильтра сортировки (по пути, имени и дате создания файла). Набор <a href="/php-logicheskie-operacii-uslovnyi-operator-if-v-php/">логических операторов</a> несколько шире стандартного набора. Помимо логических операций, программа позволяет работать со многими другими операторами, которые в принципе способны заменить некоторые виды поиска, например, поиск с синтаксическим разбором вполне можно заменить использованием <a href="/kak-naiti-vyklyuchennyi-aifon-5-obrashchenie-v-policiyu-i-k-operatoru/">специальных операторов</a>. Очень удивило то, что в программе отсутствует поиск с использованием морфологии. Это серьезное упущение, так как эффективность поиска сильно повышается при использовании морфологического анализа. Кроме того, нет списка значимых слов, зато присутствует обширный список незначимых слов. Также заявлены такие функции при поиске как "приблизительный поиск" и "эвристический анализ".</p><p>ISYS предоставляет на выбор несколько видов поисковых запросов, именно, видов - визуальных. Это осуществлено при помощи <a href="/led-televizory---chto-eto-takoe-preimushchestva-i-nedostatki-zhk-matricy/">разных видов</a> окон для ввода поисковых запросов, однако, фактически, ни одно окно не позволяет использовать технологии, отличные от перечисленных выше.</p><p>Результаты поиска весьма информативны, отображаются в виде списка документов, отсортированных по релевантности. Ниже отображается предпросмотр выбранного документа. В отличие от Copernic Desktop Search, предпросмотр здесь доступен лишь в виде plain текста, добиться отображения документов в родном формате, будь то Word, Html или PDF так и не удалось, хотя это в принципе и не слишком критично. Программа позволяет разбивать найденные документы на группы по определенным признакам (по умолчанию они разделены по релевантности). Можно также просматривать уже найденные документы, выбирая отдельные папки (это удобно, когда результат выдает очень большое количество документов).</p><p>Использование программы в корпоративной сети также весьма оправдано, так как она предоставляет неплохие возможности по организации сетевого поиска. Система поиска основана на создании общедоступного индекса, который содержит проиндексированные данные с общедоступных сетевых ресурсов.</p><p>По сути, программа от ISYS достойна внимания, хотя бы ознакомления с ней. Эта программа - зрелый проект, обладающий <a href="/processor-nachal-zagruzhatsya-na-100-opredelyaem-programmu/">огромным количеством</a> функций (не всегда и не всем, конечно, они бывают нужны, но все же). Шансы на то, что в программе появятся некоторые улучшения со стороны обработки поисковых запросов, не известны, но и на данный момент ее можно рекомендовать практически для повсеместного использования. А учитывая, что для домашних систем она все же слишком грузная, то основные места ее инсталляции - корпоративные сети.</p><p>Официальный сайт: <br>Размер дистрибутива: 40 MbSearchInform<br><img src='https://i1.wp.com/ixbt.com/soft/images/search-test/siresult.jpg' width="100%" loading=lazy><br></p><p>Щелкните по картинке, чтобы увеличить</p><p>Сразу начинать с описания интерфейса SearchInform, наверно, не стоит. Следует для начала описать процесс установки, а точнее одну его деталь: вы не сможете установить программу без подключения к Интернет. Дело в том, что перед первым запуском программа требует регистрации пользователя (бесплатной) и отправляет все введенные данные на сервер. Видимо, разработчикам пришлось принять такие меры в борьбе с пиратством, однако на удобстве установки это положительным образом не отразилось.</p><p>Интерфейс программы выполнен с соблюдением всех общепринятых правил, однако, на первый взгляд, несколько громоздок. Используя программу в первый раз, кажется, что он чересчур сложный, иногда бывает не просто вспомнить в каком меню или на какой вкладке находится нужная опция, однако, при более длительном использовании, интерфейс уже не кажется таким ужасающе сложным. Главное, предварительно почитать справку.</p><p>Немного разобравшись с интерфейсом, можно приступить к созданию индекса. Сам процесс весьма прост и скорость индексации даже на глаз значительно выше всех других поисковиков из обзора. Четкие цифры тестов показывают, SearchInform в два раза обогнала dtSearch и iSYS по скорости индексации! Программа проиндексировала предоставленные данные в размере 20 гигабайт за рекордное время - 3 часа 17 минут. Да и размер созданного индекса оказался самым небольшим 4.4 Гб - на 100 мегабайт меньше, чем у Google Desktop Search.</p><p>Программа поддерживает, помимо обычных файлов и папок, также индексацию электронных писем, подключение и индексацию баз данных (!) и других внешних источников (DMS, CRM), сразу же при индексации можно указать словарь для проведения морфологического поиска, а также индексироваться могут все атрибуты файлов. После создания индекса, при попытке провести первый пробный поиск документов, можно прийти в некоторое замешательство: "здесь присутствует два вида поиска, а какой же из них нужен мне?". Как уже говорилось ранее - главное прочитать справку, тогда все станет понятно. Программа действительно умеет осуществлять два вида поиска - это фразовый поиск и поиск документов, похожих по содержанию на текст запроса.</p><p>Описание всех основных функций для анализа <a href="/kak-proverit-poiskovye-zaprosy-v-yandekse-statistika/">поискового запроса</a> было приведено выше, поэтому сейчас лишь перечислим возможности поиска, предоставляемые этой программой. Начнем с фразового поиска: конечно, морфологический поиск, цитатный поиск, логические операции, поиск с синтаксическим разбором слова (поиск по началу слова, по окончанию, по средней части, либо полное совпадение), смешанный цитатный поиск (когда все слова из запроса должны присутствовать в документе, но необязательно во введенном порядке), поиск с коррекцией ошибок, использование синонимов, "почти цитатный поиск" (поиск введенной фразы как цитаты, но между введенными словами могут присутствовать другие слова) и т.п. Некоторые из перечисленных опций имеют свои специфические настройки. Кроме того, есть возможность использования словаря незначимых слов, причем в программе уже есть готовый список этих слов, также для поиска можно использовать словарь приоритетных слов (его, разумеется, придется заполнять самостоятельно).</p><p>Вот, в принципе, вкратце пробежали все основные возможности фразового поиска.</p><p>Перейдем к рассмотрению особенности данной программы - поиска похожих документов. Разработчики утверждают, что это отнюдь не простой поиск текста, это именно "поиск похожих" - именно так он описан у них везде, да ладно, называть это можно как угодно - главное суть. Недолгие поиски в Интернете могут быстро дать информацию о том, что так называемый "поиск похожих" - новая разработка в области анализа текста. Эта система позволяет находить тексты, похожие именно по смысловому содержанию. Самым приятным оказалось то, что после проведения тестовых поисковых запросов, оказалось, что теория вполне совпадает с практикой! Программа действительно ищет похожие по содержанию документы и отображает их в списке, упорядочивая по проценту похожести.</p><p>Далее рассмотрим, что предлагает SearchInform (в частности, ее <a href="/korporativnaya-versiya-windows-7-chem-otlichayutsya-raznye-redakcii-windows/">корпоративная версия</a> SearchInform Corporate) для работы в корпоративной сети. Существуют два вида приложений: серверная часть и пользовательская. <a href="/razrabotka-i-sozdanie-veb-prilozheniya-chto-nuzhno-izuchit-dlya-razrabotki/">Серверная часть</a> самостоятельно обрабатывает <a href="/kak-uznat-pochtovyi-indeks-pochtovye-indeksy-rossii-pochemu-vazhno-pravilno/">указанные индексы</a>, а пользователи могут использовать их для поиска, в зависимости от назначенных им прав доступа. Пользователи могут быть настроены автоматически, используя учетные <a href="/kontrol-uchetnyh-zapisei-windows-otklyuchenie-kontrolya-uchetnyh-zapisei-uac-v/">записи Windows</a> (говоря профессиональным языком, SearchInform использует NTFS аутентификацию Windows), так и вручную (пользователей придется добавлять по отдельности). Каждому пользователю можно разрешить или запретить доступ к определенным индексам, можно также объединять пользователей в группы. В общем, настройки для работы в сети у SearchInform опережают по гибкости Google, а по удобству и простоте Ищейку Сервер.</p><p>Официальный сайт: <br>Размер дистрибутива: 14,7 MbСравнение скоростей индексирования</p><table class="row1"><tr class="thead"><td>Система поиска </td><td>Время индексации </td><td>Размер индекса </td> </tr><tr class="row1"><td>Ищейка Проф Deluxe 4.5 </td><td>38 часов 46 минут </td><td>19 Гб </td> </tr><tr class="row2"><td>Isys Desktop 7.0 </td><td>6 часов 13 минут </td><td>7.9 Гб </td> </tr><tr class="row1"><td>DtSearch 7.0 </td><td>6 часов 3 минуты </td><td>8.6 Гб </td> </tr><tr class="row2"><td>Google Desktop Search Enterprise </td><td>8 часов 17 минут </td><td>4,5 Гб </td> </tr><tr class="row1"><td>Copernic Desktop Search * </td><td>10 часов 51 минута </td><td>7 Гб </td> </tr><tr class="row2"><td>SearchInform 1.5.02 </td><td>3 часа 17 минут </td><td>4.4 Гб </td> </tr></table><p>* Большинство документов.html и.txt, содержащих русский текст, хоть и были проиндексированы, но кроме как по названиям, найти их было невозможно.Резюме</p><p>Все программы достойны внимания.</p><p>На основе тестов и внимательного осмотра каждой программы, представленной в обзоре, можно сделать определенные выводы. Итак, Google Desktop Search Copernic Desktop Search вполне подойдут неискушенному пользователю как домашние системы поиска информации. Они неплохо справляются с <a href="/osnovy-subd-oracle-osnovnye-obekty-sredstva-manipulirovaniya/">простыми запросами</a>, не сильно загрузят пользователя настройками и, притом, совершенно бесплатны. Попытка Google выйти на рынок корпоративных поисковиков, пока не сильно оправдана: для полноценной работы программу нужно обвешивать <a href="/apgreid-operativnoi-pamyati-kompyutera-apgreid-zheleza-kompyutera/">дополнительными модулями</a>, да и в настройке она далеко не проста. Поэтому, говорящие названия Desktop Search, что Copernic, что Google отставляю за ними нишу "настольных" поисковиков.</p><p>Правда, более мощные решения - dtSearch, iSYS и SearchInform тоже не лыком шиты и предлагают пользователям свои "настольные" версии. Но по сходной цене, в отличие от бесплатных софтин от Google и Copernic. Конечно, за мощность, скорость и функционал приходится платить. Но главный прицел разработчики dtSearch, iSYS и SearchInform делают, конечно, на корпоративный сектор. Работа с сетью, функциональность, скорость индексации и поиска – вот, что отличает эти продукты от своих "конкурентов". По результатам теста был определён фаворит - SearchInform. Программа предоставляет возможность искать похожие документы, обладает <a href="/chto-oznachaet-dpi-v-kompyuternyh-myshkah-malyi-dpi-vs-bolshoi-dpi-chto-takoe/">наибольшей скоростью</a> индексирования и поиска, имеет <a href="/1155-soket-kakoi-chipset-luchshe-obzor-i-testirovanie-nabora-logiki-intel-z77-express/">хороший набор</a> функций. </p> <p>Уже давно стали неотъемлемой частью <a href="/kakaya-kompaniya-luchshe-predostavlyaet-uslugi-mobilnogo-interneta-samye-vygodnye/">российского Интернета</a>. Поисковые системы сейчас – это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса.</p><p>Большинство пользователей поисковых систем никогда не задумывались (либо задумывались, но не нашли ответа) о принципе работы поисковых систем, о схеме обрабатки запросов пользователей, о том, из чего эти системы состоят и как функционируют…</p><p>Данный мастер-класс призван дать ответ на вопрос о том, как работают поисковые системы. Однако, Вы не найдете здесь факторов, влияющих на ранжирование документов. И тем более не стоит рассчитывать на <a href="/pri-vklyuchenii-kompyutera-windows-boot-manager-windows-boot-manager-chto-eto-takoe-i-dlya-chego-nuzhno/">подробное объяснение</a> алгоритма работы Яндекса. Его, по словам Ильи Сегаловича, - директора по технологиям и разработке поисковой машины «Яндекс», можно узнать, лишь «под пыткой» самого Ильи Сегаловича…</p><p><b>2. Понятие и функции поисковой системы </b></p><p>Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: <a target="_blank" href="http://www.google.com">«Google»</a> , «Yahoo» , «MSN» . В русском Интернете это – «Яндекс» , «Рамблер» , «Апорт» .</p><p>Рассмотрим подробнее понятие поискового запроса на примере поисковой системы «Яндекс». Поисковый запрос должен быть сформулирован пользователем в соответствии с тем, что он хочет найти, максимально кратко и просто. Допустим, мы хотим найти информацию в «Яндексе» о том, как выбрать автомобиль. Для этого, открываем <a href="/kak-vkontakte-ili-odnoklassniki-sdelat-startovoi-stranicei/">главную страницу</a> «Яндекса», и вводим текст поискового запроса «как выбрать автомобиль». Далее, наша задача сводится к тому, чтобы открыть предоставленные по нашему запросу ссылки на источники информации в Интернет. Однако, вполне можно и не найти нужную нам информацию. Если таковое произошло, то либо нужно перефразировать свой запрос, либо в базе поисковой системе действительно нет никакой актуальной информации по нашему запросу (такое может быть при задании очень «узких» запросов, как, например «как выбрать автомобиль в Архангельске»)</p><p>Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут. А научить пользователей делать «правильные» запросы к системе, т.е. запросы, соответствующие принципам работы поисковых систем, невозможно. Поэтому разработчики создают такие алгоритмы и принципы работы поисковых систем, которые бы позволяли находить пользователям искомую ими информацию.</p><p>Это означает, поисковая система должна «думать» так же, как думает пользователь при поиске информации. Когда пользователь обращается с запросом к поисковой машине, он хочет найти то, что ему нужно, максимально быстро и просто. Получая результат, он оценивает работу системы, руководствуясь несколькими основными параметрами. Нашел ли он то, что искал? Если не нашел, то сколько раз ему пришлось перефразировать запрос, чтобы найти искомое? Насколько <a href="/besplatnye-sposoby-reklamy-soobshchestva-vkontakte/">актуальную информацию</a> он смог найти? Насколько быстро обрабатывала запрос поисковая машина? Насколько удобно были представлены результаты поиска? Был ли искомый результат первым или же сотым? Как много ненужного мусора было найдено наравне с <a href="/interesnye-fakty-o-vich-infekcii-vich-i-spid-interesnye-fakty-so/">полезной информацией</a>? Найдется ли нужная информация, при обращении к поисковой системе, скажем, через неделю, или через месяц? </p><p>Для того, чтобы удовлетворить ответами все эти вопросы, разработчики поисковых машин постоянно совершенствуют алгоритмы и принципы поиска, добавляют новые функции и возможности, всячески пытаются ускорить работу системы.</p><p><b>3. Основные характеристики поисковой системы </b></p><p>Опишем основные характеристики поисковых систем:</p><ul><li><i>Полнота </i><p>Полнота - одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.</p></li><li><i>Точность </i><p>Точность - еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.</p></li><li><i>Актуальность </i><p>Актуальность - не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «<a href="/bystryi-start-vizualnoe-proektirovanie-bazy-dannyh-v-mysql-workbench-ot-modeli-k/">быстрой базы</a>», которая обновляется несколько раз в день.</p></li><li><i>Скорость поиска </i><p>Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки <a href="/kak-ochistit-istoriyu-poiska-v-yula-gde-iskat-istoriyu/">отдельного запроса</a>. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.</p></li><li><i>Наглядность </i></li> </ul><p><b>4. <a href="/kogda-poyavilsya-pervyi-vindovs-istoriya-razvitiya-os-windows-kratkaya-istoriya/">Краткая история</a> развития поисковых систем </b><br></p><p>В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.</p><p>Одним из первых способов организации доступа к информационным ресурсам сети стало создание открытых каталогов сайтов, ссылки на ресурсы в которых группировались согласно тематике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. После того, как количество сайтов в каталоге значительно увеличилось, была добавлена возможность поиска нужной информации по каталогу. В полном смысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Интернет ресурсами.</p><p>Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.</p><p>В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.</p><p>В 1997 году Сергей Брин и Ларри Пейдж создали поисковую <a href="/kakuyu-rabotu-vypolnyayut-pauki-poiskovyh-mashin-poiskovyi-robot-google-kakuyu/">машину Google</a> в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google - самая популярная поисковая система в мире!</p><p>В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.</p><p>В настоящее время существуют три основные поисковые системы (международные) – Google, Yahoo и , имеющие <a href="/kak-vypolnit-energosnabzhenie-na-shine-knx-eib-osveshchenie-v-dome/">собственные базы</a> и алгоритмы поиска. Большинство остальных поисковых систем (коих насчитывается большое количество) использует в том или ином виде результаты трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo.</p><p><b>5. Состав и принципы работы поисковой системы </b></p><p>В России основной поисковой системой является «Яндекс», далее - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».</p><p>Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.</p><p><b><b>Модуль индексирования </b> </b></p><p>Модуль индексирования состоит из трех <a href="/kak-ustanovit-parol-na-papku-noutbuke-kak-ustanovit-parol-na-papku-bez/">вспомогательных программ</a> (роботов):</p><p>Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» <a href="/proksi-sleduyushchim-obrazom-znachenie-kak-polzovatsya-proksi-serverom-osnovnye/">следующим образом</a>. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий <a href="/referat-bezopasnost-korporativnyh-informacionnyh-sistem/">служебную информацию</a> и непосредственно сам документ.</p><ul><li>URL страницы</li><li>дата, когда страница была скачана</li><li>http-заголовок ответа сервера</li><li>тело страницы (html-код)</li> </ul><p>Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.</p><p>Indexer (робот- индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.</p><p>Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.</p><p><b><b>База данных </b> </b></p><p>База данных, или индекс поисковой системы - это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.</p><p><b><b>Поисковый сервер </b> </b></p><p>Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.</p><p>Поисковый сервер работает следующим образом:</p><ul><li>Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде , то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).</li><li>Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.</li><li>В зависимости от выбора пользователя этот рейтинг может быть скорректирован <a href="/linzmaster-skidka-v-den-rozhdeniya-promokody-linzmaster-dlya-dopolnitelnoi/">дополнительными условиями</a> (например, так называемый «расширенный поиск»).</li><li>Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.</li><li>Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.</li> </ul><p>Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.</p><p><b>6. Заключение </b></p><p>Теперь подытожим все вышесказанное.</p><ul><li>Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут.</li><li>Основные характеристики поисковых систем: <ol><li>Полнота</li><li>Точность</li><li>Актуальность</li><li>Скорость поиска</li><li>Наглядность</li> </ol></li><li>Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.</li><li>В состав поисковой системы входят компоненты: <ol><li>Модуль индексирования</li><li>База данных</li><li>Поисковый сервер</li> </ol></li> </ul><p>Надеемся, наш мастер-класс позволит Вам поближе ознакомиться с понятием ПС, лучше узнать основные функции, характеристики и принцип работы поисковых систем.</p> <script type="text/javascript"> <!-- var _acic={dataProvider:10};(function(){var e=document.createElement("script");e.type="text/javascript";e.async=true;e.src="https://www.acint.net/aci.js";var t=document.getElementsByTagName("script")[0];t.parentNode.insertBefore(e,t)})() //--> </script><br> <br> <script>document.write("<img style='display:none;' src='//counter.yadro.ru/hit;artfast_after?t44.1;r"+ escape(document.referrer)+((typeof(screen)=="undefined")?"": ";s"+screen.width+"*"+screen.height+"*"+(screen.colorDepth? screen.colorDepth:screen.pixelDepth))+";u"+escape(document.URL)+";h"+escape(document.title.substring(0,150))+ ";"+Math.random()+ "border='0' width='1' height='1' loading=lazy>");</script> </div> </div> </div> </div> <div class="right -is-sticky"> <div class="articles-conseilles"> <div id="focoda2" style="height:500px;width:266px;" align="center"></div> </div> </div> </div> <div class="a-decouvrir"> <h3>Рекомендуем почитать</h3> <div class="featured"> <div class="view view-articles view-id-articles view-display-id-block_4 view-dom-id-169dc93f512a102548b755435ccd1346"> <div class="view-content"> <div class="row"> <article class="preview-article"> <header class="preview-article__header"> <a href="/luchshie-utility-dlya-udaleniya-virusov-i-vredonosnyh-programm/"> <figure class=""> <img src="https://i2.wp.com/webhelper.info/images/danger.jpg" alt="Лучшие утилиты для удаления вирусов и вредоносных программ" loading=lazy> </figure> </a> </header> <div class="preview-article__content"> <div class="views-field views-field-title"> <span class="field-content"><a href="/luchshie-utility-dlya-udaleniya-virusov-i-vredonosnyh-programm/">Лучшие утилиты для удаления вирусов и вредоносных программ</a></span> </div> <div class="views-field views-field-body"> <div class="field-content"> <p> Вредоносное ПО (malware) - это назойливые или опасные программы,... </p> </div> </div> <div class="views-field views-field-field-article-categorie"> <div class="field-content"> <span class="preview-article__category se-soigner"> </span> </div> </div> </div> </article> <article class="preview-article"> <header class="preview-article__header"> <a href="/programma-dlya-vosstanovleniya-udalennyh-failov-onlain-kak-testirovalis/"> <figure class=""> <img src="https://i0.wp.com/softnonstop.ru/newi/7-Data-Recovery-Suite-min.png" alt="Как тестировались программы" loading=lazy> </figure> </a> </header> <div class="preview-article__content"> <div class="views-field views-field-title"> <span class="field-content"><a href="/programma-dlya-vosstanovleniya-udalennyh-failov-onlain-kak-testirovalis/">Как тестировались программы</a></span> </div> <div class="views-field views-field-body"> <div class="field-content"> <p> Лучшие программы для восстановления данных с любых носителей информации.... </p> </div> </div> <div class="views-field views-field-field-article-categorie"> <div class="field-content"> <span class="preview-article__category se-soigner"> </span> </div> </div> </div> </article> <article class="preview-article"> <header class="preview-article__header"> <a href="/chto-sdelat-chtoby-umenshit-nagruzku-kak-umenshit-nagruzku-na-cp/"> <figure class=""> <img src="https://i2.wp.com/pcpro100.info/wp-content/uploads/2015/03/kak-pochistit-kompyuter-ot-pyili.jpg" alt="Как уменьшить нагрузку на ЦП: простые, но эффективные методы решения проблемы" loading=lazy> </figure> </a> </header> <div class="preview-article__content"> <div class="views-field views-field-title"> <span class="field-content"><a href="/chto-sdelat-chtoby-umenshit-nagruzku-kak-umenshit-nagruzku-na-cp/">Как уменьшить нагрузку на ЦП: простые, но эффективные методы решения проблемы</a></span> </div> <div class="views-field views-field-body"> <div class="field-content"> <p> Здравствуйте.Одна из самых распространенных причин, по которым тормозит... </p> </div> </div> <div class="views-field views-field-field-article-categorie"> <div class="field-content"> <span class="preview-article__category se-soigner"> </span> </div> </div> </div> </article> </div> </div> </div> </div> </div> </div> <a href="#skip-link" class="visually-hidden visually-hidden--focusable" id="main-menu" tabindex="-1">Наверх</a> </div> </section> <div class="region region-bottom"> <div class="block block-block first last odd" id="block-block-7"> <ul> <li><a href="/category/news/">Новости</a></li> <li><a href="/category/for-android/">Для Андроид</a></li> <li><a href="/category/for-windows/">Для Windows</a></li> <li><a href="/category/for-windows-phone/">Для Windows Phone</a></li> <li><a href="/category/download-viber/">Скачать Viber</a></li> <li><a href="/category/viber-on-the-computer/">Вайбер на компьютер</a></li> </ul> <p><a href="/" id="choosit"><img alt="" height="13" src="/sites/all/themes/lanutrition/img/logo-choosit.svg" width="50" / loading=lazy></a></p> </div> </div> <div class="search-modal" id="search-modal"><button class="close-button" id="close-search" aria-label="Close reveal" type="button"><span aria-hidden="true">×</span></button> <div class="search-modal__content"> <div class="block block-search first odd" role="search" id="block-search-form"> <form class="search-form" role="search" action="/" method="get" id="search-block-form" accept-charset="UTF-8"> <div> <div class="container-inline"> <h2 class="element-invisible">Поиск по сайту</h2> <div class="form-item form-type-textfield form-item-search-block-form"> <input title="" class="custom-search-box form-text" placeholder="введите слово" type="text" id="edit-search-block-form--2" name="s" value="" size="15" maxlength="128" /> </div> <div class="form-actions form-wrapper" id="edit-actions"><input type="submit" id="edit-submit" name="op" value="Rechercher" class="form-submit" /></div> </div> </div> </form> </div> </div> </div> </body> </html>