Кто разработал всемирную паутину. Всемирная паутина

Для Windows Phone 13.08.2019
Для Windows Phone

Свободный доступ к информации, невзирая на границы и расстояния, стал возможен благодаря World Wide Web (WWW, Web) - всемирному хранилищу информации, существующему на технической базе сети Интернет.

WWW или Всемирная паутина:

Представляет собой множество информационных ресурсов, организованных в единое целое;
- объединяет многочисленные ресурсы, размещённые в компьютерах по всему миру;
- организована так, что в ней информационные ресурсы представлены не в линейной последовательности, а снабжены ссылками (гиперссылками), явно указывающими возможные переходы, связи между ресурсами.

Всемирная паутина - это мощнейшее информационное хранилище; содержащийся в ней объём информации не поддаётся точному измерению. WWW содержит информацию самого разного характера; там можно найти:

  • самые свежие новости - политические, экономические, культурные, спортивные;
  • научную, техническую, образовательную и справочную информацию абсолютно любого рода;
  • рекламу разнообразных товаров и услуг;
  • ресурсы для досуга и развлечений - книги, музыку, фильмы, игры и многое другое.

Любой человек, имеющий доступ к Интернету, может разместить в сети свою информацию.

Информация в WWW организована в виде страниц (web-страниц ). В свою очередь, страницы могут объединяться в более крупные составляющие - сайты (англ. site - место, участок).

Web-сайт - это несколько web-страниц, связанных между собой по содержанию.

Сайты есть у государственных структур, общественных организаций, предприятий, фирм и компаний, музеев и библиотек, газет, образовательных учреждений, в том числе у многих школ.

Каждый сайт и каждая страница имеют свой адрес , по которому к ним можно обратиться. Web-сайты сильно отличаются друг от друга по оформлению, но чаще всего они имеют похожую структуру.

Каждый web-сайт имеет главную страницу , которая аналогична странице с оглавлением в книге. В текстах, размещённых на страницах сайтов, могут быть выделены некоторые слова - гиперссылки , от которых идут гиперсвязи .

Они выделяются цветом или подчёркиванием.

Щёлкнув мышью на таком слове, мы переходим к просмотру другого документа, причём этот документ может находиться на другом компьютере, в другой стране, на другом континенте.

В качестве гиперссылок может использоваться не только текст, но и любое графическое изображение. Такую организацию информации называют гипертекстом .

Перемещаться пользователю по «паутине» помогают специальные программы (web-браузеры , англ. browse - осматривать, изучать).

Логотипы наиболее распространенных браузеров:

На первый взгляд Всемирную паутину можно представить как библиотеку, книги в которой расположены без видимого порядка: нет ни единой системы каталогов, ни библиотекарей. При этом посетители «библиотеки» по собственному усмотрению добавляют новые тома или безвозвратно их забирают. Для того чтобы извлечь полезную информацию из Всемирной паутины, нужно знать, где и как вести поиск, нужен опыт поисковой работы.

Поиск нужного документа в WWW происходит с помощью браузера разными способами:

    путём указания адреса документа;

    путём перемещения по паутине гиперсвязей;

    путём использования поисковых систем.

Поисковые системы

Все системы поиска информации во Всемирной паутине располагаются на специально выделенных компьютерах с мощными каналами связи. Ежеминутно они обслуживают огромное количество клиентов.

Действие поисковых систем основано на постоянном, последовательном изучении всех страниц всех сайтов Всемирной паутины. Для каждого документа составляется его поисковый образ - набор ключевых слов, отражающих содержание этого документа. В связи с постоянным обновлением информации поисковые системы периодически возвращаются к ранее изученным страницам, чтобы обнаружить и зарегистрировать изменения. Информация о ключевых словах исследованных таким образом страниц сохраняется в поисковой системе.

При поступлении запроса от пользователя поисковая система на основании имеющейся в ней информации формирует список страниц, соответствующих критериям поиска. Найденные документы, как правило, упорядочиваются в зависимости от местоположения ключевых слов (в заголовке, в начале текста), частоты их появления в тексте и других характеристик.

Существует множество поисковых систем. Несмотря на общий принцип работы, поисковые системы различаются по языкам запроса, зонам поиска, глубине поиска внутри документа, методам упорядочивания информации и другим характеристикам. На данный момент самой популярной в мире поисковой системой является Google . Крупнейшие отечественные поисковые системы - Яндекс, Rambler .

Адрес: www.google.com

Самая быстрая и самая большая поисковая система. Содержит информацию более чем о полутора миллиардах страниц. Имеется возможность выбора языка. Оценивает популярность ресурса по количеству ссылок, ведущих к нему с других страниц.

Адрес: www.yandex.ru

Мощная отечественная поисковая система. Обеспечивает поиск в основном среди русскоязычных ресурсов, при этом по возможностям не уступает зарубежным системам. Проводит качественный анализ информации с учётом словоформ русского языка.

Адрес: www.rambler.ru

Одна из первых русских поисковых систем. Кроме стандартных возможностей поиска на сайте имеется рейтинг-каталог ресурсов.

Сегодня пользование сетью стало обыденным делом. Выйти в интернет иной раз проще, чем встать с дивана, чтобы включить телевизор потому, что пульт опять куда-то исчез:). Да что там, многие уже и телевизор не смотрят, ведь в сети есть все необходимое, ну разве что не кормят…пока.

Но кто же придумал то, чем мы пользуемся ежедневно, ежечасно? Вы знаете? Я до сего момента даже не представлял. А придумал интернет Сэр Тимоти Джон Бернерс-Ли. Именно он тот самый изобретатель Всемирной паутины и автор множества других крупнейших разработок в этой области.

Тимоти Джон Бернерс-Ли родился 8 июня 1955 года в Лондоне, в не совсем обычной семье. Его родителями были математики Конвэй Бернерс-Ли и Мэри Ли Вудс, которые вели исследования в области создания одного из первых компьютеров – Manchester Mark I.

Надо сказать, что и само время располагало к различного рода технологическим прорывам в области IT-технологий: за несколько лет до этого Ванневаром Бушем (ученый из США) был предложен так называемый гипертекст. Это уникальное явление, которое представляло собой альтернативу привычной линейной структуре развития, повествования и т.п. и оказало заметное влияние на многие сферы жизни – начиная от науки и заканчивая искусством.

А уже спустя несколько лет после рождения Тима Бернерса-Ли Тед Нельсон выступил с предложением о создании «документальной вселенной», где все тексты, когда-либо написанные человечеством, были бы связаны воедино при помощи того, что мы сегодня назвали бы «перекрестными ссылками». В преддверии изобретения интернета все эти и многие другие события, безусловно, создавали благоприятную почву и наводили на соответствующие размышления.

В возрасте 12 лет родители отдали мальчика в частную школу Эмануэль в городке Вэндсворт, где он проявил интерес к точным наукам. После окончания школы он поступил в колледж при Оксфорде, где вместе с товарищами был уличен в хакерской атаке и за это их лишили права доступа к учебным компьютерам. Это досадное обстоятельство подтолкнуло Тима впервые самостоятельно собрать компьютер на базе процессора М6800, с обычным телевизором вместо монитора и сломанным калькулятором – вместо клавиатуры.

Бернерс-Ли окончил Оксфорд в 1976 году, по специальности «Физика», после чего начал свою карьеру в компании Plessey Telecommunications Ltd. Сферой его деятельности на тот момент были распределенные транзакции. Уже через пару лет он перешел в другую компанию – DG Nash Ltd, где разрабатывал программное обеспечение для принтеров. Именно здесь он впервые создал некий аналог будущей операционной системы, способной работать в режиме многозадачности.

Следующим местом работы стала уже Европейская лаборатория по ядерным исследованиям, расположенная в г. Женева (Швейцария). Здесь, на должности консультанта по ПО, Бернерс-Ли написал программу Enquire (дословный перевод с английского звучит как «дознаватель», «справочная» или «записная книжка»), которая использовала метод случайных ассоциаций. Принцип ее работы, во многом, явился подспорьем для создания Всемирной паутины.

Затем были три года работы в качестве системного архитектора и научная работа в CERN, где он разработал ряд распределенных систем для сбора данных. Здесь же, в 1989 году, им впервые был внедрен проект на основе гипертекста – родоначальник современной сети интернет. Позже этот проект получил название Всемирная паутина (англ. World Wide Web ).

В двух словах, суть его заключалась в следующем: публикация гипертекстовых документов, которые были бы связаны между собой гиперссылками. Это позволяло заметно облегчить поиск информации, ее систематизацию и хранение. Первоначально предполагалось, что проект будет реализован во внутренней сети CERN для локальных исследовательских нужд, как современная альтернатива библиотеки и другим хранилищам данных. При этом, загрузка данных и доступ к ним были возможны с любого компьютера, подключенного к WWW.

Работа над проектом продолжалась с 1991 по 1993 год в виде сбора отзывов пользователей, координации и всевозможных доработок всемирной паутины. В частности, уже тогда были предложены первые версии протоколов URL (как частный случай идентификатора URI), HTTP и HTML. Также был внедрен первый веб-браузер на основе гипертекста World Wide Web и редактор WYSIWYG.

В 1991 году был запущен самый первый веб-сайт, который имел адрес . Его содержанием была ознакомительная и вспомогательная информация относительно Всемирной паутины: как установить веб-сервер, как подключиться к интернету, как пользоваться веб-браузером. Там же размещался интернет-каталог со ссылками на другие сайты.

С 1994 года Бернерс-Ли возглавляет в Лаборатории информатики MIT (сейчас – Лаборатория информатики и искусственного интеллекта, совместно с Массачусетским институтом) кафедру Основателей 3Com, где работает в качестве ведущего исследователя.

В 1994 году при Лаборатории им был основан , который и по сей день осуществляет разработку и внедрение стандартов для сети интернет. В частности, Консорциум работает над тем, чтобы обеспечить Всемирной паутине стабильное и непрерывное развитие – в соответствии с последними требованиями пользователей и уровнем технического прогресса.

В 1999 году вышла знаменитая книга Бернерса-Ли под названием « ». В ней подробно описывается процесс работы над ключевым проектом в жизни автора, рассуждает о перспективах развития интернета и интернет-технологий и обозначает ряд важнейших принципов. Среди них:

— значимость веб 2.0, непосредственного участия пользователей в создании и редактировании контента веб-сайтов (яркий пример Wikipedia и социальные сети);
— тесная взаимосвязь всех ресурсов друг с другом посредством перекрестных ссылок в сочетании с равными позициями каждого из них;
— моральная ответственность ученых, внедряющих те или иные IT-технологии.

С 2004 года Бернерс-Ли – профессор Саутгемптонского университета, где работает над проектом семантической паутины. Она представляет собой новую версию Всемирной паутины, где все данные пригодны для обработки при помощи специальных программ. Это – своего рода «надстройка», предполагающая, что у каждого ресурса будет не только обычный текст «для людей», но и специальным образом закодированный контент, понятный компьютеру.

В 2005 году была издана его вторая книга – «Пройдя семантическую паутину: полное раскрытие потенциала Всемирной паутины».

На настоящий момент Тим Бернерс-Ли имеет звание Рыцаря-Командора от королевы Елизаветы II, является Выдающимся членом Британского компьютерного общества, иностранным членом Национальной академии наук США и многих других. Его труд был отмечен множеством наград, включая Орден заслуг, место в списке «100 величайших умов века» по версии журнала Time Magazine (1999 год), премию «Квадрига» в номинации «Сеть знаний» (2005), премию М.С.Горбачева в номинации «Перестройка» — «Человек, изменивший мир» (2011) и др.

В отличие от многих его успешных собратьев, вроде , или , Бернерс-Ли никогда не отличался особым стремлением монетизировать и получать сверхприбыли от своих проектов и изобретений. Его манеру общения характеризуют как «стремительный поток мысли», сопровождаемый редкими отступлениями и самоиронией. Словом, налицо все признаки гения, живущего в своем собственном, «виртуальном» мире, который, при этом, колоссальным образом повлиял на мир сегодняшний.

Всемирная паутина (англ. World Wide Web) - глобальное информационное пространство, основанное на физической инфраструктуре Интернета и протоколе передачи данных HTTP. Всемирная паутина вызвала настоящую революцию в информационных технологиях и бум в развитии Интернета. Часто, говоря об Интернете, имеют в виду именно Всемирную паутину. Для обозначения Всемирной паутины также используют слово веб (англ. web) и аббревиатуру «WWW».

Всемирную паутину образуют миллионы веб-серверов сети Интернет, расположенные по всему миру. Веб-сервер - программа, запускаемая на подключённом к сети компьютере. В простейшем виде такая программа получает по сети HTTP-запрос на определённый ресурс, находит соответствующий файл на локальном жёстком диске и отправляет его по сети запросившему компьютеру. Более сложные веб-серверы способны динамически формировать ресурсы в ответ на HTTP-запрос.

Для просмотра информации, полученной от веб-сервера, на клиентском компьютере применяется специальная программа-клиент - веб-бра́узер (web-browser) . Основная функция веб-браузера - отображение гипертекста .

Всемирная паутина неразрывно связана с понятиями гипертекста. Гипертекст (Hypertext) – это документ или система документов с перекрестными ссылками (гиперссылками ). По такому документу можно перемещаться не последовательно, а, активируя гиперссылки, переходить по ним к связанным со ссылками текстам или файлам.

Для создания, хранения и отображения гипертекста используется язык HTML (англ. HyperText Markup Language) , язык разметки гипертекста. Работа по разметке гипертекста называется вёрсткой, специалисты по разметке называются веб-мастерами .

HTML-файл является самым распространённым ресурсом Всемирной паутины. HTML-файл доступный веб-серверу, называют «веб-страницей ». Набор связанных тематикой, дизайном или владельцем веб-страниц образует веб-сайт .

Информация в вебе может отображаться как пассивно (то есть пользователь может только считывать её), так и активно - тогда пользователь может добавлять информацию и редактировать её. К способам активного отображения информации во Всемирной паутине относятся:

Гостевые книги,

Wiki-проекты,

Системы управления контентом.

HTML-разметка

HTML (HyperText Markup Language) не является языком программирования, он является языком форматирования, т.е. придания внешнего вида web-странице, при ее присмотре в браузере. Для разметки документа используются теги . Теги заключаются в угловые скобки, и, за редким исключением, являются парными, т.е. существует открывающий и закрывающий тег. Например, чтобы отметить начало нового абзаца в документе ставится тег

(от paragraph ). Тогда в конце абзаца обязательно должен ставиться закрывающий тег

.


При расстановке тегов соблюдается правило: закрываются теги в порядке обратном их появлению. Например, если слово в тексте должно быть выделено жирностью (тег от bold ) и одновременно курсивом (тег от italic ), то это может быть сделано одним из следующих способов: слово , или слово.

Ниже приводится текст некоторого html-документа и результат его отображения в браузере:

Доброе время суток, уважаемый посетитель!

Надеюсь, вы попали как раз туда, куда хотели.

Здесь вы найдете стихи , песни и сценарии для организации любых праздников.

А теперь специальный подарок к 1 сентябряb>

Он к "пятерочкам" привык -

Русский пять и пение.

Мне всегда его дневник

Портит настроение.

Всемирная паутина (сокращенно World Wide Web или WWW) - это единство информационных ресурсов, которые связаны между собой средствами телекоммуникаций и основаны на гипертекстовом представлении данных, разбросанных по всему миру.

Годом рождения Всемирной паутины считается 1989 год. Именно в этом году Тим Бернерс-Ли предложил общий гипертекстовый проект, который получил впоследствии название Всемирной паутины.

Создатель «паутины» Тим Бернес-Ли, работая в лаборатории физики элементарных частиц европейского центра ядерных исследований «CERN» В Женеве (Швейцария), совместно с партнером Робертом Кайо занимались проблемами применения идей гипертекста для построения информационной среды, которая упростила бы обмен информацией между физиками.

Итогом данной работы явился документ, в котором рассматривались понятия, имеющие принципиальное значение для «паутины» в ее современном виде, и были предложены идентификаторы URI, протокол HTTR и язык HTML. Без данных технологий уже нельзя представить современный Интернет.

Бернерс-Ли создал первый в мире веб-сервер и первый в мире гипертекстовый веб-браузер. На первом в мире веб-сайте он описал, что такое Всемирная паутина и как установить веб-сервер, как использовать браузер и т.п. Этот сайт являлся и первым в мире Интернет-каталогом.

Начиная с 1994 года самые главные задачи по развитию Всемирной паутины взял на себя Консорциум Всемирной паутины (World Wide Web Consortium, WЗС ), который организовал и до сих пор возглавляет Ким Бернес-Ли. Консорциум разрабатывает и внедряет технологические стандарты для Интернета и Всемирной паутины. Миссия WЗС: «Полностью раскрыть потенциал Всемирной паутины, путем создания протоколов и принципов, гарантирующих долгосрочное развитие Сети» . WЗС разрабатывает «Рекомендации», что бы достичь совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной.

Поисковые системы: состав, функции, принципы работы.

Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: «Google» , «Yahoo» , «MSN» . В русском Интернете это – «Яндекс» , «Рамблер» , «Апорт» .

Опишем основные характеристики поисковых систем :

    Полнота

Полнота - одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.

    Точность

Точность - еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.

    Актуальность

Актуальность - не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.

    Скорость поиска

Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

    Наглядность

Наглядность представления результатов является важным компонентом удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска.одробные пояснения по странице результатов поиска, например у «Яндекса» можно посмотреть по ссылке http://help.yandex.ru/search/?id=481937 .

Краткая история развития поисковых систем

В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.

Одним из первых способов организации доступа к информационным ресурсам сети стало создание открытых каталогов сайтов, ссылки на ресурсы в которых группировались согласно тематике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. После того, как количество сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска нужной информации по каталогу. В полном смысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Интернет ресурсами.

Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.

Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.

В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.

В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google - самая популярная поисковая система в мире!

В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.

В настоящее время существуют три основные международные поисковые системы – Google, Yahoo и MSN, имеющих собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих насчитывается большое количество) использует в том или ином виде результаты трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo.

Состав и принципы работы поисковой системы

В России основной поисковой системой является «Яндекс», далее - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».

Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.

Модуль индексирования

Модуль индексирования состоит из трех вспомогательных программ (роботов):

Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.

    URL страницы

    дата, когда страница была скачана

    http-заголовок ответа сервера

    тело страницы (html-код)

Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Indexer (робот- индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.

Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.

База данных

База данных, или индекс поисковой системы - это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.

Поисковый сервер

Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.

Поисковый сервер работает следующим образом:

    Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде сниппета, то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).

    Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.

    В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).

    Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.

    Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.

Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

Ни одна поисковая система не охватывает все ресурсы Интернет.

Каждая поисковая система собирает сведения о ресурсах Интернет, применяя свои уникальные методы, и формирует собственную периодически обновляемую базу данных. Доступ к этой базе предоставляется пользователю.

Поисковые системы реализуют два способа поиска ресурса:

    Поиск по тематическим каталогам - информация представляется в виде иерархической структуры. На верхнем уровне - общие категории (“Интернет”, “Бизнес”, “Искусство”, “Образование” и т.д.), на следующем уровне категории делятся на разделы и т.д. Самый нижний уровень - ссылки на конкретные веб-страницы или другие информационные ресурсы.

    Поиск по ключевым словам (индексный поиск или детальный) - пользователь отправляет поисковой системе запрос , состоящий из ключевых слов. Система возвращает пользователю перечень найденных по запросу ресурсов.

Большинство поисковых систем сочетают оба способа поиска.

Поисковые системы могут быть локальными, глобальными, региональными и специализированными.

В русской части Интернет (Рунет) наиболее популярны сейчас поисковые системы общего назначения Rambler (www.rambler.ru), Яндекс (www.yandex.ru), Апорт (www.aport.ru), Гугл (www.google.ru).

Большинство поисковых систем реализовано в виде порталов.

Портал (от англ. portal - главный вход, ворота) -это веб-сайт, который интегрирует различные сервисы Интернет: средства поиска, почту, новости, словари и т.д.

Порталы могут быть специализированными (как, www . museum . ru ) и общими (например, www . km . ru ).

Поиск по ключевым словам

Набор ключевых слов, по которым ведется поиск, называют также критерием поиска или темой поиска.

Запрос может состоять как из одного слова, так и из сочетания слов, объединенных операторами - символами, по которым система определяет, какое действие ей нужно произвести. Например: запрос “Москва Питер” содержит оператор И (так воспринимается пробел), который указывает, что надо искать документы, в которых есть оба слова - и Москва, и Питер.

Для того, чтобы поиск был релевантным (от англ. relevant -уместный, относящийся к делу), следует учитывать несколько общих правил:

    Независимо от того, в какой форме употреблено слово в запросе, поиск учитывает все его словоформы по правилам русского языка. Например, по запросу “билет” будут найдены и слова “билетом”, “билету” и т.д.

    Заглавные буквы следует использовать только в именах собственных, чтобы не просматривать лишние ссылки. По запросу “кузнецов”, например, будут найдены документы, где говорится и о кузнецах, и о Кузнецовых.

    Желательно сужать круг поиска, используя несколько ключевых слов.

    Если нужного адреса нет среди первой двадцатки найденных адресов, следует изменить запрос.

Каждая поисковая система использует свой язык запросов. Для знакомства с ним, пользуйтесь встроенной справкой поисковой системы

Крупные сайты могут иметь встроенные системы поиска информации в пределах своих веб-страниц.

Запросы в подобных системах поиска, как правило, строятся по тем же правилам, что и в глобальных поисковых системах, однако знакомство со справкой и здесь не будет лишним.

Расширенный поиск

Поисковые системы могут предоставлять в распоряжение пользователя механизм, позволяющий формировать сложный запрос. Переход по ссылке Расширенный поиск дает возможность редактировать параметры поиска, указывать дополнительные параметры и выбирать наиболее удобную форму показа результатов поиска. Ниже описаны параметры, которые могут быть заданы при расширенном поиске в системах Япс1ех и Rambler.

Описание параметра

Название в Яндекс

Название в Rambler

Где искать ключевые слова (заголовок документа, основной текст и т.д.)

Словарный фильтр

Поиск по тексту...

Какие слова должны или не должны присутствовать в документе и насколько точным должно быть совпадение

Словарный фильтр

Искать слова запроса... Исключить документы, содержащие следующие слова...

На каком расстоянии друг от друга должны располагаться ключевые слова

Словарный фильтр

Расстояние между словами запроса...

Ограничение на дату документа

Дата документа...

Ограничение поиска пределами одного или нескольких сайтов

Сайт/Вершина

Искать документы только на следующих сайтах...

Ограничение поиска по языку документа

Язык документа...

Поиск документов, содержащих картинку с определенным именем или подписью

Изображение

Поиск страниц, содержащих объекты

Специальные объекты

Форма представления результатов поиска

Формат выдачи

Вывод результатов поиска

Некоторые поисковые системы (например, Яндекс) позволяют вводить запросы на естественном языке. Вы пишите, что нужно найти (например: заказ билетов на поезд из Москвы в Питер). Система анализирует запрос и выдает результат. Если он Вас не устраивает, переходите на язык запросов.

с. 1

Школа информатики и вычислительной техники
«Реферат»
На тему: Всемирная паутина.

Работу выполняла ученица 190(1)

Григорьева Анастасия

Работу проверяет учитель Исаева И.А.

Таллинн 2010

Введение 3

Структура и принципы Всемирной паутины 4

История Всемирной паутины 5

Путешествие по всемирной паутине 7

Связь страниц гипертекста 8

Перспективы развития Всемирной паутины 9


Рис.1.1

Структура и принципы Всемирной паутины

Всемирную паутину образуют миллионы веб-серверов сети Интернет, расположенных по всему миру. Веб-сервер является программой, запускаемой на подключённом к сети компьютере и использующей протокол HTTP для передачи данных. В простейшем виде такая программа получает по сети HTTP-запрос на определённый ресурс, находит соответствующий файл на локальном жёстком диске и отправляет его по сети запросившему компьютеру. Более сложные веб-серверы способны динамически распределять ресурсы в ответ на HTTP-запрос. Для идентификации ресурсов (зачастую файлов или их частей) во Всемирной паутине используются единообразные идентификаторы ресурсов URI (англ. Uniform Resource Identifier ). Для определения местонахождения ресурсов в сети используются единообразные локаторы ресурсов URL (англ. Uniform Resource Locator ). Такие URL-локаторы сочетают в себе технологию идентификации URI и систему доменных имён DNS (англ. Domain Name System ) - доменное имя (или непосредственно IP-адрес в числовой записи) входит в состав URL для обозначения компьютера (точнее - одного из его сетевых интерфейсов), который исполняет код нужного веб-сервера.

Для обзора информации, полученной от веб-сервера, на клиентском компьютере применяется специальная программа - веб-браузер. Основная функция веб-браузера - отображение гипертекста. Всемирная паутина неразрывно связана с понятиями гипертекста и гиперссы́лки. Большая часть информации в Вебе представляет собой именно гипертекст. Для облегчения создания, хранения и отображения гипертекста во Всемирной паутине традиционно используется язык HTML (англ. HyperText Markup Language ), язык разметки гипертекста. Работа по разметке гипертекста называется вёрсткой, ма́стера по разметке называют веб-мастером или вебмастером (без дефиса). После HTML-разметки получившийся гипертекст помещается в файл, такой HTML-файл является самым распространённым ресурсом Всемирной паутины. После того, как HTML-файл становится доступен веб-серверу, его начинают называть «веб-страницей». Набор веб-страниц образует веб-сайт. В гипертекст веб-страниц добавляются гиперссылки. Гиперссылки помогают пользователям Всемирной паутины легко перемещаться между ресурсами (файлами) вне зависимости от того, находятся ресурсы на локальном компьютере или на удалённом сервере. Гиперссылки веба основаны на технологии URL. (2 ссылка)

История Всемирной паутины

Изобретателями всемирной паутины считаются Тим Бернерс-Ли и в меньшей степени , Роберт Кайо. Тим Бернерс-Ли является автором технологий HTTP, URI/URL и HTML. В 1980 году он работал в Европейском совете по ядерным исследованиям (фр. Conseil Européen pour la Recherche Nucléaire, CERN ) консультантом по программному обеспечению. Именно там, в Женеве (Швейцария), он для собственных нужд написал программу «Энквайр» (англ. « Enquire » , можно вольно перевести как «Дознаватель»), которая использовала случайные ассоциации для хранения данных и заложила концептуальную основу для Всемирной паутины.

В 1989 году, работая в CERN над внутренней сетью организации, Тим Бернерс-Ли предложил глобальный гипертекстовый проект, теперь известный как Всемирная паутина. Проект подразумевал публикацию гипертекстовых документов, связанных между собой гиперссылками, что облегчило бы поиск и консолидацию информации для учёных CERN. Для осуществления проекта Тимом Бернерсом-Ли (совместно с его помощниками) были изобретены идентификаторы URI, протокол HTTP и язык HTML. Это технологии , без которых уже нельзя себе представить современный Интернет. В период с 1991 по 1993 год Бернерс-Ли усовершенствовал, технические спецификации этих стандартов и опубликовал их. Но, всё же, официально годом рождения Всемирной паутины нужно считать 1989 год.

В рамках проекта Бернерс-Ли написал первый в мире веб-сервер «httpd» и первый в мире гипертекстовый веб-браузер, называвшийся «WorldWideWeb». Этот браузер был одновременно и WYSIWYG-редактором (сокр. от англ. What You See Is What You Get - что видишь, то и получишь), его разработка была начата в октябре 1990 года, а закончена в декабре того же года. Программа работала в среде «NeXTStep» и начала распространяться по Интернету летом 1991 года. (2)

Первый в мире веб-сайт

П
ервый в мире веб-сайт Бернерс-Ли создал по адресу http://info.cern.ch/, теперь сайт хранится в архиве. Этот сайт появился он-лайн в Интернете 6 августа 1991 года. На этом сайте описывалось, что такое Всемирная паутина, как установить веб-сервер, как использовать браузер и т. п. Этот сайт также являлся первым в мире интернет-каталогом , потому что позже Тим Бернерс-Ли разместил и поддерживал там список ссылок на другие сайты.


а первой фотографии во Всемирной паутине была изображена пародийная филк-группа Les Horribles Cernettes. Тим Бернес-Ли попросил их отсканированные снимки у лидера группы после CERN Hardronic Festival. (2)

Путешествие по всемирной паутине

Самое простое путешествие по

Всемирной паутине начинается с ввода какого-либо электронного адреса в строку

Location (местоположение) и после нажатия кнопки Enter система переносит вас в

виртуальный мир. Технологически при этом браузер устанавливает соединение с

уровней страниц – то есть одна основная, с нее – ссылки на несколько

промежуточных или страниц второго уровня, а с них – на страницы следующего

уровня. Линейная организация предполагает наличие страниц одного уровня,

несколько других страниц. И паутина представляет собой множество


Рис.8.1

Перспективы развития Всемирной паутины

В настоящее время наметились две тенденции в развитии Всемирной паутины : семантическая паутина и социальная паутина.


  • Семантическая паутина предполагает улучшение связности и релевантности информации во Всемирной паутине через введение новых форматов метаданных.

  • Социальная паутина полагается на работу по упорядочиванию имеющейся в Паутине информации, выполняемую самими пользователями Паутины. В рамках второго направления наработки, являющиеся частью семантической паутины, активно используются в качестве инструментов (RSS и другие форматы веб-каналов, OPML, микроформаты XHTML).Частично семантизированные участки Дерева категорий Википедии помогают пользователям осознано перемещаться в информационном пространстве, однако, очень мягкие требования к подкатегриям не дают основания надеется на расширение таких участков. В связи с этим интерес могут представлять попытки составления атласов Знания.
Существует также популярное понятие Web 2.0, обобщающее сразу несколько направлений развития Всемирной паутины. (2)


Рис.9.1

Способы активного отображения информации во Всемирной паутине

Информация в вебе может отображаться как пассивно (то есть пользователь может только считывать её), так и активно - тогда пользователь может добавлять информацию и редактировать её. К способам активного отображения информации во Всемирной паутине относятся:

  • гостевые книги,

  • форумы,

  • чаты,

  • блоги,

  • wiki-проекты,

  • социальные сети,

  • системы управления контентом. (2)


Рис.10.1

Заключение

За счет выгод от применения гипертекста World Wide Web создал неведомый ранее информационный простор и комфорт для пользователей. Ныне практически все крупные и средние, и большинство мелких компаний, университеты, правительственные учреждения, общественные объединения и просто граждане по всему свету имеют собственные web-страницы, на которых размещают информацию о своей деятельности , предоставляют с их помощью сотни услуг. Развитие WWW уже привело к появлению новой профессии web-мастера, в задачу которого входит создание web-страниц с использованием огромного количества графических, видео и аудио эффектов.


Таким образом, всемирная паутина или WWW-безусловно, самая яркая, удобная и популярная часть интернета. Сегодня через «странички» WWW мы можем читать электронную почту, получать доступ к файловым архивам, работать с группами новостей и получать множество новой информации. Для этого нам нужно ввести только нужный адрес сайта в строку поиска и нажать Enter.

Список используемой литературы


  1. Леонтьев В.П. Компьютерная энциклопедия школьника, ОЛМА-ПРЕСС Образование, 2005

  1. http://www.wikipedia.org

  1. http://www.cssblok.ru/istori/index2.html

с. 1

Рекомендуем почитать

Наверх