Основы компьютерных сетей

Поисковые службы


В попытках облегчить поиск в Web нужной информации разработаны сотни различных поисковых служб. Поисковая служба представляет собой Web-узел с интерактивной индексированной базой данных, в которой Web-узлы классифицированы, как правило, с помощью метадескрипторов. Метадескрипторы — это ключевые слова, добавленные Web-дизайнером. Согласно www.wwwmwtnc.com (на этом узле приводится статистическая информация по Web) к услугам поисковых служб прибегают 85%

пользователей, однако индексированы поисковыми службами лишь 20% общедоступных Web-узлов.

Первой солидной поисковой службой была Yahoo (www.yahoo.com), которая и сейчас пользуется большой популярностью. Ниже приведен список наиболее часто посещаемых поисковых служб.

•        Lycos (www. lycos. com).

•        DirectHit (www. directhit. com).

•        Excite (www. excite. com).

•        AltaVista (www.altavista.com).

•        Northern Light (www.northernlight.com).

•        Google (www. google. com).

Принцип действия большинства поисковых служб основан на анализе ключевых слов, или метадескрипторов, добавленных к HTML-страницам их разработчиками. Эти ключевые слова представляют собой технические или научные термины, по которым пользователь вручную искал бы материалы с нужной ему тематикой в реферативных журналах. Допустим, что пользователь хочет найти что-нибудь о разведении сиамских котов. В этом случае его заинтересуют страницы HTML с ключевыми словами “кот”, “сиамский”, “разведение” или “сиамский кот”.

В поисковых службах применяются приведенные ниже компоненты.

•        Паук (spider). Программа, “путешествующая” по различным Web-узлам и собирающая индексную информацию.

•        Индексная база данных. База данных, в которой хранится индексная информация, собранная пауком.

•        Механизм поиска и выдачи результатов. Программы интерфейса между пользователями и поисковой службой, с помощью которых пользователи задают свои вопросы и получают ответы.

Некоторые поисковые службы могут в поиске ключевых слов перебирать не только метадескрипторы HTML-страниц, но и весь текст страниц. Это значительно увеличивает количество найденных страниц, но среди них будет намного больше ненужных. Пусть, например, пользователь ищет рецепт торта и поисковая служба нашла ему все страницы HTML, в тексте которых встречается слово “торт”.

Комментарии закрыты