Мегаобучалка Главная | О нас | Обратная связь


Отличительные особенности



2020-03-17 218 Обсуждений (0)
Отличительные особенности 0.00 из 5.00 0 оценок




Очень удобной функцией является "cache" . Благодаря этой функцией пользователь может просмотреть проиндексированную страницу даже если эта страница удалена или сервер, на котором расположена страница недоступен. Вы также можете использовать эту функцию для исследования ваших конкурентов, это также помогает лучше понять принцип индексирования страницы поисковым пауком (роботом).

С помощью Google можно найти страницы, которые не содержаться в его базе данных. Это возможно потому что поисковый паук индексирует текст ссылок со страниц.

 

Поисковая система AltaVista

 

 

Одна из наиболее популярных поисковых систем Altavista Search появилась в декабре 1995 года. Первоначально она задумывалась как демонстрация мощи 64-разрядного сервера Alpha APX корпорации Digital Equipment, однако быстро приобрела самостоятельное значение как эффективное и мощное средство поиска. По последним данным, на сегодняшний день в индексе Altavista зарегистрировано до 100 миллионов URL. Система поражает своим быстродействием - в сутки она обслуживает более 20 миллионов запросов, при этом она отвечает на запросы незамедлительно, без всякого "притормаживания". Благодаря таким характеристикам система используется не только конечными пользователями, но и другими службами поиска, в частности, каталогом Yahoo. Система обновления индекса - краулер - посещает WWW сервера во всем мире, не испытывая проблем с языковым многообразием, поскольку Altavista поддерживает поиск на 25 языках. Странички, обновляемые редко, посещаются краулером реже чем популярные и часто обновляющиеся страницы. К сожалению, автоматически из индекса никогда не удаляются "мертвые" ссылки, поэтому по некоторым запросам количество недействующих ссылок может быть довольно велико (до 12 %). Дизайн у системы простой и удобный - в центре экрана находится окно с полем ввода запроса и кнопками "Search" и "Refine", немного ниже - ссылки на расширенный поиск, помощь, информацию о системе и страницу с настройками. Сервер не перегружен рекламой и графикой, поэтому все странички загружаются очень быстро. Даже начинающий пользователь мгновенно освоит технологию построения простого запроса к Altavist'e. К сожалению, на этом список преимуществ системы Altavista для неискушенного пользователя заканчивается. На простой запрос она выдает огромное количество результатов, многие из которых совершенно не имеют отношения к интересующей пользователя теме, а составление сложных (расширенных) запросов требует освоения специального языка, что для многих пользователей неприемлемо. Результаты поиска отсортированы с учетом частоты встречаемости ключевых слов в документе, учитывается также раздел, в котором встречается ключевое слово (заголовок, название страницы, и т. д.), однако не производится сортировка по тематике - Altavista попросту не поддерживает концепцию темы. Поэтому, например, в результатах поиска по слову Scala будут соседствовать странички, посвященные известной бухгалтерской программе и странички об одноименной мультимедийной системе. Несколько улучшает ситуацию с простым поиском имеющаяся в системе Altavista функция Refine (уточнить). На страничке с результатами поиска нужно нажать Refine, после чего появится список терминов, которые наиболее часто встречаются в одном контексте с ключевым словом. Возле каждого термина есть выпадающий список, в котором можно выбрать, относится ли это слово к теме поиска или нет. После такого уточнения, как правило, релевантность верхних ссылок в результатах поиска резко повышается. Из всего вышесказанного следует, что Altavista не является оптимальным средством для простого поиска. Хотя результат, безусловно, будет достигнут, затраты времени на его получение будут довольно велики. Сильные стороны этой системы проявляются, когда пользователю необходимо осуществить сложный поиск с указанием многих критериев отбора или поиск редких терминов (например, поиск слова Antropomorphic). В этом случае Altavista предоставляет наиболее мощные и изощренные средства поиска среди всех рассматриваемых систем, среди которых такие уникальные средства как поиск документов на конкретном языке, поиск по названию страницы, поиск среди гиперссылок (можно узнать, например, есть ли в WWW ссылки на вашу страницу и если есть, то где), поиск объектов Java/ActiveX, поиск в "якорях" и т.д. Кроме того, Altavista обеспечивает набор более стандартных, но очень ценных критериев отбора, таких как логические операции над ключевыми словами, поиск с учетом вариантов написания слов, поиск целых фраз, поиск документов только на определенных серверах (или доменах), ограничения по дате создания документа, и т.д. Многие из этих возможностей доступны даже с основной страницы

 

 

Поисковый каталог Yahoo

Удивительно, но эта невероятно популярная система, обслуживающая миллионы запросов ежедневно, зародилась как простая коллекция закладок, которую пополняли всего 2 человека - Дэвид Фило и Джерри Янг. На сегодняшний день Yahoo, это уже не просто каталог, это целая группа разнообразных сервисов, среди которых такие как каталог Yahooligans - Yahoo для детей, система персональных каналов My Yahoo, бесплатный E-mail сервис, система "Shop with Yahoo" (покупайте с Yahoo), совместный с MTV проект MTV unfURLed и многое другое. Среди всех рассмотренных систем, Yahoo - единственная чисто каталоговая, на Yahoo нет собственной поисковой машины. Зато список категорий на Yahoo является наиболее полным и простым - в отличие от других каталогов, на Yahoo всегда легко определить, в каком разделе находится нужная информация. Заглавная страничка Yahoo грузится очень быстро - хотя на ней очень много ссылок, но все они текстовые. Центральная часть страницы, конечно, занята окном поиска и списком категорий. Ссылки вверху страницы (графические) обеспечивают доступ к такой информации, как "что нового", "что хорошего", "More Yahoos". Последнюю ссылку рекомендуется посетить - она приводит на страницу с огормным количеством ссылок на разнообразные Yahoo-каталоги и сервисы. В нижней части основной страницы Yahoo расположено большое количество ссылок на наиболее популярные разделы Yahoo. При вводе ключевых слов с основной страницы Yahoo, запрос обрабатывается по методу "Intelligent default", то есть Yahoo ищет наиболее подходящие результаты в таких областях: в категориях Yahoo; в Web-сайтах, зарегистрированных на Yahoo; на Altavista (запрос передается при отсутствии результатов); в новостях. Такой интеллектуальный поиск занимает довольно много времени. При задании критериев поиска для Yahoo нужно помнить, что Yahoo ищет эти слова только в названии и описании страницы, поскольку полнотекстового индекса на Yahoo нет. Поэтому не следует указывать при поиске слишком много терминов или синонимов - количество результатов с Yahoo снизится или даже будет нулевым. При вводе ключевых слов со страницы каталога, нужно выбрать область поиска - весь каталог Yahoo или только его текущий раздел. Это делается с помощью радиокнопок под полем ввода. На странице с результатами поиска выводятся сначала удовлетворяющие критерию поиска категории, а потом сайты. Возле каждой категории в скобках стоит число - это количество сайтов в данной категории. В случае если на Yahoo нет результатов, сразу выводятся результаты с Altavista. Вверху и внизу страницы выводится маленькая табличка, с помощью которой можно одним нажатием кнопки мыши произвести поиск в категориях Yahoo, на Altavista, в новостях и событиях. Количество результатов поиска на Yahoo, естественно, невелико, зато большинство из них являются релевантными. Возможна проблема с отсутствующими страницами, поскольку вебмастера обычно забывают удалить свои сайты с поисковых систем, а на Yahoo нет механизма автоматического обновления. Для расширенного поиска Yahoo предлагает не очень большой, но очень полезный набор инструметов. Чтобы попасть на страничку расширенного поиска, надо перейти по ссылке "options" с основной страницы Yahoo. Среди средств расширенного поиска - ограничение результатов по дате, поиск в Yahoo, Usenet и среди E-mail адресов, использование логических операций над терминами и поиск конкретной фразы. Также присутствует возможность искать слова с произвольными окончаниями, указывать слова, которые должны или НЕ должны присутствовать в документе, и т.д. Чисто русские ресурсы в Yahoo не добавляются, потому что в Yahoo Inc. просто некому смотреть и оценивать их содержимое. Но те запросы, которые не дали результатов на Yahoo передаются на Altavista, а там есть хороший индекс русских ресурсов.

Или вот некоторые характеристики узла InfoSeek

 

 

В качестве его аппаратной базы используется восьмипроцессорный компьютер Sun Microsystems Ultra Enterprise 4000 с 2Гбайт оперативной памяти (данные на конец 1998 года). Для разработчиков это далеко не предел, и они планировали в ближайшем будущем довести оперативную память до 14Гбайт. Столь мощное аппаратное обеспечение уже позволяет обрабатывать до тысячи полнотекстовых запросов в секунду, поэтому UltraSeek относится к числу самых быстрых поисковых систем Internet (к сожалению, в России это не всегда заметно).

Дисковое пространство составляет порядка 400 Гбайт. Это сразу позволило кардинально расширить объем базы данных, доведя ее более чем до 50 млн страниц в полнотекстовом режиме. По этому показателю InfoSeek превосходит AltaVista (более 31 млн). Помимо объема базы данных, для поисковых систем последнего поколения ключевое значение имеют возможности формирования запроса.

 

Краткая характеристика языка запросов системы InfoSeek .

Поисковый синтаксис системы InfoSeek, т. е. набор команд (операторов) для указания отношений между вводимыми терминами, хотя и относительно прост, но в то же время достаточен для формирования очень точного запроса. Основные операции, как правило, те же, что и в других поисковых системах, но синтаксис имеет некоторые ососбенности. Знаком "+" помечается термин, присутствие которого в документе обязательно, а "-" ставится перед словом, появление которого должно быть исключено. Если возникает потребность отыскать несколько вариантов названия одного и того же предмета или близких терминов, при их перечислении следует употреблять запятые, которые в этом случае равносильны оператору ИЛИ. InfoSeek допускает также поиск терминов, которые должны стоять вплотную друг к другу. Для этого расположенные рядом слова соединяются дефисом в единую цепочку без пробелов: 21st-century-information-resources. Система, чувствительная к употреблению заглавных и строчных букв, способна самостоятельно вычленять имена собственные, будь то имена людей или названия организаций, если они написаны с заглавных букв. Усечение окончаний вводимых терминов не допускается, однако морфологический механизм К дополнительным возможностям составления поискового предписания относится способность ограничивать поисковое пространство названием страницы или ее адресом. Для этого в начале запроса вводится слово title: или url:, а затем без пробела следуют искомые термины, например title:computerweek.

"Интеллектуальный уровень" системы во многом определяется тем, насколько точно, взвешенно и комфортно для пользователя она выдает результаты поиска.
InfoSeek обладает в этом смысле достаточно развитым механизмом выдачи найденных ссылок. Их перечень дается в порядке релевантности запросу. При этом система искусственного интеллекта на основании количества и местонахождения искомых лексических единиц в документе определяет уровень соответствия в процентах.

InfoSeek предоставляет также ряд мелких услуг, которые являются побочными результатами деятельности поискового робота. Например, можно узнать, сколько ссылок в Web приходится на конкретную страницу, т. е. степень ее популярности, или же, наоборот, выяснить, сколько ссылок на внешние страницы имеется на данном Web-узле, а также получить данные о том, сколько Web-узлов содержат определенный термин в адресе или названии. Полезна возможность поиска в Internet логотипов и изображений на различную тематику. Для этого в режиме ImageSeek вводится обозначение предмета, и система выдает соответствующие картинки. Например на запрос "football" было получено 36 фотографий, на которых запечатлены моменты этой популярной игры. Все перечисленные функции реализуются через специальное меню, расположенное слева от основной строки запроса.

За счет всего этого интерфейс InfoSeek служит неплохой отправной точкой для любых действий, связанных с поиском информации, что заметно облегчает жизнь пользователям. Все перечисленные сервисные возможности, конечно же, добавляют ценности всему Web-узлу InfoSeek.

 

Раздел 3

Анализ ресурсов Интернета по вопросу:



2020-03-17 218 Обсуждений (0)
Отличительные особенности 0.00 из 5.00 0 оценок









Обсуждение в статье: Отличительные особенности

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние...
Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной...
Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (218)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.009 сек.)