Мегаобучалка Главная | О нас | Обратная связь


Средства поиска данных в Интернете



2016-01-26 1585 Обсуждений (0)
Средства поиска данных в Интернете 0.00 из 5.00 0 оценок




WWW – это система Web – страниц, связанных между собой гиперссылками. Однако эти связи не имеют регулярности, как, например, в иерархической структуре данных. В этом смысле можно говорить о том, что система Web – страниц не структурирована.

Единственной координатой Web – документа является его URL – адрес. Однако URL – адрес никак не связан с содержанием документа. Но поиск данных производится именно по содержанию.

В поиске информации в WWW пользователю помогает поисковая служба Интернета. Поисковая служба основана на услугах поисковых серверов. Существуют две разновидности поисковых серверов: поисковые каталоги и поисковые указатели.

Поисковые каталоги. Поисковые каталоги WWW организованы по принципу иерархии библиотечного каталога. Только в них систематизируется информация не о книгах, а о документах, хранящихся в World Wide Web. На главной странице поискового каталога располагается список основных тематических разделов (рубрик). Например: финансы и экономика, государство и право, наука и образование, компьютеры, политика и т.д. Каждое имя в этом списке является внутренней гиперссылкой, то есть ссылкой на внутренний документ сайта, поискового каталога. Щелчок мышью на гиперссылке вызывает на экран список заголовков следующего подраздела и т.д. Очевидно, что такая система подобна дереву файловой системы операционной системы. Перемещаясь по дереву внутренних гиперссылок каталога, пользователь в конечном итоге получает список внешних ссылок на искомые Web – документы.

Поисковые каталоги заполняются вручную специалистами, поддерживающими данную службу. При ручном способе отбора невозможно получить в каталоге исчерпывающую информацию о ресурсах Сети, и в этом состоит основной недостаток каталогов. Однако такой способ классификации исключает ссылки на случайные документы, не имеющие отношения к указанной теме.

Таким образом, поисковые каталоги при относительно небольшом охвате ресурсов Сети обеспечивают хорошее качество подборки документов.

Поисковые указатели. Другое название этого вида поисковой службы – поисковые машины. Принцип работы поисковых указателей заключается в создании и использовании индексных списков – аналогов книжных предметных указателей.

Задачи поисковых машин состоят в формировании индексных списков, так чтобы охватить ими как можно большее число документов «паутины», а также в ответах на запросы клиентов. Ясно, что таким способом проиндексировать вручную все документы WWW невозможно. Их число давно перевалило за миллиард. Поэтому поисковые машины строят индексные списки автоматически.

Основной составляющей поисковых машин являются программы просмотра Web – документов, которые называют по–разному: роботами, червяками, пауками и пр. Наверное, наиболее, подходящим является название «пауки», если уд сеть WWW называть «паутиной»! Непрерывно, днем и ночью, они сканируют все информационное пространство WWW, просматривая все документы, определяя в них ключевые слова и записывая в свою базу индексов данное слово с указателем на документ, в котором оно присутствует. Этот процесс не прерывается, поскольку содержание паутины все время меняется. Даже в уже просмотренные документы авторы могут внести изменения или вообще удалить их. Поисковая машина все время должна поддерживать информацию в актуальном состоянии.

Эффективность работы поисковой машины зависит от используемых алгоритмов формирования базы указателей. Эти алгоритмы являются интеллектуальной собственностью их авторов и обычно держатся в секрете. Число указателей к некоторым ключевым словам составляет многие тысячи. Чем лучше алгоритм, тем меньше в индексный список попадает «мусора» - случайных документов, не имеющих отношения к теме поиска.

В отборе наиболее важных документов пользователю помогает рейтинговый принцип, используемый некоторыми поисковыми указателями. На запрос пользователя по ключевому слову система выдает список ссылок на документы, расположенных по убыванию рейтинга. Рейтинг определяется по числу обращений к документу, которые были сделаны ранее. Самые популярные документы попадают в начало списка.

 

Заключение

Таким образом, глобальная компьютерная сеть Интернет позволяет осуществлять связь между пользователями, не объединенными каким-либо признаком – территориальным, корпоративным и т.п.

Главное назначение глобальных сетей - это предоставление информационных услуг своим клиентам: быстрое обеспечение необходимой информацией, оформление соглашений, обработка информации в интересах клиента (исполнение его программ на мощных компьютерах сети с помощью соответствующего программного обеспечения).

Глобальная компьютерная сеть – это система мощных компьютеров, соединенными специальными каналами связи: кабельными, радио и спутниковыми. Для обеспечения единообразного взаимодействия компьютеров в глобальной сети – их называют хост – компьютерами – используется протокол информационного обмена. Одним из таких протоколов является TCP/IP. Интернет – это объединение глобальных сетей, поддерживающих данный протокол.

Для получения в глобальной сети Интернет той или иной услуги надо указать вид сервиса, которым собирается воспользоваться пользователь, и доменное имя. Такое описание называется универсальным указателем ресурса.

Одним из наиболее используемых сервисов Интернета является Всемирная информационная паутина – World Wide Web (WWW). Под WWW понимают множество интернет – страниц, размещенных на интернет – узлах и связанных между собой гиперссылками.

Для навигации и просмотра страниц Всемирной паутины используются специальные программы – браузеры. Для розыска нужной информации в WWW применяют поисковые системы.

 

 

Список литературы

1. Большая Российская энциклопедия: В 30 т./ Председатель науч. – ред. совета Ю.С. Осипов. Отв. ред. С.Л. Кравец. Т 11. Изучение плазмы – Исламский фронт спасения. – М.: Большая Российская энциклопедия, 2008. – 767.: ил.: карт.

2. Вики Знание: гипертекстовая электронная энциклопедия: http://www.wikiznanie.ru

3. Википедия: свободная многоязычная энциклопедия: http://ru.wikipedia.org.

4. Информатика и ИКТ. Базовый уровень: учебник для 10 – 11 классов/И.Г. Семакин, Е.К. Хеннер. – 2-е изд. – М.: БИНОМ. Лаборатория знаний, 2008.

5. Информатика и информационные технологии: учеб. для 9 кл. общеобразоват. Учреждений/ А.Г. Гейн, А.И. Сенокосов. – М.: Просвещение, 2006. – 301 с.

6. Информатика и информационные технологии: Учебник для 10 11 классов/ Н.Д. Угринович. – 3-е изд. – М.: БИНОМ. Лаборатория знаний, 2006 – 511 с.: ил.

7. Информатика: Энциклопедический словарь для начинающих/ Сост. Д.А. Поспелов. – М.: Педагогика – Пресс, 1994. – 352 с.: ил.

8. Кенин А.М., Печенкина Н.С. IBM PC для пользователей или как научиться работать на компьютере. – Екатеринбург: АРД ЛТД, 1997

9. Семенов Ю.А. Сети Интернет. Архитектура и протоколы. – М., 1998

10. Шафрин Ю. Основы компьютерных технологий. – М.: АБФ, 1997

11. Энциклопедия для детей. Т.14. Техника/ Главный ред. М.Д. Аксенова. – М.: Аванта+, 1999. – 688 с.: ил.

 



2016-01-26 1585 Обсуждений (0)
Средства поиска данных в Интернете 0.00 из 5.00 0 оценок









Обсуждение в статье: Средства поиска данных в Интернете

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас...
Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы...
Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (1585)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.009 сек.)