Мегаобучалка Главная | О нас | Обратная связь


Поиск информации в INTERNET. Технология поиска. Поисковые системы.



2019-11-20 197 Обсуждений (0)
Поиск информации в INTERNET. Технология поиска. Поисковые системы. 0.00 из 5.00 0 оценок




Одной из функций интернета - является поиск информации. Для этой цели существуют поисковые системы. Процесс поиска довольно прост: задавая ключевые слова, характерные для искомой информации, мы найдём нужный нам документ.

Алгоритм поиска информации:

Начальная страница поисковой системы (или любая страница, на которой находятся поля для ввода запроса и кнопка для начала поиска)

Вводится запрос на поиск.

Нажимается кнопка для начала поиска, и после некоторой паузы вы автоматически попадаете на страницу со списком документов, удовлетворяющих вашему запросу.

Поочередно открывая ссылки на документы, находится нужная. (В большинстве систем список включает в себя кроме ссылок несколько строк каждого из найденных документов, чтобы было легче выбрать нужный).

 

Поисковая система — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете (сайт, на котором размещён интерфейс (фронт-энд) системы).

 

Если пользователь исследует новую проблему, осуществляет поиск информации среди ресурсов, которые до этого ещё не были им изучены и освоены, одним из наиболее эффективных методов является использование поисковых систем и каталогов. В этом случае может быть предложена следующая технология поиска:

1) определение общего направления запроса и его содержания (текст, изображения, товары в интернет-магазинах, новости и последние обновления) по ключевым словам;

2) определение географических рамок поиска (популярные поисковые машины Рунета Яндекс, всемирные Yahoo!, Google, в Европейском Союзе – Accoona). Для получения лучших результатов можно воспользоваться расширенными условиями поиска. Например задать язык, дату создания документа, страну, популярность посещения сайта.

3) На следующем этапе осуществляется отбор и установка последовательного использования поисковых машин в соответствии с убыванием ожидаемой эффективности поиска в каждой из машин. Качество выполнения постановки задания поисковой машине будет напрямую зависеть от опытности работы пользователя с ней.

4) Далее задается запрос к поисковой машине – это наиболее ответственный момент. Требуется максимально сузить область поиска информации. Следует отдавать предпочтение нескольким узким запросам, а не обширному предложению. Эффективно создать тезаурус по ключевым словам – требуется углубленное знания языка пользователя, а так же знание специфической терминологии исследуемой предметной области.

5) На заключительном этапе происходит выполнение запроса и его уточнение. Анализ полученных результатов позволяет корректировать запрос с целью сужения области поиска.

Можно воспользоваться услугой Query-By-Example (найти подобные). Этой услугой оснащены не все поисковые системы. При просмотре результатов поиска пользователь выбирает документ или группу документов, наиболее близких по содержанию к тому, что Вы ищете, и даете команду «найти подобные документы».

Все поисковые системы (службы, серверы) разделяются на поисковые машины (роботы, указатели) и поисковые каталоги

Одни из самых известных поисковых систем можно классифицировать так:

Основные функции поисковых систем:

1)сбор статистики (что бы определять число страниц на сервере, типы присутствующих на нем файлов, их соотношения, средний размер страницы и т. д);

2)обслуживание (сбор информации о неисправных ссылках и обновлениях, проверка ссылок сайтов, авторы которые самостоятельно подали регистрационную заявку, и др);

3)поиск новых ресурсов.

Каталог ресурсов — классифицированный набор ссылок на сайты с кратким описанием содержания. Сайты в каталоге делятся по тематике, а внутри тем могут быть ранжированы по индексу цитирования, дате добавления, алфавиту, или по другому параметру. В зависимости от тематики ссылок каталоги могут быть общими и специализированными.

Популярные поисковые системы: Bing, Google, Yahoo – всеязычные; Яндекс, Mail.ru, Рамблер – русскоязычные.

Голосовой поиск

В 2010 году компания Google запустила голосовой поиск в России. Чтобы осуществить поиск, необходимо нажать в телефоне кнопку рядом со строкой поиска и произнести свой запрос, телефон отправит ваш голос на сервер, и браузер выдаст строку с распознанным вашим запросом и результатами поиска по нему.

Обзор современных web-технологий. Архитектура клиент-сервер. Основные понятия: WWW, URL, HTTP.

Для улучшения визуального восприятия веба стала широко применяться технология CSS, которая позволяет задавать единые стили оформления для множества веб-страниц. Ещё одно нововведение, на которое стоит обратить внимание, — система обозначения ресурсов URN (англ. Uniform Resource Name).

Популярная концепция развития Всемирной паутины — создание семантической паутины. Семантическая паутина — это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в сети информацию более понятной для компьютеров. Семантическая паутина — это концепция сети, в которой каждый ресурс на человеческом языке был бы снабжён описанием, понятным компьютеру. Семантическая паутина открывает доступ к чётко структурированной информации для любых приложений, независимо от платформы и независимо от языков программирования. Программы смогут сами находить нужные ресурсы, обрабатывать информацию, классифицировать данные, выявлять логические связи, делать выводы и даже принимать решения на основе этих выводов. При широком распространении и грамотном внедрении семантическая паутина может вызвать революцию в Интернете. Для создания понятного компьютеру описания ресурса, в семантической паутине используется формат RDF (англ. Resource Description Framework), который основан на синтаксисе XML и использует идентификаторы URI для обозначения ресурсов. Новинки в этой области — это RDFS (англ.)русск. (англ. RDF Schema) и SPARQL (англ. Protocol And RDF Query Language) (произносится как «спа́ркл»), новый язык запросов для быстрого доступа к данным RDF.

Клиент-сервер (англ. Client-server) — вычислительная или сетевая архитектура, в которой задания или сетевая нагрузка распределены между поставщиками услуг (сервисов), называемыми серверами, и заказчиками услуг, называемыми клиентами. Нередко клиенты и серверы взаимодействуют через компьютерную сеть и могут быть как различными физическими устройствами, так и программным обеспечением.

WWW -Всемирная паутина (англ. World Wide Web) — распределенная система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету. Всемирную паутину образуют миллионы web-серверов. Большинство ресурсов всемирной паутины представляет собой гипертекст. Гипертекстовые документы, размещаемые во всемирной паутине, называются web-страницами. Несколько web-страниц, объединенных общей темой, дизайном, а также связанных между собой ссылками и обычно находящихся на одном и том же web-сервере, называются web-сайтом. Для загрузки и просмотра web-страниц используются специальные программы — браузеры. Всемирная паутина вызвала настоящую революцию в информационных технологиях и бум в развитии Интернета. Часто, говоря об Интернете, имеют в виду именно Всемирную паутину, однако важно понимать, что это не одно и то же. Для обозначения Всемирной паутины также используют слово веб (англ. web) и аббревиатуру WWW.

Единый указатель ресурсов (англ. URL — Uniform Resource Locator) — единообразный локатор (определитель местонахождения) ресурса. Ранее назывался Universal Resource Locator — универсальный локатор ресурса. URL — это стандартизированный способ записи адреса ресурса в сети Интернет

HTTP (сокр. от англ. HyperText Transfer Prоtocоl — «протокол передачи гипертекста») — протокол прикладного уровня передачи данных (изначально — в виде гипертекстовых документов). Основой HTTP является Технология «клиент-сервер», то есть предполагается существование потребителей (клиентов), которые инициируют соединение и посылают запрос, и поставщиков (серверов), которые ожидают соединения для получения запроса, производят необходимые действия и возвращают обратно сообщение с результатом. HTTP в настоящее время повсеместно используется во Всемирной паутине для получения информации с веб-сайтов. В 2006 году в Северной Америке доля HTTP-трафика превысила долю P2P-сетей и составила 46 %, из которых почти половина — это передача потокового видео и звука[1].

Преимущества:

  1. Делает возможным, в большинстве случаев, распределение функции вычислительной системы между несколькими независимыми компьютерами в сети. Это позволяет упростить обслуживание вычислительной системы. В частности, замена, ремонт, модернизация или перемещение сервера не затрагивают клиентов.
  2. Все данные хранятся на сервере, который, как правило, защищён гораздо лучше большинства клиентов. На сервере проще обеспечить контроль полномочий, чтобы разрешать доступ к данным только клиентам с соответствующими правами доступа.
  3. Позволяет объединить различные клиенты. Использовать ресурсы одного сервера часто могут клиенты с разными аппаратными платформами, операционными системами и т. п.

Недостатки:

  1. Неработоспособность сервера может сделать неработоспособной всю вычислительную сеть.
  2. Поддержка работы данной системы требует отдельного специалиста - системного администратора.
  3. Высокая стоимость оборудования.

 



2019-11-20 197 Обсуждений (0)
Поиск информации в INTERNET. Технология поиска. Поисковые системы. 0.00 из 5.00 0 оценок









Обсуждение в статье: Поиск информации в INTERNET. Технология поиска. Поисковые системы.

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ...
Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (197)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.007 сек.)