Поиск информации в INTERNET. Технология поиска. Поисковые системы.
Одной из функций интернета - является поиск информации. Для этой цели существуют поисковые системы. Процесс поиска довольно прост: задавая ключевые слова, характерные для искомой информации, мы найдём нужный нам документ. Алгоритм поиска информации: Начальная страница поисковой системы (или любая страница, на которой находятся поля для ввода запроса и кнопка для начала поиска) Вводится запрос на поиск. Нажимается кнопка для начала поиска, и после некоторой паузы вы автоматически попадаете на страницу со списком документов, удовлетворяющих вашему запросу. Поочередно открывая ссылки на документы, находится нужная. (В большинстве систем список включает в себя кроме ссылок несколько строк каждого из найденных документов, чтобы было легче выбрать нужный).
Поисковая система — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете (сайт, на котором размещён интерфейс (фронт-энд) системы).
Если пользователь исследует новую проблему, осуществляет поиск информации среди ресурсов, которые до этого ещё не были им изучены и освоены, одним из наиболее эффективных методов является использование поисковых систем и каталогов. В этом случае может быть предложена следующая технология поиска: 1) определение общего направления запроса и его содержания (текст, изображения, товары в интернет-магазинах, новости и последние обновления) по ключевым словам; 2) определение географических рамок поиска (популярные поисковые машины Рунета Яндекс, всемирные Yahoo!, Google, в Европейском Союзе – Accoona). Для получения лучших результатов можно воспользоваться расширенными условиями поиска. Например задать язык, дату создания документа, страну, популярность посещения сайта. 3) На следующем этапе осуществляется отбор и установка последовательного использования поисковых машин в соответствии с убыванием ожидаемой эффективности поиска в каждой из машин. Качество выполнения постановки задания поисковой машине будет напрямую зависеть от опытности работы пользователя с ней. 4) Далее задается запрос к поисковой машине – это наиболее ответственный момент. Требуется максимально сузить область поиска информации. Следует отдавать предпочтение нескольким узким запросам, а не обширному предложению. Эффективно создать тезаурус по ключевым словам – требуется углубленное знания языка пользователя, а так же знание специфической терминологии исследуемой предметной области. 5) На заключительном этапе происходит выполнение запроса и его уточнение. Анализ полученных результатов позволяет корректировать запрос с целью сужения области поиска. Можно воспользоваться услугой Query-By-Example (найти подобные). Этой услугой оснащены не все поисковые системы. При просмотре результатов поиска пользователь выбирает документ или группу документов, наиболее близких по содержанию к тому, что Вы ищете, и даете команду «найти подобные документы». Все поисковые системы (службы, серверы) разделяются на поисковые машины (роботы, указатели) и поисковые каталоги Одни из самых известных поисковых систем можно классифицировать так: Основные функции поисковых систем: 1)сбор статистики (что бы определять число страниц на сервере, типы присутствующих на нем файлов, их соотношения, средний размер страницы и т. д); 2)обслуживание (сбор информации о неисправных ссылках и обновлениях, проверка ссылок сайтов, авторы которые самостоятельно подали регистрационную заявку, и др); 3)поиск новых ресурсов. Каталог ресурсов — классифицированный набор ссылок на сайты с кратким описанием содержания. Сайты в каталоге делятся по тематике, а внутри тем могут быть ранжированы по индексу цитирования, дате добавления, алфавиту, или по другому параметру. В зависимости от тематики ссылок каталоги могут быть общими и специализированными. Популярные поисковые системы: Bing, Google, Yahoo – всеязычные; Яндекс, Mail.ru, Рамблер – русскоязычные. Голосовой поиск В 2010 году компания Google запустила голосовой поиск в России. Чтобы осуществить поиск, необходимо нажать в телефоне кнопку рядом со строкой поиска и произнести свой запрос, телефон отправит ваш голос на сервер, и браузер выдаст строку с распознанным вашим запросом и результатами поиска по нему. Обзор современных web-технологий. Архитектура клиент-сервер. Основные понятия: WWW, URL, HTTP. Для улучшения визуального восприятия веба стала широко применяться технология CSS, которая позволяет задавать единые стили оформления для множества веб-страниц. Ещё одно нововведение, на которое стоит обратить внимание, — система обозначения ресурсов URN (англ. Uniform Resource Name). Популярная концепция развития Всемирной паутины — создание семантической паутины. Семантическая паутина — это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в сети информацию более понятной для компьютеров. Семантическая паутина — это концепция сети, в которой каждый ресурс на человеческом языке был бы снабжён описанием, понятным компьютеру. Семантическая паутина открывает доступ к чётко структурированной информации для любых приложений, независимо от платформы и независимо от языков программирования. Программы смогут сами находить нужные ресурсы, обрабатывать информацию, классифицировать данные, выявлять логические связи, делать выводы и даже принимать решения на основе этих выводов. При широком распространении и грамотном внедрении семантическая паутина может вызвать революцию в Интернете. Для создания понятного компьютеру описания ресурса, в семантической паутине используется формат RDF (англ. Resource Description Framework), который основан на синтаксисе XML и использует идентификаторы URI для обозначения ресурсов. Новинки в этой области — это RDFS (англ.)русск. (англ. RDF Schema) и SPARQL (англ. Protocol And RDF Query Language) (произносится как «спа́ркл»), новый язык запросов для быстрого доступа к данным RDF. Клиент-сервер (англ. Client-server) — вычислительная или сетевая архитектура, в которой задания или сетевая нагрузка распределены между поставщиками услуг (сервисов), называемыми серверами, и заказчиками услуг, называемыми клиентами. Нередко клиенты и серверы взаимодействуют через компьютерную сеть и могут быть как различными физическими устройствами, так и программным обеспечением. WWW -Всемирная паутина (англ. World Wide Web) — распределенная система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету. Всемирную паутину образуют миллионы web-серверов. Большинство ресурсов всемирной паутины представляет собой гипертекст. Гипертекстовые документы, размещаемые во всемирной паутине, называются web-страницами. Несколько web-страниц, объединенных общей темой, дизайном, а также связанных между собой ссылками и обычно находящихся на одном и том же web-сервере, называются web-сайтом. Для загрузки и просмотра web-страниц используются специальные программы — браузеры. Всемирная паутина вызвала настоящую революцию в информационных технологиях и бум в развитии Интернета. Часто, говоря об Интернете, имеют в виду именно Всемирную паутину, однако важно понимать, что это не одно и то же. Для обозначения Всемирной паутины также используют слово веб (англ. web) и аббревиатуру WWW. Единый указатель ресурсов (англ. URL — Uniform Resource Locator) — единообразный локатор (определитель местонахождения) ресурса. Ранее назывался Universal Resource Locator — универсальный локатор ресурса. URL — это стандартизированный способ записи адреса ресурса в сети Интернет HTTP (сокр. от англ. HyperText Transfer Prоtocоl — «протокол передачи гипертекста») — протокол прикладного уровня передачи данных (изначально — в виде гипертекстовых документов). Основой HTTP является Технология «клиент-сервер», то есть предполагается существование потребителей (клиентов), которые инициируют соединение и посылают запрос, и поставщиков (серверов), которые ожидают соединения для получения запроса, производят необходимые действия и возвращают обратно сообщение с результатом. HTTP в настоящее время повсеместно используется во Всемирной паутине для получения информации с веб-сайтов. В 2006 году в Северной Америке доля HTTP-трафика превысила долю P2P-сетей и составила 46 %, из которых почти половина — это передача потокового видео и звука[1]. Преимущества:
Недостатки:
Популярное: Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной... Организация как механизм и форма жизни коллектива: Организация не сможет достичь поставленных целей без соответствующей внутренней... Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (201)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |