Мегаобучалка Главная | О нас | Обратная связь


Поиск информации в Интернете



2019-07-03 179 Обсуждений (0)
Поиск информации в Интернете 0.00 из 5.00 0 оценок




 

Интернет является глобальным хранилищем информации, там можно найти все что угодно, нужно только знать, как и где искать, а также разумно относиться к найденной информации. С появлением Интернета и Всемирной паутины человек читающий стал человеком публикующим. Достаточно разместить рукопись на одном из web-серверов… В связи с этим рукописи публикуются, но редко читаются и почти никогда не рецензируются. В Сети можно найти совершенно безграмотные публикации с орфографическими ошибками на каждой странице, изобилующие достаточно странными идеями и ненормативной лексикой. Одним из ярких явлений последних лет являются так называемые блоги или живые журналы — дневники, публикуемые в сети. Иногда они яркие и интересные, иногда от них волосы дыбом встают. Познакомиться с живыми журналами можно, например на http://www.livejournal.com. По одному образному выражению Интернет — это большая помойка, к найденной в Интернете информации необходимо относиться осторожно. В Интернете имеется достаточно большое число поисковых серверов, которые собирают и каталогизируют информацию из Всемирной паутины и других источников (архивов групп новостей, FTP- серверов и т.п.). Для поиска русскоязычной информации в настоящее время наиболее популярными являются поисковые серверы:

• http://gg.ru,

• http://www.yandex.ru,

• http://www.rambler.ru.

Не следует ограничиваться поиском информации на одном сервере, так как они используют различные алгоритмы поиска, поэтому и результаты будут разными. То, что не может быть найдено с помощью одного сервера, легко отыщется с помощью другого. Для поиска русскоязычной информации лучше пользоваться российскими серверами. В Интернете все быстро меняется, создаются новые поисковые серверы, закрываются старые. Технически поиск информации с помощью поискового сервера прост: наберите в адресной строке унифицированный указатель сервера, появится форма поиска, введите в ней ключевые слова. В данном случае нас интересовали программные компоненты для технологии Microsoft ASP.Net, поэтому в форме было введено компоненты asp.net. Дальше нужно нажать кнопку Поиск в Google, обеспечивающую передачу ключевых слов серверу. Сервер вернет ссылки на страницы, содержащие ключевые слова компоненты и asp.net,. В этом случае Google вернул первые десять ссылок из 2330, имеющихся в базе данных. Это, пожалуй, слишком много, поэтому ограничимся просмотром первых десяти ссылок. Google упорядочил их для нас так, чтобы наиболее полезные ссылки шли первыми (возможно, что у нас и у Google определения полезности несколько разные). Отметим, что ссылки сопровождаются краткими аннотациями, которые в большинстве случаев помогает принять решение о том, просматривать ли страницу или ограничиться чтением комментария. Для перехода к найденной странице достаточно щелкнуть на заголовке, например для первой ссылки достаточно щелкнуть мышью на подчеркнутом тексте ActiveX компоненты, утилиты, скрипты. Можно уменьшить число ссылок, возвращаемых сервером, уточнив, что же нам нужно. В данном примере кроме информации о компонентах ASP.Net было бы желательно получить их, поэтому уточним запрос, введя загрузить компоненты asp.net. Может оказаться, что сервер не возвратит нам ничего, в этом случае необходимо, исправить возможные орфографические ошибки в запросе, переформулировать его, используя другие ключевые слова, изменить язык запроса, сформулировав его по-английски, так как английский является основным языком Интернета. То о чем сообщалось выше, называется простыми запросами. Для работы с расширенными запросами необходимо щелкнуть на ссылке Расширенный поиск. Для выполнения сложных запросов поисковые серверы обладают собственными языками запросов. Если результаты поисков не удовлетворяют, не поленитесь прочитать на сервере инструкцию по использованию языка запросов. Наряду с поиском по ключевым словам большинство поисковых серверов предоставляют возможность поиска с помощью каталогов — иерархических указателей. Выбрав интересующую тему, например Образование, щелкните мышью, и так постепенно уточняя запрос, можно добраться до ссылок на интересующую информацию. Откуда поисковые серверы берут информацию? Используются два основных источника информации. Во-первых, осуществляется сканирование Всемирной паутины с помощью специальных программ-пауков, «ползающих» по Всемирной паутине (паутинками служат гиперссылки). Паук загружает очередную web-страницу, анализирует гиперссылки, имеющиеся в ней, и загружает данные, опубликованные по этим гиперссылкам, после чего процесс повторяется. Таким образом, осуществляется обход Всемирной паутины. Полученная информация разбивается на слова, «сорные» слова (артикли, предлоги, местоимения) отбрасываются, строится нечто, похожее на предметный указатель книги: слова размещаются по алфавиту, с ними связываются ссылки на страницы. Это обеспечивает быстрый поиск информации с помощью поисковых серверов. Следует отметить, что русский язык из-за своей флективной (изменяющейся) структуры (много окончаний, приставок) достаточно сложен для анализа. Поэтому отечественными разработчиками (например, http://www.yandex.ru) создано специальное программное обеспечение для морфологического анализа русских текстов. Это или подобное программное обеспечение применяется практически всеми поисковыми серверами, работающими в русском сегменте Интернета. Вторым источником информации являются сами публикаторы, заинтересованные в том, чтобы их web-сайты посещались. Для этого автор или публикатор должен зайти на поисковый сервер, заполнить специальную форму, после чего поисковый сервер поместит информацию о публикации в свою базу данных после соответствующей проверки, естественно. Авторы заинтересованы не только в регистрации на поисковых серверах, но и в том, чтобы ссылки на информацию имели высокий ранг, т.е. отображались пользователю первыми (более 90 % пользователей, обращающихся к поисковым серверам, просматривают только первые три ссылки). Поисковые серверы ранжируют информацию либо по числу гиперссылок на страницу, либо по числу обращений к страницам (здесь ситуация упрощена, так как поисковые серверы используют более сложные алгоритмы, которые держатся в секрете, чтобы избежать искусственного завышения ранга недобросовестными публикаторами). Поисковые серверы определяют число посещений web-страниц с помощью специальных счетчиков посещений, размещаемых публикаторами на своих страницах. Польза здесь обоюдная: автор видит, насколько популярна данная страница, а поисковые серверы используют данную информацию для ранжирования. Выше был рассмотрен поиск в Интернете с непосредственным использованием поисковых серверов. В настоящее время популярность приобретает программное обеспечение, устанавливаемое на компьютере пользователя и облегчающее поиск информации, по крайней мере, в двух направлениях: введенный запрос на поиск передается не одному, а нескольким поисковым серверам, программа также облегчает хранение, анализ и классификацию полученных данных. В качестве примеров таких программ можно привести Copernic Agent (http://www.copernic.com/) или отечественный ДИСКО Искатель (http://disco.ru/russian/products/finder.htm). Кроме поисковых серверов общего назначения в Интернет имеются специализированные поисковые серверы, например для поиска рефератов (http://www.referat.ru), товаров и сравнения цен (http://www.price.ru). Для поиска научной информации, включая статьи, книги, публикации в Интернете можно использовать сервис http://www.scirus.com (рис. 7.6). Отметим также, что поиск в Интернете требует терпения и навыков, приобретаемых при проведении поиска.

 



2019-07-03 179 Обсуждений (0)
Поиск информации в Интернете 0.00 из 5.00 0 оценок









Обсуждение в статье: Поиск информации в Интернете

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация...
Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы...
Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние...
Как построить свою речь (словесное оформление): При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (179)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.01 сек.)