Мегаобучалка Главная | О нас | Обратная связь


СОВРЕМЕННЫЕИНФОРМАЦИОННО-ПОИСКОВЫЕСИСТЕМЫ.



2018-07-06 329 Обсуждений (0)
СОВРЕМЕННЫЕИНФОРМАЦИОННО-ПОИСКОВЫЕСИСТЕМЫ. 0.00 из 5.00 0 оценок




НазареразвитиякомпьютерныхтехнологийиИнтернетавопроспоисканужнойинформациинасайтахнестоялтакостро,таккаксайтоввтовремяпоотношениюксегодняшнимднямбылосовсемнемного.Втегодыпоискосуществлялсяпотематическимкаталогамсайтов,иэтогобылодостаточно.Первымтакимкаталогомв1994годусталYahoo.Тогдаэтотресурсещенебылпоисковоймашиной,апредставлялсобойкаталогзарегистрированныхнанемсайтов.Такжестоитотметить,чтоИнтернетомпользовалисьвосновномсотрудникинаучныхорганизацийипреподавателиуниверситетов.ШирокаяаудиториявоВсемирнуюпаутинупоканепопала.

Прорывначалсявовторойполовине1990-хгодов.В1995годупоявилисьпервыеполноценныепоисковыесистемы–LucosиAltavista.В1997годупоявилисьGoogleиYandex–сегодняшниелидерысредипоисковыхсистемвРоссииивмире.

Далее–долгийпутьсовершенствованияалгоритмовпоиска,созданиесвоихбазданных.Витогеоказалось,чтоуспешноэтизадачимогутрешатьлишьединицы–насегодняшнийденьтолькотрипоисковыхсистемызарубежомобладаютсвоимиалгоритмамипоискаиинформационнымибазами-Google,Yahoo,MSNSearch.ВРоссииэто–ЯндексиSearch.Mail.ru.Поисковаясистемасостоитизследующихкомпонентов:

· WEB-сервер:компьютер,вкоторомнаходитсяпоисковаямашина;

· паук–программа,разработаннаядлясканированияиработающаясHTML-кодомстраницынапрямую,скачиваетеевбазуданныхпоисковоймашины;

· путешествующийпаук–программадляанализавнешнихссылокстраниц;

· индексатор–анализируетHTML-код,т.еиндексируетскачанныеWEB-страницы;

· базаданных–здесьхранятсязакаченныеWEB-страницы;

· поисковыйдвижок,которыйвыдаетрезультаты,–именноэтапрограммарешаетпорядоксоответствияWEB-страницзапросампользователей,т.еформируетвыдачу.

 

ФОРМУЛИРОВАНИЕЗАПРОСОВВИПС.

Благодарявнедрениюновыхязыковыхтехнологийпоисковыесистемысталигораздолучшепониматьпользователя.Поисковикимогутискатькакзапрашиваемоеслово,такиегословоформы.Этопозволяетделатьболееточнымирезультатыпоиска.Конечно,страницысословоформаминебудутвчислепервыхрезультатовпоиска,ноэлементыискусственногоинтеллектаналицо.Этотфактнеобходимоучитыватьприпостроениипоисковыхзапросов.

Следуетпомнитьотом,чтопоисковыесистемыприобработкезапросанеучитываютположениерегистрасимволов,знакипрепинания,таккакониигнорируютсяпоисковымисерверами.Однакоприпостроениирасширенныхзапросов,дающихболееточныерезультатыпоиска,традиционныезнакипрепинанияиспользуются.Большинствопоисковыхсистемможетборотьсясопечатками.

Основнаязадачапользователяприсоставлениипоисковогозапроса—выделитьключевыеслова,задачапоисковогосервера—наилучшимобразомобработатьвведенныйзапрос.Вотнесколькоправилсоставлениязапросов:

• выбиратьнеобходимотолькосамыеважныеключевыеслова,касающиесярассматриваемойтемы;

• количествословдолжнобытьоптимальным(неслишкоммного,ноинеслишкоммало);

• приотрицательныхрезультатахпоиска,необходимоиспользоватьболее«мягкие»условиядляпоследующегозапросаилииспользоватьальтернативнуюпоисковуюсистему(таккакмеханизмыработыпоисковиковотличаютсядруготдруга,тоирезультатытакжемогутразличаться);

• дляобеспеченияболееэффективногопоисканеобходимоиспользоватьвозможностирасширенногопоискасуказаниеммножестваразличныхпараметров,атакжепоискасиспользованиемязыказапросов.

 

DATAMINING

Развитиеметодовзаписиихраненияданныхпривелокбурномуростуобъемовсобираемойианализируемойинформации.Объемыданныхнастольковнушительны,чточеловекупростонепосилампроанализироватьихсамостоятельно,хотянеобходимостьпроведениятакогоанализавполнеочевидна,ведьвэтих"сырых"данныхзаключенызнания,которыемогутбытьиспользованыприпринятиирешений.Длятогочтобыпровестиавтоматическийанализданных,используетсяDataMining.

DataMining–этопроцессобнаруженияв"сырых"данныхранеенеизвестныхнетривиальныхпрактическиполезныхидоступныхинтерпретациизнаний,необходимыхдляпринятиярешенийвразличныхсферахчеловеческойдеятельности.DataMiningявляетсяоднимизшаговKnowledgeDiscoveryinDatabases.

Информация,найденнаявпроцессепримененияметодовDataMining,должнабытьнетривиальнойиранеенеизвестной,например,средниепродажинеявляютсятаковыми.Знаниядолжныописыватьновыесвязимеждусвойствами,предсказыватьзначенияоднихпризнаковнаосноведругихит.д.Найденныезнаниядолжныбытьприменимыинановыхданныхснекоторойстепеньюдостоверности.Полезностьзаключаетсявтом,чтоэтизнаниямогутприноситьопределеннуювыгодуприихприменении.Знаниядолжныбытьвпонятномдляпользователянематематикавиде.Например,прощевсеговоспринимаютсячеловекомлогическиеконструкции"если…то…".Болеетого,такиеправиламогутбытьиспользованывразличныхСУБДвкачествеSQL-запросов.Вслучае,когдаизвлеченныезнаниянепрозрачныдляпользователя,должнысуществоватьметодыпостобработки,позволяющиепривестиихкинтерпретируемомувиду.

Алгоритмы,используемыевDataMining,требуютбольшогоколичествавычислений.РаньшеэтоявлялосьсдерживающимфакторомширокогопрактическогопримененияDataMining,однакосегодняшнийростпроизводительностисовременныхпроцессоровснялостротуэтойпроблемы.Теперьзаприемлемоевремяможнопровестикачественныйанализсотентысячимиллионовзаписей.

 



2018-07-06 329 Обсуждений (0)
СОВРЕМЕННЫЕИНФОРМАЦИОННО-ПОИСКОВЫЕСИСТЕМЫ. 0.00 из 5.00 0 оценок









Обсуждение в статье: СОВРЕМЕННЫЕИНФОРМАЦИОННО-ПОИСКОВЫЕСИСТЕМЫ.

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ...
Как построить свою речь (словесное оформление): При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (329)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.005 сек.)