СОВРЕМЕННЫЕИНФОРМАЦИОННО-ПОИСКОВЫЕСИСТЕМЫ.
НазареразвитиякомпьютерныхтехнологийиИнтернетавопроспоисканужнойинформациинасайтахнестоялтакостро,таккаксайтоввтовремяпоотношениюксегодняшнимднямбылосовсемнемного.Втегодыпоискосуществлялсяпотематическимкаталогамсайтов,иэтогобылодостаточно.Первымтакимкаталогомв1994годусталYahoo.Тогдаэтотресурсещенебылпоисковоймашиной,апредставлялсобойкаталогзарегистрированныхнанемсайтов.Такжестоитотметить,чтоИнтернетомпользовалисьвосновномсотрудникинаучныхорганизацийипреподавателиуниверситетов.ШирокаяаудиториявоВсемирнуюпаутинупоканепопала. Прорывначалсявовторойполовине1990-хгодов.В1995годупоявилисьпервыеполноценныепоисковыесистемы–LucosиAltavista.В1997годупоявилисьGoogleиYandex–сегодняшниелидерысредипоисковыхсистемвРоссииивмире. Далее–долгийпутьсовершенствованияалгоритмовпоиска,созданиесвоихбазданных.Витогеоказалось,чтоуспешноэтизадачимогутрешатьлишьединицы–насегодняшнийденьтолькотрипоисковыхсистемызарубежомобладаютсвоимиалгоритмамипоискаиинформационнымибазами-Google,Yahoo,MSNSearch.ВРоссииэто–ЯндексиSearch.Mail.ru.Поисковаясистемасостоитизследующихкомпонентов: · WEB-сервер:компьютер,вкоторомнаходитсяпоисковаямашина; · паук–программа,разработаннаядлясканированияиработающаясHTML-кодомстраницынапрямую,скачиваетеевбазуданныхпоисковоймашины; · путешествующийпаук–программадляанализавнешнихссылокстраниц; · индексатор–анализируетHTML-код,т.еиндексируетскачанныеWEB-страницы; · базаданных–здесьхранятсязакаченныеWEB-страницы; · поисковыйдвижок,которыйвыдаетрезультаты,–именноэтапрограммарешаетпорядоксоответствияWEB-страницзапросампользователей,т.еформируетвыдачу.
ФОРМУЛИРОВАНИЕЗАПРОСОВВИПС. Благодарявнедрениюновыхязыковыхтехнологийпоисковыесистемысталигораздолучшепониматьпользователя.Поисковикимогутискатькакзапрашиваемоеслово,такиегословоформы.Этопозволяетделатьболееточнымирезультатыпоиска.Конечно,страницысословоформаминебудутвчислепервыхрезультатовпоиска,ноэлементыискусственногоинтеллектаналицо.Этотфактнеобходимоучитыватьприпостроениипоисковыхзапросов. Следуетпомнитьотом,чтопоисковыесистемыприобработкезапросанеучитываютположениерегистрасимволов,знакипрепинания,таккакониигнорируютсяпоисковымисерверами.Однакоприпостроениирасширенныхзапросов,дающихболееточныерезультатыпоиска,традиционныезнакипрепинанияиспользуются.Большинствопоисковыхсистемможетборотьсясопечатками. Основнаязадачапользователяприсоставлениипоисковогозапроса—выделитьключевыеслова,задачапоисковогосервера—наилучшимобразомобработатьвведенныйзапрос.Вотнесколькоправилсоставлениязапросов: • выбиратьнеобходимотолькосамыеважныеключевыеслова,касающиесярассматриваемойтемы; • количествословдолжнобытьоптимальным(неслишкоммного,ноинеслишкоммало); • приотрицательныхрезультатахпоиска,необходимоиспользоватьболее«мягкие»условиядляпоследующегозапросаилииспользоватьальтернативнуюпоисковуюсистему(таккакмеханизмыработыпоисковиковотличаютсядруготдруга,тоирезультатытакжемогутразличаться); • дляобеспеченияболееэффективногопоисканеобходимоиспользоватьвозможностирасширенногопоискасуказаниеммножестваразличныхпараметров,атакжепоискасиспользованиемязыказапросов.
DATAMINING Развитиеметодовзаписиихраненияданныхпривелокбурномуростуобъемовсобираемойианализируемойинформации.Объемыданныхнастольковнушительны,чточеловекупростонепосилампроанализироватьихсамостоятельно,хотянеобходимостьпроведениятакогоанализавполнеочевидна,ведьвэтих"сырых"данныхзаключенызнания,которыемогутбытьиспользованыприпринятиирешений.Длятогочтобыпровестиавтоматическийанализданных,используетсяDataMining. DataMining–этопроцессобнаруженияв"сырых"данныхранеенеизвестныхнетривиальныхпрактическиполезныхидоступныхинтерпретациизнаний,необходимыхдляпринятиярешенийвразличныхсферахчеловеческойдеятельности.DataMiningявляетсяоднимизшаговKnowledgeDiscoveryinDatabases. Информация,найденнаявпроцессепримененияметодовDataMining,должнабытьнетривиальнойиранеенеизвестной,например,средниепродажинеявляютсятаковыми.Знаниядолжныописыватьновыесвязимеждусвойствами,предсказыватьзначенияоднихпризнаковнаосноведругихит.д.Найденныезнаниядолжныбытьприменимыинановыхданныхснекоторойстепеньюдостоверности.Полезностьзаключаетсявтом,чтоэтизнаниямогутприноситьопределеннуювыгодуприихприменении.Знаниядолжныбытьвпонятномдляпользователянематематикавиде.Например,прощевсеговоспринимаютсячеловекомлогическиеконструкции"если…то…".Болеетого,такиеправиламогутбытьиспользованывразличныхСУБДвкачествеSQL-запросов.Вслучае,когдаизвлеченныезнаниянепрозрачныдляпользователя,должнысуществоватьметодыпостобработки,позволяющиепривестиихкинтерпретируемомувиду. Алгоритмы,используемыевDataMining,требуютбольшогоколичествавычислений.РаньшеэтоявлялосьсдерживающимфакторомширокогопрактическогопримененияDataMining,однакосегодняшнийростпроизводительностисовременныхпроцессоровснялостротуэтойпроблемы.Теперьзаприемлемоевремяможнопровестикачественныйанализсотентысячимиллионовзаписей.
Популярное: Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ... Как построить свою речь (словесное оформление):
При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (329)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |