АВТОМАТИЗИРОВАННЫЕИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ
Автоматизированнаяпоисковаясистема–система,состоящаяизперсоналаикомплексасредствавтоматизацииегодеятельности,реализующаяинформационнуютехнологиювыполненияустановленныхфункций Особенностиавтоматизированныхпоисковыхсистем Вработепоисковыйпроцесспредставленчетырьмястадиями: 1.формулировка(происходитдоначалапоиска); 2.действие(начинающийсяпоиск); 3.обзоррезультатов(результат,которыйпользовательвидитпослепоиска); 4.усовершенствование(послеобзорарезультатовипередвозвращениемкпоискусинойформулировкойтойжепотребности). Болееудобнаянелинейнаясхемапоискаинформациисостоитизследующихэтапов: Фиксацияинформационнойпотребностинаестественномязыке; Выборпоисковыхсервисовсетииформализациязаписиинформационнойпотребностинаконкретныхинформационно-поисковыхязыках(ИПЯ); Выполнениесозданныхзапросов; Предварительнаяобработкаполученныхсписковссылокнадокументы; Обращениеповыбраннымадресамзаискомымидокументами; Предварительныйпросмотрсодержимогонайденныхдокументов; 7.Сохранениерелевантныхдокументовдляпоследующегоизучения; 8.Извлечениеизрелевантныхдокументовссылокдлярасширениязапроса; 9.Изучениевсегомассивасохраненныхдокументов; 10.Еслиинформационнаяпотребностьнеполностьюудовлетворена,товозвраткпервомуэтапу. Работапоисковогоуказателяпроисходитвтриэтапа,изкоторыхдвапервыхявляютсяподготовительнымиинезаметныдляпользователя.СначалапоисковыйуказательсобираетинформациюизWorldWideWeb.Дляэтогоиспользуютспециальныепрограммы,аналогичныебраузеры.ОниспособныскопироватьзаданнуюWeb-страницунасерверпоисковогоуказателя,просмотретьее,найтивсегиперссылки,которыенанейимеюттересурсы,которыенайденытам,сноваразыскатьимеющиесявнихгиперссылкиит.д.Подобныепрограммыназываютчервяками,пауками,гусеницами,краулерами,спайдерамиидругимиподобнымиименами.Каждыйпоисковыйуказательэксплуатируетдляэтойцелисвоюуникальнуюпрограмму,которуюнередкосамиразрабатывает.Многиесовременныепоисковыесистемыродилисьизэкспериментальныхпроектов,связанныхсразработкойивнедрениемавтоматическихпрограмм,занимающихсямониторингомСети.Теоретически,приудачномвходеспайдерспособенпрочесатьвсеWeb-пространствозаоднопогружение,нонаэтонадооченьмноговремени,аемуещенеобходимопериодическивозвращатьсякранеепосещеннымресурсам,чтобыконтролироватьпроисходящиетамизмененияивыявлять«мертвые»ссылки,т.е.потерявшиеактуальность. ПослекопированияразысканныхWeb-ресурсовнасерверпоисковойсистемыначинаетсявторойэтапработы—индексация.Входеиндексациисоздаютсяспециальныебазыданных,спомощьюкоторыхможноустановить,гдеикогдавИнтернетевстречалось,тоилииноеслово.Считайте,чтоиндексированнаябазаданных—этосвоегородасловарь.Онанеобходимадлятого,чтобыпоисковаясистемамоглаоченьбыстроотвечатьназапросыпользователей.Современныесистемыспособнывыдаватьответызадолисекунды,ноеслинеподготовитьиндексызаранее,тообработкаодногозапросабудетпродолжатьсячасами. Натретьемэтапепроисходитобработказапросаклиентаивыдачаемурезультатовпоискаввидеспискагиперссылок.Допустим,клиентхочетузнать,гдевИнтернетеимеютсяWeb-страницы,накоторыхупоминаетсяизвестныйголландскиймеханик,оптикиматематикХристианГюйгенс.ОнвводитсловоГюйгенсвполенабораключевыхсловинажимаеткнопку.Найти(Search).ПосвоимбазамуказателейпоисковаясистемавдолисекундыразыскиваетподходящиеWeb-ресурсыиформируетстраницурезультатовпоиска,накоторойрекомендациипредставленыввидегиперссылок.Далееклиентможетпользоватьсяэтимиссылкамидляпереходакинтересующимегоресурсам.
ИНФОРМАЦИОННО-ПОИСКОВЫЕЯЗЫКИ СтруктураИПЯ. Впоследниегодысоздаетсямножестворазнообразныхискусственныхязыков,ориентированныхнарешениеопределенныхзадач.Этоинформационно-поисковыеязыки,языкиописанияданных,языкиманипулированияданными,языкиуправлениязаданиями,моделирования,автоматизациипроектированияит.д.Средивсехклассовискусственныхязыковостановимсяподробнеенаинформационно-поисковыхязыках(ИПЯ).Основнымиэлементами,составляющимиИПЯ,являются:алфавит,словарныйсоставиграмматика. АлфавитИПЯ–системазнаков,используемыхвязыкедлязаписиотдельныхсловивыражений.Этомогутбытьбуквыестественногоязыка,знакипрепинания,иныесимволы,втомчислецифры. СловарныйсоставилилексикаИПЯ–совокупностьслов,словосочетанийивыражений,используемыхдляпостроениятекстовИПЯ.ВкачествелексическихединицИПЯиспользуются: · слова,фрагментыслов,словосочетанияивыражениялюбогоестественногоязыка; · кодыишифры(цифровые,буквенные,буквенно-цифровые)словосочетаний,словивыражений,выступающиевролиименсоответствующихклассов; · шифрыикодывсочетаниисословами,словосочетаниямиивыражениями. СуществуютразныеспособыформированиясловарногосоставаИПЯ: 1. ПеречислениевсехлексическихединицИПЯ; 2. Перечислениечастилексическихединицизаданиеправилформированияизнихдругихлексическихединиц; 3. Заданиеправилпостроениялексическихединиц,словивыраженийестественногоязыка. Первыйспособзаданиялексикинеподдаетсяавтоматизацииинетребуетбольшихинтеллектуальныхусилий.ЛексикаИПЯвбольшинствеслучаевнепозволяетдостаточноточновыразитьсмысловоесодержаниетекстовиоказываетсяжесткофиксированной. Второйспособможетбытьполностьюавтоматизирован,нотребуетбольшихинтеллектуальныхзатратнаопределениеправилформированиялексики.Однаконаучныйподходкформированиюсловарногосоставаделаетегоболеесовершенным,обеспечиваетединообразиеиуменьшаетсубъективизмприпостроениилексики. Третийспособзанимаетпромежуточноеположениеивотношенииинтеллектуальныхусилий,ивотношенииавтоматизациипроцессов. ГрамматикаИПЯ–совокупностьсредствиспособовпостроения,измененияисочетаниялексическихединиц.Грамматикавключаетморфологиюисинтаксис.Морфология–совокупностьсредствиспособовпостроенияиизмененияслов.Синтаксис–совокупностьсредствиспособовсоединениясловввыраженияифразы.
ТРЕБОВАНИЯКИПЯ
1. ИПЯдолженрасполагатьнаборомлексико-грамматическихмеханизмовдляоднозначноготолкованияосновногосодержаниядокумента. 2. ИПЯдолженбытьнедвусмысленным.ЛюбоевыражениеИПЯдолжновосприниматьсяоднозначно,чтоотличаетегоотестественногоязыка,длякоторогохарактернамногозначность. 3. ИПЯдолженбытьудобнымдляалгоритмизации. ДескрипторныеИПЯстроятсянаосновепринципакоординатногоиндексирования,предполагающеговыражениеосновногосмысловогосодержаниядокументаспискомключевыхслов. ДескрипторныеИПЯсостоятизследующихэлементов: 1. Лексическиеединицы(ЛЕ),обеспечивающиевыделениеопределенныхчастейтекстаспоследующейзаменойихкодамилексическихединиц; 2. Грамматика–правилапримененияИПЯ,которыезадаютпроцедурупереводанаИПЯтекстовнаестественномязыкевдокументахизапросах; 3. Словарииправилаихприменения–правила,определяющиепроцедуруизмененияисовершенствованияИПЯ. РазличаютдвегруппысловарейЛЕ:а)основныелексическиесловари,формирующиеосновнуюлексикуИПЯ;б)морфологическиесловари,позволяющиеосуществлятьморфологическийанализипроводитьнормализациюслов. ОсновуЛЕосновныхсловарейсоставляютключевыеслова,устойчивыесловосочетанияидескрипторы.Соответственнословари,содержащиеэтиэлементы,называются:"Словарьключевыхслов","Словарьсловосочетаний"и"Словарьдескрипторов". Ключевымсловом(КС)называютполнозначноесловоестественногоязыка,выражающеесмысловоесодержаниефрагментадокументаилизапросасамостоятельно,иливнаборесдругимиКС. Словосочетание–последовательностьнесколькихслов(обычно2–5)естественногоязыка,выражающаяосновноесмысловоесодержаниефрагментадокументаилизапроса.Частословосочетаниеиспользуетсякакключевоеслово.Какправило,словарьКСвключаеткакотдельныеслова,такисловосочетания.Однакопосравнениюсколичествомотдельныхсловвсловареколичествословосочетаниймало. Дескриптор–группатождественныхилиблизкихпосмыслуКС,используемыхкакимяклассасинонимов.Дескрипторамимогутбытькод,словоилисловосочетание. Словарьдескрипторовсустановленнымипарадигматическимисвязямимеждуегоэлементаминазываетсятезаурусом.Тезаурус–основнойтипсловарявсовременныхИПС. Информационно-поисковыйтезаурус(ИПТ)–нормативныйсловарь-справочник,фиксирующийопределеннуюобластьзнанийчеловечествавданнойпредметнойобласти.МеждуэлементамиИПТустанавливаютсяпарадигматическиеотношения. ВкачественаиболеезначимыхпарадигматическихотношенийИПТвыступаютотношениявида: · часть–целоеицелое–часть; · соподчинение; · вид–род; · функциональноесходство; · причина–следствиеиследствие–причина. ПарадигматическиеотношениявыражаютсявИПТследующимиспособами: 1. лексикографически(спомощьюссылок); 2. аналитически(спомощьюкодов); 3. таблично(спомощьюсвязывающихсловатаблиц); 4. графически(спомощьюграфов).
Популярное: Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас... Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной... Личность ребенка как объект и субъект в образовательной технологии: В настоящее время в России идет становление новой системы образования, ориентированного на вхождение... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (325)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |