Мегаобучалка Главная | О нас | Обратная связь


АВТОМАТИЗИРОВАННЫЕИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ



2018-07-06 325 Обсуждений (0)
АВТОМАТИЗИРОВАННЫЕИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ 0.00 из 5.00 0 оценок




 

Автоматизированнаяпоисковаясистема–система,состоящаяизперсоналаикомплексасредствавтоматизацииегодеятельности,реализующаяинформационнуютехнологиювыполненияустановленныхфункций

Особенностиавтоматизированныхпоисковыхсистем

Вработепоисковыйпроцесспредставленчетырьмястадиями:

1.формулировка(происходитдоначалапоиска);

2.действие(начинающийсяпоиск);

3.обзоррезультатов(результат,которыйпользовательвидитпослепоиска);

4.усовершенствование(послеобзорарезультатовипередвозвращениемкпоискусинойформулировкойтойжепотребности).

Болееудобнаянелинейнаясхемапоискаинформациисостоитизследующихэтапов:

Фиксацияинформационнойпотребностинаестественномязыке;

Выборпоисковыхсервисовсетииформализациязаписиинформационнойпотребностинаконкретныхинформационно-поисковыхязыках(ИПЯ);

Выполнениесозданныхзапросов;

Предварительнаяобработкаполученныхсписковссылокнадокументы;

Обращениеповыбраннымадресамзаискомымидокументами;

Предварительныйпросмотрсодержимогонайденныхдокументов;

7.Сохранениерелевантныхдокументовдляпоследующегоизучения;

8.Извлечениеизрелевантныхдокументовссылокдлярасширениязапроса;

9.Изучениевсегомассивасохраненныхдокументов;

10.Еслиинформационнаяпотребностьнеполностьюудовлетворена,товозвраткпервомуэтапу.

Работапоисковогоуказателяпроисходитвтриэтапа,изкоторыхдвапервыхявляютсяподготовительнымиинезаметныдляпользователя.СначалапоисковыйуказательсобираетинформациюизWorldWideWeb.Дляэтогоиспользуютспециальныепрограммы,аналогичныебраузеры.ОниспособныскопироватьзаданнуюWeb-страницунасерверпоисковогоуказателя,просмотретьее,найтивсегиперссылки,которыенанейимеюттересурсы,которыенайденытам,сноваразыскатьимеющиесявнихгиперссылкиит.д.Подобныепрограммыназываютчервяками,пауками,гусеницами,краулерами,спайдерамиидругимиподобнымиименами.Каждыйпоисковыйуказательэксплуатируетдляэтойцелисвоюуникальнуюпрограмму,которуюнередкосамиразрабатывает.Многиесовременныепоисковыесистемыродилисьизэкспериментальныхпроектов,связанныхсразработкойивнедрениемавтоматическихпрограмм,занимающихсямониторингомСети.Теоретически,приудачномвходеспайдерспособенпрочесатьвсеWeb-пространствозаоднопогружение,нонаэтонадооченьмноговремени,аемуещенеобходимопериодическивозвращатьсякранеепосещеннымресурсам,чтобыконтролироватьпроисходящиетамизмененияивыявлять«мертвые»ссылки,т.е.потерявшиеактуальность.

ПослекопированияразысканныхWeb-ресурсовнасерверпоисковойсистемыначинаетсявторойэтапработы—индексация.Входеиндексациисоздаютсяспециальныебазыданных,спомощьюкоторыхможноустановить,гдеикогдавИнтернетевстречалось,тоилииноеслово.Считайте,чтоиндексированнаябазаданных—этосвоегородасловарь.Онанеобходимадлятого,чтобыпоисковаясистемамоглаоченьбыстроотвечатьназапросыпользователей.Современныесистемыспособнывыдаватьответызадолисекунды,ноеслинеподготовитьиндексызаранее,тообработкаодногозапросабудетпродолжатьсячасами.

Натретьемэтапепроисходитобработказапросаклиентаивыдачаемурезультатовпоискаввидеспискагиперссылок.Допустим,клиентхочетузнать,гдевИнтернетеимеютсяWeb-страницы,накоторыхупоминаетсяизвестныйголландскиймеханик,оптикиматематикХристианГюйгенс.ОнвводитсловоГюйгенсвполенабораключевыхсловинажимаеткнопку.Найти(Search).ПосвоимбазамуказателейпоисковаясистемавдолисекундыразыскиваетподходящиеWeb-ресурсыиформируетстраницурезультатовпоиска,накоторойрекомендациипредставленыввидегиперссылок.Далееклиентможетпользоватьсяэтимиссылкамидляпереходакинтересующимегоресурсам.

 

ИНФОРМАЦИОННО-ПОИСКОВЫЕЯЗЫКИ

СтруктураИПЯ.

Впоследниегодысоздаетсямножестворазнообразныхискусственныхязыков,ориентированныхнарешениеопределенныхзадач.Этоинформационно-поисковыеязыки,языкиописанияданных,языкиманипулированияданными,языкиуправлениязаданиями,моделирования,автоматизациипроектированияит.д.Средивсехклассовискусственныхязыковостановимсяподробнеенаинформационно-поисковыхязыках(ИПЯ).Основнымиэлементами,составляющимиИПЯ,являются:алфавит,словарныйсоставиграмматика.

АлфавитИПЯ–системазнаков,используемыхвязыкедлязаписиотдельныхсловивыражений.Этомогутбытьбуквыестественногоязыка,знакипрепинания,иныесимволы,втомчислецифры.

СловарныйсоставилилексикаИПЯ–совокупностьслов,словосочетанийивыражений,используемыхдляпостроениятекстовИПЯ.ВкачествелексическихединицИПЯиспользуются:

· слова,фрагментыслов,словосочетанияивыражениялюбогоестественногоязыка;

· кодыишифры(цифровые,буквенные,буквенно-цифровые)словосочетаний,словивыражений,выступающиевролиименсоответствующихклассов;

· шифрыикодывсочетаниисословами,словосочетаниямиивыражениями.

СуществуютразныеспособыформированиясловарногосоставаИПЯ:

1. ПеречислениевсехлексическихединицИПЯ;

2. Перечислениечастилексическихединицизаданиеправилформированияизнихдругихлексическихединиц;

3. Заданиеправилпостроениялексическихединиц,словивыраженийестественногоязыка.

Первыйспособзаданиялексикинеподдаетсяавтоматизацииинетребуетбольшихинтеллектуальныхусилий.ЛексикаИПЯвбольшинствеслучаевнепозволяетдостаточноточновыразитьсмысловоесодержаниетекстовиоказываетсяжесткофиксированной.

Второйспособможетбытьполностьюавтоматизирован,нотребуетбольшихинтеллектуальныхзатратнаопределениеправилформированиялексики.Однаконаучныйподходкформированиюсловарногосоставаделаетегоболеесовершенным,обеспечиваетединообразиеиуменьшаетсубъективизмприпостроениилексики.

Третийспособзанимаетпромежуточноеположениеивотношенииинтеллектуальныхусилий,ивотношенииавтоматизациипроцессов.

ГрамматикаИПЯ–совокупностьсредствиспособовпостроения,измененияисочетаниялексическихединиц.Грамматикавключаетморфологиюисинтаксис.Морфология–совокупностьсредствиспособовпостроенияиизмененияслов.Синтаксис–совокупностьсредствиспособовсоединениясловввыраженияифразы.

 

ТРЕБОВАНИЯКИПЯ

 

1. ИПЯдолженрасполагатьнаборомлексико-грамматическихмеханизмовдляоднозначноготолкованияосновногосодержаниядокумента.

2. ИПЯдолженбытьнедвусмысленным.ЛюбоевыражениеИПЯдолжновосприниматьсяоднозначно,чтоотличаетегоотестественногоязыка,длякоторогохарактернамногозначность.

3. ИПЯдолженбытьудобнымдляалгоритмизации.

ДескрипторныеИПЯстроятсянаосновепринципакоординатногоиндексирования,предполагающеговыражениеосновногосмысловогосодержаниядокументаспискомключевыхслов.

ДескрипторныеИПЯсостоятизследующихэлементов:

1. Лексическиеединицы(ЛЕ),обеспечивающиевыделениеопределенныхчастейтекстаспоследующейзаменойихкодамилексическихединиц;

2. Грамматика–правилапримененияИПЯ,которыезадаютпроцедурупереводанаИПЯтекстовнаестественномязыкевдокументахизапросах;

3. Словарииправилаихприменения–правила,определяющиепроцедуруизмененияисовершенствованияИПЯ.

РазличаютдвегруппысловарейЛЕ:а)основныелексическиесловари,формирующиеосновнуюлексикуИПЯ;б)морфологическиесловари,позволяющиеосуществлятьморфологическийанализипроводитьнормализациюслов.

ОсновуЛЕосновныхсловарейсоставляютключевыеслова,устойчивыесловосочетанияидескрипторы.Соответственнословари,содержащиеэтиэлементы,называются:"Словарьключевыхслов","Словарьсловосочетаний"и"Словарьдескрипторов".

Ключевымсловом(КС)называютполнозначноесловоестественногоязыка,выражающеесмысловоесодержаниефрагментадокументаилизапросасамостоятельно,иливнаборесдругимиКС.

Словосочетание–последовательностьнесколькихслов(обычно2–5)естественногоязыка,выражающаяосновноесмысловоесодержаниефрагментадокументаилизапроса.Частословосочетаниеиспользуетсякакключевоеслово.Какправило,словарьКСвключаеткакотдельныеслова,такисловосочетания.Однакопосравнениюсколичествомотдельныхсловвсловареколичествословосочетаниймало.

Дескриптор–группатождественныхилиблизкихпосмыслуКС,используемыхкакимяклассасинонимов.Дескрипторамимогутбытькод,словоилисловосочетание.

Словарьдескрипторовсустановленнымипарадигматическимисвязямимеждуегоэлементаминазываетсятезаурусом.Тезаурус–основнойтипсловарявсовременныхИПС.

Информационно-поисковыйтезаурус(ИПТ)–нормативныйсловарь-справочник,фиксирующийопределеннуюобластьзнанийчеловечествавданнойпредметнойобласти.МеждуэлементамиИПТустанавливаютсяпарадигматическиеотношения.

ВкачественаиболеезначимыхпарадигматическихотношенийИПТвыступаютотношениявида:

· часть–целоеицелое–часть;

· соподчинение;

· вид–род;

· функциональноесходство;

· причина–следствиеиследствие–причина.

ПарадигматическиеотношениявыражаютсявИПТследующимиспособами:

1. лексикографически(спомощьюссылок);

2. аналитически(спомощьюкодов);

3. таблично(спомощьюсвязывающихсловатаблиц);

4. графически(спомощьюграфов).

 



2018-07-06 325 Обсуждений (0)
АВТОМАТИЗИРОВАННЫЕИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ 0.00 из 5.00 0 оценок









Обсуждение в статье: АВТОМАТИЗИРОВАННЫЕИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас...
Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной...
Личность ребенка как объект и субъект в образовательной технологии: В настоящее время в России идет становление новой системы образования, ориентированного на вхождение...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (325)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.009 сек.)