Мегаобучалка Главная | О нас | Обратная связь


Парадигматические  отношения.



2019-12-29 181 Обсуждений (0)
Парадигматические  отношения. 0.00 из 5.00 0 оценок




При построении словарных статей иерархические отношения устанавливаю гея между понятиями, объем одного из которых составляет часть объема другого. К ним относятся, например, отношения типа «род-вид», «часть-целое»; «шире-уже» и т. п. Более широкое понятие (подчиняющее, вышестоящее) имеет больший объем, оно выражает существенные признаки класса предметов, процессов и т. п., которые являются частью этого широкого понятия, подчиненными ему или нижестоящими.

При построении тезауруса все основные понятия его тематического диапазона рассматриваются с точки зрения выделения наиболее существенных признаков этих понятий. Выделенные признаки используются в качестве основания деления широких понятий на более узкие. Эти узкие понятия по какому-либо существенному признаку делятся на еще более узкие. Таким образом строится классификационная схема какого-либо понятия с иерархической структурой - так называемое иерархическое дерево.

Например, одним из основных понятий тематической области «Ветеринария» является понятие БОЛЕЗНИ ЖИВОТНЫХ. Основанием деления одного из них -ИНФЕКЦИОННЫЕ БОЛЕЗНИ ЖИВОТНЫХ - является этиология заболеваний (по возбудителям). По этому принципу выделены нижестоящие понятия: БАКТЕРИАЛЬНЫЕ БОЛЕЗНИ, ВИРУСНЫЕ БОЛЕЗНИ, МИКОПЛАЗМЕННЫЕ БОЛЕЗНИ и др. Рассмотрим формирование дерева понятия БАКТЕРИАЛЬНЫЕ БОЛЕЗНИ ЖИВОТНЫХ. Известно, что бактериальные болезни животных вызывают бактерии из разных таксономических групп. Однако классификация заболеваний только но таксономической принадлежности возбудителей явно недостаточна. Она не отвечает, например, интересам специалистов по анаэробным инфекциям: чтобы найти нужные документы, пользователь должен перечислить в запросе все заболевания, относящиеся к этой группе, искать ее по терминам текста или ключевым словам, что, как правило, не дает удовлетворительного результата. Задача решается, если классификацию бактериальных болезней проводить еще по одному специфическому признаку (основанию деления), например, АНАЭРОБНЫЕ ИНФЕКЦИИ. В результате иерархическое дерево понятия БАКТЕРИАЛЬНЫЕ БОЛЕЗНИ ЖИВОТНЫХ приобретает вид:

 

БАКТЕРИАЛЬНЫЕ БОЛЕЗНИ ЖИВОТНЫХ

с бактериозы животных

В1 инфекционные болезни животных

Н1 анаэробные инфекции

Н2 клостридиозы

НЗ ботулизм

Н1 бруцеллез

Н1 вибриоз

Н1 гемофильные инфекции

 В приведенной иерархической классификации дескриптор ИНФЕКЦИОННЫЕ БОЛЕЗНИ ЖИВОТНЫХ является вышестоящим (метка В) по отношению к дескриптору БАКТЕРИАЛЬНЫЕ БОЛЕЗНИ ЖИВОТНЫХ, а термины с меткой Н - нижестоящими по отношению к нему. Цифры при метках отражают все уровни иерархических отношений между заглавным дескриптором словарной статьи и дескрипторами более широкими (вышестоящими) и узкими (нижестоящими).

В словарной статье дескриптора его вышестоящие дескрипторы являются вершинами, с которыми он входит в соответствующие иерархические деревья. Один и тот же дескриптор может входить в разные деревья (пример 1), и находиться на разных вершинах иерархии одного и того же дерева (пример 2). Понятия, состоящие в родовидовых отношениях, не должны находиться на одном уровне иерархии. Максимальная глубина иерархии в тезаурусе БД АГРОС - 6 уровней.

 Пример 1

 ЛЮПИН

 

  В1 алкалоидные культуры

                                           В2 технические культуры

                                        В1 бобовые травы

     В2 кормовые травы

ВЗ кормовые культуры

В1 зернобобовые культуры

В1 ядовитые растения

а сидераты

 

Пример 2

ГОРНОАЛТАЙСКИЕ ОВЦЫ

 

 В1 тонкорунные овцы

В2 породы овец

В1 мясо-шерстные овцы

В2 породы овец

 

 

Иерархическая связь имеет двунаправленный характер. Это значит, что если между двумя ЛЕ установлены отношения типа «род-вид», «выше-ниже» и т. п., то обратной ссылкой для отношения «вид» будет «род» и наоборот:

 

ягодные культуры           клубника

Н1 клубника                        В1 ягодные культуры

 

Непротиворечивость связей отслеживается в компьютерной форме тезауруса программными средствами.

Отметим, что иерархические отношения, устанавливаемые между дескрипторами тезауруса, не претендуют на всеобщую применимость, их реализация отвечает задачам поиска информации конкретных областей знания. В связи с такой концепцией тезауруса, признано нецелесообразным строить иерархические деревья очень широких понятий как, например, СЕЛЬСКОЕ ХОЗЯЙСТВО, БОЛЕЗНИ ЖИВОТНЫХ и др., т. к. очевидна практическая узкая специализация пользователей или по отраслям сельского хозяйства, или по видам заболеваний животных и т. п. В тезаурусе такие широкие понятия связаны с более узкими терминами не иерархическими, а другими логическими отношениями - ассоциативными.

 

Пример:

 

болезни животных

а акушерские болезни

а аллергические болезни

а бесплодие животных

а болезни внутренних органов и систем


а хирургические болезни

а экзотические болезни

Такие широкие дескрипторы как БОЛЕЗНИ ЖИВОТНЫХ следует использовать только для индексирования документов общего характера, например, монографий, учебников, справочников и т. п., поиск по этому дескриптору из-за отсутствия иерархической связи с более узкими дескрипторами не будет эффективным - пользователь получит только часть документов.

При разработке тезауруса не ставятся чисто классификационные цели - иерархические деревья в нем формируются с целью создания средств для автоматизированного расширения ПОД или запроса.

Наличие в ИПС функции автоматизированного расширения ПОД имеет важное значения для методических принципов индексирования, стратегии поиска и оказывает существенное влияние на выбор логики тезауруса. Расширение ПОД - это включение в него более широких (вышестоящих) терминов тезауруса по отношению к использованным индексатором. Такое избыточное индексирование поисковая система осуществляет посредством реализации иерархических отношений, установленных между дескрипторами тезауруса.

 

В документе БД в поле ТЕР (термины тезауруса) находятся дескрипторы, используемые индексатором, а в ноле РТЗ (расширение по тезаурусу) - их вышестоящие дескрипторы, приписанные документу поисковой системой. При поиске но запросу <торговля зерном всех зерновых культур странами мира> документ об экспорте зерна пшеницы Канадой будет найден и выдан пользователю как релевантный запросу, благодаря процедуре избыточного индексирования за счет иерархических связей тезауруса:

 

       зерновые культуры                                           

Н1 гречиха

Н1 ежовник

Н1 кукуруза

Н1 овес

Н1 просо

Н1 пшеница


Н1 овес

Н1 просо

Н1 рис

 Н1 рожь

 


         Н1 ячмень

 

торговля

 

Н1 внешняя торговля

Н1 импорт


Н1 экспорт

страны мира

Н1 австрия

Н1 албания

Н1 алжир


Н1 канада

 

 


Установление иерархических связей между терминами тезауруса устраняет необходимость вручную индексировать документы всеми широкими понятиями, необходимыми для обеспечения полноты поиска., Например, по запросу <зерновые культуры> этот прием обеспечивает поиск в БД как документов, заиндексированных дескриптором ЗЕРНОВЫЕ КУЛЬТУРЫ, так и дескрипторами ПШЕНИЦА, РОЖЬ, ЯЧМЕНЬ и др., благодаря тому, что поисковая система расширяет ПОД последних термином ЗЕРНОВЫЕ КУЛЬТУРЫ. Поиск по общим терминам, стоящим над заданными в запросе, задается формулой запроса и выполняется, если между терминами в тезаурусе действительно установлены иерархические отношения.

При индексировании документов и формулировании темы запроса иерархическое построение словарных статей позволяет легко найти наиболее применимый специфический дескриптор. Поиск в тезаурусе нужного термина нужно проводить в следующей последовательности:

- обращение к известному дескриптору (одному или нескольким), отражающему более широкое понятие, к классу которого может относиться индексируемое понятие;

- обязательный просмотр статей выбранных дескрипторов, анализ их семантического «обрамления», т. е. примечания, синонимов, ассоциативных дескрипторов и, конечно, иерархически связанных с ними дескрипторов;

- выбор одного или нескольких дескрипторов, позволяющих точно отразить индексируемое понятие.

Иерархическая классификация позволяет быстро подбирать дескрипторы, необходимые для индексирования таких понятий, смысл которых в тезаурусе еще не отражен конкретными терминами.

Из-за определенной противоречивости концепций построения тезауруса, реализованных на разных этапах его развития, широкого тематического диапазона лексики, большого объема работ не все иерархические связи между дескрипторами существующей версии ИПТ установлены достаточно полно и корректно с точки зрения смысловых отношений между понятиями и задач поиска. Перечисленные недостатки устраняются в процессе отладки тезауруса.

При построении тезауруса необходимо стремиться к максимальному отражению семантических связей, однако, как показывает опыт, усложнение структуры ИПТ затрудняет его использование в самой ИПС и поэтому естественно искать разумный компромисс между объективностью ИПТ как структуры знаний и его практичностью - как информационно-поискового средства конкретной ИПС.

Многие дескрипторы тезауруса могут быть связаны отношениями подчинения более чем с одним дескриптором. Вслучае множественной     иолииерархии,     при

автоматизированном расширении ПОД в него включаются дескрипторы, отвечающие смысловым требованиям разных запросов, что порождает нежелательный информационный шум при поиске по конкретному запросу. Для ограничения поиска и получения релевантных документов пользователь должен средствами поисковой системы устранить нежелательные последствия полииерархии, поэтому можно сказать, что «нагрузка» на пользователя по корректировке запроса обратно пропорциональна «нагрузке» на индексатора. Напомним, что иерархические связи освобождают индексатора от необходимости вручную приписывать документу наряду со специфическими терминами и широкие (вышестоящие) дескрипторы.

Примером разного подхода к реализации иерархических отношений между понятиями являются два англоязычных тезауруса международных систем по сельскому хозяйству - тезаурус CABI* и тезаурус AGRIS (AGROVOC)**.

Некоторые иерархические связи, будучи правильными с точки зрения классификации знаний, могут быть маловажными или избыточными с точки зрения поиска. В таких случаях логично понятие подчинить наиболее важному термину (и с точки зрения поиска и с точки зрения естественности, органичности такой связи), а отношения с остальными выразить с помощью ассоциативных ссылок, которые индексатор примет во внимание при отражении того или другого аспекта. Этот подход и реализован в структуре отношений дескриптора LUPINUS LUTEUS в тезаурусе БД АГРОС: иерархически он подчиняется термину LUPINUS (истинная родовидовая связь), другие возможные аспекты его рассмотрения представлены ассоциативно связанными терминами, которые индексатор обязан использовать, если растение рассматривается в документе именно с этих точек зрения.

Кроме того, в силу принятой логики индексирования документов по растениеводству, ПОД должен содержать и общеупотребительное название с.-х. культуры, и научное (латинское) название конкретного вида используемого растения, например, ЛЮПИН и LUPINUS LUTEUS. Расширение ПОД в таком случае происходит за счет иерархических связей дескриптора ЛЮПИН как с.-х. культуры.

* САВ I - Международное бюро по с.-х. информации стран британского содружества

** AGRIS – Международная информационная система по сельскому хозяйству при ФАО

 


Современные поисковые системы располагают большим набором средств, используя которые грамотный пользователь добьется высокой релевантности поиска. Однако при разработке тезауруса следует предусматривать простые и эффективные стратегии поиска, учитывая, что пользователь, как правило, недостаточно осведомлен о возможностях ИПС. Индексатор должен знать все об особенностях ИПЯ, как инструментах индексирования документов и запросов, а также об особенностях поиска в данной ИПС.

Частичная замена иерархических отношений ассоциативными дает возможность заметно упростить структуру тезауруса, уменьшает риск информационного шума при поиске, упрощает его стратегию. Следует отметить также, что построение строго «научного» тезауруса требует неоправданно больших интеллектуальных и временных ресурсов, что неприемлемо в реальных условиях.

 

Отношения предпочтения устанавливаются между дескриптором и другими ЛЕ класса условной эквивалентности, т. е. его синонимами, омонимами или ЛЕ, которые обладают многозначностью. В целях единообразия индексирования документов и формулирования запросов, из множества ЛЕ класса условной эквивалентности только одной ЛЕ придается статус дескриптора, другие ЛЕ класса условной эквивалентности запрещены для использования в ПОД.

Среди них:

- синонимы - ЛЕ, абсолютно или относительно совпадающие по значению и употреблению, но отличающиеся друг от друга по звуковому составу и написанию;

- омонимы - ЛЕ, значение которых не связано друг с другом ни по смыслу, ни ассоциативно, но совпадающие по звуковому составу и написанию, например, бор - химический элемент и бор – хвойный лес;

- ЛЕ, обладающие свойством обозначать разные понятия (предметы, явления и т. п.), т. е. обладающие многозначностью - лексической полисемией. В отличие от омонимов, между ними может существовать определенная семантическая связь.

Например, сыворотка в зависимости от контекста может обозначать сыворотку молока, сыворотку крови или препарат - сыворотка жеребой кобылы. Разграничение значений омонимов и многозначных ЛЕ достигается вводом в тезаурус в качестве дескрипторов более специфических терминов или присоединением к ЛЕ реляторов, уточняющих их значение. Сами же омонимы и многозначные ЛЕ, как и синонимы, имеют в ИПТ статус аскрипторов.

  Аскрипторы размещаются в тезаурусе в общем порядке алфавита, они выделяются знаком «-» (черточка) и шрифтом «курсив». Синонимы имеют ссылку «см», омонимы и многозначные ЛЕ - «исп» к дескрипторам, которые следует использовать вместо них при индексировании.

В словарной статье дескриптора его синоним(ы), омоним или частично совпадающий по значению аскриптор (условный синоним) размещаются по алфавиту после дескриптора или лексическою латыни (научные наименования растений, животных, микроорганизмов и т. п.). Омонимы выделяются меткой <о>.

В тезаурусе взаимность ссылок между дескрипторами и аскрипторами контролируется программными средствами.

Аскрипторы составляют семантическое окружение дескриптора, уточняя понятие, которое он отражает в тезаурусе.

При отладке тезауруса для разграничения значений омонимов в случае наименований организмов в дальнейшем будут использоваться в качестве реляторов их таксономическая принадлежность, для других омонимов - уточнения в круглых скобках.

 

Просматривая статью многозначного аскриптора, индексатор должен сделать альтернативный выбор специфического термина (терминов).

Установлением отношений синонимии, омонимии, полисемии обеспечивается единообразная замена терминов, встречающихся в индексируемых документах, нормализованными ЛЕ тезауруса - дескрипторами. В результате согласованного отражения содержания документов индексаторами закладывается основа для эффективного поиска нужной информации пользователями БД, т. к. при составлении поисковых предписаний они также будут руководствоваться связями терминов тезауруса.

Все термины словарной статьи дескриптора так или иначе уточняют значение и объем понятия, отражаемого данным дескриптором. Так, например, в него включаются и аспекты, передаваемые некоторыми синонимами. В связи с этим, прорабатывая тот или другой дескриптор, следует обращать внимание не только на иерархические и ассоциативно связанные с ним дескрипторы, но и на ЛЕ, по отношению к которым использование данного дескриптора является предпочтительным. Только анализируя все связи дескриптора, можно быть уверенным в правильности выбора термина индексирования.

Наличие у каждого дескриптора большого количества синонимов, встречающихся в литературе, имеет ряд преимуществ. Зафиксированные отношения синонимии обеспечивают:

- поиск нужных дескрипторов в тезаурусе;

- автоматизированную замену ошибочно использованных индексатором аскрипторов соответствующим и дескрипторами;

поиск информации в БД по известным пользователю синонимам (конечно, если они есть в тезаурусе): в запросах также происходит автоматизированная замена их дескрипторами;

- удобство восприятия ПОД с латинскими дескрипторами, благодаря визуализации их русских эквивалентов (синонимы с меткой <рус>).

 

 

Ассоциативные отношения - это любой вид смысловых отношений между понятиями, возможный в данной предметной области, кроме отношений синонимии.

Одним из критериев установления ассоциативных отношений между терминами является достаточно частая совместная встречаемость их в литературе, однако решающим является полезность такой связи для индексатора при подборе им нужных терминов для индексирования какого-либо понятия. Ассоциативную связь (метка а) следует воспринимать как рекомендацию обратить внимание на термины, имеющие какое-либо отношение к индексируемому понятию, т. е. пересекающиеся с ним но какому-либо аспекту отображения.

Ассоциативные отношения устанавливаются в основном:

 

- между дескрипторами разных иерархических деревьев одной категории (например, между дескрипторами тематической области «Ветеринария»);

- между дескрипторами разных категорий (например «Животноводство. Кормление животных. Корма» и «Пищевая промышленность. Продукты питания»);

- между дескрипторами, содержательно относящимся к одному иерархическому дереву (как правило, с развитым «ветвлением»), для устранения неоправданного возрастания объема тезауруса, а также информационного шума за счет маловажных для поиска терминов. В тезаурусе зафиксированы следующие распространенные логические связи между терминами, а также отношения, полезные с точки зрения индексирования и поиска:

 

- причина - следствие:

ветровая эрозия

а пыльные бури

 

- часть - целое:

крс

а породы крс

 

- предмет-процесс:

плуги

а вспашка

 

- вещество - его производные:

фенол

а карболовая кислота

 

- сходство или общность некоторых признаков:

биотипы

а генотипы

 

- организм (растения, животные, микроорганизмы и т. п.) -вид использования:

acer tataricum

а декоративные деревья

 

- предмет, явление - аспекты рассмотрения:

паразито-хозяинные отношения

а круг хозяев

 

- используемые растения, животные, микроорганизмы -научное наименование рода или вида:

пшеница

а triticum

 

Приведенные примеры, конечно, не исчерпывают всех видов логических отношений между понятиями. По мере появления новых знаний, ввода новых дескрипторов количество и разнообразие ассоциативных связей в тезаурусе возрастает. Гак несомненно полезным для поиска является фиксация ассоциативных отношений типа «сырье-продукт», «свойство-носитель свойства», антонимия и др.

Ранее отмечалось, что в определенных случаях ассоциативные отношения устанавливаются между понятиями, которые фактически находятся в родовидовых, т. с. иерархических отношениях, но эти отношения нецелесообразны с точки зрения поиска. Иерархические деревья таких широких понятий, как, например, РАСТЕНИЯ или ЖИВОТНЫЕ имели бы слишком большое количество нижестоящих терминов, сложную структуру, большую глубину иерархии, что нецелесообразно, т. к. поиск по таким дескрипторам вряд ли возможен. Поэтому словарные статьи таких дескрипторов включают, как правило, только термины с меткой ассоциативной связи.

 

 

Пример:

растения

а вечнозеленые растения

а декоративные растения

 

а с-х культуры

а ядовитые растения

 

 

Разрыв иерархической цепочки в «безвредной» для поиска точке и установление в этом месте ассоциативной связи часто используется в тезаурусе в научных классификациях организмов. Именно так предполагается связать, например, ботанические семейства с верхними таксонами.

Ассоциативные отношения не следует устанавливать между дескрипторами, связь между которыми очевидна:

Пример:

 

болезни зубов                           зубы

В1 хирургические болезни     В1 ротовая полость

Н1 пародонтоз                             В2 пищевой тракт

 

Ассоциативно связанные с дескриптором термины с меткой а размещаются в конце словарной статьи дескриптора. Метка является симметричной (двунаправленной) и контролируется программными средствами.

 

Пример:

 

несовместимость                   конкуренция

а конкуренция                          а несовместимость

 

Изучив словарные статьи ассоциативных терминов, индексатор может найти в них дескрипторы, которые уточняют выбранное понятие или отражают какие-либо аспекты его рассмотрения, важные с точки зрения поиска. Кроме того, возможно, в словарных статьях ассоциативных терминов, будет найден дескриптор, более точно отражающий тему документа, чем ранее выбранный.

 

2.2.3. Использование тезаурусов

 

Индексирование - это перевод содержания документа и запроса с естественного на информационно-поисковый язык. В зависимости от типа ИПЯ (иерархическая классификация, дескрипторный ИПЯ) индексирование реализуется в процессах:

- предметизации (индексирование на языке предметных рубрик, алфавитно-предметной классификации):

- систематизации литературы на языке классификационных иерархических ИПЯ;

- координатного индексирования на языке дескрипторного ИПЯ или языка ключевых слов.

 

       В зависимости от ИПЯ результатом индексирования, т. е. элементом ПОД на соответствующем ИПЯ, будет либо предметная рубрика, либо индекс классификации, либо набор дескрипторов или ключевых слов.

 

Отметим некоторые общие положения индексирования с помощью ИПТ.

При выборе аспектов индексирования содержания документа индексатор должен принимать во внимание:

- аспекты, которые выделяет автор работы - это видно из заглавия, определения целей и задач работы, самого исследования, заключения и выводов;

- темы, к которым данная работа имеет непосредственное отношение, хотя сам автор это не подчеркивает (такой анализ документа требует большой компетентности индексатора как специалиста):

- как положительные, так и отрицательные результаты работы.

Качество индексирования и эффективность поиска зависят от соблюдения следующих правил индексирования:

- максимально полно использовать лексический состав тезауруса, его структуру и связи между терминами;

- подбирать дескрипторы с учетом возможного использования их пользователем в поисковых предписаниях (ПОЗ);

- отражать разные аспекты содержания документа достаточным количеством дескрипторов, с тем чтобы

документ был найден по запросам пользователей разных специальностей.

Каждый выделенный аспект содержания документа следует индексировать как можно более специфичными дескрипторами и не использовать дополнительно более широких понятий. Однако если в содержании документа затрагивается и широкий аспект, и один или два узких, следует использовать и общий дескриптор, и один или два специфичных. Например, для индексирования статьи о породах овец, разводимых в Алтайском крае, следует использовать общий термин ПОРОДЫ ОВЕЦ и ГОРНОАЛТАЙСКИЕ ОВЦЫ, если этой породе уделено особое внимание.

Если для отражения понятия индексатор в тезаурусе не находит точного эквивалента, необходимо подобрать дескрипторы, близкие по смыслу.

В словарной статье дескриптора нужно принимать во внимание все элементы ее структуры:

- лексическое примечание и аскрипторы дают представление об объеме понятия, уточняют его содержание, область применения;

 

- ассоциативные термины - это дополнительный список дескрипторов, имеющих какое-либо отношение к данному понятию, среди них могут оказаться полезные для индексирования его аспектов. В случае растений, микроорганизмов, насекомых, рыб, диких животных и т.п. обращение к статьям ассоциативных дескрипторов обязательно для уточнения латинского наименования семейства рода или вида.

- иерархические отношения дают возможность легко подобрать наиболее специфичный дескриптор.

Например, для индексирования из алфавитного списка вначале был отобран дескриптор КУЛЬТИВИРУЕМЫЕ ГРИБЫ. В словарной статье этого дескриптора имеются вышестоящие термины (две ветви), т. е. дескриптор входит в иерархическое дерево с двумя вершинами: НИЗШИЕ РАСТЕНИЯ и ОВОЩНЫЕ КУЛЬТУРЫ. Двигаясь по иерархическому дереву вниз, т. е. просматривая нижестоящие термины, можно найти среди них более специфичный термин, чем выбранный вначале, например, ВЕШЕНКА, более точно отражающий индексируемое понятие. Движение вверх по иерархическому дереву приведет к более широким понятиям, использование которых при наличии более специфичных дескрипторов, конечно, недопустимо.

 

Если специфичный термин еще не введен в тезаурус, но включен в картотеку кандидатов в дескрипторы, он может быть использован для индексирования, но при этом индексатор должен выбрать из тезауруса еще и близкий по смыслу дескриптор или более широкое понятие. Так же следует поступать и с новыми понятиями, для отражения которых в картотеке нет терминов, при этом индексатор должен внести в картотеку использованное ключевое слово. На его карточке должны быть приведены известные индексатору сведения о термине, необходимые для включения его в тезаурус: вышестоящие и нижестоящие термины, синонимы, ассоциативные термины, лексическое примечание, если оно необходимо. Если термин не рекомендуется вводить в тезаурус, на карточке ставится помета «КЛ» (ключевое слово).

 

Компьютерная база данных ИПТ позволяет выводить его на печать автоматизированным способом в различных формах. Используемые в настоящее время печатные формы -дескрипторный словарь и лексико-семантический указатель (ЛСУ) имеют следующую последовательность знаков:

 

- цифры (0-9);

- латинский алфавит (А-2);

- русский алфавит (А-Я).

 

 

В пределах одной записи пробел предшествует знаку «дефис».

Дескрипторный словарь представляет собой алфавитный список дескрипторов и аскрипторов - терминов, запрещенных для использования при индексировании, со ссылкой на соответствующий дескриптор.

В ЛСУ термины даны в алфавитном порядке со своим семантическим окружением, составляющим словарную статью термина. Словарная статья дескриптора может включать лексическое примечание, синонимы, вышестоящие и нижестоящие дескрипторы и ассоциативные термины. Один и тот же дескриптор может присутствовать в словарных статьях нескольких других терминов - в зависимости от парадигматических отношений, установленных с ними в основной классификационной схеме понятия. Словарную статью аскриптора составляет сам аскриптор и дескриптор, который следует использовать вместо него. [43, C. 62-66].

Развитие тезауруса БД АГРОС носит динамический характер, что обусловлено появлением новых областей знаний, тематическим расширением документального совершенствованием дескрипторного языка и структуры тезауруса, задачами совместимости его с другими ИПЯ числе с тезаурусами международных ИПС, совпадающими по тематическому охвату с БД АГРОС. Такими тезаурусами являются Тезаурус САВI (САВ Thesaurus)* и тезаурус (AGROVOC). Для решения проблемы полной совместимости необходимо:

 

- провести сопоставительный анализ англоязычных тезаурусов и выбрать наиболее развитый соответствующий задачам поиска в БД AGROS в качестве базисного для создания его русской версии;

- осуществить сопряжение русской терминов лексикой базисного тезауруса;

- перенести структуру всех отношений базисного тезауруса на национальную терминологию;

 

- разработать технологию, программные и лингвистические средства для формирования и ведения динамического двуязычного ИПТ.

 

Сопоставительный анализ показал, что ни один из англоязычных тезаурусов в полном объеме не может служить в качестве базисного. Перенос их структуры отношений в отечественный ИПТ на данной стадии его развития сложен по многим причинам: особенности языка, развития отраслей; традиции и т. п. Кроме того, создание русской в целесообразно рассматривать но отношению к единому международному тезаурусу, вопрос о котором решается на международном уровне.

Тем не менее вопросы сопряжения термина решаются уже сейчас с целью облегчения вхождения, пользователя в "чужую" БД с помощью терминов национального тезауруса. Сближение терминологическою состава отечественного ИПТ с тезаурусами международных систем САВI, NAL, AGRIS происходит в процессе отбора лексики: одним из оснований для включения термина в состав ИПТ является наличие его английского эквивалента в тезаурусах международных систем. Классификационные схемы отдельных понятий, например, систематика растений, рыб, насекомых. вирусов, микроорганизмов и др., классификация ферментов, химических соединений и т. п. включаются в отечественный тезаурус в версии тезауруса САВI.

* Тезаурус САВ I используется также Национальной библиотекой по сельскому хозяйству США (NAL) для индексирования документов БД AGRICOLA.




2019-12-29 181 Обсуждений (0)
Парадигматические  отношения. 0.00 из 5.00 0 оценок









Обсуждение в статье: Парадигматические  отношения.

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (181)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.018 сек.)