Мегаобучалка Главная | О нас | Обратная связь


С редства лингвистического обеспечения Государственной научной сельскохозяйственной библиотеки Украинской академии сельскохозяйственных наук.



2019-12-29 140 Обсуждений (0)
С редства лингвистического обеспечения Государственной научной сельскохозяйственной библиотеки Украинской академии сельскохозяйственных наук. 0.00 из 5.00 0 оценок




 

Лингвистическое обеспечение - это комплекс языковых средств, необходимых для обработки документов и запросов, проведения эффективного поиска в электронном каталоге (ЭК) по тематическим запросам, осуществления языковой совместимости ЭК разных библиотек для обмена данными. Вопрос ЛС - пожалуй, наиболее проблемная и трудоемкая часть работы по ЭК, который является визитной карточкой библиотеки. Предоставление пользователю максимально благоприятных условий для поиска и распространения ресурсов библиотеки с целью информационно-библиотечного обеспечения агропромышленного производства, расширение их доступности для всех категорий пользователей - эта задача может быть решена при наличии развитой системы лингвистического обеспечения ЭК.

       Для раскрытия содержания документов есть три основных вида информационно-поисковых языков: классификационный, предметизационный и дескрипторный.

Классификационный язык предназначен для индексирования документов и информационных запросов посредством понятий и кодов определенной классификационной системы (ББК, УДК, Десятичная классификация Дьюи и др.). [66, C. 35].

Универсальная десятичная классификация (УДК) является одной из самых распространенных классификационных систем в мире. Она постоянно развивается и совершенствуется, хорошо приспособлена для автоматизированных технологий и дает возможность осуществлять отраслевой поиск информации в АБИС "ИРБИС".Это позволяет сохранить в ЭК все положительные характеристики традиционных каталогов, которые вобрали в себя многолетний опыт библиотекарей и библиографов и привнести новые возможности поиска информации посредством использования информационно-коммуникационных технологий.

Для систематизации документов в ГНСХБ УААН частично используются таблицы ББК (для расстановки документов общественно-политического и гуманитарного направления) и украиноязычные таблицы УДК, подготовленные Книжной палатой Украины им. Ивана Федорова (К., 2000, с изменениями и дополнениями). [69]

В основе классификационных языков лежит систематическая классификация понятий, то есть такая, которая фиксирует смысловые отношения между понятиями. Классификационные языки предназначены, прежде всего, для формализации логических связей слов естественного языка.

Все ИПМ классификационного типа характеризуются определенными свойствами, прежде всего, невысокой эффективностью и некоторыми трудностями при информационном поиске, особенно с применением технических средств. К этим недостаткам относятся: предварительная координация (связь) слов и словосочетаний в рубрике, практическая невозможность полного и детального разработки схемы классификации и подключение ее к АБИС, сложность обновления и дополнения, трудоемкость использования при индексировании.

Все эти недостатки побудили к созданию языков вербального типа. Их используют для представления лексических единиц слова и выражения естественного языка в орфографические форме. В отличие от классификационных языков, используемых для систематизации документов, они ориентированы на обозначение в поисковом образе документа (ПОД) или в поисковом образе запроса (ПОЗ) конкретных объектов или предметов содержания этих документов.

К языкам вербального типа относятся предметизационный дескрипторный языки, которые используют предметные рубрики и ключевые слова при наличии неконтролируемой лексики.

Язык предметизации предназначен для индексирования документов и информационных запросов с помощью рубрикаторов (словарей предметных рубрик), а в случае их отсутствия - по методике предметизации. В основе лежит алфавитный перечень предметных рубрик (ПР), который является краткой формулировкой темы на естественном языке. Важнейшим этапом предметизации является идентификация признаков содержания документа с предметными рубриками. Предметная рубрика выполняет информационную, эвристическую, комплектующую и терминологическую функции.

 Основными требованиями к формированию ПР являются лаконичность вместе с полным и точным раскрытием содержания документа, а также простота, которая способствует поиску необходимых документов. Особенностью формулировки предметных рубрик является то, что лексика ИПМ предметных рубрик должна быть максимально приближенной к языку автора документа. Однако, с развитием науки, практической деятельности людей, с изменениями информационных потребностей пользователей и т.д. она может изменяться, дополняться новыми и избавляться от устаревших лексических единиц, изменять свою структуру.

       Как искусственная система язык предметизации должен быть построен стандартно, предельно однообразно. Это помогает читателю сэкономить время и силы при поиске. Практика работы ГНСХБ УААН доказывает, что пользователи чаще заинтересованы вести поиск не по классификационным системами, а по запросам тематического, предметного характера. При этом предметные рубрики менее популярны, чем ключевые слова, потому что в библиотеках нет единой системы предметизации, отсутствует универсальный словарь предметных рубрик, пользователи не владеют методикой предметизации, что усложняет формулировку ПОЗ, адекватного поисковом образа документа. Не во всех ЭК реализуется доступ пользователей к внутренним словарям предметных рубрик. Вместе предметные рубрики непригодны для глубокого, достоверного поиска по теме в машиночитаемых библиографических базах данных.  

  Некоторые темы документа могут не охватываться ПР. Особенно это касается научных сборников, материалы конференций, симпозиумов и т.п., где встречаются статьи и доклады, которые лишь отдаленно пересекаются с основной тематикой сборника, но представляют интерес для пользователей конкретной библиотеки. Вероятнее всего, такие побочные (непрофильные) темы не будут отражены ни классификационными индексами, ни ПР, но могут быть описаны ключевые слова (КС).

Ключевые слова - это нормализованный ИПЯ; слова записываются в соответствии с правилами, разработанных для ИПС. При выборе сроков и обработки их для введения в усовершенствованный информационный документ разрабатываются и принимаются решения по методике индексирования документов различной тематики.

Ключевые слова целесообразно использовать для дополнительного раскрытия содержания документа на более глубоком уровне, то есть использовать ПР для описания основных предметов документа и их аспектов, а КС - для дальнейшей детализации, а также описания побочных тем документа. Тогда в ПОД будут содержаться ПР (нормализованная лексика) и КС в редакции автора. Такой подход удобен для всех категорий пользователей: как для тех, кто примерно знает, что хочет найти (для этого удобно использовать ПР), так и для тех, кого может заинтересовать очень специфическое (поиск происходит при КС).Особую ценность список КС может приобрести на последнем этапе поиска, когда по запросу найдено определенный массив документов. Просмотрев списки КС, можно, даже не просматривая источники, сразу определить нужную информацию. Таким образом, использование КС увеличивает поисковые возможности ЭК.

Ключевые слова следует рассматривать как дополнительное средство увеличения полноты индексирования и представления разных по значимости тем документа, не описанных другими ИПМ. Вот почему целесообразно расширить возможности тематического поиска с помощью подключения к КС, которые для пользователей является наиболее понятным средством розыска большого количества релевантных документов.

Дескрипторный язык служит для координатного индексирования документов и запросов с помощью тезауруса (словаря дескрипторов) или определением ключевых слов с использованием естественного языка. В основу дескрипторных ИПМ положен алфавитный перечень лексических единиц. Комплекс ключевых слов является своего рода лексической моделью научного текста. Функциональная значимость КС определяется тем, что они являются одним из наиболее оптимальных способов классификации, хранения и передачи информации. Отражая развитие и терминодинамику определенной научной отрасли, комплекс КС является еще и системой отбора и распространения современной терминологии.

       Следовательно, каждая из указанных ИПМ имеет свои преимущества и недостатки.

Любая из указанных выше ИПМ обязательно функционирует в определенной информационно-поисковой системе, представленной как в традиционном, так и в автоматизированном режимах.

Традиционная ИПС - это совокупность каталогов и картотек на бумажных носителях, автоматизированная - электронный каталог. Собственно каталоги и картотеки и являются теми навигационными "ступеньками", с помощью которых читатель открывает все богатство библиотечных фондов, ориентируется в тематическом разнообразии документального потока в разные исторические периоды существования библиотеки.

На сегодня все больше библиотек сельскохозяйственной сети создают электронные каталоги, базы данных (БД) и перед ними встает вопрос о выборе лингвистического обеспечения для них. Во многом выбор ЛС зависит от того, какие информационно-поисковые языки использовались в этих библиотеках для карточных каталогов. Как правило, именно их приспосабливают для электронных каталогов и БД. Это обусловлено тем, что новые ИПМ требуют обучения индексаторов, а также трудоемкостью создания ИПМ и желанием сохранить пользовательские связь традиционных и электронных каталогов. В основном в сельскохозяйственных библиотеках для карточных каталогов используются ИПМ классификационного типа: УДК и ББК. [65, C. 14-15].

С 2000 г. в ГНСХБ УААН наряду с традиционными каталогами и картотеками ведется электронный каталог. Как для карточного каталога, так для ЭК используются своя собственная классификация - Отраслевой предметный рубрикатор по сельскому и лесному хозяйству (ГПР), разработанный на основе списка рубрик предметного каталога ГНСХБ. Он создавался на протяжении многих лет и сейчас является основным методическим и рабочим инструментом систематизаторов сектора.

       Выбор лингвистического обеспечения библиотеки определяется задачами ее информационно-поисковой системы и информационными ресурсами, а также запросами ее пользователей. Именно их разнообразные потребности необходимо учитывать, планируя и создавая ЛС. ГНСХБ УААН использует как лингвистические средства несколько ИПМ параллельно. Это способствует быстрому и широкому доступу пользователей к информации наиболее известной им на информационно-поисковом языке.

Для расширения возможностей поиска в ЭК библиотеки применяется предметный поиск, который является междисциплинарным, межотраслевым и комплексным. По такому запросу пользователи получают комплекс всех документов по предмету, проблемы, темы независимо от отраслей знаний, к которым относятся все эти документы. Основой для создания языка предметных рубрик стал перечень рубрик алфавитно-предметного указателя (АПП) в Список рубрик предметного каталога ГНСХБ УААН и Государственный стандарт Украины ГСТУ 25395-2000 (ISO 5963:1985) «Информация и документация. Обследование документа, установление его предмета и отбор терминов индексирования. Общая методика». [68]

Разнообразие информационно-поисковых языков, которые составляют структуру лингвистических средств, объясняется типо-видовым разнообразием и тематической сложностью входного документного потока, традициями и особенностями Государственной научной сельскохозяйственной библиотеки, навыками работников и запросами пользователей библиотеки, а также тем, что ни одна из современных ИПМ не может в полном объеме обеспечить полноту и эффективность поиска релевантной информации.

 

 Комплексное применение ИПМ позволяет:

 • наиболее полно осуществлять обработку политематической входного документного потока библиотеки для ввода его в БД;

 • обеспечить точность информационного поиска;

 • удовлетворять требованиям сортировки массивов документов при создании различной исходной продукции, в т ч. текущих изданий;

 • выполнять формально-логический контроль рубрик документов, которые вводятся.

 Для этого выявляются дублирующие или избыточные (неработающие) рубрики; проводится сравнительный анализ части рубрик ГПР с целью устранения многоаспектности, дублирование рубрик, унификации наименований; уточняется справочно-ссылочный аппарат, редактируются наименования рубрик, примечания.

С включением в фонд и аналитико-синтетическую обработку документов новой тематики (например, "Нанотехнологии", "Интеллектуальная собственность", "Экономические нормативы") создаются новые ПР, для которых разрабатываются схемы, создается ссылочной-справочный аппарат, приписываются комментарии и примечания. Затем этот раздел включается в машинный ГПР ЭК.

 Ведутся подготовительные работы по организации Отраслевого тезауруса (ГТ): проводится отбор массива лексических единиц (ЛЕ) по всему диапазону входного потока БД, формируется словарь ОТ. Отбор ЛЕ осуществляется специалистами в ходе аналитико-синтетического обработки документов. ЛЕ поступают сначала в карточную картотеку и используются некоторое время как ключевые слова. Работа над ними состоит из нескольких этапов:

1. мониторинг на частотность появления терминов в документах;

2. согласование со специалистами,

3. проверка в справочниках и тезаурусах, а также в зарубежных БД.

Впоследствии:

1. проводится лингвистическая обработка;

2. редакция;

3. происходит построение статьи термина-дескриптора;

4. проводится сверка с электронной рубрикой.

Все эти процессы позволяют выявлять ошибки индексирования и ввода информации в Отраслевой тезаурус. [70, C. 55-57]

В связи с отсутствием в Украине единого научно-исследовательского, научно-методического и информационного центра по разработке и ведению лингвистических средств, библиотеки на практике сталкиваются с рядом сложных проблем не решенных на теоретическом уровне. Это, например, выбор ИПЯ. При организации электронного каталога неизбежно возникает вопрос: каким ИПЯ воспользоваться для раскрытия предметного содержания документа: языком предметных рубрик, языком ключевых слов или их сочетанием?

Несмотря на принципиальные различия этих языков, практика их применения осложняется из-за нерешенных проблем. Ни в теории предметизации, ни в теории координатного индексирования нет четких рекомендаций относительно выбора таких параметров, как длина лексической единицы (слово или словосочетание), постоянство словосочетаний, прямой или инверсированный порядок приведения ЛЕ в словосочетаниях т.д. На практике это влечет за собой невозможность сравнения результатов семантической обработки документов и запросов, снижает показатели полноты и точности информационного поиска.

Проблема нормализации лексических единиц усиливается из-за того, что на практике нет средств контроля лексики, в равной мере доступных всем библиотекам. Отсутствие информационно-поискового тезауруса, который бы поддерживался в рабочем состоянии, был пригоден для пополнения и внесения изменений, причем учитывал отраслевую специфику, существенно осложняет процесс координатного индексирования, а отдельные попытки их создания не решают этих проблем.

Таким образом, определенность в подходах при решении проблем, первые шаги к координации усилий библиотек разных систем и ведомств дают надежду на более активные действия. Надо понимать, что каждая идея интеграции предусматривает необходимость строгого соблюдения стандартов. Стандарты при интеграции библиотечно-информационных ресурсов содержат правила предъявления библиографических записей и правил взаимодействия библиотек при обмене записями.

       При создании единой информационно-библиографической среды следует учитывать ряд условий, а именно:

• полная совместимость с международными форматами UNIMARC и UKRMARC на основе использования средств импорта / экспорта данных;

 • разработка технологии доступа с использованием WEB-технологий в объединенных ресурсов библиотек - участниц корпоративной системы каталогизации;

• разработка технологии доступа с использованием протокола Z39.50 к объединенным ресурсам библиотек;

 • разработка технологии пополнения объединенных ресурсов библиотек-участниц корпоративной системы каталогизации;

• создание возможности для совместной работы библиотек - участниц региональной системы с библиотекой государственного уровня;

 • вопросы обеспечения форматной и лингвистической совместимости библиографических записей партнеров.

Кроме того, необходимо решать вопросы технического обеспечения (приобретение, тестирование и установка оборудования; поддержка системы связи между участниками проекта), а также вопросы подготовки кадров в виде мероприятий по обучению разработанным новым технологиям персонала библиотек-участниц, проведения оперативного консультирования. [67, C. 32-35].

Единое ЛО сельскохозяйственных БД позволит создать единое информационное пространство отрасли. Наличие предметного рубрикатора, разработанного на основе Государственного рубрикатора научно-технической информации, который используется в отраслевых библиотеках, УДК и в дальнейшем Отраслевого тезауруса позволит улучшить качество индексирования документов, облегчит поиск в отраслевых БД.

       Согласно плану научной работы сектора и фундаментальной научной темы исследования библиотеки "Научные основы совершенствования информационно-библиотечного обеспечения аграрной отрасли" (№ гос. Регистрации 107U003106), утвержденной Экспертным советом при УААН (решение № 3 от 20.03.08 г.) ГНСХБ УААН проводит информационную научно-методическую работу с библиотеками области, организует семинары, курсы повышения квалификации по вопросам индексирования и работы с ИПЯ. В рамках этих мероприятий была разработана Инструкция "О порядке формирования предметных рубрик ЭК ДНСХБ УААН". В системе повышения квалификации работников сети все большую актуальность приобретает проблема расширения общей лингвистической (относительно информационно-поисковых языков) культуры библиотекарей, в том числе путем привлечения специалистов для проведения занятий по УДК. Это способствует профессиональному становлению библиотекаря качественно новой формации, для которого свободная ориентация в ресурсах глобальных сетей является неотъемлемым элементом профессиональной квалификации.

       Это сложная и трудоемкая работа может быть решена только коллективными усилиями. Только объединение библиотек сделает возможным создание библиотеки нового типа, которая бы соответствовала международному модельному стандарту деятельности и формировала новый взгляд общества на современное культурно-информационное учреждение.

Работники ГНСХБ надеются что библиотеки области также примут участие в разработке статей тезауруса или в отборе лексики для него. Такая кооперация поможет не только созданию единого ЛО, единого информационного пространства, не только сократит финансовые затраты библиотек на разработку собственного ЛО, но и поможет повысить уровень индексирования документов по сельскому и лесному хозяйству.

 

 



2019-12-29 140 Обсуждений (0)
С редства лингвистического обеспечения Государственной научной сельскохозяйственной библиотеки Украинской академии сельскохозяйственных наук. 0.00 из 5.00 0 оценок









Обсуждение в статье: С редства лингвистического обеспечения Государственной научной сельскохозяйственной библиотеки Украинской академии сельскохозяйственных наук.

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Организация как механизм и форма жизни коллектива: Организация не сможет достичь поставленных целей без соответствующей внутренней...
Личность ребенка как объект и субъект в образовательной технологии: В настоящее время в России идет становление новой системы образования, ориентированного на вхождение...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (140)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.008 сек.)