Мегаобучалка Главная | О нас | Обратная связь


Принципы электронного архивирования



2019-10-11 277 Обсуждений (0)
Принципы электронного архивирования 0.00 из 5.00 0 оценок




Последние исследования в области обеспечения долговременного хранения электронных документов выдвинули множество требований к электронному архивированию, но при обобщении этих требований можно выделить восемь принципов электронного архивирования:

· технологическая обработка документов («processing»)

· ясность (понятность) ЭД, т.е. совместимость

· возможность поиска ЭД

· реконструкция («восстановимость») ЭД

· «понимаемость» ЭД (средствами ЭВТ), то есть «читабельность» ЭД

· неизменяемость ЭД

· возможность проверки (контроля) ЭД

· «упаковка» (капсулирование) ЭД

Система хранения ЭД будет признана действующей, если она «работает» на основе перечисленных принципов.

Технологическая обработка ЭДуказывает на то, что только обработанные ЭВТ электронные документы (т.е. описанные по определенным правилам, имеющие, в том числе метаданные) могут быть прочитаны, правильно интерпретированы и управляемы современным компьютерным hardware и software (оболочка и программное обеспечение) и могут быть легко трансформированы (перемещены) на новую технологическую платформу (новое программное оборудование), использующую функцию импорт/экспорт в software.

Электронные документы, которые могут быть только просмотрены и отпечатаны, являются необработанными в том смысле, что изначальная функциональность программного обеспечения, ассоциирующаяся с документами, не может быть выполнена, то есть документы нельзя редактировать, копировать, частями и т.д. В документ нельзя войти без несанкционированных изменений его содержания, т.е. система не может фиксировать «вхождение» в документ, его использование и пр.

Отработанные документы можно трансформировать (транспортировать) на новую технологическую платформу, т.е. в новую модель компьютера или в новое программное обеспечение. Есть два пути выполнения такого «перевода». Первый – обратная совместимость, которая выстраивается в продуктивную линию. Второй – использование технологически независимого формата обмена данными, поддержанного несколькими производителями программного обеспечения.

Обратная совместимость является эффективным кратковременным решением, и она становиться проблематичной, когда производитель прекращает поддержку продукта или когда потребитель «перешагивает» (перескакивает) ревизующую генерацию (поколение) технических средств и желает двигаться к абсолютно иной технологической платформе.

Использование технологически независимого (или нейтрального) формата обмена данными позволяет пережить кризис даже тогда, когда устанавливается совершенно новая технологическая платформа.

Вторым принципом электронного архивирования является понимание ЭДкомпьютерами, то есть распознание ЭД. Сегодня любой компьютер может распознать поток бинарных битов из единиц и нулей, генерируемый любым другим компьютером. Однако единицы и нули потока бинарных битов не несут присущей (изначальной) ясности, которую компьютер может распознать и интерпретировать для целей обработки.

Можно использовать и хромотографический анализ потока битов (единицы и нули). Любой компьютер может распознать поток бинарных битов, включающий «сырые» сведения, находящиеся в естественном формате системы хромотографических данных. Однако этот поток бинарных битов понятен только такому программному обеспечению, которое может переводить естественный формат и «передавать» его для просмотра, печатания и переработки, нового анализа.

Возможность поиска ЭД. Электронные документы, как доказательства для будущего, должны быть доступны в течение всего времени их хранения, а, следовательно, должны обладать способностью «быть найденными». Текстовые ЭД могут храниться в директории файлов, в то время как цифровые данные хранятся в БД. Электронные документы в БД могут быть легко «найдены» по взаимосвязям, потому что функция индексирования осуществляется автоматически. Идентификация (определение) текстовых документов, особенно тех, которые были созданы текстовыми редакторами, требуют выделения терминов индексирования (т.е. терминов для создания указателей). Термины, которые учитывают документные особенности в системах документационного обеспечения управления, могут включать даты, время, автора, получателя, форму материала (текст, образ), действие, которое ведет к созданию документа, взаимосвязанные документы и период сохранения информации. Фактически, под «терминами» понимаются «точки доступа», которые должны создаваться при создании ЭД.

Возможность реконструкции ЭД. Реконструкция означает, что ЭД могут быть переданы на монитор или принтер с сохранением всех физических и логических связей, которые они имели на момент записи их на «долговечный» носители. Другими словами, возможность реконструкции ЭД ясно видна, когда они перешли от создателя к получателю. «Восстановимость» ЭД должна сохранять любые внутренние или внешние качества, которые требовались им, чтобы быть полными и эффективными во время их создания. Это означает, например, то, что если аутентичность письма или «мемо» доказывается с помощью цифровой подписи, то эта подпись должна быть сохранена, причем так долго как это потребуется.

Возможность прочтения (читабельность) ЭДопределяет факты или обстоятельства, окружающие создание, использование и поддержание ЭД, которые доступны для понимания человеку. «Понимание» ЭД не ограничивается только словами или цифрами, но включает и контекст создания и использования. Специалист по информационным технологиям Давид Блэр определил это следующим образом: «понимание» документа может быть только в его взаимосвязи с другими документами, которые вместе влияют на деятельность учреждения». Одним из ключевых моментов «читабельности» ЭД является их взаимосвязь с другими ЭД, которые частично создают контекст появления, использования, или сохранения ЭД. Архивный шифр (код), заголовок дела или его «обложка» могут определять эти взаимоотношения. Другими словами, информация, определяющая взаимоотношения является метаданными, которым должен быть обеспечен такой же уровень защиты, как и самим ЭД (это то, что Лючана Дуранти назвала архивными связями).

Вся информация о контексте создания и использования ЭД должна быть определена, идентифицирована компьютерными системами. Идентифицированная информация содержится в фактических метаданных, без которых ЭД не могут быть полностью «поняты».

Неизменность ЭДозначает, что они не подвергаются изменению, переделке, утрате или порче, как по умыслу, так и случайно после их первоначальной идентификации на долговременных носителях. Неизменяемость ЭД может рассматриваться как доказательная представительность фактов, идей и событий, которые содержатся в документах. Защищенность ЭД от изменений является вновь возникшей проблемой, потому что это связано с возможностью «легкого» внесения изменений в ЭД без разрешения и видимого доказательства таких изменений. Больше того, перевод ЭД на новые сохраняющие носители и конвертирование на новые технологические платформы приводит к порче и потере информации, как при создании дизайна, так и случайно.

Хотя сегодня неизвестен способ поддержания стопроцентной защиты от порчи, изменения или уничтожения электронных документов, есть несколько способов уменьшить риск и выявить любые произошедшие изменения. Первая линия защиты против изменения и уничтожения ЭД – это перевод их хранения из-под контроля тех, кто создавал электронные документы, в хранилища, являющиеся «третьим доверенным лицом», обязанностями которых является следование лучшей практике и защита ЭД от уничтожения, изменения или порчи (то есть перевод ЭД с временного ведомственного хранения на постоянное хранение). Такие хранилища ЭД могли бы поддерживать доступ к ЭД только в режиме прочтения (read only) после того, как ЭД переводятся (и идентифицируются) на долговременный носитель. Если последующий анализ выявит ошибку или будет использована новая техника, то будет определена копия ЭД, которая существует как новая версия.

Другой путь защиты электронных документов от изменений – это использование цифровых технологий, которые могут определить произошедшие изменения. Одним из таких способов является «цикличный избыточный контроль» – CRC (Cyclical Redundancy Checksum), который обычно используется в телекоммуникациях для гарантии свободной от ошибок передачи ЭД. Используя CRC во время обновления, конверсии или миграции ЭД можно быть уверенным, что ошибки не произойдет. С подходящим программным обеспечением результативная ценность CRC для каждого документа или массива документов может быть усилена и закреплена в образе документа или массива документов как часть исторического образа, который документирует свободную от ошибок обработку электронных документов.

Другая цифровая технология – «хэширование», то есть наложение кода (хэш-кода), который как бы закрепляет («замораживает») документ со всеми реквизитами и текстовым содержанием, гарантируя его аутентичность при воспроизведении на компьютере, поскольку все внесенные в документ изменения после хэш-кодирования будут зафиксированы, показаны и воспроизведены.

Односторонняя хэш-функция служит алгоритмом, который сжимает объект в очень маленькую запись фиксированной длины. Эта функция называется односторонней, потому что само изложение хэш-функции является необратимым: невозможно восстановить документ из хэш-дайжеста. Безразлично как много раз документ «хэширован», определяющий хэш-дайжест основного документа (оригинала) будет производиться, несмотря на отсутствие изменений. Таким образом, «второе хэширование» электронных документов (и все последующие) будут сравнивать его с первоначальным «хэшированием», что обнаружит любое изменение в ЭД.

Хотя цель состоит в гарантировании того, что электронные документы не будут изменены, фактически, это – невозможно. Как указывалось выше, существует объективная причина этому: при любой передаче ЭД с носителя на носитель происходит утрата информации, особенно если трансформация происходит через значительные промежутки времени.

«Проверяемость» ЭД(контроль за электронными документами) означает возможность определения и сохранения информации о том кто, когда, что, почему и как использовал, хранил, поддерживал. Таким образом, «проверяемость» электронных документов – это документирование всех действий, производимых с документами. Этот путь проверки (ревизии) важен для документирования процесса создания ЭД, включая цифровой временной штамп и соответствующие действия, расширяющие пригодность ЭД через обновление носителя, конверсию или миграцию. Эта информация является метаданными и должна бы сохраняться, как и электронные документы, в первую очередь это относится к той части метаданных, которые капсулированы (упакованы) в ЭД.

Упаковка (капсулирование) ЭД. В «упакованных» (капсулированных) ЭД вся информация ассоциируется с особым документом или многочисленными документами, которые включают папку электронных файлов, таких как метаданные и содержание, существующую в виде отдельной логической или физической сущности (т. е. «упакованные» документы – это ЭД, в которых содержание и метаданные прочно увязаны в одно целое).

Различие между логической и физической сущностью важно, потому что такие технические средства как связанный объект и гипертекст, по – существу, создают динамичные документы, которые могут существовать на разнообразных носителях и серверах и которые могут использоваться только при специальном программном обеспечении.

Логическая «упаковка», то есть объект связанный и закрепленный (MSWord) может поддерживаться и сохраняться на протяжении одного технологического поколения, но становится труднодостижимым через поколения.

Физическая «упаковка» интегрирует все логические компоненты ЭД в единую систему (общность). Физическая упаковка может помочь уменьшить сложность мультимедийных электронных документов. Однако она не лишена своих собственных проблем. Например, задача конвертации, скажем, графических материалов или новое программное оборудование для графики может потребовать временного интенсивного компьютерного поиска всех ЭД в «хранилище» для такого материала. Одним из путей упрощения этой проблемы является создание заменителя основной совокупности (общности), которое включает описательную информацию о различных типах информационного представления, которое может быть найдено по определению особых документов или массива.

Одна из частных форм физической «упаковки» может расширить возможности поиска и сохранность электронных документов, например, с помощью XML (Extensile Markup Language), который является наиболее технологически независимым решением, доступным сегодня для описания массива документов и любых взаимосвязанных процессов документирования или метаданных. Такое описание происходит через DTD (Document Type Definition). 

Эти восемь принципов являются множественно зависимыми так, что каждый может быть взят в расчет при дизайне стратегии электронного архивирования.



2019-10-11 277 Обсуждений (0)
Принципы электронного архивирования 0.00 из 5.00 0 оценок









Обсуждение в статье: Принципы электронного архивирования

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ...
Генезис конфликтологии как науки в древней Греции: Для уяснения предыстории конфликтологии существенное значение имеет обращение к античной...
Почему люди поддаются рекламе?: Только не надо искать ответы в качестве или количестве рекламы...



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (277)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.012 сек.)