ВИДЫ И ФОРМЫ ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ В ИНФОРМАЦИОННЫХ СИСТЕМАХ
Глава 2 Количество и качество информации УРОВНИ ПРОБЛЕМ ПЕРЕДАЧИ ИНФОРМАЦИИ При реализации информационных процессов всегда происходит перенос информации в пространстве и времени от источника информации к приемнику (получателю). При этом для передачи информации используют различные знаки или символы, например естественного или искусственного (формального) языка, позволяющие выразить ее в некоторой форме, называемой сообщением. Сообщение — форма представления информации в виде совокупности знаков (символов), используемая для передачи. Сообщение как совокупность знаков с точки зрения семиотики (от греч. semeion — знак, признак) — науки, занимающейся исследованием свойств знаков и знаковых систем, — может изучаться на трех уровнях [8]: 1) синтаксическом, где рассматриваются внутренние свойства сообщений, т. е. отношения между знаками, отражающие структуру данной знаковой системы. Внешние свойства изучают на семантическом и прагматическом уровнях; 2) семантическом, где анализируются отношения между знаками и обозначаемыми ими предметами, действиями, качествами, т. е. смысловое содержание сообщения, его отношение к источнику информации; 3) прагматическом, где рассматриваются отношения между сообщением и получателем, т. е. потребительское содержание сообщения, его отношение к получателю. Таким образом, учитывая определенную взаимосвязь проблем передачи информации с уровнями изучения знаковых систем, их разделяют на три уровня: синтаксический, семантический и прагматический. Проблемы синтаксического уровнякасаются создания теоретических основ построения информационных систем, основные показатели функционирования которых были бы близки к предельно возможным, а также совершенствования существующих систем с целью повышения эффективности их использования. Это чисто технические проблемы совершенствования методов передачи сообщений и их материальных носителей — сигналов. На этом уровне рассматривают проблемы доставки получателю сообщений как совокупности знаков, учитывая при этом тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов представления информации, надежность и точность преобразования этих кодов и т. п., полностью абстрагируясь от смыслового содержания сообщений и их целевого предназначения. На этом уровне информацию, рассматриваемую только с синтаксических позиций, обычно называют данными, так как смысловая сторона при этом не имеет значения. Современная теория информации исследует в основном проблемы именно этого уровня. Она опирается на понятие «количество информации», являющееся мерой частоты употребления знаков, которая никак не отражает ни смысла, ни важности передаваемых сообщений. В связи с этим иногда говорят, что современная теория информации находится на синтаксическом уровне. Проблемы семантического уровнясвязаны с формализацией и учетом смысла передаваемой информации, определения степени соответствия образа объекта и самого объекта. На данном уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи, формируются понятия и представления, выявляется смысл, содержание информации, осуществляется ее обобщение. Проблемы этого уровня чрезвычайно сложны, так как смысловое содержание информации больше зависит от получателя, чем от семантики сообщения, представленного на каком-либо языке. На прагматическом уровне интересуют последствия от получения и использования данной информации потребителем. Проблемы этого уровня связаны с определением ценности и полезности использования информации при выработке потребителем решения для достижения своей цели. Основная сложность здесь состоит в том, что ценность, полезность информации может быть совершенно различной для различных получателей и, кроме того, она зависит от ряда факторов, таких, например, как своевременность ее доставки и использования. Высокие требования в отношении скорости доставки информации часто диктуются тем, что управляющие воздействия должны осуществляться в реальном масштабе времени, т. е. со скоростью изменения состояния управляемых объектов или процессов. Задержки в доставке или использовании информации могут иметь катастрофические последствия. МЕРЫ ИНФОРМАЦИИ Для каждого из рассмотренных выше уровней проблем передачи информации существуют свои подходы к измерению количества информации и свои меры информации. Различают соответственно меры информации синтаксического уровня, семантического уровня и прагматического уровня. КАЧЕСТВО ИНФОРМАЦИИ Эффективность применения и качество функционирования :юбых систем в значительной степени определяется качеством информации, на основе которой принимаются управляющие решения. Составляющие качества информации отражены на рис. 2.3. Качество информации — совокупность свойств информации, характеризующих степень ее соответствия потребностям (целям, ценностям) пользователей (средств автоматизации, персонала и др.). Выделяют внутреннее качество — содержательность (присущее собственно информации и сохраняющееся при ее переносе в другую систему) и внешнее — защищенность (присущее информации, находящейся или используемой только в определенной системе) [16]. Рис. 2.3. Составляющие качества информации Содержательность информации— совокупность сведений о конкретном объекте (системе) или процессе, содержащаяся в сообщениях и воспринимаемая получателем. Содержательность отражает семантическую емкость информации в информационных массивах (ИМ) (массивах данных, массивах программ, сообщениях, фактах). Содержательная информация используется, как правило, для выработки и принятия управляющего воздействия. Содержательность информации определяется такими свойствами, как значимость и кумулятивность. Значимость информации— свойство информации сохранять ценность для потребителя с течением времени, т. е. не подвергаться моральному старению. Составляющими значимости являются полнота и идентичность. Полнота информации — свойство содержательной информации, характеризуемое мерой ее достаточности для решения определенных задач. Полнота (достаточность) информации означает, что она обеспечивает принятие правильного (оптимального) решения. Из этого следует, что данное свойство является относительным: полнота информации оценивается относительно вполне определенной задачи или группы задач. Поэтому, чтобы иметь возможность определить показатель полноты информации, необходимо для каждой существенно значимой задачи или группы задач иметь перечень тех сведений, которые требуются для их решения. Как неполная, т. е. недостаточная для принятия правильного решения, так и избыточная информации снижают эффективность принимаемых пользова-м решений. Идентичность — свойство, заключающееся в соответствии содержательной информации состоянию объекта. Нарушение идентичности связано с техническим (по рассогласованию признаков) старением информации, при котором происходит расхождение реальных признаков объектов и тех же признаков, отображенных в информации. Обычно закон старения информации представляют в виде рис. 2.4. На рис. 2.4 tQ обозначает момент времени генерирования (получения) оцениваемой информации, при этом коэффициент К, характеризующий идентичность информации, равен 1. Закон старения информации определяется четырьмя характерными интервалами: Att— продолжительностью времени, в течение которого оцениваемая информация полностью сохраняет свою идентичность; At2 — продолжительностью времени, в течение которого идентичность информации падает, но не более чем на одну четверть; At3 — продолжительностью времени, в течение которого идентичность информации падает наполовину; Дг4 — продолжительностью времени, в течение которого идентичность информации падает на три четверти. Кумулятивность информации— свойство содержательной информации, заключенной в массиве небольшого объема, достаточно полно отображать действительность. Задачу обеспечения кумулятивности информации можно решать без учета и с учетом опыта и квалификации конкретного потребителя информации, применяя соответственно формально-технические исоциально-психологические приемы. К числу формально-технических приемов относится, например, агрегирование — получение сводных показателей различного уровня обобщения или выбор отдельных показателей из массивов исходных данных. Эти и другие формальные приемы направлены на построение моделей типа «многое в одном», когда действительность отображается с помощью малого числа символов. Такие модели называются гомоморфными, а соответствующее свойство — гомоморфизмом информации. Это формально-техническая составляющая кумулятивности информации. Гомоморфизм информации — свойство содержательной информации, связанное с достаточно полным отображением действительности, представленной информационными массивами большого объема, с помощью малого числа информационных единиц (символов) на основе соответствующих моделей агрегирования. Информационное обеспечение конкретного потребителя может осуществляться с учетом его опыта, квалификации и других свойств, а также с учетом решаемых им задач. Информация, специально отобранная для конкретного потребителя, обладает определенным свойством — избирательностью. Это социально-психологическая составляющая свойства кумулятивности. Избирательность информации — свойство содержательной информации, заключающееся в достаточно полном отображении действительности, представленной информационными массивами -'•:льшого объема, с помощью малого числа информационных единиц (символов) на основе учета квалификации, опыта и других ка-[ честв конкретного потребителя. Защищенность отражает внешнее качество информации, определяемое совокупностью свойств информации, обеспечиваемых системой контроля и защиты информации (КЗИ) в конкретной информационной системе. Основными из них являются свойства, заключающиеся в способности не допускать случайного или целена-— явленного искажения или разрушения, раскрытия или модификации информационных массивов, соответственно достоверность, конфиденциальность и сохранность информации. При переносе ин-г-:рмации в другую систему (среду) эти свойства исчезают. Достоверность информации — свойство информации, характеризуемое степенью соответствия (в пределах заданной точности) реальных информационных единиц (символов, знаков, записей, сообщений, информационных массивов и т. д.) их истинному значению и определяемое способностью КЗИ обеспечить отсутствие осибок переработки информации, искажений информационных пассивов, их смыслового значения, замены символов из-за несовершенства организации (структуры) процесса переработки, несовершенства алгоритмов, ненадежной работы аппаратно-программных средств, ошибок пользователей и т. д. Требуемый уровень достоверности информации достигается жутем внедрения методов контроля и защиты информации на всех _:иях ее переработки, повышением надежности комплекса технических и программных средств информационной системы, а также административно-организационными мерами (моральным и материальным стимулированием, направленным на снижение числа ошибок, улучшением условий труда персонала и др.). Критериями оптимальности при этом, как правило, являются: ■ минимизация вероятности искажения единичного массива информации; ■ максимизация достоверности переработки информации как некоторой функции вероятности ошибки; ■ минимизация времени переработки ИМ и материальных затрат при ограничении на достоверность;
• минимизация суммарного среднего времени на обработку, контроль и исправление ИМ; • минимизация суммарных потерь с учетом затрат на разработку и функционирование структур контроля, исправление ошибок и на потери в информационной системе (ИС) при использовании недостоверной информации и т. п. Конфиденциальность информации— свойство информации, позволяющее сохранять предоставленный ей статус. Конфиденциальность информации характеризуется такими показателями, как доступность, скрытность и имитостойкость информации. Доступность информации характеризуется степенью разграничения действий объектов информационной системы (операторов, задач, устройств, программ, подсистем и др.) и заключается в возможности использования ИМ по требованию объектов системы, имеющих соответствующие полномочия (мандаты). Скрытность информации характеризуется степенью маскировки информации и отражает ее способность противостоять раскрытию смысла ИМ (семантическая скрытность на основе обратимых преобразований информации), определению структуры хранимого ИМ или носителя (сигнала-переносчика) передаваемого ИМ (структурная скрытность на основе необратимых преобразований, использования спецаппаратуры, различных форм сигналов-переносчиков, видов модуляции и др.) и установлению факта передачи ИМ по каналам связи (энергетическая скрытность на основе применения широкополосных сигналов-переносчиков ИМ, маскирование закрытой информации в открытых ИМ (стенография) и др.). Имитостойкость информации определяется степенью ее защищенности от внедрения ИМ, имитирующих авторизованные (зарегистрированные) массивы, и заключается в способности не допустить навязывания дезинформации и нарушения нормального функционирования информационной системы. Требуемый уровень конфиденциальности ИМ достигается путем дополнительных преобразований (семантических, криптографических и др.) информации, контроля полномочий программно-технических средств, ресурсов ИС и лиц (операторов, персонала, пользователей и др.), взаимодействующих со средствами автоматизации и разграничения доступа к ИМ. Критериями оптимальности при этом, как правило, являются: ■ минимизация вероятности преодоления («взлома») защиты; подсистемы защиты; ■ минимизация суммарных затрат (интеллектуальных, финан ■ минимизация суммарных потерь от «взлома» защиты и за Сохранность информации — свойство информации, характери-иемое степенью готовности определенных ИМ к целевому приведению и определяемое способностью КЗИ обеспечить постоян-юе наличие и своевременное предоставление ИМ, необходимых си автоматизированного решения целевых и функциональных аыач системы, т. е. не допускать разрушения ИМ из-за несовершенства носителей, механических повреждений, неправильной экс-щии, износа и старения аппаратных средств, ошибок перевала и несанкционированных корректировок, недостатков в хеюграммных средствах и т. д. Основными показателями сохран-■остн являются целостность и готовность информации. Целостность информации характеризуется степенью аутентично-к (подлинности) ИМ в информационной базе и исходных до-[тментах (сообщениях) и определяется способностью КЗИ обеспе-•:асколько это возможно, физическое наличие информационных ■виц в информационной базе в любой момент времени, т. е. не дометить случайных искажений и разрушения ИМ из-за дефектов и ■боев аппаратных средств, действия «компьютерных вирусов», оши-Еок оператора (при вводе информации в информационную базу или ирашении к ней), ошибок в программных средствах (операционных ■стемах, СУБД, комплексах прикладных программ и др.). Готовность информации характеризуется степенью работоспо-»ности ИМ при выполнении целевых и функциональных задач зкгтемы и определяется возможностью КЗИ обеспечить своевременное предоставление необходимых неразрушенных ИМ. Необходимый уровень сохранности ИМ достигается путем введения специальной организации хранения и подготовки, регенера-■га и восстановления ИМ, использования дополнительных ресур-вов для их резервирования, что позволяет значительно уменьшить дние разрушающих факторов на эффективность функционировала ИС в целом. Основными критериями оптимальности при этом являются: ■ максимизация вероятности успешного решения определен ■ максимизация вероятности восстановления ИМ; ■ минимизация среднего времени решения задачи системы; ■ минимизация среднего времени восстановления ИМ; ■ максимизация вероятности сохранности ИМ за фиксированный интервал времени их эксплуатации; ■ минимизация стоимостных затрат на дополнительные носители информации для размещения резервных ИМ, потерь от разрушения ИМ и т. п. ВИДЫ И ФОРМЫ ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ В ИНФОРМАЦИОННЫХ СИСТЕМАХ Все многообразие окружающей нас информации можно классифицировать по различным признакам. Так, по признаку «область возникновения» информацию, отражающую процессы, явления неодушевленной природы, называют элементарной или механической, процессы животного и растительного мира — биологической, человеческого общества — социальной. Информацию, создаваемую и используемую человеком, по общественному назначению можно разбить на три вида: личная, массовая и специальная. Личная информация предназначается для конкретного человека, массовая — для любого желающего ею пользоваться (общественно-политическая, научно-популярная и т. д.), а специальная — для применения узким кругом лиц, занимающихся решением сложных специальных задач в области науки, техники, экономики и т. п. Информация может быть объективной и субъективной. Объективная информация отражает явления природы и человеческого общества. Субъективная информация создается людьми и отражает их взгляд на объективные явления. В автоматизированных информационных системах выделяют: ■ структурную (преобразующую) информацию объектов системы, заключенную в структурах системы, ее элементов управления, алгоритмов и программ переработки информации; ■ содержательную (специальную, главным образом осведомляющую, измерительную и управляющую, а также научно-техническую, технологическую и др.) информацию, извлекаемую из информационных массивов (сообщений, команд и т. п.) относительно индивидуальной модели предметной области получателя (человека, подсистемы). Первая связана с качеством информационных процессов в системе, с внутренними технологическими эффектами, затратами на переработку информации. Вторая — как правило, с внешним целевым (материальным) эффектом. Один из возможных вариантов классификации информации в автоматизированных системах представлен на рис. 2.5. При реализации информационных процессов передача информации (сообщения) от источника к приемнику может осуществляться с помощью какого-либо материального носителя (бумаги, магнитной ленты и т. п.) или физического процесса (звуковых или электромагнитных волн). В зависимости от типа носителя различают следующие виды информации (рис. 2.6): ■ документальную; ■ акустическую (речевую); ■ телекоммуникационную. Документальнаяинформация представляется в графическом или буквенно-цифровом виде на бумаге, а также в электронном виде на магнитных и других носителях. Речевая информациявозникает в ходе ведения разговоров, а также при работе систем звукоусиления и звуковоспроизведения. Носителем речевой информации являются акустические колебания (механические колебания частиц упругой среды, распространяющиеся от источника колебаний в окружающее пространство в виде волн различной длины) в диапазоне частот от 200...300 Гц до 4...6 кГц. Телекоммуникационная информацияциркулирует в технических средствах обработки и хранения информации, а также в каналах связи при ее передаче. Носителем информации при ее обработке техническими средствами и передаче по проводным каналам . связи является электрический ток, а при передаче по радио- и оптическому каналам — электромагнитные волны. Источник информации может вырабатывать непрерывное сообщение (сигнал), в этом случае информация называется непрерывной, или дискретное — информация называется дискретной. Например, сигналы, передаваемые по радио и телевидению, а также используемые в магнитной записи, имеют форму непрерывных, быстро изменяющихся во времени зависимостей. Такие сигналы называются непрерывными, или аналоговыми, сигналами. В противоположность этому в телеграфии и вычислительной технике сигналы имеют импульсную форму и называются дискретными сигналами.
Рис. 2.6. Классификация информации в зависимости от типа носителя Непрерывная и дискретная формы представления информации имеют особое значение при рассмотрении вопросов создания, хранения, передачи и обработки информации с помощью средств вычислительной техники. В настоящее время во всех вычислительных машинах информация представляется с помощью электрических сигналов. При этом возможны две формы представления численного значения какой-либо переменной, например X: ■ в виде одного сигнала — например, электрического напряжения, которое сравнимо с величиной X (аналогично ей). Например, при X ш 2003 единицам на вход вычислительного устройства можно подать напряжение 2,003 В (масштаб представления 0,001 В/ед.) или 10,015 В (масштаб представления 0,005 В/ед.); ■ в виде нескольких сигналов — нескольких импульсов напряжений, которые сравнимы с числом единиц в X, числом десятков в X, числом сотен вХит.д. (например, при X, равном 1995 единицам, на вход вычислительного устройства можно подать четыре импульса напряжением 1 В, 9 В и 5 В). Первая форма представления информации (с помощью сходной величины — аналога) называется аналоговой, или непрерывной. Величины, представленные в такой форме, могут принимать принципиально любые значения в определенном диапазоне. Количество значе- ний. которые может принимать такая величина, бесконечно велико. Отсюда названия — непрерывная величина и непрерывная информация.Слово «непрерывность» отчетливо выделяет основное свойство таких величин — отсутствие разрывов, промежутков между значени-l которые может принимать данная аналоговая величина. Вторая форма представления информации называется дискрет-[ (с помощью набора напряжений, каждое из которых соответ-езует одной из цифр представляемой величины). Такие величи-■. принимающие не все возможные, а лишь вполне определенные нпения, называются дискретными (прерывистыми). В отличие от ■ярерывной величины количество значений дискретной величием эсегда будет конечным. Сравнивая непрерывную и дискретную формы представления формации, нетрудно заметить, что при использовании непрерыв- i формы для создания вычислительной машины потребуется мень- вее число устройств (каждая величина представляется одним, а не восолькими сигналами), но эти устройства будут сложнее (они дол- ; различать значительно большее число состояний сигнала). Непрерывная форма представления используется в аналоговых ■иислительных машинах (АВМ). Эти машины предназначены в поеном для решения задач, описываемых системами дифферен- ■шльных уравнений: исследования поведения подвижных объектов, вделирования процессов и систем, решения задач параметриче- ё оптимизации и оптимального управления. Устройства для работки непрерывных сигналов обладают более высоким быстро- яствием, они могут интегрировать сигнал, выполнять любое его ршюшональное преобразование и т. п. Однако из-за сложности тех- иеской реализации устройств выполнения логических операций с прерывными сигналами, длительного хранения таких сигналов, их чиого измерения АВМ не могут эффективно решать задачи, свя- :ъ!е с хранением и обработкой больших объемов информации, ко- ■фые легко решаются при использовании цифровой (дискретной) рормы представления информации, реализуемой цифровыми элек- гфовными вычислительными машинами (ЭВМ). С>.^рольные вопросы и задания =z^^=zz^=z=iz= . Какие уровни проблем передачи информации Вы знаете? 2- Назовите меры информации синтаксического уровня. Охарактеризуйте сущность понятия энтропии. 4. Как связаны между собой понятия количества информации и энтропии? 5. Что определяет термин «бит»? Приведите примеры сообщений, содержащих один (два, восемь) бит информации. 6. Запишите формулы Хартли и Шеннона. При каком условии формула Шеннона переходит в формулу Хартли? 7. Что такое абстрактный алфавит? 8. Дайте определение избыточности алфавита источника сообщений. 9. Какие меры информации семантического уровня Вы знаете?
10.Что такое тезаурус? 11.Какие меры информации прагматического уровня Вы знаете? 12.Дайте определение дезинформации. 13.Что такое качество информации? 14.Назовите основные составляющие качества информации. 15.Как Вы понимаете защищенность и содержательность информации? 16.Чем достигается требуемый уровень защищенности информации? 17.Назовите основные классификационные признаки информации. 18.Какие виды и формы представления информации в информационных системах Вы знаете? 19.Назовите особенности непрерывной и дискретной форм представления информации.
Популярное: Как построить свою речь (словесное оформление):
При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою... Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (2173)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |