Структура и обработка данных
Единицы представления, измерения и Структура данных
абота с большими наборами данных проще, если они образуют упорядоченную структуру. Существуют три основных типа структур данных: линейная, табличная и иерархическая. Они различаются методом адресации к данным. Линейные структуры данных (списки) – это упорядоченные структуры, в которых адрес каждого элемента однозначно определяется своим номером в списке. Разделителем между элементами списка может быть конец строки, пробел или какой-либо другой специальный символ. Примером линейной структуры данных может служить список студентов в журнале посещаемости занятий. Если все элементы списка имеют одинаковую длину, то разделители вообще не нужны. Такие упрощенные списки называются векторами данных. Работать с ними особенно удобно. Табличные структуры данных – это упорядоченные структуры, в которых адрес элемента определяется номером строки и номером столбца, на пересечении которых находится ячейка, содержащая этот элемент. Примером может служить таблица умножения. Если все элементы имеют равную длину, то такие таблицы называются матрицами. В этом случае разделители можно не использовать. Если число измерений в таблице больше двух, то такая таблица называется многомерной. Приведем пример таблицы с размерностью, равной четырем.
С помощью такой таблицы может быть организован учет студентов. Для отыскания данных о студенте в подобной структуре надо знать все четыре параметра. Иерархические структуры данных – это структуры в виде дерева, в котором адрес каждого элемента определяется указанием пути (маршрута), ведущим от вершины структуры к данному элементу. Вот, например, как выглядит путь к команде, запускающей программу Калькулятор. Пуск®Все программы®Стандартные®Калькулятор Файловые структуры данных – это иерархические структуры хранения файлов на диске в специальных областях памяти, называемых каталогами (или папками). В отдельном файле хранятся данные одного типа. Уникальность имени файла обеспечивается тем, что полное имя файла (полный адрес) включает в себя собственное имя файла и путь доступа к нему. Например, следующие два файла имеют одно и то же собственное имя (выделено курсивом), но отличаются полными именами, так как имеют разные пути доступа. D:\Мои документы\Группа 251\Статистика\Гистограммы.xls D:\Мои документы\Excel 253\Гистограммы.xls Обработка данных
бработка данных включает в себя множество различных процедур, полный список которых составить практически невозможно. К числу основных можно отнести следующие процедуры. Сбор данных – накопление информации с целью обеспечения достаточной полноты для принятия решений. Формализация данных – приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить уровень их доступности. Преобразование данных – перевод данных из одной формы или структуры в другую форму или структуру соответственно. Необходимость преобразования данных, например, возникает при транспортировке цифровых потоков данных по каналам телефонной сети, которые изначально ориентированы на передачу аналоговых сигналов. Для преобразования цифровых данных в аналоговые сигналы используются специальные устройства – модемы. Фильтрация данных – отсеивание «лишних» данных. При этом уменьшается «уровень шума», а достоверность и адекватность данных возрастает. Сортировка данных – упорядочение данных с целью повышения доступности информации. Архивация данных – специальная организация хранения данных. Служит для снижения затрат на хранение данных и повышает надежность информационного процесса. Защита данных – комплекс мер, предназначенных на предотвращение потери данных, их воспроизведения и модификации. Транспортировка данных – прием и передача данных между удаленными участниками информационного процесса. При этом источник данных в информатике принято называть сервером, а потребителя – клиентом. Задачи по обработке данных предполагают способы описания процесса обработки. Процедуры обработки представляются как на внешнем уровне в виде алгоритма, так и на внутреннем в виде программы, которая кодируется средствами машинного языка. Единицы представления, измерения и
пособы представления данных зависят от того, для кого эти данные предназначены: для человека (внешнее представление) или для ЭВМ (внутреннее представление). Во внешнем представлении все данные хранятся в виде файлов. Более высоким уровнем организации данных на внешнем уровне являются базы данных. Для внутреннего представления данных разных типов используется универсальная система двоичного кодирования. Исходя из этого, приняты следующие единицы представления, измерения и хранения данных. Единицы представления данных. Минимальной единицей представления данных в вычислительной технике считается бит. Более крупной единицей является совокупность из восьми битов, которая называется байтом. Во многих случаях целесообразно не восьмиразрядное кодирование, а 16-разрядное, 24-разрядное, 32-разрядное и более. Слово – группа из двух взаимосвязанных байтов (16 разрядов). Удвоенное слово – группа из четырех взаимосвязанных байтов (32 разряда). Учетверенное слово – группа из восьми взаимосвязанных байтов (64 разряда). Пока, на сегодняшний день такой системы обозначений достаточно. Единицы измерения данных. Наименьшей единицей измерения данных принят байт. 1 байт состоит из 8 бит 1 Кбайт = 1024 байт (210 байт=213бит); 1 Мбайт = 1024 Кбайт (220 байт=223бит); 1 Гбайт = 1024 Мбайт (230 байт=233бит); 1 Тбайт = 1024 Гбайт (240 байт=243бит). В килобайтах измеряются относительно небольшие объемы данных. Условно можно считать, что если на одной странице машинописного текста помещается в среднем 2500 знаков (около 2 Кбайт), то 1 Мбайт – это примерно 400 страниц, а 1 Гбайт – 400 тысяч страниц. Единицы хранения данных. При хранении данных в компьютере решаются две проблемы: как сохранить данные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ. В настоящее время в качестве единицы хранения данных принят файл. Все данные на компьютере записываются в виде файлов или наборов файлов. Файл — это объект переменной длины, хранящийся на машинном носителе (магнитные или оптические диски) и обладающий уникальным именем. Файл представляет собой последовательность произвольного числа байтов. В отдельном файле хранятся однотипные данные. В определении файла особое внимание уделяется имени, так как в полном имени файла указаны адресные данные (путь), обеспечивающие доступ к файлу, и задан тип данных. Тесты
Популярное: Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас... Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы... Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние... Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (1089)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |