Файлы, их виды и организация
Файлом называется именованная совокупность данных на внешнем носителе информации. В ПК понятие файла применяется в основном к данным, хранящимся на дисках (реже на кассетной магнитной ленте), и поэтому файлы обычно отождествляют с участком (областью, полем) памяти на этих носителях информации. Данные, хранящиеся в файлах, – программы на алгоритмическом или машинном языке; исходные данные для работы программ или результаты выполнения программ; произвольные тексты; графические изображения и т. п. Понятие файла в DOS обобщается на внешние устройства и блоки компьютера (логические устройства), работающие с массивами данных: принтер, клавиатуру, дисплей, оперативную память (виртуальные диски) и т. д. Файловой системой (ФС) называется совокупность программ, обеспечивающая выполнение операций над файлами. В настоящее время в операционных системах (ОС) для ПК используются десятки файловых систем: в DOS используются FAT16, FAT32 и FAT12 для дискет (FAT – Fail Allocation Table, таблицы размещения файлов), для Windows 9x характерны FAT16 и FAT32, популярными в Windows NT и Windows 2000 является NTFS и т. д. Но наибольшее распространение получили файловые системы DOS: FAT16 и FAT32. В общем случае при программировании работы с файлами необходимо производить: - указание области ОЗУ для ввода-вывода информации файла; - чтение информации (считывания записей) из файла; - запись информации (включение записей) в файл; - создание файла (присвоение файлу имени, проверка уникальности этого имени файла, формирование его атрибутов и т. д.); - изменение атрибута файла; - открытие файла (отыскания файла на диске и перенос в ОЗУ атрибутов файла); - закрытие файла (сохранение на диске атрибутов файла для дальнейшего использования); - переименование файла; - удаление файла (ликвидация). В зависимости от версии файловой системы набор таких операций может меняться, но при этом всегда обеспечивается возможность создания и удаления файлов, а также чтение их содержимого и запись информации в них. Файловая система включает в себя также: - правила образования имен файлов и способов обращения к ним; - иерархическую систему оглавления файлов; - структуру хранения файлов на дисках; -методы доступа к содержимому файлов. Файлы могут создаваться в двух форматах: двоичном и текстовом. Текстовой файл (файл ASCII) состоит из последовательности строк переменной длины, каждая из которых является логической записью файла. Каждая строка содержит только текстовые символы и завершается маркером конца строки. Текстовым символом может быть любой символ ASCII, но в отличие от двоичных файлов последовательность символов в текстовом файле непосредственно воспринимается человеком на экране или принтере. Текстовый файл может содержать текст программы на алгоритмическом языке (ассемблер, Basic и т. д.), таблицу, исходные и результатные данные решения задач, документы, научные сообщения и т. п. Некоторые программные продукты (текстовые редакторы, системы управления базами данных и другие) создают файлы, близкие к текстовым, но содержащие дополнительные управляющие символы, а иногда часть информации и в двоичном коде. При выводе таких файлов на экран или принтер средствами DOS появляются символы редактирования и/или описания баз данных. Однако при чтении этих файлов средствами текстового редактора или СУБД, их создавших, они выводятся в удобочитаемом виде. С каждым файлом связываются: - полное имя файла; - атрибуты (характеристики) файла; - дата создания файла; - время создания файла; - длина файла. Полное имя файла в общем случае состоит из двух частей: - идентифицирующей – имени файла; - классифицирующей – расширения. Расширение, определяющее тип файла, может отсутствовать. В имени файла может быть от 1 до 8 символов в DOS и от 1 до 255 символов в современных версиях Windows. Оно является обязательным элементом и должно всегда указываться при доступе к файлу. Расширение содержит от 1 до 3 символов и отделяется от имени файла символом «.» (точка). Хотя операционная система разрешает в имени файла и расширении наличие разных символов, рекомендуется использовать буквы латинского алфавита и цифры, а имя начинать обязательно с буквы. При назначении имен файлам рекомендуется образовывать их так, чтобы они отражали смысловое содержание файла. Расширение указывает тип файла, причем некоторые из расширений являются стандартными для операционной системы, например: - EXE (EXEcutable – исполняемый) – файл-программа на машинном языке, готовая к выполнению; - COM (COMmand) – файл-программа на машинном языке, готовая к выполнению (небольшая программа); - ВАT (BATch – пачка, группа) – пакетный исполняемый командный файл; - SYS – системный файл; - BAS – файл-программа на языке BASIC; - PRG – файл-программа на языке DBase; - ASM –файл-программа на языке ассемблер; - ТХТ – текстовый файл DOS; - DOC – текстовый файл Windows; - XLS – файл электронных таблиц Excel; - ВАК– копия файла, создаваемая при перезаписи оригинала; - ARJ – архивный файл; - ZIP –архивный файл. Приведенный выше список расширений содержит наиболее часто встречающиеся расширения и является далеко не полным. В трансляторах, системных программах и пакетах прикладных программ применяются расширения, являющиеся стандартными для конкретного программного продукта. Применение стандартных расширений в именах файлов позволяет компьютеру автоматически выбирать нужную процедуру обработки файла по укороченному сигналу (например, нажатие клавиши Enter). DOS предоставляет средства для указания не одного, а сразу группы существующих на диске файлов путем задания так называемых шаблонов. Шаблоном является имя файла, в полях имени и/или расширения которого используются символы-заменители, называемые также глобальными символами. Шаблон обозначает не единственный файл, а группу существующих файлов, имена и/или расширения которых сопоставляются с данным шаблоном. Область действия шаблона ограничивается содержимым определенного каталога. DOS использует в шаблонах глобальные символы ? и *. Вопросительный знак (?) в имени файла (расширении) означает, что в данной позиции может стоять любой (но только один!) допустимый символ. В имени файла (расширении) может быть несколько вопросительных знаков. Если символ ? стоит в конце имени или расширения, то в этой позиции может быть пусто. Например: PROG?.EXE – это шаблон исполняемого файла, имя которого начинается с букв PROG и содержит в пятой позиции любой допустимый символ. Этими файлами могут быть PROG1.EXE, PROGA.EXE, PROG.EXE и т. п. Звездочка (*) в имени (расширении) файла означает, что на ее месте, начиная с этой позиции и до конца имени (расширения), могут стоять один или несколько любых допустимых символов или не быть никаких символов (пусто). В имени или расширении допускается только по одному символу *, и все символы, стоящие за ним, игнорируются. Например, *.ASM – все файлы с расширением ASM; Prog.* – все файлы с именем Prog с любым расширением; *.* – все файлы с любыми расширениями; ABC*.D? – все файлы, имена которых начинаются с ABC, а расширения начинаются с буквы D и имеют в его второй позиции любой допустимый символ, например ABCRK.DA, ABC.D1, ABC1.D. Шаблоны удобно использовать в командах DOS и при работе с программными оболочками (например, Norton Commander) для поиска, копирования, перемещения и удаления групп файлов. Управление файлами Один из видов управления файлом – доступ. Доступом называется обращение к файлу с целью чтения или записи в него информации. Файловая система поддерживает два метода доступа к записям файла: - последовательный метод доступа; - прямой (непосредственный) метод доступа. При последовательном доступе записи из файла считываются подряд, строго в порядке их расположения в файле. Поэтому, чтобы обратиться (получить доступ) к определенной записи, необходимо читать все предыдущие. При прямом доступе обеспечивается непосредственное обращение к записи по ее номеру в файле. Механизм доступа к файлу и его записям при программировании также имеет два варианта: - доступ к файлу с использованием специальной таблицы – управляющего блока файла; - доступ к файлу по идентификатору. Управляющий блок файла (FCB– file control block) содержит следующую информацию: - номер (имя) дисковода, где установлен диск с файлом; - имя файла и его расширение; - текущий номер блока в файле; - длину записи в байтах; - размер файла в байтах; - дату последней модификация файла; - относительный номер записи (текущий номер); - произвольный номер записи и т. д. Файл состоит из блоков, объединяющих по 128 записей в каждом. Относительный номер записи – это порядковый номер записи в блоке. Параметры текущий номер блока и относительный номер записи используются при последовательном доступе к записям файла. Номер записи – это параметр, объединяющий номер блока и относительный номер записи в блоке, он используется при произвольном доступе к записям файла. Важный параметр – длина записи (точнее длина логической, кажущейся записи, которая может отличаться от длины физической записи ввиду наличия различных служебных элементов в структуре записи и файла). Длина записи используется при определении числа байт, пересылаемых при обмене информацией с ОЗУ и при определении положения записи внутри блока. Блок FCB позволяет получать доступ к файлам только в текущем каталоге. Идентификатор файла – ASCIIZ (ASCII-zero)-стpoкa, идентифицирующая файл, содержит следующую информацию: - номер (логическое имя) дисковода и путь к файлу (если нужно); - имя файла и его расширение; - нулевой байт (zero-байт). Использование FGB для обращения к файлу позволяет реализовать и произвольный, и последовательный методы организации доступа, но часто оказывается довольно сложным; поэтому в версиях MS-DOS, начиная с DOS 2.0 и выше, введено обращение к файлу по идентификатору, которое чаще всего и применяется на практике, если не требуется выполнять детализированные процедуры с отдельными дорожками и секторами диска. Каждый файл и в случае использования FCB, и в случае использования ASCIIZ имеет свой набор атрибутов. Атрибуты файлов Атрибут – это набор классифицирующих файл признаков, определяющих способы его использования и права доступа к нему. ОС DOS допускает задание следующих элементов в атрибуте. à R (Read only) – файл предназначен только для чтения и не может быть ни удален, ни изменен. При попытке обновить или уничтожить такой файл системными средствами (при помощи программ DOS) будет выдано сообщение об ошибочных действиях. Атрибут устанавливается для защиты от случайного изменения или уничтожения файла. à H (Hidden) – скрытый файл, игнорируется многими командами DOS, При просмотре каталога командой DIR сведения о скрытом файле не выдаются. à S (System) – системный файл. Системные файлы обеспечивают работу внешних устройств ПК. à A (Archive) – еще не архивированный файл. Этот атрибут позволяет определить, был ли архивирован файл (архивация файла – создание его резервной копии в специальном формате). Атрибут А присваивается каждому вновь создаваемому файлу и сбрасывается (уничтожается) при архивировании файла. Файлу могут быть присвоены одновременно любые из перечисленных атрибутов или ни один из них. К группе атрибутов файла можно условно отнести пароль, обеспечивающий разграничение доступа к файлам. Защиту паролем обеспечивают DR DOS версий 5.0 и 6.0 и ОС Windows.
Популярное: Личность ребенка как объект и субъект в образовательной технологии: В настоящее время в России идет становление новой системы образования, ориентированного на вхождение... Как построить свою речь (словесное оформление):
При подготовке публичного выступления перед оратором возникает вопрос, как лучше словесно оформить свою... Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (184)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |