Файлы, их виды и организация
Файлом называется именованная совокупность данных на внешнем носителе информации. В ПК понятие файла применяется в основном к данным, хранящимся на дисках (реже на кассетной магнитной ленте), и поэтому файлы обычно отождествляют с участком (областью, полем) памяти на этих носителях информации.
Данные, хранящиеся в файлах, – программы на алгоритмическом или машинном языке; исходные данные для работы программ или результаты выполнения программ; произвольные тексты; графические изображения и т. п. Понятие файла в DOS обобщается на внешние устройства и блоки компьютера (логические устройства), работающие с массивами данных: принтер, клавиатуру, дисплей, оперативную память (виртуальные диски) и т. д.
Файловой системой (ФС) называется совокупность программ, обеспечивающая выполнение операций над файлами. В настоящее время в операционных системах (ОС) для ПК используются десятки файловых систем: в DOS используются FAT16, FAT32 и FAT12 для дискет (FAT – Fail Allocation Table, таблицы размещения файлов), для Windows 9x характерны FAT16 и FAT32, популярными в Windows NT и Windows 2000 является NTFS и т. д. Но наибольшее распространение получили файловые системы DOS: FAT16 и FAT32.
В общем случае при программировании работы с файлами необходимо производить:
- указание области ОЗУ для ввода-вывода информации файла;
- чтение информации (считывания записей) из файла;
- запись информации (включение записей) в файл;
- создание файла (присвоение файлу имени, проверка уникальности этого имени файла, формирование его атрибутов и т. д.);
- изменение атрибута файла;
- открытие файла (отыскания файла на диске и перенос в ОЗУ атрибутов файла);
- закрытие файла (сохранение на диске атрибутов файла для дальнейшего использования);
- переименование файла;
- удаление файла (ликвидация).
В зависимости от версии файловой системы набор таких операций может меняться, но при этом всегда обеспечивается возможность создания и удаления файлов, а также чтение их содержимого и запись информации в них. Файловая система включает в себя также:
- правила образования имен файлов и способов обращения к ним;
- иерархическую систему оглавления файлов;
- структуру хранения файлов на дисках;
-методы доступа к содержимому файлов.
Файлы могут создаваться в двух форматах: двоичном и текстовом.
Двоичный файл состоит из последовательности байтов, обычно сгруппированных в логические записи фиксированной длины. В двоичных файлах хранятся исполняемые программы и данные во внутреннем (двоичном, кодовом) представлении, Файлы с исполняемыми программами при их запуске на выполнение должны иметь определенную структуру. При выводе двоичного файла на дисплей или принтер прочесть его содержимое невозможно, так как при этом считываемые 8-разрядные двоичные коды (байты) переводятся в произвольные графические символы, звуковые сигналы или вообще не воспринимаются, если данный код не имеет графического представления и никак на устройство не действует.
Текстовой файл (файл ASCII) состоит из последовательности строк переменной длины, каждая из которых является логической записью файла. Каждая строка содержит только текстовые символы и завершается маркером конца строки. Текстовым символом может быть любой символ ASCII, но в отличие от двоичных файлов последовательность символов в текстовом файле непосредственно воспринимается человеком на экране или принтере. Текстовый файл может содержать текст программы на алгоритмическом языке (ассемблер, Basic и т. д.), таблицу, исходные и результатные данные решения задач, документы, научные сообщения и т. п.
Некоторые программные продукты (текстовые редакторы, системы управления базами данных и другие) создают файлы, близкие к текстовым, но содержащие дополнительные управляющие символы, а иногда часть информации и в двоичном коде. При выводе таких файлов на экран или принтер средствами DOS появляются символы редактирования и/или описания баз данных. Однако при чтении этих файлов средствами текстового редактора или СУБД, их создавших, они выводятся в удобочитаемом виде.
С каждым файлом связываются:
- полное имя файла;
- атрибуты (характеристики) файла;
- дата создания файла;
- время создания файла;
- длина файла.
Полное имя файла в общем случае состоит из двух частей:
- идентифицирующей – имени файла;
- классифицирующей – расширения.
Расширение, определяющее тип файла, может отсутствовать.
В имени файла может быть от 1 до 8 символов в DOS и от 1 до 255 символов в современных версиях Windows. Оно является обязательным элементом и должно всегда указываться при доступе к файлу. Расширение содержит от 1 до 3 символов и отделяется от имени файла символом «.» (точка). Хотя операционная система разрешает в имени файла и расширении наличие разных символов, рекомендуется использовать буквы латинского алфавита и цифры, а имя начинать обязательно с буквы. При назначении имен файлам рекомендуется образовывать их так, чтобы они отражали смысловое содержание файла. Расширение указывает тип файла, причем некоторые из расширений являются стандартными для операционной системы, например:
- EXE (EXEcutable – исполняемый) – файл-программа на машинном языке, готовая к выполнению;
- COM (COMmand) – файл-программа на машинном языке, готовая к выполнению (небольшая программа);
- ВАT (BATch – пачка, группа) – пакетный исполняемый командный файл;
- SYS – системный файл;
- BAS – файл-программа на языке BASIC;
- PRG – файл-программа на языке DBase;
- ASM –файл-программа на языке ассемблер;
- ТХТ – текстовый файл DOS;
- DOC – текстовый файл Windows;
- XLS – файл электронных таблиц Excel;
- ВАК– копия файла, создаваемая при перезаписи оригинала;
- ARJ – архивный файл;
- ZIP –архивный файл.
Приведенный выше список расширений содержит наиболее часто встречающиеся расширения и является далеко не полным. В трансляторах, системных программах и пакетах прикладных программ применяются расширения, являющиеся стандартными для конкретного программного продукта. Применение стандартных расширений в именах файлов позволяет компьютеру автоматически выбирать нужную процедуру обработки файла по укороченному сигналу (например, нажатие клавиши Enter).
DOS предоставляет средства для указания не одного, а сразу группы существующих на диске файлов путем задания так называемых шаблонов. Шаблоном является имя файла, в полях имени и/или расширения которого используются символы-заменители, называемые также глобальными символами. Шаблон обозначает не единственный файл, а группу существующих файлов, имена и/или расширения которых сопоставляются с данным шаблоном. Область действия шаблона ограничивается содержимым определенного каталога.
DOS использует в шаблонах глобальные символы ? и *. Вопросительный знак (?) в имени файла (расширении) означает, что в данной позиции может стоять любой (но только один!) допустимый символ. В имени файла (расширении) может быть несколько вопросительных знаков. Если символ ? стоит в конце имени или расширения, то в этой позиции может быть пусто. Например: PROG?.EXE – это шаблон исполняемого файла, имя которого начинается с букв PROG и содержит в пятой позиции любой допустимый символ. Этими файлами могут быть PROG1.EXE, PROGA.EXE, PROG.EXE и т. п. Звездочка (*) в имени (расширении) файла означает, что на ее месте, начиная с этой позиции и до конца имени (расширения), могут стоять один или несколько любых допустимых символов или не быть никаких символов (пусто). В имени или расширении допускается только по одному символу *, и все символы, стоящие за ним, игнорируются.
Например, *.ASM – все файлы с расширением ASM; Prog.* – все файлы с именем Prog с любым расширением; *.* – все файлы с любыми расширениями; ABC*.D? – все файлы, имена которых начинаются с ABC, а расширения начинаются с буквы D и имеют в его второй позиции любой допустимый символ, например ABCRK.DA, ABC.D1, ABC1.D.
Шаблоны удобно использовать в командах DOS и при работе с программными оболочками (например, Norton Commander) для поиска, копирования, перемещения и удаления групп файлов.
Дата добавления: 2015-08-08; просмотров: 919;