Форматы файлов таблица. Типы файла и их расширения. Форматы текстовых файлов

При загрузке файлов из Интернета, нам встречаются файлы различных форматов и расширений. Чтобы определить формат (тип) файла, просто посмотрите на его расширение, которое обычно состоит из точки (.) за которой следуют от 2 до 4 букв (.xxx). Для чего необходимо знать формат файла? Это знание облегчает определение программы с помощью которой можно открыть, запустить, распаковать или просмотреть конкретный файл.

В настоящее время многие сайты предоставляют файлы, предназначенные для операционных систем Windows, Android и Macintosh (Mac). Ваш браузер в состоянии определить и открыть некоторые из них, но не все, тем более, что новые форматы появляются регулярно. На практике нет необходимости знать все существующие форматы файлов, поскольку львиная доля из них приходятся на системные файлы операционных систем и программ. Достаточно знать наиболее распространенные форматы файлов, которые приведем ниже в виде таблицы расширения файлов.

Большинство форматов это текстовые, графические, аудио или видео файлы. Они могут быть сжатыми (заархивированными). Наиболее распространенными архиваторами являются файлы .zip , .rar , .tar . Эти расширения файлов программ архиваторов для операционных систем Windowa, Macintosh и UNIX. Архиватор может упаковать в единый файл архива как один одиночный файл, так и целую группу файлов. Архив может содержать видео или графические файлы. Довольно часто программное обеспечение, а также и документацию на него помещают в файл архива. Иногда вы можете встретить файлы с разными расширениями, например, tar.gz , это означает, что несколько видов программного обеспечения были применены для сбора и сжатия файла.

Наиболее распространенными форматами графических файлов в интернете являются файлы с расширениями .jpg и .gif . Расширение.jpg относится к файлам JPEG — стандарт сжатия, применяемый для фотографий и прочих изображений. Расширение .gif — это сокращение от слов Graphics Interchange Format (Формат для обмена изображениями) — стандарт, разработанный CompuServe в конце 80-х годов. Эти форматы являются независимыми от используемой платформы. Другими словами, вы можете использовать их на Windows, Macintosh или рабочей станции UNIX.

Для видеофайлов, наиболее распространенными расширениями являются .avi , .mpg (сокращенное от MPEG), которые не зависят от используемой платформы, но требует своего собственного плеера, а так же .mov и .qt для фильмов QuickTime. Первоначально QuickTime был разработан только для Macintosh, но сегодня он также работает на Windows, и UNIX.

В настоящее время, наиболее распространенным форматом среди звуковых файлов является.MP3, подходящий как для Mac, так и PC. Есть и другие форматы аудио файлов: .aiff для Mac , .au для Mac и UNIX, .wav для Windows . А так же .ra для Real Audio — фирменная платформа, которая позволяет воспроизводить музыку в режиме потокового вещания через интернет.

Все форматы файлов, которые находятся в Интернете, могут быть классифицированы на два типа: формат ASCII и формат Binary (двоичный формат). ASCII файлы — это текстовые файлы, которые можно просмотреть с помощью редактора DOS или текстового редактора. Двоичные файлы содержат символы, отличные от ASCII. При просмотре двоичного файла, вы увидите только странные символы и знаки.

Описание самых распространенных форматов файлов

Ниже приводятся форматы файлов, их краткое описание и какими программами они открываются.

Графические файлы

Расширение файла

Описание

Чем открыть

.gif

Наиболее распространенный в Интернете графический формат файла. Gif означает (Graphics Interchange Format).

В операционной системе Windows уже встроен просмотрщик GIF файлов. Просто кликните дважды на имени файла с расширением.gif. Так же можно посоветовать для открытия и редактирования следующие программы: CorelDRAW, Photoshop.
.jpg и.jpeg

Текущий стандарт сжатия используется для фотографий и статичных изображений.

Программы Adobe Photoshop CS6, Corel PaintShop Pro X4, Roxio Creator 2012
.tiff

TIFF (Tagged Image File Format) — формат растрового изображения с очень высоким разрешением.

Большинство графических редакторов способны открыть файл с расширением.tiff. К примеру, Photoshop, GIMP.

Звуковые файлы

Расширение файла

Описание

Чем открыть

.mp3 Файл MP3 – самый распространенный формат для потоковой передачи музыки с качеством CD. Приблизительно одна минута музыки по объему равняется 1 МБ Для воспроизведения необходим MP3 файла необходим плеер, например, AIMP3
.wav Наиболее распространенный звуковой формат. Это собственный аудио формат операционной системы Windows. данный формат характеризуется высоким качеством воспроизведения, поскольку он не сжат. Воспроизвести можно при помощи встроенного проигрывателя, либо программой WindowsPlayer. Для конвертации wav в mp3 можно использовать программу Movavi Video Converter
.ra Фирменное название формата — RealAudio. Данный формат р азработан компанией RealNetworks. RealAudio позволяет воспроизводить звуки в реальном времени. Этот тип файла требует плеер Real Player, который доступен как для Macintosh, и для Windows.

Видео файлы

Расширение файла

Описание

Чем открыть

.avi AVI (Audio Video Interleave)формат предназначен для формирования как аудио, так и видео данных. Аудио и видео данные могут быть обработаны с помощью любого кодека. Для воспроизведения файла avi можно воспользоваться программой DivX Player или KMPlayer.
.mov и. movie Воспроизведение потокового видео

Необходимая программа — QuickTime Player

.mpg и.mpeg Это формат сжатого видео высокого качества.

Программы открывающие.mpg и.mpeg — Winamp Media Playe, DivX Player, Splash Lite.

Файлы документов

Расширение файла

Описание

Чем открыть

.doc Формат отформатированного документа системы Windows (тип файла ASCII). Так же зачастую расширение.doc имеют файлы программы Word (тип файла Binary). Программы: для типа файлов ASCII — любой текстовый редактор, для типа файлов Binary — программа Word.
.pdf Формат переносимых документов разработан Adobe Systems. Формат отформатированного документа содержащий текст, рисунки, графики. Обеспечивает одинаковое отображение на всех платформах. : PDF-XChange Viewer, PDF-Tools.
.txt Обычный текстовый файл (ASCII). Эти файлы можно просматривать с помощью текстового процессора, такие как Microsoft Word или простой текстовый редактор

Все знают, что каждый файл имеет свое наименование. Оно состоит из имени файла и его расширения, разделенные между собой знаком точки (например: photo.jpg). Имя файла может быть выбрано самим пользователем, или программистом, создающим программу. Расширение (его еще иногда называют форматом), жестко привязано к типу файла, и изменять его категорически противопоказано.

Хотя человек работает чаще с типами файлов, непосредственно связанных со своим родом деятельности (например музыкант со звуковыми файлами), есть наиболее часто встречающиеся форматы файлов, которые используют практически все. Вот основные из них:

Архивы:

RAR – файл или группа файлов, сжатых с использованием RAR-сжатия (имеет более высокий коэффициент сжатия, чем ZIP). "RAR" происходит от "Roshal ARchive" (имя разработчика - Евгений Рошаль, программа WinRar).

ZIP – файл сжатый, с использование ZIP-сжатия, поддерживается большинством программ- . Windows пользователи могут создавать ZIP-файлы, используя, к примеру, программу WinZip.

Видео:

AVI – формат видео-файла содержащий данные, которые могут быть закодированы в различных кодеках. Использует меньшее сжатие, чем аналогичные форматы. AVI-файлы могут быть проиграны различными плеерами, но плеер должен поддерживать кодек используемый для кодирования данного видео. (Прим. автора: слово кодек – происходит от слов КОдировать и ДЕКодировать).

MPEG1-2(MPG) –формат хранения видео и звука с компрессией и потерей данных.

MPEG4(MP4) – фильм или видео клип, сжатый в MPEG-4 стандарт, обычно используется для обмена и передачи видео-файлов в Интернете. В этом формате используется раздельное сжатие для аудио и видео дорожек.

SWF - ShockWare Flash. Файлы SWF создаются с помощью программного продукта Macromedia Flash. SWF называют также форматом Flash Player. Формат предназначен для хранения векторной графики и анимационных клипов, которые могут содержать звук. Для его просмотра используется проигрыватель Flash Player, а также современные Web-браузеры. Редактировать SWF-файлы нельзя.

Графика:

BMP – растровый графический формат. Стандартный формат графических файлов для Windows. Практически все программы редактирования изображения Windows могут создавать и читать файлы BMP. Можно установить цвет изображения, от чёрно-белого до полноцветного. Изображение в этом формате не подвергается сжатию. Примерно 16.7 миллионов цветов.

GIF – Graphics Interchange Format (формат обмена графическими данными). Стандарт фирмы CompuServe, для определения растровых цветных изображений. Созданные для сетевого распространения, файлы данного формата очень малы. Формат записывает чёрно-белое изображение, используя 256 оттенков серого, и цветное изображение, используя 256 или менее цветов. Изображение также можно использовать в анимации.

JPEG(JPG) – чаще всего используется для растровых изображений (фотографий, рисунков т.д.). Высокая степень сжатия в формат JPEG значительно уменьшает размер файла изображения, но при этом происходит потеря качества изображения. На сегодняшний день JPEG является лучшим форматом для фотографий и изображений с большим числом цветов. Удобен для использования в Интернете или пересылке по электронной почте. Примерно 16.7 миллионов цветов.

PSD – Photo Shop Data. Формат файлов программы обработки фотоизображений Photoshop. Примерно 280 триллионов цветов.

TIFF(TIF) – Tagged Image File Format (тегированный формат файлов изображений), растровый графический формат. Этот формат ассоциируется с изображением высокого качества и считается стандартным форматом обмена данных между ПК. Формат TIFF позволяет сжимать изображение без потери данных. Широко используется пользователями цифровых камер. Примерно16.7 миллионов цветов.

Документы, текст:

DOC – документ, созданный в Microsoft Word. Может содержать отформатированный текст, картинки, таблицы, графики, диаграммы, форматирования страниц и параметры печати.

PDF – Portable Document Format. Документ программы Adobe Acrobat. Используется для представления документов в фиксированной форме и формате, независимо от устройств, на котором они будут открыты и от разрешения. Т.е. каким документ создан, таким он и будет всегда виден.

RTF - Rich Text Format. Формат хранения размеченных текстовых документов, предложенный Microsoft. RTF-документы поддерживаются большинством современных текстовых редакторов. Большинство текстовых редакторов реализуют импорт/экспорт в формат RTF, благодаря чему этот формат часто используется для передачи текста из одной программы в другую. Редактор WordPad, встроенный в Windows по умолчанию сохраняет документы в формате RTF.

TXT – стандартный текстовый документ, который содержит неформатированный текст и открывается любой программой обработки текстов (обычно "Блокнотом")

Звук:

MIDI – Musical Instrument Digital Interface. Это скорее программа для управления встроенными синтезаторами, чем звуковой файл. MIDI позволяет создавать схожие звуки на различных устройствах, а также обмениваться данными между устройствами.

MP3 – для объяснения параметров сжатия, которые в применяют в MP3, этот формат сравнивают с JPG для изображений. Коэффициент сжатия в 10-12 раз, соответственно с потерей качества звука. Качество звука МР3 формата вызывает много споров, но для "не специалистов" вполне приемлемо. Сжатие обеспечивается за счёт исключения частот не воспринимаемых ухом человека.

WAV – файл фирмы Microsoft. Он используется в Windows. Не сжатый формат. Этот формат точно передаёт звук, но занимает много места на диске. По причине своего большого объема он не удобен для передачи через Интернет.

WMA - Windows Media Audio. Формат файла, разработанный компанией Microsoft для хранения и трансляции аудиоинформации. Характеризуется хорошей способностью сжатия.

Другие:

EXE – приложение (программа) DOS или Windows, иногда . Исполняемый файл, который запускается при одинарном или двойном (в зависимости от настроек Windows) клике мышью.

HTM, HTML - текст написанный на Hyper Text Markup Language. Используется для создания Интернет страниц.

Здравствуйте, друзья, с Вами снова сайт! Предлагаю сегодня поговорить о таком явлении, как расширение файла , заодно разберемся с понятием "тип файла " и узнаем, какие типы файлов наиболее распространены в наше время. Давайте вместе подумаем, а зачем нужны разные типы файлов, что они означают, почему бы не сделать всем файлам, например, Windows, один и тот же формат?

Несомненно, каждый из Вас замечал, что определенные файлы, имеющие отношения к компьютерам и прочей электронно-цифровой технике, объединены одним и тем же "окончанием", например, документы всем известного MS Word заканчиваются doc, различные песни и музыкальные треки чаще всего - mp3. Вот именно это окончание и называется расширением файла.

Что такое расширение файла и тип файла (формат файла)

Для начала определимся с тем, что такое тип файла - это определенная спецификация (одна из многих), описывающая действительную структуру файла. В соответствии с данной структурой файл обрабатывается программами и хранится на носителе. Видимая для пользователя часть типа файла - это расширение файла.

Расширение файла - конкретная последовательность символов (букв и цифр), следующая за именем файла через символ точки "." и применяемая для идентификации типа файла программными продуктами и/или пользователем. То есть с помощью расширения файла программы и человек понимают (если знают) какой тип данных заключен в конкретном файле, какими особенностями он обладает, что необходимо для его исполнения.

В системе Windows (о самой Windows можно почитать ) существует множество похожих приложений, способных открывать одни и те же типы файлов, например, AIMP-плеер и KMP-плеер. Оба они могут воспроизводить музыкальные файлы, но, в то же время, ни один, ни второй не смогут открыть файл с расширением.exe или.zip, следовательно плееры не знают спецификацию архивных или исполняемых файлов. Таким образом можно понять, что каждое приложение, каждая программа создается для того, чтобы работать только с определенными типами файлов. Из этого можно сделать вывод: не существует (и не может существовать) программы, которая знала бы все типы файлов и умела бы с ними работать. Мало того, что такую программу невозможно создать из-за гарантированных проблем совместимости различных модулей, так она еще и весила бы гигабайт 500 в итоге

Отсюда и ответ на второй вопрос, озвученный в начале статьи, один и тот же формат всем файлам сделать нельзя, потому что программа должна понимать, какое действие или набор действий от нее ожидается, что она должна сделать. Кроме того, видимая часть, после имени файла, я говорю о расширении, помогает пользователям группировать файлы так, как им будет удобно, позволяет запоминать, что и как открывать в конкретном случае. Например, файл.doc(docx) знаем, что нужно открыть MS Word (про Word можно почитать в этой статье), файл.avi - KMP-плеером , а файл.adr будем открывать браузером Opera (это файл закладок оперы).

Стоит заметить, что расширения файлов часто означают именно специфику файла, а не принадлежность файла к какой-либо группе. Речь о том, что все типы файлов можно объединить в группы, а уже каждая группа имеет свою общую специфику. Например, файл.mp3, файл.ac3, файл.waw, файл.flac - это все музыкальные файлы, то есть все они могут открываться 1 программой, хотя и имеют разное расширение. А некоторые файлы не имеют вариаций, взять, хотя бы, обычный документ Word, файл.doc(docx) и больше нет ничего похожего. Но при этом можно объединить такой файл в группу текстовых файлов (txt, html, doc/docx).

Кроме символьного расширения, все файлы в системе windows имеют значок, миниатюрное изображение, характеризующее тот или иной тип файла. Как правило, значки эти присваиваются файлам уже самой программой, которая работает с данным видом файлов.

Вот так выглядят хорошо всем известные файлы в Windows 7 (как установить Windows 7 читайте ):

Документы Microsoft Word:

Документы Microsoft Excel:

Музыкальные файлы, открываемые через проигрыватель Windows:

Исполняемый файл.exe антивируса Касперского (зачем он нужен я писал в этой статье):

С помощью таких, легко узнаваемых значков, мы уже сразу понимаем, какого типа файл перед нами, более того, мы понимаем, что он сделает, если на него кликнуть.

Что делать, если Вам нужно узнать расширение файла, но через проводник его не видно? Первое, что приходит в голову - запустить Total Commander, но кто-то работает через проводник и не хочет никаких "коммандеров" (хотя время они экономят очень прилично), для таких пользователей есть способ. Нажимаем "Пуск ", выбираем "Панель управления - Параметры папок ", затем выбираем сверху вкладку "Вид ", проматываем вниз, находим строку "Скрывать расширения для зарегистрированных типов файлов " и убираем галочку.

(кликните для увеличения)

Теперь через проводник нам будут показаны не только значки файлов, но и их расширение, а это, иногда, очень важно. Кстати, расширение Вы можете сами менять (например, вместо jpg сделать png) простым переименованием файла и заменой символов после точки, но я не советую этого делать, так-то в большинстве случаев не произойдет смены формата, а просто сменятся символы, которые видите Вы. Кроме этого, Вы можете "наэкспериментировать" и забыть, какое расширение было изначально, следовательно, испортите файл безвозвратно. Также, обратите внимание, если Вам нужно просто ПЕРЕИМЕНОВАТЬ сам файл, то изменяйте символы, которые находятся только ДО точки, например, нужно изменить название с "Поющая Девочка.mp3" на "Поющий мальчик.mp3" - в этом случае изменяйте только часть до ".mp3" иначе файл потеряет расширение, а компьютер не будет знать, что это за файл и как его открыть.

Что означает расширения файла, связь расширения и программы

Специально для Вас я составил список расширений, наиболее часто встречающихся на компьютере, вместе со списком программ, которые данный тип файла открывают.

Итак, преступим!

Вид расширения Тип (формат) файла Программа\утилита
.exe Исполняемый файл (программный бинарный файл) Любая рабочая программа Windows, DOS, Symbian, OS/2
.msi Инсталлятор программ (установщик) Пакет программ, требующих установки (MS Office, например)
.doc(docx) Документ Word (Word 2007 и выше) MS Word, одно из приложений Office
.xls(xlsx) Файл таблиц Excel (Excel 2007 и выше) MS Excel, одно из приложений Office
.txt Текстовый файл простого формата (документ) Блокнот
.ppt(pptx) Файл презентаций PowerPoint MS PowerPoint, одно из приложений Office
.accdb База данных Access MS Access, одно из приложений Office
.mp3, .flac, .ape, .ogg, .waw, .ac3, .wma, .m4a, .aac и другие форматы Звуковой (цифровой) файл Любой аудио-плеер (не только Windows) с необходимыми кодеками
.bmp, .jpg(jpeg), .png, .gif, .tiff, .ico, .raw Файл изображения Стандартные менеджеры изображений, иногда специальные программы для конкретного формата (MOPM,ACDC,Stone)
.avi, .wmw, .mkv, .3gp, .flv, .mpeg, .mp4, .mov, .vob Видео файлы Различные плееры, главное условие - установлен необходимый кодек для вывода изображений соответствующего формата
.swf, .flv Флеш или видео файлы в интернете Воспроизводятся любым браузером с установленным flash-проигрывателем
.rar, .zip, .7z, .tar, .gzip, .gz, .jar Архивный контейнер В большинстве случает хватает WinRar и 7-Zip для работы со всеми популярными архивами
.html, .htm, .php Веб-страница Браузеры
.dll Программный модуль Не должен открываться, подключается в виде библиотеки различными компонентами MS Windows при возникновении необходимости
.ini Конфигурационный файл Используется Windows для загрузки настроек различных компонентов, к которым относится конкретный ini-файл
.bat Пакетный файл. Имеет свой синтаксис, может быть создан из обычного тестового файла заменой расширения Используется командным интерпретатором (CMD.exe/Command.com) для выполнения заложенных в bat-файл последовательных команд.
.iso, .mds/.mdf, .vdf, .img, .daa, .vcd, .nrg Файл образа диска Различные форматы открываются различными программами. Например, Alcohol, UltraISo, VirtualCD, Nero, Daemon Tools, PowerIso и другими.
.djvu Файл сжатых изображений. Используется для точной передачи информации (сканированные книги, исторические документы) без потери данных. Любая программа для чтения djvu-файлов. WinDJView, DJVUReader и т.д.
.pdf Файл электронного документа, подходит для передачи любой полиграфической продукции и прочего Adobe Reader, Foxit PDF Reader и прочие

Надеюсь, используя полученные сегодня данные, Вы с легкостью сможете определить, какой перед Вами файл, чем его открыть и зачем он нужен. Немного практики, и файлы будут узнаваться на лету.

05.09.2007 / Центр информационной безопасности

Расширения файлов

список наиболее часто встречающихся расширений файлов

Расширение файла - последовательность символов, предназначенных для идентификации типа файла. Основное предназначение расширений файлов - указать операционной системе, какой программой был создан данный файл и какую программу следует вызвать для открытия этого файла. Обычно расширение состоит из трех (двух, четырех) символов, отделяемых точкой от имени файла.
Здесь приведены наиболее часто встречающиеся расширения файлов, а к ним добавлен комментарий о содержимом файла или о программе, с помощью которой файл создан.

.3DF --- файл с трехмерным чертежом
.ACS --- файл в формате Microsoft Access
.ADI --- файл монохромной растровой графики, генерируемый AutoCAD
.APD --- файл Aldus PageMaker Printer description
.ARC --- архивированный, сжатый файл, который можно разархивировать с помощью программы PKXARC
.ART --- графический файл с иллюстративными вставками
.ASP --- действующая (активная) страница сервера
.ANI --- Animation (Presidio - many)
.AU --- звуковой файл в Интернете
.AVI --- мультимедийный файл в Windows
.BAK --- копия файла, создаваемая перед его изменением
.BAT --- файл, содержащий команды DOS
.BDB --- резервная копия файла базы данных пакета Works for Windows
.BIB --- файл, содержащий библиографические сведенья
.BIN --- двоичный файл; файл, содержащий образ памяти
.BMP --- битовый файл
.BTR --- Btrieve Database File или MS Frontpage-related File
.BPS --- резервная копия документа текстового процессора пакета Works for Windows
.CAG --- формат файла со сжатым изображением
.CAL --- данные календаря
.CAP --- файл с изображением, захваченным с экрана
.CAT --- файл каталога
.CDR --- файл (векторного) изображения в формате графического пакета Corel Draw
.CDT --- шаблон в графическом пакете Corel Draw
.CFG --- файл конфигурации в прикладных пакетах и системах
.CGM --- метафайл в Windows; диаграмма в Lotus 1-2-3
.CLP --- файл, в котором на диске сохраняется содержимое буфера обмена
.CMD --- командный файл
.CNT --- справочный файл некоторых программ
.CNV --- конвертер из одного графического формата в другой; файл конфигурации
.COD --- список команд
.COM --- выполняемый файл, программа
.CPE --- обложка, первая страница документа
.CPI --- файлы с информацией о кодовых таблицах
.CPL --- 1. панель управления; 2. файл с цветовой палитрой в пакете Corel Draw
.CPP --- файл с исходными текстами программ C++
.CPT --- файл (растрового) изображения в формате Corel Photo-Paint
.CRD --- 1. картотека; 2. музыкальный файл
.DAT --- файл данных
.PDF --- (аббревиатура от англ. Portable Document Format, произносится пи-ди-эф) - платформонезависимый формат электронных документов, созданный фирмой Adobe Systems с использованием ряда возможностей PostScript
.DBX --- файл базы данных
.DEF --- файл определений
.DEM --- файл с презентацией
.DFV --- файл в формате для печати
.DjVu --- (фонетическое сокращение от англ. «Digital View» - «Цифровой вид» или «Цифровая фотография») - формат, разработанный специально для хранения сканированных документов - книг, журналов, рукописей и пр., где обилие формул, схем, рисунков и рукописных символов делает чрезвычайно трудоёмким их полноценное распознание
.dgs --- файл программы “Dagesh” («Дагеш»)
.DIB --- графический файл, аналогичный.ВМР
.DIC --- файл словаря
.DIF --- формат обмена данными
.DOC --- документ
.DOT --- файл с описанием (шаблоном) документа
.DRV --- драйвер; программа, управляющая каким-либо устройством
.DRW --- графический файл
.DTA --- файл даты
.DVR --- драйвер устройства
.DXR --- Adobe Acrobat File
.EDB --- WIN SECURITY file
.EFM --- файл Equation FontMetrics
.EMF --- Enhanced Windows Meta-file picture
.EML --- текст письма, пришедшего по электронной почте
.ENC --- зашифрованный
.EPS --- файл с изображением
.ERR --- файл сообщений об ошибках
.EXE --- выполняемый файл, перемещаемая выполняемая программа
.FAX --- факс-файл
.FLR --- папка
.FLT --- фильтр
.FNT --- файл с графическим шрифтом
.FON --- 1. файл с графическим шрифтом; 2. файл с номерами телефонов пакетов Phone
.FRM --- 1. файл с формами Visual Basic; 2. отчеты
.GEM --- файл с изображением
.GID --- индексный файл помощи
.GIF, .gif --- 1. графический формат файла; 2. файл с изображением в пакете 3D Studio
.GLY --- глоссарий
.GRF --- графический файл
.GRP --- файл с определением группы объектов или файлов
.HLP --- файл с подсказками
.HTM --- файл на языке разметки гипер-текста Hyper Text Markup Language
.html --- см. HTML
.HYP --- 1. файл переносов; 2. архивный упакованный файл, созданный упаковщиком HYPER
.ICE --- архивный упакованный файл упаковщика LHICE (ICE.exe)
.ICO --- пиктограмма
.IMG --- графический файл; сканированное изображение
.INC --- файл, включаемый в состав других программ
.IND --- индекс
.INF --- информационный файл
.INI --- файл с начальной установкой некоторых программ
.jpeg --- см. .JPG
.JPG, .jpg --- графический файл в формате JPEG
.KBD --- файл назначения функциональных клавиш
.KEY --- макрофайл
.LBL --- файл с этикетками
.LBR --- библиотека
.LES --- файл с уроком в обучающих программах
.LET --- письмо
.LEX --- файл с текстом, обработанным программой-редактором
.LIB --- библиотечный файл
.LNK --- копия инвертированного файла
.LOG --- протокол работы системы или оператора
.LHZ --- LH ARC compressed archive
.LZX --- сжатый файл
.MAC --- 1. макрофайл; 2. файл Macintosh
.MAI --- письмо
.MAN --- руководство
.MAT --- файл с данными матрицы
.MAX --- 3DStudio Scene
.MCI --- высокоуровневый программный интерфейс для управления мультимедиа-устройствами
.MDB --- файл базы данных
.MDF --- файл определения меню
.ME --- открытая информация
.MES --- аудиофайл программы REALJBOX
.MET --- метафайл
.MIC --- формат для создания изображений для Интернета
.MID --- звуковой миди-файл, формат миди-файлов
.MOV --- файл с видеофильмом
.MP2 2
.MP3 --- музыкальный файл в формате MPEG3
.MPA --- музыкальный файл в формате MPEG
.MPG --- музыкальный файл в формате MPEG
.MRB --- файл из программы помощи Windows
.MSP --- графический файл программы Paint вWindows
.MTM --- формат музыкального файла с записью до 32 каналов
.NDX --- индексный файл
.NEW --- новая версия
.OLD --- предыдущая версия
.OPT --- опции
.ORI --- исходная версия
.OUT --- контуры
.OVL, .OVR --- программа, подгружаемая во время работы; оверлей
.PAK --- упакованный программой Pack файл под MS DOS
.PAT --- файл с исправлениями («заплатками»)
.PBM --- переносное растровое изображение
.PCX --- файл растрового изображения в формате пакета PC PaintBrush
.PHO --- файл со списком телефонов
.PIF --- файл с дополнительной информацией о программе
.PLY --- игровой файл
.PPM --- формат для хранения цветных растровых изображений
.PPC --- Game: Uefa champions league file
.PPT --- файл презентации Power Point
.PPD --- файл PageMaker: PostScript printer description file
.PRD --- файл со спецификацией принтера
.PRN --- файл для печати
.PRO --- 1. файл с исходными текстами программ на языке Пролог или в среде Турбо Пролог; 2. файл проекта, профиль (расширение имени файла)
.PRT --- файл, отформатированный для вывода на принтер
.PSD --- формат графических файлов редактора Adobe Photoshop: - использующий компрессию; и - позволяющий записывать изображение со многими слоями, их масками, дополнительными каналами
.PUB --- файл MS Publisher Document
.RA --- аудиофайл для прослушивания музыки в Сети
.RAM --- аудиометафайл
.REC --- устройство записи в Windows
.REF --- файл со ссылками
.RES --- файл ресурсов
.RI --- Lotus 1-2-3 data
.RLE --- сжатый файл в графическом формате
.RTF --- файл с поддержкой многих атрибутов форматирования
.SAF --- стандартный архивный файл
.SCR --- 1. файл сценария; 2. экранный файл; 3. файл с данными для хранителя экрана
.SDF --- стандартный формат данных
.SWF (Shockwave Flash) --- внутренний векторный формат программы Flash фирмы Macromedia. Используется для анимации в Интернете
.SEA --- самораспаковывающийся архив
.SHW --- демонстрация
.SIG --- файл электронного письма с автоматической подписью
.SLD --- слайд
.SMP --- пример
.SND --- звуковой файл
.SOL --- файл данных
.SPL --- программа проверки орфографии
.SRC --- исходный текст
.SRP --- файл сценария
.STY --- файл стилей
.SVD --- файл, создаваемый при автоматическом сохранении
.SWP --- файл подкачки
.SYL --- файл с программой мероприятия, расписанием, планом
.SYM --- символ
.SYN --- синоним
.SYS --- системный файл
.TAR --- Tape Archive, Unix standard Archive format / not compressed
.TBL --- таблица
.TBS --- файл с частью текста в Word
.THS --- файл словаря, тезауруса
.TIF(F) --- графический файл, часто введенный со сканера
.TLX --- телекс
.TMP --- временный рабочий файл
.TPM --- файл с данными о терминале
.TST --- файл с набором тестовых данных или тестовым примером
.TUT --- обучающая программа, учебное пособие
.TXT --- текстовый файл
.VBS --- видеофайл
.VID --- видеодрайвер
.WAB --- файл Microsoft Outlook (Address Book file)
.WAV --- звуковой файл
.WB2 --- Spreadsheet; Lotus 1-2-3 for OS/2
.WDB --- файл базы данных или отчет Works for Windows
.WKS --- файл электронной таблицы
.WK4 --- Lotus 123 version 4 spreadsheet
.WMF --- аппаратно-независимый графический векторный файл в среде Windows
.WPD --- описание принтера в Windows
.WPS --- документ, созданный пакетом деловых предложений Microsoft Works for Windows
.XLA --- файл надстройки редактора электронных таблиц Excel
.XLC --- файл диаграммы редактора электронных таблиц Excel
.XLK --- файл с резервной копией электронной таблицы Excel
.XLM --- файл макросов редактора электронных таблиц Excel
.XLS --- файл с электронной таблицей Excel
.XLT --- файл шаблона редактора электронных таблиц Excel
.ZIP --- заархивированный файл, могущий быть распакованным с помощью программы PKUNZIP
.ZOO --- файл, созданный программой-упаковщиком Zoo

ЛЕКЦИЯ 19. СИСТЕМЫ ФАЙЛОВ

Понятие файла

Файл (file) – это смежная область логического адресного пространства. Как правило, файлы хранятся во внешней памяти.

Немного о терминологии. Слово файл уже несколько десятков лет используется как русское – один из многочисленных примеров программистских неологизмов. Первоначально, когда около 50 лет назад появился данный английский термин, в русскоязычной литературе специалисты пытались ввести другую терминологию – слово file переводили как фонд и даже тека (в смысле хранилище ). Однако исторически сложилось иное решение – слово файл стало русским. В английском языке слово file имеет много других значений: например, подшитый в папку бумажный документ и даже стадо (например, слонов) – в последнем случае, как можно предположить, размер "файла" может быть очень велик. У всех в памяти название легендарного сериала " X files" (в вольном русском переводе – "Секретные материалы").

Фирма IBM в документации по своей системе IBM 360 в 1960-х гг. использовала иной термин – набор данных (data set) – для обозначения этого же понятия, однако он не пережил операционную систему, в которой использовался.

Каждый файл имеет свой тип , определяющий, какая информация хранится в файле. Основные типы файлов – программа (код) или данные . Данные подразделяются на числовые, символьные (текстовые) идвоичные ( произвольная информация ).

Структура файла

В различных системах приняты различные точки зрения на структуру файлов. В ряде систем структура файла привязывалась к типу устройства, на котором он находится. В некоторых других системах структура файла была искусственно усложнена. Однако наиболее простую и унифицированную точку зрения из них предложили авторы системы UNIX : файл – это последовательность слов или байтов . Казалось бы, это очевидно, но преимущество данного подхода к файлам в том, что базовое представление файла и базовые операции над ним (read , write ) не зависят от типа устройства. В свое время для программистов нашего поколения такой подход к файлам был откровением, после сложностей системы файлов IBM 360, а затем – "Эльбруса". Можно сказать, что файлы в своем развитии прошли путь , аналогичный развитиюархитектур компьютеров – сначала в сторону значительных усложнений, затем – упрощения и унификации .

Файлы можно условно подразделять на файлы простой и сложной структуры (хотя точка зрения на структуру файла зависит от той программы, которая его обрабатывает).

Файлы простой структуры состоят из последовательности записей (records) – элементарных единиц, в терминах которых выполняются операции обмена с файлом. Записи могут быть:

· строками , если это текстовый файл ;

· двоичными данными фиксированной длины ;

· двоичными данными переменной длины .

Файлы сложной структуры могут быть самого разного вида, например:

· отформатированным документом Microsoft Office (такой файл, кроме собственно текста, содержит управляющие символы переключения шрифтов, цветов и т.д.);

· загрузочным модулем реального или виртуального двоичного кода, например, portable executable (PE) -файлом для платформы.NET; class-файлом для платформы Java; подобные файлы состоят из нескольких секций, содержат внутренние ссылки и таблицы и т.д.

Сложная структура файла может быть смоделирована записями путем добавления соответствующих управляющих символов .

Файлы интерпретируются операционной системой или программами их обработки.

Атрибуты файла

Практически в любой системе файлов можно считать, что файл состоит из заголовка и памяти .В заголовке файла хранятся его атрибуты – общие свойства, описывающие содержимое файла, память файла – это его записи, строки, секции и т.д., содержащие собственно хранимую в нем информацию.

Различаются следующие основные атрибуты файла :

Имя (Name) – название файла в символьной форме, воспринимаемое пользователем.

Тип (Type) – тип хранимой в файле информации. Отдельный атрибут тип необходим для систем, которые поддерживают различные типы файлов. Например, в системе "Эльбрус" значением атрибута тип файла является число, кодирующее тип: 0 – данные, 2 – код, 3 – текст и т.д. Однако более общепринятым подходом является подход, принятый в системах MS DOS , Windows , UNIX : тип файла кодируется расширением имени , например, book.txt – текстовый файл (.txt), содержащий текст книги.

Размещение (Location) указатель на размещение файла на устройстве.

Размер (Size) – текущий размер файла .

Защита (Protection) – управляющая информация , задающая полномочия чтения, изменения и исполнения файла.

Время и дата . Например, во всех системах хранится дата создания файла и дата последней модификации файла. Последняя играет важную роль при компиляции (сборке) больших программных проектов, так как утилиты для сборки проектов (например, make ) определяют по соотношению дат последней модификации файлов исходного кода и двоичного кода, следует ли перекомпилировать исходный файл .

В ОС UNIX дату модификации файла можно изменить командой touch f, где f – имя файла . Touch дословно означает потрогать . Кроме изменения времени модификации, больше никаких действий над файлом не производится.

Идентификация пользователя .В любой системе поддерживается понятие хозяин (создатель) файла (owner) .Именно хозяин вправе задавать другим пользователям полномочия для работы с файлом.

Информация о файлах хранится в структуре директорий ( или справочников - directories) ,иногда, например, в системе Windows , называемых также папками (folders) – структурами во внешней памяти, содержащими символьные имена файлов и ссылки на них. Важнейшая концепция директории подробно рассматривается далее в данной лекции.

Операции над файлами

Хотя набор операций над файлами и особенно их обозначений различается от системы к системе, можно выделить следующие основные операции над файлами.

· Создание файла (Create ). Создается заголовок файла; первоначально его содержимое (память) пусто.

· Запись в файл (Write ). Как правило, происходит записями (records) или блоками – более крупными логическими единицами информации, объединяющими несколько записей, с целью оптимизацииопераций ввода-вывода .

· Чтение из файла (Read ). Обычно также выполняется записями или блоками.

· Поиск позиции внутри файла (позиционирование) (Seek ). Позиция задается номером записи или блока, либо специальными именами, обозначающими начало файла (позиция перед первой записью) или конец файла (позиция после последней записи).

· Удаление файла (Delete ). В зависимости от реализации системы файлов, ошибочное удаление файла может быть фатальным (UNIX) или исправимым (MS DOS).

· Сокращение файла (Truncate ).

· Открытие файла (Open ) – поиск файла в структуре директорий по его символьному имени (пути) и считывание его заголовка и одного или нескольких смежных блоков в буфера в основной памяти.

· Закрытие файла (Close ) – запись содержимого буферов в блоки файла; обновление файла во внешней памяти в соответствии с его текущим состоянием; освобождение всех структур в основной памяти, связанных с файлом.

Для выполнения операций обмена с файлом (read, write ), как правило, файл необходимо открыть. Закрытие файла является обязанностью пользовательского процесса ; однако, если он по какой-либо причине этого не выполняет, то закрывает все файлы, открытые процессом, операционная система после завершения или прекращения процесса.

Типы файлов – имена и расширения

В таблица 19.1 приведены некоторые наиболее употребительные типы файлов и соответствующие им расширения имен.

Таблица 19.1. Типы файлов – имена и расширения
тип файла расширение имени функциональность
исполняемый код (загрузочный модуль) exe, com, bin или отсутствует готовая к выполнению программа в бинарном машинном коде
обьектный модуль obj , о откомпилированная программа в бинарном коде, но не слинкованная
исходный код на языке программирования с, сс, Java, pas, asm , а исходный код на различных языках (Си, Паскаль и др.)
командный файл bat, sh файл с командами для командного интерпретатора
текст txt, doc текстовые данные, документы
документ для текстового процессора wp, tex, rtf , doc документ в формате какого-либо текстового процессора
библиотека lib, a, so, dll, mpeg, mov, rm библиотеки модулей для программирования
файл для печати или визуализации arc , zip, tar ASCII или бинарный файл в формате для печати или визуализации
архив arc , zip, tar несколько файлов, сгруппированных в один файл, для архивации или хранения
мультимедиа mpeg, mov, rm бинарный файл , содержащий аудио- или видео информацию

Смысл их ясен из приведенной таблицы. Следует заметить, что унифицированных расширений имен, принятых в различных ОС, очень мало – по -видимому, только .txt (текст) и расширения для исходных кодов на языках программирования, например, .c – Си , .p или. pas – Паскаль и др. Объектные модули называются по -разному (в Windows .obj , в UNIX - .o ), библиотеки – тоже: статически линкуемые в Windows - .lib , вUNIX - .a ; динамически линкуемые в Windows - .dll , в UNIX – .so .Интересно отметить, что для исполняемого кода в Windows есть стандартное расширение - .exe ,а в UNIX – нет, зато есть весьма экзотическое полное стандартное имя: a.out (assembler output) .Унифицированы расширения имен для различных текстовых процессоров: . doc - Microsoft Word , .pdf – Adobe Acrobat и др.

Методы доступа к файлам

Традиционно различаются файлы последовательного доступа и прямого доступа .Файл последовательного доступа – это файл , доступ к которому возможен только позиционированием на начало и конец и затем операциями обмена вида считать или обновить следующую (предыдущую ) запись . Файл прямого доступа – это файл , для которого возможен непосредственный доступ по номеру записи и операция обмена с явным указанием номера записи. В любом случае, при выполнении обмена с файлом всегда существует некоторая текущая позиция по файлу, указывающая на некоторую запись , на позицию перед началом или после конца файла. В операциях над файлом последовательного доступа произвольная установка позиции не допускается, а разрешены только операции , автоматически передвигающие текущую позицию на следующую (предыдущую) запись .

Подобная особенность связана с различием устройств, на которых размещены файлы (например, магнитная лента – по сути дела, последовательное устройство), однако необходимость организации последовательных или прямых файлов может быть связана с сутью задачи.

По -видимому, последовательный доступ используется чаще: именно так происходит ввод данных, вывод результатов на печать или на экран.

Типичные :

reset – установка на начало файла для чтения

rewrite – установка на начало файла для записи.

Типичные операции прямого доступа:

position to n – позиционирование на запись с номером n

rewrite n, где n - относительный номер блока (записи).

Описанная трактовка последовательных файлов и операций над ними иллюстрируется рис. 19.1.

Рис. 19.1. Файл последовательного доступа.

При необходимости можно смоделировать операции последовательного доступа для файла с прямым доступом. Способ моделирования показан в таблица 19.2.

Указатель на текущую позицию, характерный для последовательного доступа , для файла прямого доступа моделируется переменной cp , а операции последовательного доступа – операциями прямого доступа с указанием cp в качестве номера блока.

Для ускорения доступа к файлу большого объема может использоваться индексный файл , содержащий ссылки на записи основного (относительного ) файла. рис. 19.2 изображен пример основного файла, содержащего упорядоченные по фамилиям анкетные данные людей. Индексный файл для данного основного файла содержит ссылки на первые логические записи анкет с заданной фамилией, например, Smith.


Рис. 19.2. Индексный файл и основной файл.

Директории

Директория (directory, folder) - узел, содержащий информацию о файлах – их имена и ссылки на файлы и на другие директории во внешней памяти. Таким образом, возможна организация иерархии директорий или их более сложных взаимосвязей, вплоть до произвольных графов. Как структура директорий, так и файлы хранятся на диске. С помощью директорий поддерживается именование файлов с помощью путей (paths) – многослоговых имен, состоящих из имени корневой директории (или логического диска) и последовательности имен директорий последующих уровней. Например, в системе Windows c:\doc\plan.txt путь доступа к файлу, задающий его расположение – на логическом диске C: ,в директории doc (документы), и имя файла plan.txt .Имя содержит расширение, указывающее на тип файла .

Резервное копирование (back-up) файлов и директорий выполняется на специальные предназначенные для этого носители – например, на ленту (стример ), flash-память , внешний переносной жесткий диск , компакт-диск (CD , DVD ). Настоятельно рекомендуется регулярно копировать на внешний носитель (или на несколько внешних носителей) наиболее важные директории.

Особенности системы файлов в "Эльбрусе"

Говоря о структуре директорий и именовании файлов, нельзя не упомянуть столь экзотическую систему файлов, как в МВК "Эльбрус". Это будет полезно читателям, чтобы сравнить и лучше оценить разнообразие подходов к системам файлов.

Основные концепции системы файлов МВК "Эльбрус" – это файлы , контейнеры , справочники . Понятие контейнера в "Эльбрусе" близко к современным понятиям тома и контейнера в системах Windows и Solaris: контейнер – это хранилище файлов на одном или нескольких дисках. Понятие справочника близко к понятию директории в традиционных файловых системах.

Файл в "Эльбрусе" состоит из заголовка и памяти. В заголовке хранятся атрибуты файла , число которых – порядка 100 (!).

Существенным отличием файловой системы "Эльбруса" является то, что возможно создание файла и управление им без присваивания ему имени , т.е. без отображения его в справочниках (директориях). Такой временный файл создается в программе, ссылка на файл хранится в глобальной или локальной переменной, и по окончании выполнения программы файл уничтожается, если на него не была сохранена ссылка в справочнике на диске. Кроме того, файлы могут ссылаться друг на друга (по прямой "физической" файловой ссылке, а не c помощью символьных путей) через справочники внешних ссылок (СВС) .СВС имеется у каждого файла. Его элементы адресуются по номерам, а не по именам. Типичный пример: файл объектного кода (ФОК) ссылается через свой СВС на файл дополнения к файлу объектного кода (ДФОК) ,содержащий в унифицированном виде таблицы именованных сущностей, определенных в программе и ее процедурах. Выражаясь современным языком, ДФОК содержит метаданные . Эта взаимосвязь используется при диагностике ошибок времени выполнения и для многих других целей.

К недостаткам файловой системы "Эльбруса" можно отнести усложненную структуру файлов, большое число атрибутов, зависимость логической структуры файла и набора операций над ним от типа внешнего устройства , на котором он расположен. По сравнению с системой файлов "Эльбруса", система файлов в UNIX гораздо проще и удобнее, но нисколько не уступает по функциональности.

Типичная организация файловой системы изображена на рис. 19.3.


Рис. 19.3. Организация файловой системы.

Файловые системы организуются на дисках . Каждый диск поделен на разделы (partitions) – смежные области дисковой памяти, имеющие свои логические имена (обычно в виде первых букв латинского алфавита). Однако возможна и организация раздела, занимающего несколько дисков. Для деления диска на разделы рекомендуем утилиту Partition Magic . В разделах хранятся директории и файлы. Каждый раздел имеет корневую директорию , у которой при необходимости могут быть организованы поддиректории , на которые она ссылается.

Следует иметь в виду, что в разных разделах могут быть установлены различные операционные системы, использующие разное форматирование и разные файловые системы для своей работы. Даже если на компьютере установлена только одна ОС, различные разделы могут использовать различные типы файловых систем, например, в Windows раздел A может использовать файловую систему FAT32 , а раздел B – файловую систему NTFS . В разделе C может быть инсталлирована ОС Linux, использующая свою собственную файловую систему Ext2Fs .


©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-11