Что нужно знать чтобы определить тип файла. Определение типа файла по содержимому. Программа File Type Verificator

К ак известно любая информация будь то текст, изображение или видео, по сути, является ничем иным как набором двоичного кода - последовательности нулей и единиц. Именно в таком виде на жёстком диске хранятся данные. Понятие двоичный код едва ли не абстрактное, это не запись в привычном понимании этого слова, двоичный или машинный код это скорее состояние микроскопических ячеек на магнитной поверхности жесткого диска. Положительный заряд такой ячейки имеет знак плюс или 1, отрицательный - минус или 0.


Логически объединенные последовательности нулей и единиц как раз и составляют то, что мы называем файлами. Но ведь мы знаем и то, что типов файлов очень много. Есть текстовые файлы, мультимедийные, архивные, системные, исполняемые и так далее. Каким же образом операционная система определяет как читать или обрабатывать тот или иной файл? Прикладные программы распознают тип файла по его расширению - набору символов следующих после имени файла и отделенных от него точкой.

Но что будет, если расширение удалить? Всё правильно, операционная система не сможет открыть такой файл, так как не будет знать какую программу для этого использовать. Однако ни логическая структура, ни содержимое переименованного файла от этого не изменится. Вы и сами в этом можете убедиться удалив расширение какого-нибудь файла, а затем попробовав его открыть соответствующей программой. Уверены, с этим у вас проблем не возникнет.

Следовательно, вовсе не расширение определяет тип файла. Тогда что же? Тип файла определяет его формат или иначе спецификация структуры данных. Расширение и формат очень часто путают, хотя на деле это совершенно разные понятия. Тут возникает вполне закономерный вопрос, а как определить формат файла, если его расширение по какой-то причине оказалось утрачено? Оказывается очень просто.

Грубо говоря, все файлы состоят из двух частей. Первая часть это заголовок, содержащий различную метаинформацию включая те данные, которые позволяют прикладным программам этот самый файл идентифицировать. Вторая часть это «тело» файла. Отвечающая за определение типа файла часть заголовка файла именуется дескриптором или описанием. Наиболее распространёнными типами дескрипторов являются HEX и ASCII. Первый тип заголовков можно просмотреть только с помощью специальных утилит - шестнадцатеричных редакторов .

Для просмотра дескрипторов второго типа можно обойтись обычным текстовым редактором, тем же Блокнотом или . Однако следует учитывать, что далеко не все последовательности байтов можно перевести в ASCII-код, поэтому для определения формата всё-таки лучше использовать HEX-редакторы. Открытый в HEX-редакторе файл отображается в виде матрицы из последовательности байтов. Каждая ячейка соответствует одному байту. Данные дескриптора содержатся как раз в первых трёх ячейках (реже двух или четырех), расположенных по горизонтали. Представляют они из себя шесть символов в шестнадцатеричном счислении, например 49 44 33 или ff d8 e0 .

Естественно они нуждаются в расшифровке. А расшифровать их можно на специальных сайтах с описаниями форматов. Одним из лучших сайтов, где можно определить формат по HEX-дескриптору является open-file.ru . Есть и другие подобные ресурсы, но они не настолько удобны. На open-file.ru же имеется специальная поисковая форма, куда можно вставить HEX или ASCII дескриптор и пробить его по базе данных. Система быстро найдёт соответствующий формат и предоставит вам его полное описание.

С HEX-редакторами всё более или менее понятно, но как мы сказали для определения ASCII-заголовков также можно использовать редакторы текстовые. Принцип здесь тот же самый, открываем файл Блокнотом или Notepad++, копируем первые символы и вставляем их в поисковое поле того же open-file или другого сайта с поддержкой поиска по заголовкам.

Казалось бы всё очень просто, но есть в деле идентификации форматов и свои сложности. Иногда ASCII-заголовки совпадают с расширением файла (RAR и PDF), но может быть и такое, что заголовок оказывается принадлежащим сразу нескольким форматам. Это можно видеть на примере офисного формата DOCX (PK и 50 4b 03 04). В таких случаях точно определить формат проблематично.

Так, строка .xml в DOCX явно указывает на то, что исследуемый файл является размеченным текстовым документом.

В информационном мире существуют десятки тысяч разнообразных форматов файлов. Как открыть файл неизвестного формата, не открывающийся стандартными программами?

Что сделать в первую очередь

Перед тем, как открыть или запустить файл, пришедший по электронной почте или находящийся на флеш-накопителе, в обязательном порядке антивирусной программой и удостоверьтесь, что он не является ни , ни носителем вируса.

Расширение файла

Расширение имени файла – это буквенные или цифровые символы, расположенные после имени файла и отделенные от него точкой. Расширение файла может рассказать о формате файла очень много.

Но как узнать расширение имени файла, если в Проводнике отображаются только имена файлов, а расширения скрыты?

В главном меню Проводника выберите пункт Сервис, а в выпадающем меню – Свойства папки. Перейдите на закладку Вид, в окне Дополнительных параметров снимите птицу с параметра Скрывать расширения для зарегистрированных типов файлов и нажмите ОК. Теперь в Проводнике в именах файлов после точки показаны их расширения.

Еще один способ узнать расширение файла, если оно не отображается в Проводнике — выполнить правый клик мышкой по файлу, во всплывающем меню выбрать пункт Свойства. В окне свойств имя файла всегда будет отображено с расширением, отделенным от имени файла точкой.

Распространенные типы и форматы файлов

Тип файла Расширение
Аудио .aac .ac3 .acm .cdr .kar .kfn .m3u .mid .midi .mp3 .wav
Видео .3gp .3mm .avi .dat .mkv .mov .mp4 .mpeg .mpg .vob .wmv
Графический .bmp .cdr .djvu .gif .ico .jpg .jpeg .psd .tif .thumb
Текстовый .doc .docx .dot .faq .log .mg .rtf .txt
Архивный .7z .arc .arj .rar .rev .tar .tgz .zip
Исполняемый .app .bat .cmd .com .exe
Интернет .asp .cer .chm .htm .html .js .jsp .rss .vbd .xul .zfo
Системные .ani .cab .cur .dll .hlp .ico .nfo .reg .sys
Резервные копии .asd .bak .bup .da0 .gho .nba .old .tib
Базы данных .cdb .db .dbf .dsk .fpt .mdb .odb .pdb .sql .xld
Скрипты .aps .asm .dcu .def .dsp .jav .json .pas .res .src

Назначение программы по умолчанию

Для большинства форматов файлов в операционной системе назначены программы, которые по умолчанию используются для открытия файлов определенного типа.

Как быть в случаях, когда для формата файла не назначена программа, с помощью которой можно этот файл открыть?

Выполните в проводнике правый клик по файлу и во всплывающем меню выберите пункт Открыть с помощью. В дополнительном всплывающем меню выберите пункт Выбрать программу.

В открывшемся окне Выбор программы выберите одну из предлагаемых программ и нажмите ОК. К примеру, вы выбрали программу WinDjView.

Для того, чтобы сопоставить эту программу файлам такого типа на постоянной основе, следует перед нажатием ОК поставить птичку в параметре Использовать выбранную программу для всех файлов такого типа.

Если же в списке предлагаемых программ нет нужной программы, можно указать программу для открытия файлов вручную.

Для этого в окне Выбор программы нажмите кнопку Обзор и укажите месторасположение нужной программы, вернее, ее исполняемого файла.

К примеру вы выбрали программу AllReader2, а точнее – исполняемый файл AllReader2.exe.

Теперь все файлы такого формата будут открываться этой программой всегда, до тех пор пока вы не переназначите для их открытия какую-нибудь другую программу.

Обычно операционная система сама открывает или предлагает открыть файл какой-либо программой. Если открыть файл все же не удается, узнать, какая программа для этого нужна, можно, обратившись ко всезнающему сообществу Всемирной Паутины.

Пусть для всех ваших файлов всегда находится программа, способная их открыть!

Посильную помощь в идентификации незнакомых объектов окажет бесплатная утилита TrID, распознающая родословную файлов методом сигнатурного анализа.

Пользователи, хоть раз занимавшиеся восстановлением информации после краха файловой системы компьютера, знают, насколько сложно бывает разобраться в завалах реанимированных данных, лишившихся привычных идентификаторов - расширений и толковых наименований. И если с названиями еще полбеды, то с подбором подходящего расширения к анонимному файлу возникает немало проблем, решить которые поможет утилита TrID от итальянского программиста Марко Понтелло, знакомого постоянным читателям рубрики RTFM по материалу об антивирусом плагине для почтового клиента TheBat!.

Приложение распространяется разработчиком абсолютно бесплатно и доступно аж в трех различных вариантах.

Первый - TrID - представляет собой консольную версию утилиты, портированную и под Windows (24,5 кб), и под Linux (27,3 кб). Вне зависимости от используемой платформы для утилиты еще потребуется докачать мегабайтный файл TrIDDefs.TRD с базой сигнатур более чем на две тысячи объектов и поместить его в рабочую директорию с программой.

После этих нехитрых манипуляций инструмент TrID готов к выполнению своих задач. Просто открываем консоль (Пуск -> Выполнить -> cmd.exe), находим утилиту и скармливаем ей в качестве параметра незнакомый объект. Программа лихо проанализирует его структуру, пробежится по содержимому и выдаст свое предположение о причастности заданного файла к тому или иному формату.

Куда привлекательнее для рядового пользователя второй вариант утилиты, именуемый TrIDNet и оснащенный привычным графическим интерфейсом. Данная версия функционирует только в среде Windows и требует для работы проинсталлированный в системе компонент.NET Framework. Как и в случае с консольными редакциями, программа состоит из двух частей - основного рабочего файла TrIDNet.exe (92 кб) и структурных описаний XML-формата, занимающих в разархивированном виде свыше одиннадцати мегабайтов.

Перед началом работы с TrIDNet необходимо указать приложению расположение папки с сигнатурами, после чего можно смело приступать к распознаванию файлов непонятного происхождения. Алгоритм управления утилитой, полагаем, ясен из приведенного выше скриншота, поэтому подробно останавливаться на этом не будем.

Наконец, третий, самый простой вариант использования описываемого сегодня детектора файлов - через браузер и сетевой сервис Online TrID . Тут и говорить-то нечего: загружаем веб-страничку, выбираем файл для проверки, и после нажатия кнопки Analyze! высвечивается результат его обработки.

Остается добавить, что поучаствовать в поддержании актуальности базы сигнатур файлов может любой желающий. Необходимо лишь загрузить сканер командной строки TrIDScan и обкатать его на массе однотипных объектов, сигнатуру которых предполагается включить в общую базу. Далее сгенерированный программой отчет нужно вручную дополнить поясняющими комментариями (в "шапке" XML-файла) и отправить по электронной почте Марко Понтелло для добавления файла в базу описаний.

Случалось ли Вам получать на электронную почту или по другим каналам связи файлы без расширения? Такие файлы имеют вид белого значка, который свидетельствует о том, что система не знает, какой программой его открыть.

В ответ на попытку открыть загадочный документ, Windows предложит Вам самостоятельно выбрать программу из перечня.

Такое “поведение” обусловлено тем, что операционная система, анализируя расширения файлов, сопоставляет их с нужной программой и присваивает им соответствующие значки, чтобы не только машина, но и пользователь понимал, с каким видом информации он имеет дело. В нашем примере система думает, что файл, который мы пытаемся открыть имеет расширение.09, которого нет в ее справочнике, поэтому и выдает такое сообщение.
Как же так выходит, что полученный документ или иного вида файл не имеет расширения? Скорее всего, дело в том, что Ваш собеседник, редактируя наименование документа, просто напросто затер то самое расширение.

Как открыть файл, если расширения нет, но известно содержимое файла

Хорошо если мы знаем отправителя и знаем какой вид документа нам отправлен. К примеру, точно знаем, что данный файл представляет собой таблицу. В таком случае мы просто выберем из предложенного системой перечня табличный редактор и благополучно раскроем наш файл.

Для этого наводим курсор на файл, жмем правой клавишей мыши и в контекстном меню выбираем пункт “Открыть с помощью”

Затем, жмем “Использовать приложение с этого ПК”

Промотаем список программ до конца и выберем пункт “Найти приложение на этом компьютере”

Будет предложено поискать нужную программу в папке с установленными программами Program Files. Если пакет офисных программ установлен на вашем компьютере, то вы сможете найти соответствующую папку. Если вы используете свободное ПО, то вместо Microsoft Office возможно будут такие папки как Libre Office или Open Office

Еще один вариант — дописать нужно расширение вручную, например.xls, если речь идёт об Excel-таблице.

Наводим курсор на файл, вызываем контекстное меню правой клавишей мышки и выбираем “Переименовать”.

Затем внимательно, после точки вводим правильное расширение и жмем Enter, чтобы сохранить изменения. С предупреждением соглашаемся, жмем “Да”.

Но как же быть, если уточнить тип файла нет возможности?
Стоит ли говорить, что если отправитель неизвестен, то пытаться открыть вложенные нельзя ни в коем случае, дабы не подвергнуть свой компьютер вирусному заражению. Но если файл получен из надёжного источника и не вызывает у Вас сомнений, то узнать его тип можно не иначе как проанализировав его содержимое.

Как определить тип (формат) файла по его содержимому

Всякий файл, будь то текстовый документ, изображение, или еще что-либо, есть ни что иное, как определенным образом структурированный код, понятный программе, предназначенной для его чтения и/или редактирования. Как упоминалось выше, выбор программы для открытия файла операционная система осуществляет основываясь на его расширении. Записывается оно после наименования файла через точку. Анализируя файл image1.jpeg, где.jpeg — расширение, система понимает, что это изображение, и для чтения данного файла нужно использовать программу просмотра изображений. Изменив расширение файла с.jpeg к примеру на.txt, мы конечно же не превратим изображение в текстовый файл, просто система попытается открыть его с помощью текстового редактора, в результате чего мы увидим лишь набор символов. Очевидно, формат (тип) файла определяется вовсе не расширением, а его содержимым.
Чтобы увидеть в содержимом файла признаки, указывающие на его принадлежность к какому-то типу, воспользуемся шестнадцатиричным редактором, например Hex Editor или онлайн сервисом.
Какое бы jpeg-изображение мы не открыли, можем наблюдать сходство в первых трех парах цифр, которые и указывают на тип файла.

Остается найти какому формату соответствует кодировка. Но можно не усложнять себе жизнь и воспользоваться готовым приложением, которое сделает всю работу. В нашем примере это будет программа File Type Verificator (FTV). Она свободно распространяется и имеет понятный русскоязычный интерфейс.
Узнать формат файла с помощью этой программы проще простого. Жмем кнопку добавить файл,

выбираем нужный файл через окошко проводника,

и видим формат файла, соответствующий его содержимому.

В программе предусмотрена возможность выполнить переименование файла, путем изменения его расширения. Чтобы воспользоваться этой функцией жмем “Файл” -> “Начать переименование…”

А в появившемся затем окошке, жмем применить, если согласны с предложенным программой вариантом.

После таких манипуляций проблемный файл будет открываться нужной программой.

Типа , состоящее из трех символов после точки в конце названия файла . Так, например, “.exe” в конце названия файла будет означать, что перед вами файл, который запустится без помощи посторонних , а файл с расширение м “.mp3” содержит в себе музыкальную композицию и может быть открыт только с помощью специальных медиапроигрывателей.

Итак, чтобы узнать расширение файла , откройте любое окно проводника Windows. Например, окно «Мой ». В меню выберите пункт «Сервис» и далее «Свойства папки». В открывшемся окне перейдите на вкладку «Вид» и снимите галочку с пункта «Скрывать расширения для зарегистрированных ». Нажмите «ОК». Теперь в конце названия каждого файла будет его расширение ! Скрыть расширение вы сможете действуя аналогичным образом.

Для каждого типа файла предусмотрен свой формат и приложение, которое данный формат распознает. Существуют разные случаи, при которых расширение файлов не отображается. Вам необходимо выбрать тот способ действий, который подходит под вашу конкретную ситуацию.

Инструкция

Если расширение не отображается из-за заданных пользователем (или использующихся по умолчанию) настроек, существует несколько способов определить тип файла. Самый простой из них: подведите курсор мыши к значку файла и подождите пару секунд, не нажимая на кнопки. Всплывет небольшое окно с краткой информацией. В числе прочего в такой всплывающей подсказке будет указан тип файла.

Обратитесь к свойствам файла, если информации не хватает. Для этого подведите курсор к иконке нужного вам файла и щелкните по ней правой кнопкой мыши. В выпадающем меню выберите пункт «Свойства». Откроется новое диалоговое окно, перейдите в нем на вкладку «Общие» и прочтите нужную вам информацию в поле «Тип файла». Если вы случайно открыли свойства не самого файла, а ярлыка, на вкладке «Общие» будет указан тип «Ярлык». В этом случае перейдите на вкладку «Ярлык» и ознакомьтесь с данными в поле «Тип объекта».

Также вы всегда можете настроить отображение расширения файлов. Для этого откройте «Панель управления» через клавишу Windows или кнопку «Пуск». Выберите значок «Свойства папки» в категории «Оформление и темы». Или же можно открыть любую папку на компьютере и выбрать в меню «Сервис» пункт «Свойства папки». Когда откроется новое диалоговое окно, сделайте активной вкладку «Вид».