Notion de fichier


(Version projecteur)




Qu'est-ce qu'un fichier ?

Un fichier est un ensemble de données informatiques stockées en mémoire auxilliaire (disque dur, CD, DVD, clef USB, ...) possédant un nom, un chemin d'accès et généralement implicitement associé à un format (format image, format de documents, formats de base de données, ....).


Le terme de mémoire auxilliaire désigne tout support de stockage de l'information d'un ordinateur autre que la mémoire vive.

Le fait qu'un fichier soit toujours stocké sur mémoire auxilliaire à deux conséquences.

Premièrement, les données contenues dans un fichier ne sont pas perdues lorsque l'ordinateur est mis hors tension (contrairement aux données contenues dans les variables d'un programme !).

Deuxièmement, l'accès à des données stockées dans un fichier est considérablement plus lent qu'un accès à des données contenues en mémoire vive.

Nom de fichier

La manière de nommer les fichiers dépend fortement du système d'exploitation. Par exemple sous Windows, les noms de fichiers peuvent comporter des espaces. Ce n'est pas le cas sous Linux. Sous Windows, tout fichier possède une extension (.doc, .jpg, ...) qui permet d'identifier son format, alors que dans d'autres systèmes d'exploitation ce n'est pas obligatoire.

Chemin d'accès

Le chemin d'accès d'un fichier définit sa localisation sur un périphérique donné. C'est une chaine de caractères qui définit la suite des répertoires à parcourir pour atteindre le fichier depuis la racine du périphérique.

La manière de décrire un chemin dépend du système d'exploitation. Sous Windows, un chemin est une chaine de caractères de la forme:

 X:\Répertoire\Répertoire\ ... \Répertoire 

X est une lettre définissant le périphérique utilisé.

Par exemple:

 C:\Utilisateurs\Thirion\Documents 

Identification d'un fichier par son nom complet

Le nom d'un fichier ne l'identifie pas de manière unique. Par exemple, il peut exister un fichier nommé CV.doc sous

   C:\Utilisateurs\Thirion\Documents

et un autre sous

   C:\Utilisateurs\Einstein\Documents

Pour identifier un fichier de manière unique, il faut utiliser son chemin concaténé avec le nom (simple) du fichier. Par exemple:

 C:\Utilisateurs\Thirion\Documents\CV.doc 

désigne le CV de Thirion, alors que:

 C:\Utilisateurs\Einstein\Documents\CV.doc 

désigne le CV de Einstein.

J'utiliserais par la suite le terme de nom complet, pour désigner le chemin concaténé avec le nom du fichier.

Format

Le format d'un fichier est un ensemble de conventions définissant la représentation des données qu'il contient : la localisation et le codage des différents types d'informations contenues dans le fichier.

Le fichier en lui même ne permet pas de retrouver son format : comme toute chose en informatique, ce n'est qu'une suite de zéros et de uns. La seule manière de vérifier si un fichier est bien dans un format donné est de l'ouvrir avec un logiciel adapté à ce format. Si le logiciel gère correctement le fichier, il est certainement dans le bon format (mais ce n'est pas une certitude !)

Exemple : si je peux ouvrir un fichier avec word, il s'agit très certainement d'un fichier respectant un des formats accepté par word (.doc, .txt, ...). Au contraire, si j'essaie d'ouvrir avec word un fichier qui n'est pas dans un format accepté par word, il se produira probablement n'importe quoi.

Sous windows, le format d'un fichier est repérable par l'extension (.doc pour un fichier word, .exe pour un fichier exécutable ... etc). Mais l'extension d'un fichier peut être changé manuellement ... L'extension d'un fichier ne donne donc aucune certitude sur son format !

Les fichiers textes

Les fichiers textes sont des fichiers que l'on peut ouvrir avec un éditeur de texte (comme wordpad ou bloc notes) afin de modifier leurs contenus. Ce sont par exemple les fichiers d'extension .txt sous windows, les fichiers sources d'un programme, les fichiers html etc ...).

Un fichier texte est un fichier qui peut être interprétée comme une suite de caractères (le plus souvent en code ASCII) affichables à l'écran.

Deux caractères spéciaux servent à coder le passage à la ligne et la fin du fichier.

Les fichiers structurés

Les fichiers structurés sont des fichiers interprétables comme une suite d'enregistrements d'un certain type. Tous les enregistrements sont forcéments de même taille.

Les fichiers structurés peuvent être vus comme la représentation d'un tableau en mémoire auxilliaire. Rappelez vous que tous les éléments d'un tableau doivent être de même type. Les éléments du tableau correspondent ici aux enregistrements.

Certains auteurs utilisent le nom de fichiers séquentiels pour désigner des fichiers structurés. Je trouve ce nom très mal adapté car il porte à confusion. Nous verrons pourquoi un peu plus loin.