Le fait qu'un fichier soit toujours stocké sur mémoire auxilliaire à deux conséquences.
Premièrement, les données contenues dans un fichier ne sont pas perdues lorsque l'ordinateur est mis hors tension (contrairement aux données contenues dans les variables d'un programme !).
Deuxièmement, l'accès à des données stockées dans un fichier est considérablement plus lent qu'un accès à des données contenues en mémoire vive.
La manière de nommer les fichiers dépend fortement du système d'exploitation. Par exemple sous Windows, les noms de fichiers peuvent comporter des espaces. Ce n'est pas le cas sous Linux. Sous Windows, tout fichier possède une extension (.doc, .jpg, ...) qui permet d'identifier son format, alors que dans d'autres systèmes d'exploitation ce n'est pas obligatoire.
La manière de décrire un chemin dépend du système d'exploitation. Sous Windows, un chemin est une chaine de caractères de la forme:
X:\Répertoire\Répertoire\ ... \Répertoire
où X est une lettre définissant le périphérique utilisé.
Par exemple:
C:\Utilisateurs\Thirion\Documents
Le nom d'un fichier ne l'identifie pas de manière unique. Par exemple, il peut exister un fichier nommé CV.doc sous
C:\Utilisateurs\Thirion\Documents
et un autre sous
C:\Utilisateurs\Einstein\Documents
Pour identifier un fichier de manière unique, il faut utiliser son chemin concaténé avec le nom (simple) du fichier. Par exemple:
C:\Utilisateurs\Thirion\Documents\CV.doc
désigne le CV de Thirion, alors que:
C:\Utilisateurs\Einstein\Documents\CV.doc
désigne le CV de Einstein.
J'utiliserais par la suite le terme de nom complet, pour désigner le chemin concaténé avec le nom du fichier.
Le fichier en lui même ne permet pas de retrouver son format : comme toute chose en informatique, ce n'est qu'une suite de zéros et de uns. La seule manière de vérifier si un fichier est bien dans un format donné est de l'ouvrir avec un logiciel adapté à ce format. Si le logiciel gère correctement le fichier, il est certainement dans le bon format (mais ce n'est pas une certitude !)
Exemple : si je peux ouvrir un fichier avec word, il s'agit très certainement d'un fichier respectant un des formats accepté par word (.doc, .txt, ...). Au contraire, si j'essaie d'ouvrir avec word un fichier qui n'est pas dans un format accepté par word, il se produira probablement n'importe quoi.
Sous windows, le format d'un fichier est repérable par l'extension (.doc pour un fichier word, .exe pour un fichier exécutable ... etc). Mais l'extension d'un fichier peut être changé manuellement ... L'extension d'un fichier ne donne donc aucune certitude sur son format !
Les fichiers textes sont des fichiers que l'on peut ouvrir avec un éditeur de texte (comme wordpad ou bloc notes) afin de modifier leurs contenus. Ce sont par exemple les fichiers d'extension .txt sous windows, les fichiers sources d'un programme, les fichiers html etc ...).
Un fichier texte est un fichier qui peut être interprétée comme une suite de caractères (le plus souvent en code ASCII) affichables à l'écran.
Deux caractères spéciaux servent à coder le passage à la ligne et la fin du fichier.
Les fichiers structurés sont des fichiers interprétables comme une suite d'enregistrements d'un certain type. Tous les enregistrements sont forcéments de même taille.
Les fichiers structurés peuvent être vus comme la représentation d'un tableau en mémoire auxilliaire. Rappelez vous que tous les éléments d'un tableau doivent être de même type. Les éléments du tableau correspondent ici aux enregistrements.
Certains auteurs utilisent le nom de fichiers séquentiels pour désigner des fichiers structurés. Je trouve ce nom très mal adapté car il porte à confusion. Nous verrons pourquoi un peu plus loin.