Cette question peut paraître simple, mais elle est compliquée pour la plupart des gens.
En effet, comment expliquer qu'un .doc n'est pas un fichier texte, alors que justement votre mère vous certifie qu'elle l'a créée avec un traitement de texte ?
Au tout début de l'informatique, il n'y avait que des 0 et des 1, puis des nombres, enregistrés sur des octets, groupes de 8 bits.
On a alors codé l'alphabet et d'autres caractères sur les 8 bits en les faisant correspondre aux nombres de 0 à 255 (maximum sur 8 bits). C'est la table ASCII.
Si vous regardez les caractères de votre clavier, vous verrez qu'ils sont loin de faire 256 caractères. Rapidement, on peut compter 26 minuscules, 26 majuscules et environ 20 touches avec au plus 3 caractères, ce qui nous fait 112 caractères.
À quoi sert le reste des 256 caractères ? Ce sont des caractères de contrôle, comme celui qui indique la fin d'une chaîne de caractères, mais aussi des caractères graphiques par exemple pour dessiner des fenêtres en mode texte. Avant que l'interface graphique n'arrive sur les PC, je me rappelle avoir utilisé Works sous DOS, où il y avait déjà des fenêtres....
Un fichier texte est un fichier qui ne contient, pour simplifier, que des caractères de texte. Cela implique qu'un humain peut utiliser un éditeur de texte pour lire les caractères qu'il contient.
Un éditeur de texte est simplement un programme qui affiche les caractères du fichier sous forme de texte. Le plus connu est notepad, l'éditeur de texte de base, fournit avec windows (dans Accessoires).
Prenez un fichier (document word ou image) et ouvrez-le avec notepad. Il y a de grandes chances pour que vous voyez des caractères bizarres, comme des carrés, mélangés avec des lettres, des chiffres, etc. : votre fichier n'est pas un fichier texte, il utilise d'autres caractères que notepad a de la peine à afficher correctement.
Si vous recommencez en choisissant une page web préalablement enregistrée sur le disque ou un fichier .txt, vous verrez que ces fichiers ne contiennent que des caractères de texte : ce sont des fichiers texte
Dans un document word (et c'est pareil pour OpenOffice.org), il y a le texte, mais aussi les informations de mise en forme, comme le gras et l'italique, ainsi que l'auteur, la date de création, etc. Tout cela est organisé et compacté dans un fichier (pour que le fichier soit de petite taille), ce qui fait que le fichier n'est pas un fichier texte.
Oui. Les informations de mise en forme sont contenues dans le fichier, mais elles sont elles-mêmes décrites avec des caractères de texte, ce qui fait que le fichier est un fichier texte : c'est le codage HTML.
Si vous utilisez Firefox, vous pouvez faire un clic droit sur cette page (ou une autre) et choisir « Code source de la page » pour voir le fichier texte correspondant à la page affichée.
D'un naturel joyeux, positif et curieux, je m'intéresse à beaucoup de choses parmi lesquels la salsa, l'espéranto, la plongée mais surtout l'informatique, le web et Linux.
Même si j'aime programmer, je m'intéresse également aux aspects d'ergonomie, de design et de marketing.
Si vous pensez avoir du travail pour moi, il y a mon LinkedIn et mon CV.
M'écrire : olivier+blog@faurax.fr
Retrouvez-moi sur Facebook et Twitter.
Cette hCard sémantique a été créée avec le hCard creator.