Accueil > Creative Commons > Formats ouverts, pour quoi faire ? .docx .doc, .odt, .pdf, .epub : (...)
Formats ouverts, pour quoi faire ? .docx .doc, .odt, .pdf, .epub : ouverts, fermés, quelles différences ? C’est quoi le problème ?
mercredi 18 décembre 2013, par
L’April publie un poster pour expliquer aux utilisateurs de logiciels, l’intérêt de choisir des "formats ouverts" pour échanger et sauvegarder leurs fichiers.
Quelles sont les différences, de quoi parle-t-on ?
Formats ouverts, pourquoi faire ?
**Qu’est-ce qu’un format ?
Deux définitions.
- C’est quoi un fichier ? Que vous écriviez un article, modifiez une image, construisiez une page web, écoutiez un morceau de musique ou regardiez un film sur votre ordinateur, vous avez à faire à des fichiers. Pour que ces fichiers puissent être ouverts, lus ou modifiés, il faut qu’ils aient un format. [*Un format est ce qui permet à un logiciel d’interpréter les données brutes d’un fichier*]. C’est, autrement dit, le mode de représentation de ces données. Souvent, les formats des fichiers sont indiqués par leur extension : [**le suffixe*] (souvent trois lettres) attaché au nom de fichier. Par exemple : mapageweb.htm est un fichier en format HTML. Il existe des formats spécifiques pour les images (par exemple JPEG, PNG, GIF, TIF, BMP), pour les textes sans mise en forme (ASCII, souvent indiqué comme TXT), pour les textes avec mise en forme (HTML, RTF, DOC), pour les pages prêtes à l’impression (PDF, PS) etc ...
- Formats interopérables : chacun son logiciel pour un même fichier ? Lorsque vous enregistrez un document sur votre ordinateur, celui-ci est placé dans un fichier informatique. Que ce soit du texte, une image, de la vidéo ou tout autre type de réalisation, il sera enregistré sous une forme codée spécifique : le format de fichier. [*Pour que les logiciels puissent partager des données, ils doivent être en mesure de communiquer entre eux.*] Ceci implique de [**lire et de modifier sans entrave les informations*] qu’ils s’échangent. On dit alors qu’ils doivent être « interopérables ». [**L’interopérabilité est garantie lorsqu’elle repose sur des standards ouverts*] : des spécifications techniques publiques, librement utilisables par tous, sans restriction ni contrepartie et maintenues grâce à un processus de décision ouvert. Lorsqu’un format est basé sur ces standards ouverts, alors nous sommes en présence d’un « [*format ouvert*] ». Si l’interopérabilité des logiciels n’est pas prévue, si l’éditeur ne donne pas accès aux informations essentielles à l’interopérabilité ou si la recette de fabrication du fichier est secrète, alors le [*format est considéré comme fermé*] et ne permet pas l’interopérabilité. [**Il faut avoir le logiciel qui a créé ce fichier pour le lire*], voire l’exacte même version, dans certains cas. Et tout le monde se retrouve avec les mêmes logiciels qui ont les mêmes défauts : la "biodiversité" informatique est à ce prix ! Pour l’utilisateur d’un logiciel, choisir entre un format ouvert ou fermé a des conséquences importantes sur l’accès à ses propres données et leur conservation au fil du temps.
*Quels sont les avantages des formats ouverts ?
- les documents seront lisibles et modifiables, par soi-même ou par des tiers,
- la lisibilité des documents sera garantie dans le temps,
- les formats ouverts présentent l’avantage d’être [*librement utilisables dans tout logiciel et donc de rendre les logiciels interopérables*],
- ils favorisent la [*liberté de choix*] en ne privilégiant pas le format d’une entreprise en particulier. Ils permettent d’[*éviter le monopole d’un éditeur*] qui souhaiterait rendre les utilisateurs captifs d’un format qu’elle a conçu.
*Quels sont les inconvénients des formats fermés ?
- ils imposent l’[*acquisition d’un logiciel spécifique*] pour lire ou modifier un document,
- ils excluent les logiciels libres,
- ils [**risquent de rendre illisibles vos documents au bout de quelques années*].
- ils empêchent les utilisateurs d’opter pour les logiciels de leur choix, [*surtout quand un format fermé devient un monopole de fait*],
- ceux qui ne peuvent ou ne veulent acheter ce logiciel ou pour qui leur entreprise n’offre pas un ordinateur portable avec une suite bureautique pré-installée et payée, seront amenés à [*pirater ce logiciel en téléchargeant un exemplaire*] qui n’en pas le droit de propriété ni les mises à jour des inévitables bugs (consubstantiels de l’informatique grand public pas encore assez mature).
*Logiciels libres et formats ouverts, le duo parfait !
Les logiciels libres sont des programmes informatiques qui offrent [**quatre libertés aux utilisateurs*], selon R.M. Stallman, l’inventeur du projet GNU qui a rendu possible les systèmes GNU/Linux (http://stallman.org/, http://en.wikipedia.org/wiki/Richard_Stallman) :
- la liberté de copier et distribuer le logiciel à ses amis,
- le droit de l’utiliser pour tous les usages,
- le droit de l’étudier pour connaître son fonctionnement,
- le droit de le modifier pour l’améliorer.
Les concepteurs de logiciels libres privilégient généralement les formats ouverts existants. Par ailleurs, dans la mesure où les auteurs des logiciels libres distribuent leur code source (la recette de conception), les méthodes d’enregistrement et les descriptions des formats utilisés sont de facto distribuées avec le logiciel. Les formats ouverts et les logiciels libres répondent aux mêmes objectifs : [*être à la disposition de tout le monde et garantir aux utilisateurs la maîtrise et la pérennité de leurs données*].
*Pourquoi est-il important d’utiliser des logiciels libres ?
En utilisant un logiciel propriétaire pour lire un format fermé, vous élargissez le nombre d’utilisateurs de ce format, [**forçant d’autres utilisateurs à acquérir le logiciel à leur tour*]. [**Cette situation accentue la position dominante que des entreprises ont acquise sur leur secteur en entravant l’accès à leur format : un brevet utilisé par tous mais caché à tous*]
Exemple de formats avec les fichiers textes
format | ouvert | commentaires |
.txt | oui | attention à l’encodage (ASCII, UTF8, ISO8859-n...) |
.rtf | oui | pas vraiment standard, pas implémenté partout pareil si mise en forme complexe, mais largement implémenté dans les éditeurs des différentes plateformes |
.odt | oui | format ouvert de texte avec mise en forme, standard ISO/IEC 26300. Utilisé par LibreOffice, OpenOffice.org, Koffice, AbiWord etc. |
.doc | non | les différentes versions ne sont pas compatibles entre elles, ni avec l’éditeur de dernière génération |
.docx | non | formats apparus en 2008 dans MS OFFICE2008, qui n’est pas lisible par les versions précédentes de MS OFFICE et qui oblige à acheter la nouvelle version ; c’est une version zippée du format .DOC avec un fichier .XML donnant des informations supplémentaire sur le fichier ; Microsoft a livré un module pour les lire avec les précédentes versions de MS OFFICE |
bof | format ouvert de texte avec mise en forme, dificilement éditable, c’est un format de partage pour fichier abouti (et impression), les versions 1.3 et 1.7 sont les standards ISO 19005 et ISO 32000. La définition du PDF reste la prérogative d’Adobe ; si le pdf a été créé avec libreoffice et qu’on a coché l’option de rétrocompatibilité, on pourra de pdf revenir à un odt. | |
.epub | oui | format utilisé pour les livres numériques, ebook, qui utilise les fonctions de styles si on l’importe depuis un doc ou odt, très bon format pour les tablettes ou smartphones |
l’inter-opérabilité
*Pourquoi l’interopérabilité ?
Il arrive souvent de devoir envoyer par courriel des fichiers de bureautique, par exemple un rapport écrit. Cependant, si vous diffusez des documents que seul un certain logiciel peut ouvrir correctement, [*vous obligez votre destinataire à posséder ce logiciel*]. Il arrive également que des documents enregistrés par d’anciennes versions de certains logiciels, lorsqu’ils sont lisibles, ne conservent pas un rendu correct dans les versions les plus récentes ! [**Si vous voulez diffuser des documents sans mettre votre destinataire dans une situation inconfortable, le mieux est de le faire dans des formats ouverts, utilisables par tous et sans restriction.*]
**L’enjeu des formats pour des données durables
Il y a encore quelques années, on réalisait des documents bureautiques avec des logiciels généralement non libres. Aujourd’hui, une grande partie de ces logiciels ont disparu. Ouvrir les documents qui ont été enregistrés avec ces produits coute désormais très cher. Le plus souvent, ils sont simplement perdus à jamais car écrits dans une langue qui n’est plus connue de personne. Ce qui était vrai hier l’est toujours aujourd’hui : [*conserver vos œuvres (textes, vidéos, musique, etc.) dans les formats fermés des logiciels privateurs vous soumet à un risque élevé de perte à plus ou moins long terme*]. À l’avenir, on retrouvera de moins en moins de photos ou de documents conservés dans des boites au fond des greniers. Ces documents seront stockés sur des disques et des mémoires électroniques.
Si vous souhaitez que vos documents soient suffisamment pérennes à l’ère du numérique, n’hésitez pas à en faire le maximum de copies possible, sur différents supports, à la fois durables et accessibles dans des formats ouverts.
** Interopérabilité en bureautique
Pendant longtemps, chaque éditeur de logiciel fabriquait son logiciel, et des filtres pour faire migrer les clients utilisateurs de leur suite bureautique à la nouvelle. L’échange de document n’était pas garanti.
Depuis quelques années, sous l’impulsion d’OpenOffice.org (racheté par Sun Microsystems), deux systèmes d’échange de fichier bureautique ont été créés, dont l’un d’entre eux est l’OpenDocument. L’autre étant celui de Microsoft.
Depuis le rachat d’OpenOffice, un dérivé (un fork) s’est imposé : [*LibreOffice est devenu une solution très solide*].
Cependant, en 2006, en France, dans le secteur privé bon nombre de documents continuent à circuler au format .doc de Microsoft Word, cette utilisation du format Word pose un problème d’interopérabilité, dans la mesure où :
- soit le destinataire doit acheter la bonne version de Microsoft Word (et éventuellement une version de Windows) pour lire de tels documents ;
- soit, en utilisant OpenOffice.org, il existe un [**risque que certaines parties du document, utilisant des fonctionnalités non connues de Microsoft Word ne passent pas correctement ou soient déformées.*]
Le format OpenDocument intègre des métadonnées selon le cadre de description prévu par RDF.
** L’exemple avec le format .docx
.docx : C’est la concrétisation de la norme Office Open XML développée à l’origine par Microsoft et visant à concurrencer la solution d’interopérabilité OpenDocument (suffixes .odt).
En 2008, Microsoft a annoncé que le format OOXML dans la version définitive de la norme ISO ne pourra pas être intégré dans Office 2007, mais dans la version suivante connue sous le nom de Office 2010 qui est disponible depuis le 12 mai 2010 auprès des clients professionnels et au mois de juin 2010 auprès des consommateurs
Le .docx est le format d’enregistrement par défaut de Word 2007, il n’est pas possible de relire ce format dans les versions antérieures de Word (qui utilisaient le suffixe doc), ce qui pose un problème de rétrocompatibilité.
Microsoft publie néanmoins un convertisseur dénommé « Module de compatibilité pour formats de fichier Microsoft Office Word, Excel et Powerpoint 2007 » qui permet, après installation sur les suites Office 2000, XP et 2003, de lire et écrire sous le nouveau format Office 2007 depuis ces anciennes versions.
La suite bureautique LibreOffice/OpenOffice.org permet l’import de ce format à partir de la version 3 sortie en septembre 2008.
Le format docx est en fait un fichier compressé au format ZIP qui contient un ensemble de fichiers (XML, images .jpg) décrivant le document.
De plus, il existe une variante pour les documents contenant des macros : .docm
**Deux raisons de ne pas utiliser des formats propirétaires, fermés
1.Prendre le risque que le destinataire ne puisse pas lire un fichier
Un format propriétaire demande l’achat d’un logiciel spécifique capable de décoder l’information contenue dans les fichiers. L’échange de fichiers en format propriétaire présuppose donc que le destinataire possède le logiciel capable de lire ce format : tout utilisateur n’ayant pas les moyens d’acheter le logiciel de décodification ne sera jamais en mesure de lire ces fichiers.
Certes, le logiciel peut être acheté. Supposons que le destinataire ait acheté le logiciel nécessaire à la lecture du fichier. Est-ce que cela garantit une accessibilité complète au fichier ? Malheureusement non : une stratégie largement suivie par les entreprises de production de logiciels consiste à modifier progressivement les formats dont elles détiennent la propriété. [*Ceux qui veulent continuer à utiliser ces formats de fichier seront ainsi obligés à acheter les mises à jour du logiciel.*]
Une stratégie aux effets similaires (« Embrace and Extend ») consiste à adopter à l’origine des formats ouverts en les modifiant progressivement avec du code propriétaire, ce qui les rend peu à peu incompatibles avec les formats utilisés par d’autres logiciels et force de fait une conversion du format public originaire vers un format propriétaire.
[**L’adoption de formats propriétaires ou semi-proprietaires répond en général à des stratégies d’entreprise qui ne correspondent pas aux exigences de l’utilisateur, dont l’intérêt va à l’accessibilité, à l’intéropérabilité et à la pérennité du contenu échangé.*]
2. Renforcer les monopoles de fait qui existent dans le domaine de l’informatique
Ce problème n’est pas sensible au niveau de l’utilisateur isolé, mais il concerne de manière cruciale la communauté des utilisateurs. [*En diffusant des fichiers en format propriétaire, on force implicitement le destinataire à choisir le même logiciel utilisé par celui qui diffuse les fichiers*]. Le message qu’on communique implicitement lors de l’échange d’un fichier en format propriétaire est le suivant : "[**Sers toi du même logiciel que j’ai utilisé ou tu ne pourras pas lire le contenu de ce fichier*]". Cette pratique - la même qui se produit lorsque celui qui diffuse des fichiers assume sans justification que "tous les destinataires du fichier possèdent sûrement le même logiciel " - a une double conséquence :
- premièrement, cette pratique impose et renforce l’utilisation de fait d’un format propriétaire comme format d’échange : ce qui signifie lier l’interopérabilité, l’accessibilité et la pérennité du contenu des fichiers aux choix politiques contingents du producteur de logiciel. Si ce-dernier décide un jour (ou se trouve obligé) de terminer la production du logiciel de lecture/écriture du format considéré, tous les fichiers existants dans ce format deviendront automatiquement inutilisables : [*la spécification du format étant inaccessible, il sera impossible de récupérer le contenu de ces fichiers devenus obsolètes*],
- deuxièmement, en imposant un monopole de fait, cette pratique limite fortement une concurrence équitable entre les producteurs de software, concurrence qui représente la condition universalement reconnue pour le devéloppement téchnologique, et affaiblit la pratique d’ouverture des spécifications de formats et la recherche de standards publics pour le devéloppement de logiciels, qui est un présupposé de ladite concurrence.
Aller plus loin :
http://fr.wikipedia.org/wiki/Format_ouvert
http://fr.wikipedia.org/wiki/Interopérabilité
http://fr.wikipedia.org/wiki/Interop%C3%A9rabilit%C3%A9_informatique
Education nationale : priorité grillée pour les logiciels libres : http://www.ecrans.fr/Education-nationale-priorite,16486.html
http://www.bardelli.fr/resources_libres/resources_libres.html
http://commons.wikimedia.org/w/index.php?title=File:Carte_conceptuelle_du_logiciel_libre.svg&page=1&uselang=fr
**sources principales :
http://wiki.april.org/w/FormatsOuverts
http://www.openformats.org/fr0
http://www.april.org/formats-ouverts-pourquoi-faire
**documents
Poster couleur
http://media.april.org/docs/formats_ouverts/formats_ouverts_poster_A4_laser.pdf , PDF A4, couleur, basse définition pour le web
http://media.april.org/docs/formats_ouverts/formats_ouverts_poster_A3_laser.pdf , PDF A3, couleur, pour l’impression laser
http://media.april.org/docs/formats_ouverts/formats_ouverts_poster_A3_offset.pdf , PDF A3, couleur, pour l’impression offset (Fichier destiné à un imprimeur)
http://media.april.org/docs/formats_ouverts/formats_ouverts_poster_A3.png , PNG A3 haute définition (300dpi)
http://media.april.org/docs/formats_ouverts/formats_ouverts_PosterA4.jpeg , JPG A4, (72dpi)
Poster noir et blanc
http://media.april.org/docs/formats_ouverts/formats_ouverts_poster_A3_noir.pdf , PDF A3 niveau, de gris pour l’impression laser
Dépliant couleur
http://media.april.org/docs/formats_ouverts/formats_ouverts_3volets_recto_laser.pdf , PDF A4, couleur, recto pour l’impression laser
http://media.april.org/docs/formats_ouverts/formats_ouverts_3volets_verso_laser.pdf , PDF A4, couleur, verso pour l’impression laser
http://media.april.org/docs/formats_ouverts/formats_ouverts_3volets_recto_offset.pdf , PDF A4, couleur, recto pour l’impression offset (Fichier destiné à un imprimeur)
http://media.april.org/docs/formats_ouverts/formats_ouverts_3volets_verso_offset.pdf , PDF A4, couleur, verso pour l’impression offset (Fichier destiné à un imprimeur)
Dépliant noir et blanc
http://media.april.org/docs/formats_ouverts/formats_ouverts_3volets_recto_noir.pdf , PDF recto A4, niveau de gris pour l’impression laser
http://media.april.org/docs/formats_ouverts/formats_ouverts_3volets_verso_noir.pdf , PDF verso A4, niveau de gris pour l’impression laser
Voir en ligne : URL d’origine