Textus : une solution d’annotation Open Source et collaborative

J'apprenais il y a quelques semaines (via Digital Humanities International) l'existence d'un projet important (annoncé en décembre dernier) dont j'ignorais tout : Textus de l'Open Knowledge Foundation. Important, en effet, parce qu'il se présente comme une solution d'annotation Open Source déclinable (le premier à en bénéficier devrait ainsi être l'Open Philosophy) chargée de fournir aux universitaires/scolaires les moyens de travailler ensemble. Ce qui veut dire que des étudiants pourront, par exemple, marquer un texte du domaine public (textes édités mais aussi brouillons, correspondances, avant-textes, etc.) et exporter leurs annotations dans un document PDF, voir comment d'autres étudiants l'ont parcouru, ou organiser, sous la coulpe d'un professeur, de petits groupes de travaux à "l'intérieur" des marges.

Plateforme qui s'adresse également aux chercheurs (ce billet du blog de Textus résume bien les enjeux) et dont on mesure tout l'intérêt en termes d'édition collaborative où une équipe pourrait s'occuper d'établir une version critique d'un texte en ligne (pour la traduction, voir TLHUB). Plateforme qui suppose des outils de marquage mais également de gestion pour trier les collections de textes, les hiérarchiser et les faire circuler avec la garantie de pouvoir les retrouver, comme en témoigne la liste de "User Stories".

Fonctions et interface

Plus précisément, on pourra :

  1. Citer un passage d'un texte avec une url stable.
  2. Télécharger un texte.
  3. Exporter ses propres annotations d'un texte.
  4. Créer des listes bibliographiques avec des liens.
  5. Accéder à des sections d'un texte à partir d'une table détaillée.
  6. Faire des liens entre des parties d'un texte.
  7. Traduire un texte.

L'origine du projet

Le positionnement de Textus - manifestement universitaire - ne peut se comprendre sans l'exploration des transformations dont il a hérité. La plateforme est une évolution/fusion de deux projets (voir Wikipedia et Slideshare) : Open Shakespeare et Open Correspondance et s'appuie sur des solutions déjà développées (Annotator - pour annoter les pages Web - et BibServer - partage de listes bibliographiques). Ces deux initiatives sont de premières tentatives pour évaluer le travail collaboratif en ligne entre scientifiques. Le projet Textus part en effet de trois constats (3ème slide de cette présentation) :

  1. Des milliers de textes du domaine public évoluent sur des plateformes différentes (Wikisource, InternetArchive, Projet Gutenberg) et gagneraient à être mutualisés (une opération effectuée sur un texte hébergé sur une plateforme spécifique n'est en effet éditable que sur cette plateforme).
  2. Les plateformes qui permettent d'accéder à ces textes ne proposent pas de métadonnées utiles pour la recherche scientifique.
  3. La plupart des portails publics ne gèrent pas la collaboration et l'interaction autour des textes (d'où le nom choisi pour la plateforme - "Textus" pour texte" - qui désigne étymologiquement le tissage, l'entrelacement)

Un travail de définition

C'est la raison pour laquelle le projet Textus est avant tout un travail de définition (Open BookMarks a déjà échoué dans ce domaine) qui doit déterminer la mise en relation technique entre des productions d'acteurs. Si, par exemple, une annotation est définie comme la production d'une donnée sur un document, il est bien évident qu'il faudra bien pouvoir retrouver cette donnée, l'archiver, la faire circuler.

Avec tout ce que cela comporte comme problèmes, bien identifiés par le travail de standardisation réalisé par NISO et InternetArchive : variété des formes de l'annotation (souligner/signaler sans commenter, etc.), stabilité des coordonnées textuelles dans un univers mouvant (un texte peut être mis à jour) donc des références accolées et de leur validité. La solution retenue - imparfaite - avait consisté à s'appuyer sur l'intelligence du lecteur en lui fournissant une série d'indications, au cas où le texte serait modifié. Si, en effet, je produis une annotation en face d'une partie de texte et que cette dernière change d'emplacement suite à un ajout ou à un retrait, l'annotation correspondante perdra en contexte. D'où l'idée de fournir des références procédurales, c'est-à-dire de découper le texte en données stables (chapitres, sections, paragraphes, etc.) qui ne souffriront pas de son évolution (un paragraphe peut s'agrandir à l'infini tant qu'il possède un numéro, il peut être cité et retrouvé). Au lecteur, ensuite, de faire correspondre l'annotation d'un texte qui aurait circulé à partir d'une url à sa position initiale dans le texte déstabilisé.

À la lecture de ce billet, on constate que l'équipe de Textus s'est posé des questions similaires. Certains utilisateurs ont par exemple émis le souhait de supprimer/modifier leurs annotations...Or, Textus repose sur la production d'urls stables, de liens en permanence valident. Solution trouvée : le lien sera toujours opérationnel mais précisera que le corps de l'annotation a été supprimé/modifié.

De la même façon, la présence de références procédurales indique le souci de circulation et de lisibilité. La localisation d'un passage de type "20665 à 20782" prendra ainsi cette forme : "Section 1, chapitre 2, paragraphe 12, caractère 2 à...". Un travail que refuse bien évidemment de faire Amazon, qui tente d'imposer ses propres références (les fameux "emplacements") et qui révèle bien que l'un des enjeux des textes numériques est le découpage textuel déterminant l'accès (et la traduction de ce découpage dans des références lisibles, compréhensibles), vieille technologie apparue aux alentours du XIIème siècle 1Illich Ivan, Du lisible au visible : La Naissance du texte, un commentaire du "Didascalicon" de Hugues de Saint-Victor, Cerf, 1991.sans laquelle nous ne pourrions pas nous référer à, citer, mais également consulter rapidement, manipuler, c'est-à-dire faire prendre des formes diverses à un texte. La standardisation des annotations et de ce découpage, qui paraît bien anodine, détermine ainsi des enjeux très importants de pouvoir et de contrôle de la culture qui se traduisent par des tentatives pour gérer sa circulation et sa transmission à travers les catégories spatiales et temporelles.

Une anthropologie nécessaire des pratiques

Pour cela, les opérations matérielles, intellectuelles et corporelles des pratiques d'annotations devront être prises en compte. Faire l'anthropologie de ces pratiques, c'est  analyser non seulement ce qui s'est inscrit sur un support (un mot, une phrase, un signe, etc.) mais également la manière dont ce qui s'est inscrit s'est inscrit. Un étudiant peut par exemple commencer à annoter sur un ordinateur pour finir sur une tablette ou associer écran et papier (ce que Textus a bien compris avec ses tests utilisateurs), utiliser plusieurs applications (Zotero, Mendeley). Conséquence : la plateforme doit être partout accessible et fournir l'export des annotations. Autre exemple : l'utilisation parallèle d'une édition critique imprimée peut signifier que le scientifique cherche à corriger l'édition numérique. Conséquence : proposer des outils de correction, etc.

Une interface efficace doit ainsi traiter ces gestes et ces stratégies mais également un ensemble de questions théoriques (ou commence/s'arrête un texte numérique ? Les notes en page de page font-elles doublon avec les annotations ?; l'annotation est-elle un tag ?; la présence de notes en bas de page a-t-elle une incidence sur la nature des annotations ?, etc.) qui posent des problèmes techniques (comment surligner un texte quand l'unité est la page et que le passage souligné l'excède ? Doit-on suggérer des tags si l'on considère que certaines annotations ont pour fonction de thématiser un passage ?) ou permettent, à l'inverse, de résoudre des problèmes graphiques (si la note en bas de page prend bien en charge une des fonctions de l'annotation, les marges seront désengorgées).

Notes   [ + ]

1. Illich Ivan, Du lisible au visible : La Naissance du texte, un commentaire du "Didascalicon" de Hugues de Saint-Victor, Cerf, 1991.