Textus : une solution d’annotation Open Source et collaborative

J’apprenais il y a quelques semaines (via Dig­i­tal Human­i­ties Inter­na­tion­al) l’existence d’un pro­jet impor­tant (annon­cé en décem­bre dernier) dont j’ignorais tout : Tex­tus de l’Open Knowl­edge Foun­da­tion. Impor­tant, en effet, parce qu’il se présen­te com­me une solu­tion d’annotation Open Source déclin­able (le pre­mier à en béné­ficier devrait ain­si être l’Open Phi­los­o­phy) chargée de fournir aux universitaires/scolaires les moyens de tra­vailler ensem­ble. Ce qui veut dire que des étu­di­ants pour­ront, par exem­ple, mar­quer un tex­te du domaine pub­lic (tex­tes édités mais aus­si brouil­lons, cor­re­spon­dances, avant-tex­tes, etc.) et exporter leurs anno­ta­tions dans un doc­u­ment PDF, voir com­ment d’autres étu­di­ants l’ont par­cou­ru, ou organ­is­er, sous la coulpe d’un pro­fesseur, de petits groupes de travaux à “l’intérieur” des marges.

Plate­forme qui s’adresse égale­ment aux chercheurs (ce bil­let du blog de Tex­tus résume bien les enjeux) et dont on mesure tout l’intérêt en ter­mes d’édition col­lab­o­ra­tive où une équipe pour­rait s’occuper d’établir une ver­sion cri­tique d’un tex­te en ligne (pour la tra­duc­tion, voir TLHUB). Plate­forme qui sup­pose des out­ils de mar­quage mais égale­ment de ges­tion pour tri­er les col­lec­tions de tex­tes, les hiérar­chis­er et les faire cir­culer avec la garantie de pou­voir les retrou­ver, com­me en témoigne la lis­te de “User Sto­ries”.

Fonctions et interface

Plus pré­cisé­ment, on pour­ra :

  1. Citer un pas­sage d’un tex­te avec une url sta­ble.
  2. Télécharg­er un tex­te.
  3. Exporter ses pro­pres anno­ta­tions d’un tex­te.
  4. Créer des lis­tes bib­li­ographiques avec des liens.
  5. Accéder à des sec­tions d’un tex­te à par­tir d’une table détail­lée.
  6. Faire des liens entre des par­ties d’un tex­te.
  7. Traduire un tex­te.

L’origine du projet

Le posi­tion­nement de Tex­tus — man­i­feste­ment uni­ver­si­taire — ne peut se com­pren­dre sans l’exploration des trans­for­ma­tions dont il a hérité. La plate­forme est une évolution/fusion de deux pro­jets (voir Wikipedia et Slideshare) : Open Shake­speare et Open Cor­re­spon­dance et s’appuie sur des solu­tions déjà dévelop­pées (Anno­ta­tor — pour annoter les pages Web — et Bib­Server — partage de lis­tes bib­li­ographiques). Ces deux ini­tia­tives sont de pre­mières ten­ta­tives pour éval­uer le tra­vail col­lab­o­rat­if en ligne entre sci­en­tifiques. Le pro­jet Tex­tus part en effet de trois con­stats (3ème slide de cette présen­ta­tion) :

  1. Des mil­liers de tex­tes du domaine pub­lic évolu­ent sur des plate­formes dif­férentes (Wik­isource, Inter­netArchive, Pro­jet Guten­berg) et gag­n­eraient à être mutu­al­isés (une opéra­tion effec­tuée sur un tex­te hébergé sur une plate­forme spé­ci­fique n’est en effet éditable que sur cette plate­forme).
  2. Les plate­formes qui per­me­t­tent d’accéder à ces tex­tes ne pro­posent pas de méta­don­nées utiles pour la recherche sci­en­tifique.
  3. La plu­part des por­tails publics ne gèrent pas la col­lab­o­ra­tion et l’interaction autour des tex­tes (d’où le nom choisi pour la plate­forme — “Tex­tus” pour tex­te” — qui désigne éty­mologique­ment le tis­sage, l’entrelacement)

Un travail de définition

C’est la raison pour laque­lle le pro­jet Tex­tus est avant tout un tra­vail de déf­i­ni­tion (Open Book­Marks a déjà échoué dans ce domaine) qui doit déter­min­er la mise en rela­tion tech­nique entre des pro­duc­tions d’acteurs. Si, par exem­ple, une anno­ta­tion est définie com­me la pro­duc­tion d’une don­née sur un doc­u­ment, il est bien évi­dent qu’il fau­dra bien pou­voir retrou­ver cette don­née, l’archiver, la faire cir­culer.

Avec tout ce que cela com­porte com­me prob­lèmes, bien iden­ti­fiés par le tra­vail de stan­dard­i­s­a­tion réal­isé par NISO et Inter­netArchive : var­iété des formes de l’annotation (souligner/signaler sans com­menter, etc.), sta­bil­ité des coor­don­nées textuelles dans un uni­vers mou­vant (un tex­te peut être mis à jour) donc des références accolées et de leur valid­ité. La solu­tion retenue — impar­faite — avait con­sisté à s’appuyer sur l’intelligence du lecteur en lui four­nissant une série d’indications, au cas où le tex­te serait mod­i­fié. Si, en effet, je pro­duis une anno­ta­tion en face d’une par­tie de tex­te et que cette dernière change d’emplacement suite à un ajout ou à un retrait, l’annotation cor­re­spon­dan­te per­dra en con­tex­te. D’où l’idée de fournir des références procé­du­rales, c’est-à-dire de découper le tex­te en don­nées sta­bles (chapitres, sec­tions, para­graph­es, etc.) qui ne souf­friront pas de son évo­lu­tion (un para­graphe peut s’agrandir à l’infini tant qu’il pos­sède un numéro, il peut être cité et retrou­vé). Au lecteur, ensuite, de faire cor­re­spon­dre l’annotation d’un tex­te qui aurait cir­culé à par­tir d’une url à sa posi­tion ini­tiale dans le tex­te désta­bil­isé.

À la lec­ture de ce bil­let, on con­state que l’équipe de Tex­tus s’est posé des ques­tions sim­i­laires. Cer­tains util­isa­teurs ont par exem­ple émis le souhait de supprimer/modifier leurs annotations…Or, Tex­tus repose sur la pro­duc­tion d’urls sta­bles, de liens en per­ma­nence vali­dent. Solu­tion trou­vée : le lien sera tou­jours opéra­tionnel mais pré­cis­era que le corps de l’annotation a été supprimé/modifié.

De la même façon, la présence de références procé­du­rales indique le souci de cir­cu­la­tion et de lis­i­bil­ité. La local­i­sa­tion d’un pas­sage de type “20665 à 20782” pren­dra ain­si cette forme : “Sec­tion 1, chapitre 2, para­graphe 12, car­ac­tère 2 à…”. Un tra­vail que refuse bien évidem­ment de faire Ama­zon, qui ten­te d’imposer ses pro­pres références (les fameux “emplace­ments”) et qui révèle bien que l’un des enjeux des tex­tes numériques est le découpage textuel déter­mi­nant l’accès (et la tra­duc­tion de ce découpage dans des références lis­i­bles, com­préhen­si­bles), vieille tech­nolo­gie apparue aux alen­tours du XIIème siè­cle 1Illich Ivan, Du lis­i­ble au vis­i­ble : La Nais­sance du tex­te, un com­men­taire du “Didas­cal­i­con” de Hugues de Saint-Vic­tor, Cerf, 1991.sans laque­lle nous ne pour­rions pas nous référ­er à, citer, mais égale­ment con­sul­ter rapi­de­ment, manip­uler, c’est-à-dire faire pren­dre des formes divers­es à un tex­te. La stan­dard­i­s­a­tion des anno­ta­tions et de ce découpage, qui paraît bien anodine, déter­mine ain­si des enjeux très impor­tants de pou­voir et de con­trôle de la cul­ture qui se traduisent par des ten­ta­tives pour gér­er sa cir­cu­la­tion et sa trans­mis­sion à tra­vers les caté­gories spa­tiales et tem­porelles.

Une anthropologie nécessaire des pratiques

Pour cela, les opéra­tions matérielles, intel­lectuelles et cor­porelles des pra­tiques d’annotations devront être pris­es en compte. Faire l’anthropologie de ces pra­tiques, c’est  analy­ser non seule­ment ce qui s’est inscrit sur un sup­port (un mot, une phrase, un signe, etc.) mais égale­ment la manière dont ce qui s’est inscrit s’est inscrit. Un étu­di­ant peut par exem­ple com­mencer à annoter sur un ordi­na­teur pour finir sur une tablet­te ou associer écran et papier (ce que Tex­tus a bien com­pris avec ses tests util­isa­teurs), utilis­er plusieurs appli­ca­tions (Zotero, Mende­ley). Con­séquence : la plate­forme doit être partout acces­si­ble et fournir l’export des anno­ta­tions. Autre exem­ple : l’utilisation par­al­lèle d’une édi­tion cri­tique imprimée peut sig­ni­fier que le sci­en­tifique cherche à cor­riger l’édition numérique. Con­séquence : pro­poser des out­ils de cor­rec­tion, etc.

Une inter­face effi­cace doit ain­si traiter ces gestes et ces stratégies mais égale­ment un ensem­ble de ques­tions théoriques (ou commence/s’arrête un tex­te numérique ? Les notes en page de page font-elles dou­blon avec les anno­ta­tions ?; l’annotation est-elle un tag ?; la présence de notes en bas de page a-t-elle une inci­dence sur la nature des anno­ta­tions ?, etc.) qui posent des prob­lèmes tech­niques (com­ment surlign­er un tex­te quand l’unité est la page et que le pas­sage souligné l’excède ? Doit-on sug­gér­er des tags si l’on con­sid­ère que cer­taines anno­ta­tions ont pour fonc­tion de thé­ma­tis­er un pas­sage ?) ou per­me­t­tent, à l’inverse, de résoudre des prob­lèmes graphiques (si la note en bas de page prend bien en charge une des fonc­tions de l’annotation, les marges seront désen­gorgées).

Notes   [ + ]

1. Illich Ivan, Du lis­i­ble au vis­i­ble : La Nais­sance du tex­te, un com­men­taire du “Didas­cal­i­con” de Hugues de Saint-Vic­tor, Cerf, 1991.

Laisser un commentaire