Corps de l’article

INTRODUCTION

Depuis l’avènement d’Internet et, plus récemment, des médias sociaux, les citoyens se voient offrir diverses plateformes numériques pour échanger entre eux, pour s’exprimer et pour contribuer de façon innovante à des projets de collaboration dans divers domaines et secteurs d’activités (Boudreau et Caron, 2016 ; Brabham, 2013). En réduisant les contraintes géographiques, temporelles, sociales et professionnelles de la communication (Vedel, 2006), Internet et ses plateformes d’interactions facilitent la participation citoyenne sous diverses formes (Jenkins, Ito et Boyd, 2016). En plus d’appuyer les formes traditionnelles de participation (communication, consultation, délibération et décision), les plateformes numériques contribuent à l’émergence d’un nouveau mode participatif, que Boudreau et Caron (2016) appellent la participation collaborative :

Bien qu’ayant des points communs avec la participation délibérative […], la participation collaborative s’en distingue par sa mécanique et sa finalité […]. On ne cherche pas tant à amener des citoyens à dialoguer et à trouver des terrains d’entente, qu’à solliciter les connaissances spécialisées de certains d’entre eux en vue de trouver des solutions originales et concrètes.

p. 160

Dans ce contexte propice à la collaboration citoyenne, la dichotomie entre l’utilisateur ou consommateur d’information et son producteur tend à s’estomper, faisant place à l’utilisateur-contributeur, notamment dans le traitement du patrimoine documentaire (Oomen et Aroyo, 2011 ; Tammaro, 2016). Cette participation collaborative peut s’apparenter à de l’externalisation ouverte (crowdsourcing), c’est-à-dire :

… une pratique qui consiste, pour une organisation, à externaliser une activité par l’entremise d’un site Web, en faisant appel à la créativité, à l’intelligence et au savoir-faire de la communauté des internautes pour créer du contenu, développer une idée, résoudre un problème ou réaliser un projet innovant, et ce, à moindre coût.

Office de la langue française, Le grand dictionnaire terminologique

C’est de ce type de participation dont il est question dans le présent article.

Basé principalement sur une recension d’écrits scientifiques, notre article traite de l’externalisation ouverte au sein des GLAM[1] et, plus particulièrement, de la collaboration citoyenne dans le traitement des documents patrimoniaux[2] numérisés par les centres d’archives et les bibliothèques. Il comprend trois sections. Dans une première section, nous abordons quelques considérations générales sur l’externalisation ouverte. Pour le lecteur peu familier avec cette forme de collaboration citoyenne, ce sera l’occasion de prendre connaissance de ce phénomène dynamisé par le Web et ses plateformes interactives. Dans une deuxième section, nous présentons les principales composantes de l’externalisation ouverte (organisation, contributeurs, tâches et plateformes), en particulier dans un contexte d’enrichissement du patrimoine documentaire. Nous y présentons la mécanique derrière ce phénomène et ses retombées. Dans une troisième et dernière section, nous abordons trois défis auxquels doivent faire face les GLAM qui souhaitent externaliser des tâches relatives au traitement des documents patrimoniaux, à savoir la participation des contributeurs, la qualité des contributions et l’intégration institutionnelle de ces contributions. Cette section se termine par des pistes de solution visant, entre autres, à concilier les pratiques institutionnelles (ou professionnelles) et les pratiques citoyennes dans le traitement des documents patrimoniaux.

1. L’EXTERNALISATION OUVERTE : CONSIDÉRATIONS GÉNÉRALES

Grâce à l’externalisation ouverte, des organisations de tout genre (entreprises privées, organismes publics, organismes à but non lucratif (OBNL), centres de recherche, etc.) peuvent mettre à contribution des experts, des amateurs et des non-initiés pour réaliser des tâches simples ou complexes, structurées ou libres, et ce, à des coûts moins élevés que si elles étaient réalisées à l’interne (Brabham, 2013 ; Erickson, 2013). La population est alors vue comme un bassin de contributeurs aux compétences diverses que l’on peut mobiliser pour innover, pour créer de nouveaux produits et services, pour trouver des solutions ou, plus simplement, pour collecter de l’information ou indexer des contenus (Brabham, 2013 ; Preece et Shneiderman, 2009). Cette démocratisation des savoirs par une mise en commun des contributions n’est pas sans rappeler l’intelligence collective, telle qu’elle est définie par Lévy (1997, p. 14) qui permet « de penser ensemble, de concentrer nos forces intellectuelles et spirituelles, de multiplier nos imaginations et nos expériences, de négocier en temps réel et à toutes les échelles les solutions pratiques aux problèmes complexes que nous devons affronter ». Soutenue par des plateformes numériques interactives, cette collaboration citoyenne à la production de savoirs collectifs peut être mise au service des organisations pour réaliser des tâches pour lesquelles les ressources internes ne suffisent plus.

Si les organisations ont tendance à s’en remettre aux technologies de l’information pour automatiser leurs tâches, les machines (ex : ordinateurs, logiciels, robots et algorithmes) se révèlent encore insuffisantes pour réaliser entièrement certaines d’entre elles. C’est alors que l’humain doit intervenir et effectuer le travail de la machine (human computation), par exemple quand il s’agit de reconnaître des images (objets, personnes ou caractères), de résoudre un problème complexe ou de créer un nouveau service ou produit. Avec l’avènement des plateformes numériques, l’humain et la machine tendent à se compléter et se fondre à l’intérieur d’un assemblage structuré de tâches externalisées. Ce mariage fonctionnel de la machine et de l’humain se prête bien aux traitements des documents. Par exemple, plusieurs projets de numérisation de textes manuscrits ou de journaux imprimés, initiés par des centres d’archives et des bibliothèques, mobilisent des volontaires pour corriger ou transcrire des textes préalablement numérisés afin de combler les limites des logiciels de reconnaissance optique de caractère (OCR). Comme le soulignent Moirez, Moreux et Josse (2013, p. 9), « [l]’OCR n’est à ce jour efficace ni sur les écritures manuscrites anciennes, ni sur les livres imprimés avant le XVIIe siècle ; là encore, seul l’oeil humain permet de réaliser une transcription de ces documents »[3].

Dans cette collaboration citoyenne à l’ère du numérique et des médias sociaux, la frontière entre l’amateur et le professionnel tend aussi à se dissiper. Des activités traditionnellement réservées aux professionnels semblent désormais à la portée d’amateurs enthousiastes, d’où le concept de pro-ams (professional-amateurs) développé par Leadbeater et Miller (2004). Quant aux contributions de néophytes dans un domaine donné, elles peuvent parfois être plus riches que celles des professionnels du domaine ou experts reconnus, lesquels ont tendance à se contaminer entre eux et à penser selon des schèmes prédéfinis (« think inside the box »). C’est ce que Surowiecki (2004) appelle la sagesse des foules. La diversité des perspectives et l’originalité des contributions seraient d’ailleurs l’une des forces de l’externalisation ouverte (Lakhani et Panetta, 2007 ; Surowiecki, 2004).

L’externalisation ouverte a d’abord été adoptée par des entreprises privées, particulièrement à des fins d’innovation, puis par des OBNL, des associations d’amateurs (ex : ornithologues et généalogistes), des centres de recherche, des organisations publiques, y compris les GLAM (Erickson, 2013). Cette forme de collaboration ouverte s’observe dans de nombreux projets en sciences citoyennes dans des domaines aussi variés que l’astronomie (p. ex. : Galaxy Zoo), la biochimie (p. ex. : Fordit), l’ornithologie (p. ex. : eBird), les mathématiques (p. ex. : Polymath), les langues anciennes (p. ex. :AncientLives), les plantes (p. ex. : Herbaria@home) et la météorologie (p. ex. : OldWeather). Quant à la gestion du patrimoine documentaire, de plus en plus d’organisations du domaine culturel, en particulier les GLAM, ont recours à l’externalisation ouverte pour solliciter une collaboration citoyenne dans le traitement (p. ex. : organisation de contenu, indexation, description, correction/retranscription, enrichissement) des nombreux documents qu’elles numérisent (Holley, 2009 ; Moirez, 2012 ; Oomen et Aroyo, 2011 ; Ridge, 2016 ; Smith-Yoshimura et Shein, 2011).

2. PRINCIPALES COMPOSANTES DE L’EXTERNALISATION OUVERTE

2.1. L’organisation (Crowdsourcer)

L’organisation peut décider d’externaliser certaines tâches qu’elles jugent trop exigeantes, compte tenu des ressources ou expertises limitées dont elle dispose à l’interne pour les réaliser. Ainsi, l’organisation espère profiter du travail de volontaires sur la base d’un bénévolat ou en échange d’une faible rétribution (Erickson, 2013 ; Howe, 2006). Pour Andro (2016, p. 237), « la principale force du crowdsourcing reste la diminution des coûts et l’obtention de capacités de travail ou de compétences dont on ne dispose pas en interne ». Avant d’externaliser certaines de ses tâches, l’organisation doit démontrer que celles-ci sont nécessaires à sa mission, qu’elles peuvent être externalisées et qu’il peut être plus avantageux de faire appel à des contributeurs externes qu’à ses propres ressources à l’interne pour les exécuter (Liu, 2017).

Les GLAM ne sont pas en reste dans ce phénomène d’externalisation ouverte et dans les bénéfices que procure cette nouvelle forme de collaboration. Au contraire, l’externalisation ouverte y gagne en popularité au fur et à mesure que les GLAM numérisent massivement leurs oeuvres ou documents patrimoniaux et les diffusent sur le Web, sans pour autant disposer des ressources humaines suffisantes pour décrire et indexer l’ensemble de ces contenus numérisés (Oomen et Aroyo, 2011 ; Ridge, 2013). Dans ce contexte de numérisation massive et de mise en ligne de contenus culturels et patrimoniaux, les tâches d’indexation et de description peuvent, en effet, devenir colossales et occasionner d’importants arrérages, en particulier dans le traitement des documents que possèdent les centres d’archives (Néroulidis, 2016). Si plusieurs de ces centres diffusent désormais sur le Web de nombreux documents patrimoniaux qu’ils ont numérisés, le repérage et l’interprétation de ces documents peuvent être difficiles, faute d’information les décrivant, diminuant l’utilité d’une numérisation massive entreprise à grands frais. Considérant l’augmentation constante de la consultation des documents patrimoniaux sur le Web, au détriment de la fréquentation des salles de consultation, cette incapacité à indexer correctement l’ensemble des documents numérisés peut avoir un impact sur la capacité des centres à remplir leur mission de diffusion du patrimoine documentaire dans un contexte numérique.

L’externalisation ouverte dans le traitement des documents numérisés se révèle donc comme une réponse visant à faciliter l’accès aux documents patrimoniaux massivement numérisés et diffusés, les amateurs et autres citoyens pouvant prêter main-forte à l’archiviste et au bibliothécaire dans le traitement documentaire, notamment en vue d’un meilleur repérage (Oomen et Aroyo, 2011 ; Ridge, 2013, 2016). Si l’externalisation ouverte apparaît comme une façon économique d’exécuter certaines tâches traditionnellement réservées à des professionnels ou techniciens, l’intégration institutionnelle des tâches externalisées au sein des GLAM pose d’importants défis organisationnels ainsi qu’un repositionnement des pratiques professionnelles, comme nous l’abordons plus loin dans le texte.

2.2. Les contributeurs (Crowd)

Une des caractéristiques de l’externalisation ouverte est de faire du citoyen plus qu’un simple spectateur ou consommateur d’information ; il devient aussi un contributeur de contenu. Dans le cas des amateurs, les contributions peuvent faire appel à des expertises[4] qui s’apparentent à des compétences professionnelles dans des domaines particuliers (Causer et Wallace, 2012 ; Leadbeater et Miller, 2004), dont la culture et l’histoire (Owens, 2013 ; Ridge, 2016 ; Tammaro, 2016). Pour Ridge (2016, p. 19), plusieurs amateurs d’histoire ont des compétences et des attitudes similaires à celles des historiens professionnels. Ces amateurs sont l’exemple idéal de « pro-ams », c’est-à-dire « des amateurs motivés, enthousiastes et dévoués qui peuvent travailler selon des normes professionnelles » (Ridge, 2013, p. 438 ; notre traduction). L’externalisation ouverte ne se limite pas à des amateurs au profil d’expert. Elle peut aussi mettre à contribution des non-initiés, c’est-à-dire des usagers ordinaires ayant peu de connaissances spécialisées dans le domaine visé par les tâches externalisées (Erickson, 2013).

Qu’elles proviennent d’amateurs ou de néophytes, les collaborations citoyennes sont loin d’être acquises. L’organisation qui externalise certaines de ses tâches doit en effet trouver des façons d’inciter les contributeurs à passer à l’action. Le désir de collaborer et de contribuer peut être motivé par des incitations extrinsèques à la tâche (p. ex. : rémunération, prix à gagner, acquisition d’expériences ou de compétences, système de classement des contributeurs, visibilité professionnelle) ou intrinsèques à celle-ci (p. ex. : plaisir, intérêt ou développement personnel, défi, passe-temps, curiosité, altruisme, nostalgie). Les motivations qui incitent à contribuer peuvent aussi être de nature sociale (p. ex. : appartenance à une communauté, reconnaissance par les pairs, réputation, lien de réciprocité, patriotisme, avancées scientifiques, sentiment de contribuer au bien commun). Alors que les entreprises privées ont tendance à faire surtout appel aux motivations extrinsèques, en particulier la rétribution des contributeurs, les centres de recherche engagés dans la science citoyenne, les OBNL, les centres de recherche et les organisations publiques cherchent, quant à elles, à mobiliser un bassin de bénévoles par des motivations de nature le plus souvent intrinsèques ou sociales (Brabham, 2010, 2013 ; Hossain et Kaurenen, 2015 ; Zhao et Zhu 2014).

Quant aux GLAM, elles doivent, elles aussi, proposer des leviers de motivation autres que l’argent, de manière à inciter les contributeurs à faire don de leur personne et de leur temps. C’est l’essence même de l’amateur qui collabore avant tout pour le plaisir de la chose. Les motivations intrinsèques et sociales peuvent conduire à du dévouement, voire une certaine dépendance, à un projet au point d’amener ses contributeurs à collaborer sur une base régulière et d’y consacrer plusieurs heures, comme s’il s’agissait d’un travail à plein temps (Alam et Campbell, 2012 ; Brabham, 2010 ; Holley, 2009 ; Hossain et Kaurenen, 2015). Ce phénomène de super contributeurs s’observe, entre autres, dans la correction de textes numérisés. Par exemple, « Les dix principaux correcteurs de texte [du Australian Newspapers Digitisation Program] ont corrigé considérablement plus de textes que tous les autres utilisateurs, consacrant jusqu’à 45 heures par semaine à l’activité » (Holley, 2009, p. 12, notre traduction). Alors que certains contributeurs souhaitent participer sur une base individuelle, d’autres se montrent plus enclins à participer s’ils ont le sentiment de faire partie d’une communauté dont les membres partagent leurs intérêts et s’entraident (Holley, 2010 ; Liu, 2017).

2.3. Les tâches externalisées

Les tâches externalisées peuvent prendre de multiples formes et faire appel à diverses compétences selon les besoins de l’organisation et les clientèles visées. Par exemple, elles peuvent être simples et être découpées en microtâches. Par le fractionnement des tâches, il devient possible de réduire l’effort exigé des contributeurs et le niveau de compétences requis tout en reliant les tâches autour de projets structurés. Les tâches externalisées peuvent aussi être complexes et peu structurées, nécessitant le recours à des expertises particulières. Enfin, l’externalisation des tâches peut faire appel à des contributions individuelles, diversifiées et indépendantes, telles que l’a bien décrit Surowiecki (2004) dans La sagesse des foules, ou à des contributions collectives organisées en réseau collaboratif, telles que définies par Lévy (1997) dans son ouvrage sur L’intelligence collective. Les GLAM se révèlent un terreau fertile à l’externalisation des tâches, individuelles ou collectives, si l’on en juge par le nombre croissant de projets de collaboration citoyenne qui y ont (eu) cours, notamment pour appuyer les organisations dans le traitement de contenus numérisés, dont les documents patrimoniaux (Ridge, 2016).

Pour nous aider à voir plus clair dans l’externalisation ouverte du patrimoine documentaire, Oomen et Aroyo (2011) proposent une typologie qui regroupe les tâches externalisées autour des cinq formes de contributions suivantes : 1) l’édition de contenu, c’est-à-dire la sélection des contenus culturels à numériser ou à mettre sur le Web (p. ex. : Click[5] du Brooklyn Museum, You ask, we scan[6] des Archives municipales d’Amsterdam) ; 2) la correction ou retranscription de textes lorsque l’océrisation de ceux-ci s’avère incomplète ou impossible (p. ex. : Transcribe Bentham[7] de l’University College de Londres, Trove[8] de la Bibliothèque nationale d’Australie et Old Weather[9] des Archives nationales du Royaume-Uni) ; 3) la contextualisation de contenus par la production d’articles, de fiches descriptives ou de témoignages (p. ex. : 1001 Stories[10] du Danish Agency for Culture et Projet Livernois[11] de Bibliothèque et Archives nationales du Québec (BAnQ) avec Wikipédia) ; 4) l’enrichissement du patrimoine archivistique par l’ajout de documents provenant de fonds privés (p. ex. : Europeana 1914-1918[12], Sound map[13] du British Library et de l’Oxford’s Great War Archive) et 5) l’indexation des contenus (mots-clés ou tags, catégories fermées, annotations, commentaires et géolocalisation) afin de favoriser leur repérage et référencement sur le Web (p. ex. : Chronoscope[14] de l’ÉNAP et de ses partenaires et Co-Lab[15] de Bibliothèque et Archives Canada (BAC)). Les GLAM peuvent faire appel à plusieurs types de contributions à l’intérieur d’un même projet d’externalisation ouverte. C’est le cas du projet Europeana 1914-1918, lancé à l’occasion du centenaire de la Première Guerre mondiale, dans lequel les citoyens ont été invités à partager leur histoire familiale à travers des photographies, des cartes postales ou des lettres publiées par des bibliothèques, ainsi qu’à fournir et à faire numériser des documents de ce conflit en leur possession.

2.4. Les plateformes numériques

Ce sont les plateformes numériques qui permettent techniquement aux organisations d’externaliser leurs tâches, de les structurer et de les rendre accessibles à un large public ou à un public d’initiés sur le Web afin de susciter leurs contributions. Elles constituent l’interface technologique qui met en relation l’organisation, les tâches et les contributeurs. Dans le cas des GLAM, l’organisation qui désire externaliser certaines de ses tâches peut s’appuyer sur des plateformes existantes de type grand public (p. ex. : Facebook, Instagram et Flickr) ou des plateformes dites spécialisées (p. ex. : OMEKA, Historypin, Scripto). L’organisation peut aussi développer sa propre plateforme (p. ex. : Citizen Archivist, Co-Lab, T-Pen, Chronoscope). Dans tous les cas, les plateformes numériques contribuent à élargir le bassin des contributeurs ainsi que la palette de leurs contributions.

Si la collaboration citoyenne au sein des GLAM est une tradition qui remonte bien avant l’arrivée d’Internet, les plateformes numériques contribuent à la diversification de cette collaboration dans la sélection, la production, l’indexation ou la diffusion de contenus (Owens, 2013). Il ne faut pas pour autant croire que les contributions en ligne dans le traitement des documents patrimoniaux soient principalement l’oeuvre d’une foule anonyme de néophytes. Ces contributeurs s’apparentent plutôt à « des publics initiés […] déjà familiers avec ces institutions », précise Néroulidis (2015, p. 18). Une des premières plateformes numériques à connaître du succès auprès des citoyens est celle que la Bibliothèque du Congrès américain a développée et expérimentée, en 2008, en utilisant Flickr. Les contributions citoyennes y ont été nombreuses : 67 000 tags et 7 000 commentaires ont été ajoutés aux 20 000 photos publiées (Springer et al., 2008). Le titre de meneur institutionnel en archivistique citoyenne revient cependant aux Archives nationales des États-Unis (NARA), en particulier depuis le lancement de sa plateforme Citizen ArchivistDashboard, en 2011. Par cette plateforme, les citoyens peuvent contribuer au traitement documentaire de la NARA de diverses façons : transcription et correction de textes, indexation et contextualisation de documents, numérisation des documents à l’aide de téléphone ou appareil photo, etc. Quant aux Archives nationales du Royaume-Uni, il s’agit de l’une des premières institutions à intégrer les produits de l’indexation citoyenne dans ses catalogues. Du côté de la France, on dénombrait, en 2012, plus d’une vingtaine de centres d’archives ayant mis à la disposition des citoyens une plateforme collaborative permettant de corriger et de retranscrire des textes ou d’indexer des images pour un meilleur repérage et décodage des contenus (Néroulidis, 2015).

Plus près de nous, la plateforme Co-Lab, développée et déployée par BAC, en 2018, permet aux citoyens de transcrire, d’étiqueter ou de décrire des documents numérisés de la collection de BAC. Contrairement à la France, au Royaume-Uni et aux États-Unis, un moins grand nombre d’institutions culturelles ou d’organismes publics au Québec ont déployé des plateformes d’externalisation ouverte dans le traitement de leurs documents patrimoniaux, à l’exception de BAnQ[16] et, plus récemment, la Ville de Québec et la Ville de Gatineau[17] ainsi que le Musée national des Beaux-Arts du Québec[18].

3. LES DÉFIS DE L’EXTERNALISATION OUVERTE EN PATRIMOINE DOCUMENTAIRE

Les GLAM qui souhaitent externaliser certains traitements documentaires sont susceptibles d’être confrontés aux trois défis suivants : la participation des contributeurs, la qualité des contributions et l’appropriation organisationnelle de ces contributions (Figure 1). Examinons de plus près chacun de ces défis.

Figure 1

Défis organisationnels de l’externalisation ouverte

Défis organisationnels de l’externalisation ouverte

-> Voir la liste des figures

3.1. La participation des contributeurs

Les GLAM qui externalisent certaines de leurs tâches se voient aux prises avec un enjeu préalable à la participation : le recrutement. Veut-on recruter auprès d’un public d’initiés, en particulier des amateurs d’histoire ? Désire-t-on aussi étendre le recrutement à un public de non-initiés ? Pour les GLAM qui optent pour une stratégie de niche visant à recruter parmi un bassin d’amateurs experts ou de professionnels à la retraite, comme c’est le cas de plusieurs projets en patrimoine documentaire (Ridge, 2016), il peut être commode d’approcher des communautés existantes (Liu, 2017)[19]. À ce propos, les médias sociaux, comme les pages Facebook de groupes de citoyens intéressés par l’histoire ou Wikipédia et sa communauté de wikipédiens, permettent de rejoindre facilement des groupes d’amateurs actifs sur le Web. Une fois recrutés, ces amateurs ne se contenteront pas de microtâches structurées. Les plus versés d’entre eux seront aussi attirés par des tâches complexes qui mettront à l’épreuve leurs connaissances et qui les convieront à jouer le rôle de détective (Ridge, 2016). À l’inverse, si les GLAM désirent rejoindre un large public, ils devront alors faire appel à des tâches simples et encadrées, comme dans le cas de l’indexation d’images ou la transcription ou correction de textes, de manière à diminuer l’effort mental exigé et à permettre des contributions pointues et sporadiques (Ridge, 2013, 2016). Pour ces néophytes de l’histoire et du patrimoine, le divertissement et l’expérience utilisateur prédominent sur le sérieux de la tâche. Plusieurs d’entre eux seront plus portés à consulter des contenus et à les partager qu’à y contribuer. La cohabitation d’amateurs et de néophytes dans un même projet d’externalisation ouverte n’est pas pour autant contre-indiquée. Au contraire, une communauté d’amateurs peut amener des non-initiés à s’intéresser à l’histoire, à s’approprier de nouvelles connaissances ou compétences et à devenir, à leur tour, des amateurs (Alam et Campbell, 2012 ; Ridge, 2016).

Recruter ne suffit pas, encore faut-il qu’il y ait contribution. Or, une majorité de participants dans les projets d’externalisation ouverte au sein des GLAM demeurent discrets, prenant plus la posture du spectateur que du contributeur : « Il est plus facile de convaincre les gens de regarder du contenu que d’en ajouter », signale Ridge (2016, p. 112, notre traduction). Pour inciter à la contribution, il est recommandé d’offrir des modes d’indexation à l’image des contributeurs. La folksonomie semble être le mode tout désigné en ce qu’elle offre à l’utilisateur la possibilité de recourir à son propre vocabulaire pour étiqueter (tags), commenter ou décrire un document. Contrairement à la taxonomie, qui oblige à chercher à l’intérieur d’une hiérarchie de termes prédéterminés (métadonnées formelles), la folksonomie renvoie à une indexation intuitive (métadonnées sociales) qui s’apparente au langage naturel de l’utilisateur et qui, par conséquent, ne nécessite ni formation ni investissement préalable (Francis et Quesnel 2007 ; Mathes, 2004 ; Shirky, 2005). Pas surprenant que la folksonomie soit si populaire pour indexer des images présentes sur le Web.

Quels que soient les modes d’indexation préconisés (p. ex. : taxonomie ou folksonomie), les utilisateurs ne seront pas tous animés du même désir de contribuer. Certains s’investiront plus que d’autres. C’est le cas des utilisateurs que l’on qualifie de super contributeurs et qui sont à l’origine de la majorité des contributions dans plusieurs projets d’externalisation ouverte au sein de GLAM (Causer et Wallace, 2012 ; Holley, 2010 ; Oomen et Aroyo, 2011). Compte tenu de l’apport essentiel de ces super contributeurs, il est important de s’en occuper et de reconnaître leur collaboration afin qu’ils maintiennent un rythme élevé de contributions (Holley, 2010 ; Liew, 2015 ; Liu, 2017). La reconnaissance peut prendre la forme d’un simple remerciement ou d’un système plus complexe qui identifie les super contributeurs et les classe selon le nombre de contributions (p. ex. : tableaux de classement ou d’honneur) (Holley, 2010). Or, le fait de susciter de la compétition entre les contributeurs n’est pas sans risque, dont celui de voir des contributeurs privilégier la quantité à la qualité (Ridge, 2016) ou de tenter de détourner à leur avantage le système de reconnaissance pour améliorer leur classement (Brabham, 2012). À ce propos, Ridge (2016) suggère de faire preuve de prudence dans la diffusion des statistiques de contributions, particulièrement lorsque ces statistiques ne tiennent compte ni de l’effort du contributeur ni de la qualité des contributions. Une autre façon de récompenser les super contributeurs consiste à leur confier des responsabilités particulières, dont la modération et la validation de contenus (Liew, 2015 ; Proctor, 2010).

Comme autres stratégies favorisant le recrutement et la participation des contributeurs, mentionnons la promotion du projet d’externalisation ouverte dans laquelle l’organisation doit exposer clairement les objectifs du projet, son fonctionnement et ses retombées (Holley, 2010). Avant de s’engager, les contributeurs sont en droit de savoir à quoi et à qui serviront leurs contributions. Il est aussi recommandé d’offrir aux contributeurs l’option d’identifier ou non leurs contributions ; alors que certains contributeurs souhaitent rester anonymes, d’autres désirent s’identifier et voir les autres contributeurs faire de même afin d’assurer, dans une certaine mesure, la qualité des contributions et d’établir la réputation des contributeurs (Liew, 2015 ; Erickson 2013). Par ailleurs, plusieurs contributeurs souhaitent avoir une rétroaction sur leurs contributions et sur le degré de progression de leurs tâches (Liew, 2015 ; Ridge, 2016 ; Causer et Wallace, 2012). La ludification des tâches, c’est-à-dire l’insertion d’éléments de jeu (p. ex. : obtenir un badge), peut aussi être une façon d’inciter à la contribution en joignant l’utile à l’agréable (Koivistoa et Hamaria, 2018 ; Mäntymäki, Merikivi, Verhagen, Feldberg, et Rajala, 2014 ; Moon et Kim, 2001). Enfin, les contributeurs seront d’autant plus enclins à collaborer que la plateforme d’externalisation ouverte sera simple d’utilisation et offrira un accès facile à l’ensemble des tâches et des contributions selon les besoins de l’utilisateur (Brabham, 2012 ; Holley, 2010 ; Liu, 2017).

3.2. La qualité des contributions

Contrairement aux employés, les contributeurs dans des projets d’externalisation ouverte sont des volontaires le plus souvent bénévoles, donc libres d’agir à leur guise et du mieux qu’ils peuvent (Thuan, Antunes et Johnston, 2017). Certains auteurs voient dans cette contribution volontaire une menace à la qualité de l’information produite, voire un vecteur d’infopollution (Zhao et Zhu, 2014). Ainsi, l’organisation peut être tenue de filtrer la bonne information parmi d’innombrables contributions d’inégale qualité (Erickson, 2013 ; Starbird, 2012 ; Zhao et Zhu, 2014). La qualité des contributions serait l’une des principales objections des opposants à l’externalisation ouverte (Andro, 2016). Elle constitue aussi un thème récurrent lorsqu’il est question d’externaliser une partie du traitement du patrimoine documentaire. Loin de faire l’unanimité, cette externalisation demeure une source d’inquiétudes auprès des professionnels du patrimoine, en particulier les archivistes, qui craignent devoir gérer des contributions inexactes, hors contexte ou non pertinentes (Mathes, 2004 ; Oomen et Aroyo, 2011). Pour Mathes (2004), l’indexation libre, en particulier la folksonomie, représente à la fois ce qu’il y a de meilleur et de pire dans le traitement des documents patrimoniaux. Attardons-nous d’abord aux avantages d’une indexation de type folksonomique. Pour l’utilisateur, comme pour l’organisation, il n’y a pas (ou peu) de coût associé à la mise à jour de la folksonomie, contrairement à la taxonomie (Mathes, 2004 ; Shirky, 2005). De plus, en permettant à l’utilisateur de s’exprimer « dans des vocabulaires simples et intuitifs qui correspondent aux modes de recherche en langage naturel des usagers », la folksonomie adapte l’indexation aux usages du moment et aux réalités de l’utilisateur (Moirez, Moreux et Josse, 2013, p. 7). Elle semble particulièrement bien adaptée aux contenus et aux différents formats disponibles sur le Web (p. ex. : textes, images, enregistrements sonores, photos et vidéos). Cependant, la folksonomie comporte aussi son lot de problèmes qui peut donner lieu à « de nombreuses confusions et des polysémies dérangeantes », confrontant les utilisateurs à une Babel sémantique en raison d’un manque de normalisation, affirme Le Deuff (2006, p. 68). Par exemple, des confusions peuvent survenir quand un même mot clé est utilisé pour désigner différentes choses (polysémie) ou quand différents mots-clés désignent la même chose (synonymie), sans oublier les problèmes liés au néologisme et à l’orthographe (Le Deuff, 2006 ; Mathes, 2004). Bien que l’indexation de type folksonomique rejoigne l’utilisateur moyen, « c’est le temps passé à retrouver l’information qui s’accroît, contrairement aux systèmes d’informations hiérarchisées, où le coût d’indexation par les professionnels est plus élevé, mais la recherche d’informations [spécifiques] facilitée pour l’usager » (Le Deuff, 2006, p. 70). Les problèmes liés à la folksonomie peuvent s’exacerber quand les contributeurs recourent à une indexation dite personnelle et subjective (selfish tagging) qui peut entraîner une multiplication indue de mots-clés (Dye, 2006).

Pour les GLAM, la qualité des contributions citoyennes dans l’indexation des documents patrimoniaux soulève des enjeux qui peuvent avoir des répercussions non seulement sur l’image de l’organisation, mais aussi sur l’efficience de son fonctionnement. En effet, des contributions citoyennes de mauvaise qualité ou peu pertinentes pourraient surcharger inutilement le travail de validation de l’archiviste et autres spécialistes du traitement des archives. Il faut éviter que les tâches de validation professionnelle et d’intégration institutionnelle de l’indexation sociale des documents patrimoniaux soient plus exigeantes que le traitement lui-même de ces documents à l’interne. L’organisation peut déployer diverses stratégies pour exercer un contrôle sur la qualité des contributions citoyennes afin de faciliter leur intégration institutionnelle. Une stratégie simple consiste à recourir à une liste de termes normalisés et autres vocabulaires contrôlés reconnus par des professionnels du domaine. Bien qu’intéressante, cette approche peut s’avérer, d’une part, incomplète pour indexer des contenus variés et éclatés et, d’autre part, peu intuitive et rébarbative pour des utilisateurs non familiers avec l’utilisation de nomenclatures. Une autre stratégie consiste à fractionner les tâches et à les incorporer dans une séquence de microtâches bien orchestrée, comme le font depuis quelques années nombre de centres d’archives aux États-Unis et en France à partir de leur système d’indexation collaborative (Moirez, Moreux et Josse, 2013 ; Néroulidis, 2015). Ces systèmes permettent la constitution de banques d’information structurées facilement réutilisables à partir d’un vocabulaire contrôlé (p. ex. : autocomplétion) ou d’un fractionnement des tâches et d’un ordonnancement des informations à saisir. Bien que limitant les risques de dérapage et d’erreurs ainsi que l’effort cognitif exigé, un découpage en microtâches ordonnancé ne garantit pas, à lui-seul, la qualité des contributions citoyennes, du moins sur une base individuelle.

Comme autre stratégie, il peut être bénéfique de faire appel aux contributeurs eux-mêmes pour valider collectivement la qualité (p. ex. : exactitude, véracité ou pertinence) des contributions. L’organisation peut être d’autant plus intéressée par cette régulation par les pairs (ou autorégulation) qu’une validation de la qualité peut s’avérer un exercice exigeant pour l’organisation (Momeni, Haslhofer, Tao et Houben, 2015). Cette autorégulation peut consister en un simple appel qu’un contributeur lance aux autres contributeurs pour trouver une information ou pour confirmer une piste ou une hypothèse. La régulation par les pairs peut aussi être appuyée par un système de validation manuelle qui permet aux divers contributeurs de se prononcer (p. ex. : voter) sur la qualité des autres contributions. Ainsi, les contributions ayant obtenu le plus grand nombre de votes peuvent être considérées comme étant les plus « valables » ou « valides ». La régulation par les pairs peut aussi être prise en charge par des dispositifs technologiques qui, intégrés à la plateforme, regroupent et diffusent automatiquement les contenus les plus fréquemment utilisés par les contributeurs (p. ex. : nuage de mots-clés) (Dye, 2006 ; Forte, Larco et Bruckman, 2009 ; Francis et Quesnel, 2007 ; Mathes, 2004). Le fait d’afficher les mots-clés les plus populaires tend à favoriser une uniformisation de l’indexation folksonomique (Forte, Larco et Bruckman, 2009 ; Mathes, 2004). Comme le signalent Francis et Quesnel (2007, p. 62), la force de la folksonomie « provient surtout de l’agrégation des termes proposés par les différents utilisateurs et de l’affectation d’une importance supérieure aux termes les plus fréquemment utilisés ». Ainsi, la qualité de l’indexation citoyenne peut être obtenue par la confrontation des diverses contributions. Enfin, des contributeurs actifs et crédibles peuvent se voir confier des responsabilités dans la validation des contributions, comme nous l’avons mentionné précédemment. Cela n’empêche pas que les contributions puissent être approuvées ensuite par des professionnels oeuvrant au sein de GLAM, comme le propose le Smithsonian Institution dans le cadre d’activités de correction et transcription d’anciens documents par des citoyens.

3.3. L’intégration institutionnelle des contributions

Malgré les inquiétudes d’archivistes, de bibliothécaires et d’autres professionnels oeuvrant dans le traitement du patrimoine documentaire, les quelques études tendent à montrer que les contributions citoyennes se révèlent le plus souvent de qualité, pertinentes et respectueuses et, donc, nécessitant peu de modération (Liew, 2015 ; Holley, 2009 ; Springer et al., 2008 ; Trant, 2009). Pour Ridge (2016) et pour Holley (2010, 2009), les contributeurs veulent généralement bien faire, d’où l’importance de leur faire confiance et de ne pas présumer que tout ira mal. Si les avantages de recourir à des contributions citoyennes dans l’enrichissement du patrimoine documentaire semblent attirer de plus en plus d’adeptes parmi les chercheurs et praticiens du domaine, les effets que peuvent avoir les contributions citoyennes sur les pratiques documentaires au sein des GLAM demeurent largement méconnus. Bien que des chercheurs et des professionnels voient dans cette collaboration élargie une façon de moderniser les pratiques documentaires à l’ère du Web social, l’intégration de ces contributions citoyennes aux opérations courantes des GLAM, notamment dans les services d’archives, reste en effet un champ de recherche peu étudié. Cela n’est sûrement pas étranger au fait que les archives dites participatives (participatory archives)[20] soient un phénomène émergent et que les tentatives d’intégration des contributions citoyennes aux GLAM aient été jusqu’ici peu nombreuses et modestes[21].

Il faut aussi comprendre que cette démocratisation de l’archivistique, en particulier l’indexation sociale, vient bousculer les pratiques organisationnelles et professionnelles et susciter de l’inquiétude parmi les professionnels et techniciens du domaine qui y voient une dévalorisation de leur travail (Andro, 2016). Outre une certaine résistance professionnelle, le manque de temps, de ressources et de procédures claires au sein des GLAM peut aussi expliquer le peu de projets d’intégration institutionnelle de contributions citoyennes à l’enrichissement des contenus patrimoniaux. Intégrer l’indexation sociale dans la gestion courante des centres d’archives et autres institutions culturelles peut en effet être exigeant, notamment quand il s’agit de repérer les contributions citoyennes, d’en vérifier la qualité et la pertinence, de les filtrer, de les organiser et de les transférer dans les systèmes en place. L’externalisation ouverte du patrimoine documentaire peut donc être vue par les archivistes et leurs organisations comme des tâches supplémentaires pour lesquelles ils n’ont ni de temps ni d’autres ressources à consacrer, sinon très peu.

Conscients que nous nous aventurons sur un terrain en friche et sensible, nous nous permettons certaines considérations susceptibles de faire avancer la réflexion sur l’intégration des contributions citoyennes au sein des GLAM, en particulier les centres d’archives. Comme nous l’avons vu précédemment, l’externalisation ouverte du patrimoine documentaire met en présence deux logiques distinctes, le plus souvent perçues comme concurrentes : l’une sociale, libre et spontanée (p. ex. : folksonomie), l’autre professionnelle, structurée et planifiée (p. ex. : taxonomie). Compte tenu du caractère dichotomique de l’externalisation ouverte en archivistique, il n’est pas surprenant que l’intégration des contributions citoyennes aux pratiques organisationnelles et professionnelles pose d’importants défis conceptuels et pratiques. D’ailleurs, peu d’organisations en patrimoine documentaire ayant expérimenté l’externalisation ouverte ont réussi à intégrer les contributions citoyennes dans le fonctionnement courant de leurs archives (Smith-Yoshimura et Holley, 2012). Et quand il y a eu tentatives d’intégration, celles-ci ont été de portée limitée, soulignent Smith-Yoshimura et Holley (2012). Les contributions citoyennes s’ajoutant comme une couche d’information supplémentaire sans impact véritable sur les pratiques archivistiques en place[22].

Plutôt que d’opposer ces deux logiques, de plus en plus d’auteurs cherchent à les réconcilier en les présentant comme étant complémentaires. Par exemple, Merholz (2004) recommande d’utiliser la folksonomie comme point de départ à une indexation structurée. Pour Trant (2009) et pour Rorissa (2010), l’indexation libre peut aussi être vue comme un complément qui vient bonifier l’indexation professionnelle par l’étendue et la richesse de ses éléments de repérage et de décodage. S’appuyant sur les résultats d’une expérimentation réalisée au Steve Museum, Trant constate que 88 % (32 609) des tags sociaux produits lors de ce projet ont été jugés utiles par les employés du musée. Pour ces auteurs, l’intégration institutionnelle des contributions passe par un modèle d’indexation hybride qui combine des mécanismes à la fois d’indexation structurée (p. ex. : affichage des mots-clés les plus populaires, fractionnement des tâches et vocabulaire contrôlé) et d’indexation libre (ex : mots-clés libres, commentaires et témoignages). Le succès de cette indexation hybride sera fonction du degré de cohabitation des pratiques professionnelles et des contributions citoyennes au profit de l’organisation et de ses contributeurs. À défaut d’une véritable intégration institutionnelle des contributions citoyennes, les projets d’externalisation ouverte sont susceptibles d’être perçus par les organisations, leurs employés et leurs contributeurs comme un exercice vain, démotivant et exigeant. Autrement dit, en l’absence de retombées concrètes et durables, les contributeurs auront tendance à perdre leur motivation de départ et à diminuer leurs contributions avec le temps.

CONCLUSION

Le phénomène d’externalisation ouverte amène un repositionnement des pratiques professionnelles et organisationnelles dans plusieurs sphères d’activités (p. ex. : science, innovation, microtâches rémunérées, environnement, services publics, arts et culture, etc.). C’est le cas du traitement de nombreux documents patrimoniaux que les centres d’archives numérisent et diffusent sur le Web, sans pour autant disposer des ressources suffisantes pour traiter l’ensemble de ces documents. Dans ce contexte de numérisation massive, l’externalisation ouverte est vue comme une solution des plus porteuses pour autant que les citoyens, en particulier des amateurs de patrimoine et d’histoire, puissent contribuer significativement à l’enrichissement et à la diffusion des fonds d’archives.

Bien que certains voient dans cette démocratisation une dévalorisation du métier de l’archiviste, nous croyons, au contraire, qu’il s’agit d’une occasion de repositionner avantageusement les pratiques en archivistique dans un contexte (numérique, organisationnel et social) de plus en plus propice à une collaboration citoyenne dans l’enrichissement des documents patrimoniaux. Il reste que cette collaboration comporte, rappelons-le, d’importants défis organisationnels liés au recrutement et à la participation effective des contributeurs, à la qualité des contributions et à leur intégration institutionnelle.

En raison de leurs expertises et leurs rôles dans le traitement de documents, les archivistes semblent bien placés pour relever certains de ces défis, que ce soit par la sélection et diffusion des contenus patrimoniaux ou par la validation des contributions citoyennes et leur intégration institutionnelle. En somme, les archivistes se révéleront des acteurs incontournables lorsqu’il s’agira de mettre l’intelligence collective au service du patrimoine documentaire, particulièrement dans un contexte d’externalisation ouverte qui nécessite d’aligner les contributions citoyennes aux besoins des organisations en vue d’obtenir de retombées durables dans la valorisation d’un bien commun aussi important que le patrimoine documentaire.