1 1 1 1 1 1 1 1 1 1 Rating 0.00 (0 Votes)

Interopérabilité et logiques organisationnelles
Ce qu'ouvrir ses données veut dire

Marie Després-Lonnet, Béatrice Micheau et Marie Destandau

Résumé : Dans la perspective de l’ouverture des données publiques, nous accompagnons trois institutions qui gèrent des fonds liés à la musique, dans cette triple évolution technique, organisationnelle et politique. L’objectif est de concevoir une « ontologie » qui servira d’appui à la description de la musique. Notre collaboration avec les experts a permis de saisir les tensions que ce projet génère, malgré la volonté collective de parvenir à une modélisation partagée. Nous avons ainsi pu montrer que chaque institution porte un regard situé sur la musique comme pratique sociale et sur les objets et documents qu’elle détient. La recherche d’un modèle commun et qui pourrait s'appliquer globalement nécessite que chaque institution envisage les données et les concepts associés d’une façon plus globale et remette en partie en question ses modes de faire. Notre étude montre que pour ne pas aboutir à un modèle totalement abstrait, il convient de voir la modélisation comme une forme de discours qui s’inscrit dans la continuité des écritures de notre patrimoine culturel : écritures vivantes, faites de négociations constantes entre normes et bricolages, nécessités organisationnelles et adaptation à des contraintes ponctuelles, dont nous retrouvons sans cesse les multiples traces, qui sont autant de matériaux pour nos recherches sur l’anthropologie des savoirs. 

Les recherches présentées dans cet article ont été partiellement financé par le projet ANR-2014-CE24-0020 «DOREMUS.

Mots clés : ontologie, documentation, open data, patrimoine culturel, musique, modélisation, métadonnées, circulation des savoirs 

INTRODUCTION

Engagée depuis plusieurs années dans une politique ambitieuse d’ouverture des données publiques, la France prendra en octobre prochain la présidence du « Partenariat pour le gouvernement ouvert » (Open Government Partnership), dont l’un des engagements est de «fournir dans les meilleurs délais, une information à forte valeur ajoutée, ainsi que des données brutes, dans des formats que le public peut aisément localiser, comprendre et utiliser »[1].

Pour se conformer à cet objectif, les institutions culturelles doivent faire évoluer leurs méthodes d’inventaire et leurs systèmes de gestion documentaire. Il s’agit pour elles d’une triple évolution à la fois technico-documentaire, organisationnelle et politique. En effet, il leur faut tout à la fois repenser les modes de description des objets qu’elles détiennent; revoir les procédures et les compétences des personnes chargées de ces tâches et surtout les penser dans un nouveau cadre, qui ajoute à leurs missions celle de fournisseurs de «données». Ce projet soulève donc des questions stratégiques, que Camille Domange, chef du département des programmes numériques, formule clairement dans la feuille de route stratégique « métadonnées culturelles et transition web 3.0 »[2] : « Le travail sur l’enjeu des métadonnées culturelles […] est primordial pour l’avenir des politiques culturelles |…] Dans cette perspective, un certain nombre de questions se posent : dans quelle mesure l'identification des objets, leurs modélisations, leurs interconnexions sémantiques augmentent l'interaction entre le Web et le monde tangible de la vie quotidienne ? » (Domange, 2013).

Nous accompagnons actuellement trois grandes institutions publiques françaises, qui toutes trois détiennent des catalogues en partie ou totalement liés au domaine de la musique : la BnF, Radio-France et la Philharmonie de Paris. Chacune d’elles exerce une mission de service public spécifique, qui l’amène à porter un regard particulier sur les objets qu’elle détient, mais également sur la musique comme pratique sociale. Chaque fonds est donc répertorié et décrit selon des approches « métier » qui le destinent à un usage particulier.

Le travail que nous menons avec elles pourrait, à première vue, sembler centré sur des questions techniques de mise en cohérence. Cependant, les questions soulevées lors des rencontres entre les spécialistes des trois institutions montrent qu’il ne s’agit pas simplement « d’aligner » des métadonnées, mais bien de concilier des points de vue et des regards, souvent complémentaires, mais aussi parfois divergents, sur les objets décrits, le tout à partir d’un modèle de description déjà en partie préconstruit[3]. La question de ce qu’est une œuvre musicale surgit alors au cœur d’un débat qui n’a pas encore trouvé de conclusion, mais qui est exemplaire des tensions qu’un projet a priori fédérateur, puisqu’il s’agit de s’entendre pour mieux partager l’information, peut générer. Engagés dans une recherche-action participative avec un ensemble d’acteurs qui, au départ, ne sont pas tous chercheurs, mais qui sont tous amenés à endosser partiellement ce rôle à un moment ou à un autre du projet (Gonzales-Laporte, 2014), les différents membres de l’ANR travaillent collectivement à la création d’une technologie documentaire et à ses inscriptions possibles dans des interfaces (outils de visualisation, de navigation, voire de recommandation).

Ce processus créatif d’une technologie intellectuelle (Goody 1977, Robert 2000) nécessite de définir les objets de la documentation (CD, enregistrements, partitions, mais aussi œuvre, expression…), de s’accorder, dans les contraintes d’un modèle, sur les manières de décrire les objets et les ressources détenus par chacun, tout en en pensant les usages possibles, au-delà des sphères d’usage antérieures. L’ensemble des participants chercheurs ou des chercheurs participants sont donc pris dans un processus d’innovation qui passe par une série de transformations qui pourraient être pensées comme des médiations : traduction et partage des connaissances savantes ou expertes, hybridation des pratiques de recherche et des pratiques expertes, dynamiques entre réflexion et pouvoir d’agir, fabrication de consensus sur le sens, les objectifs, les objets, et méthodes du travail de l’innovation, partage et changement des pratiques de la documentation et de l’ingénierie. Ces diverses transformations nécessitent de très longs temps d’échanges, parfois contradictoires, entre des acteurs qui avaient jusqu’ici, chacun dans leur organisation, conçu des «manières de faire» et d’innover qui leur étaient propres. Cette remise en question de leur manière de faire est amplifiée par une injonction institutionnelle, celle d’ «ouvrir leurs données» sans que ne soient explicités les contextes d’usage de cette ouverture alors que, justement, dans les organisations, ce qui fait sens, dans la formalisation et la normalisation des pratiques documentaires, c’est d’essayer de concilier usages et contraintes organisationnelles. Ce serait dans l’assomption des désordres documentaires, inhérents à l’impossibilité de textualiser tous les usages, et dans les bricolages des actes de formalisation, que pourrait se construire une langue commune, une manière de dire un domaine de connaissance et d’en partager, relier, comparer les objets.

Afin de mettre en lumière les ressorts de ces tensions, nous reviendrons tout d’abord sur la conception d’une documentation, comme acte de situer et décrire des objets culturels, sur laquelle repose le projet d’ouverture des données, afin de montrer les implications, dans le domaine que nous étudions, de la constitution d’une « ontologie » (au sens informatique du terme). Ceci nous permettra de montrer quelles questions organisationnelles et identitaires pose la recherche de définitions communes – ou à tout le moins compatibles – des principales notions qui, pour chaque famille d’acteurs, définit son champ d’activité. Enfin nous verrons pourquoi les difficultés rencontrées dans la construction d’un modèle conceptuel et descriptif commun ne peuvent trouver de résolution que dans le cadre d’une réflexion plus large qui doit porter à la fois sur le sens de chaque projet documentaire et sur les logiques institutionnelles et organisationnelles sur lesquelles il repose.

L’ONTOLOGIE COMME « ESSENCE »D’UN DOMAINE DE CONNAISSANCE ?

Le projet Doremus, sur lequel s’appuient les réflexions exposées dans cet article, regroupe des professionnels de la gestion de ressources musicales, des chercheurs en technologies et en sciences de l’information et de la communication et des sociétés de conseil et de développement spécialisées dans la valorisation documentaire. Nous faisons ici un retour réflexif sur les avancées, mais également sur les questions qui se posent à nous, en tant que participants à un projet de recherche interdisciplinaire, qui amène nos partenaires institutionnels à repenser leurs pratiques documentaires dans la perspective de l’ouverture de leurs données.

Notre positionnement de recherche se situe à la croisée de l’ethnographie des pratiques, de l’anthropologie de la connaissance et de la médiation des savoirs. Afin d’approcher le plus finement possible les situations observées, nous avons privilégié une approche qui relève plus de la participation observante que de l’observation participante puisque nous étions directement impliqués dans des tâches dont la finalité était partagée avec le groupe que nous voulions étudier [Adler, 1987]. Par ailleurs, cette participation observante prend place dans un projet de recherche action qui a des objectifs concrets de production d’une ontologie, de ressources pédagogiques à destination des professionnels de la documentation sur cette ontologie, et d’interface(s) de navigation et/ou de recommandation s’appuyant sur cette ontologie. C’est une posture de recherche délicate puisqu’elle implique que nous soyons reconnus comme des membres à part entière de ce groupe, que nous participions aux processus d’innovation et que nous en partagions donc la subjectivité. Cependant elle est d’une grande richesse si l’on assume cette proximité lors de l’interprétation des données de terrain. Le travail de recherche et les processus de collaboration et de partage des connaissances s’ensemencent les uns les autres. Cela permet, ensemble, de mieux interpréter les contraintes de la fabrication collective, tâtonnante d’une ontologie, technologie qui, par définition, se veut être une technique de mise en relation des connaissances.

Les différents documents et textes produits collectivement sont alors un appui important si nous les envisageons en tant que traces des activités dont nous tentons de comprendre le sens pour les acteurs qui y sont engagés (Galinon-Mélénec, 2011). Les ressources documentaires produites, et particulièrement celles qui servent à formaliser et à expliciter les pratiques au sein de chaque institution, peuvent être analysées dans une perspective anthropologique comme des lieux d’actualisation et d’objectivation des pratiques que nous observons. Leur production, leurs multiples évolutions et transformations sont autant de mises en textes des débats et des questions que la constitution progressive de l’ontologie pose à ceux qui tentent de concilier leurs points de vue. Les tentatives de modélisation d’œuvres musicales à partir de ces propositions, sont à la fois des jalons qui fixent des temps-clés dans l’avancée du projet et la matérialisation de l’aboutissement d’une phase de dialogue, à partir de laquelle de nouvelles discussions vont reprendre. Ainsi, par exemple, la notion de «point d’accès contrôlé» centrale pour la BnF, car garante du respect des principes internationaux de catalogage, était étrangère aux experts des autres institutions qui n’en voyaient pas l’utilité au début du projet. On voit cependant le terme apparaître et peu à peu acquérir sa légitimité aux yeux de tous dans les différentes versions des schémas. C’est donc toute la dynamique du projet en cours ainsi que l’évolution des représentations de chaque groupe d’acteurs, que nous pouvons retracer en mettant en regard nos observations et les documents de travail.

L’objectif n’est pas de revenir précisément sur les détails techniques de la constitution d’une ontologie. Il faut cependant en comprendre les principes généraux si l’on veut mesurer le type de difficultés techniques, communicationnelles et organisationnelles, auxquelles nous nous trouvons confrontés. Les ontologies font partie de la panoplie des outils conceptuels sur lesquels repose le fonctionnement du web dit «sémantique». Il s’agit de mettre en réseau un ensemble de concepts décrivant un domaine de connaissance en les associant par des relations sémantiques et de subsomption. La subsomption, dans les ontologies, est le fait de relier différentes catégories par des relations hiérarchiques, sachant que le lien entre la catégorie mère et la catégorie enfant peut a priori être parcouru dans les deux sens. Ce réseau de concepts constitue un modèle de données représentatif du domaine qu’il décrit (Charlet, 2003).

L’ontologie Doremus entend ainsi décrire le domaine de la musique en partant des pratiques professionnelles des organismes détenteurs de catalogues musicaux[4]. Dans le même temps, il est demandé aux professionnels de se situer dans un cadre conceptuel beaucoup plus large puisqu’il s’agit aussi de décrire «la musique », dans la multiplicité de ses objets, de ses acteurs, de ses lieux, de ses événements, de ses pratiques, à partir de « primitives ». Un des objectifs d’une ontologie étant de créer un réseau de relations sémantiques représentant un domaine de connaissance afin de décrire et structurer des « données », les primitives sont une représentation formelle des éléments de cette connaissance à l’aide de langages eux-mêmes plus ou moins formels : les graphes, les liens logiques, des langages normalisés et restreints (Gandon, 2006). Le travail de production d’une ontologie est à la fois un travail de tri dans les données, de normalisation et restriction des langages, d’établissement, de formalisation et de visualisation des relations sémantiques : autant de processus au croisement des ordres et désordres langagiers et documentaires de chacun des contributeurs pour finalement instituer un modèle relationnel qui, en retour, à terme, aura des effets sur la production des « données » documentaires. Il y a dans le travail ontologique le double mouvement d’amplification et de réduction que conceptualise Latour lorsqu’il analyse la production des connaissances dans ce qu’il désigne comme des « centres de calcul », c’est-à-dire les laboratoires, les muséums d’histoire naturelle ou encore les bibliothèques savantes (Latour, 1996). L’ontologie, une fois produite, fixe une représentation des connaissances et leurs relations. La fixation et la normalisation des éléments permettent alors de les mettre en lien, de les comparer, de les explorer, de les enrichir.

Comme le précise Bruno Bachimont : « Ces primitives ne sont pas des données du domaine qu’il suffirait de déterminer, mais des constructions théoriques pour les besoins de la modélisation ». (Bachimont, 2000). Il y a donc deux temps d’abstraction dans la construction : celui du détachement des données de leurs contextes sociaux de production et d’usages, et celui de la construction de primitives à partir des données extraites.

Plusieurs modèles liés au monde de la musique ou plus largement à la description des objets culturels servent de base aux réflexions collectives[5]. Ce projet s’inscrit en effet dans une perspective plus large qui porte sur le rapprochement entre le modèle CIDOC-CRM, conçu au départ pour l’information muséographique et le modèle FRBR, conçu pour l’information bibliographique, afin de disposer d’un modèle conceptuel commun, FRBRoo, qui couvre « la totalité du spectre de l’information relative au patrimoine culturel[6] ». Le modèle conceptuel CIDOC-CRM a été élaboré en 1994 au sein de la communauté muséologique. C’est une ontologie qui formalise les connaissances propres au domaine de la culture à un très haut niveau de généricité afin de faciliter la gestion d’informations à la fois riches et hétérogènes. Il a été conçu dans une logique orientée objet, il a comme principe de base de définir des classes d’objets, reliés entre eux et dotés de propriétés, ce qui permet de formaliser un réseau conceptuel entre des manières de décrire les objets.

Un autre objectif de ce modèle est de permettre aux musées de partager leurs documentations et donc participer à la mise en œuvre d’une interopérabilité entre institutions muséales, autre facette du cadre sociotechnique de la politique institutionnelle d’ouverture des données (Juanals et Minel, 2016). Le modèle FRBR, publié en 1997 par l’IFLA[7], est un modèle conceptuel de références bibliographiques qui propose un ensemble de préconisations propres à faire évoluer les normes de catalogage, afin notamment de les adapter aux conditions de production et circulation des ressources numériques. Le modèle FRBR a notamment formalisé la séparation entre l’œuvre et ses inscriptions documentaires en posant quatre niveaux d’analyse d’un document : l’œuvre, l’expression (la manière dont s’exprime une œuvre, par exemple dans une certaine langue), la manifestation (la manière dont s’inscrit cette expression dans un document), l’item (la manière dont un document existe dans différents exemplaires concrets). Le modèle FRBRoo est une fusion, envisagée pour la première fois en 2008, du modèle CIDOC-CRM et du modèle FRBR.

L’une des visées de Doremus est de produire une extension de ce nouveau modèle qui soit applicable au domaine de la musique classique et de la musique dite traditionnelle. Il s’agit donc de définir, en amont des usages effectifs, des « classes » potentiellement mobilisables pour décrire des ressources, des événements, des acteurs, etc. Puis de mettre en lien ces classes afin de représenter tous les objets et concepts de ce domaine de connaissance (Bachimont, 2006). Les experts avec lesquels nous travaillons ont donc d’abord dû se mettre d’accord sur la définition formelle des notions qu’ils mobilisaient ainsi que sur la façon dont elles s’articulaient entre elles afin de parvenir à une vision partagée des différentes classes, de leurs propriétés, de leurs attributs.

Il convient de préciser à ce stade de l’exposé que ce qui doit être partagé, comparé puis mutualisé, ce ne sont pas des « données brutes », mais bien des métadonnées à forte valeur ajoutée. De plus, ces descriptions, sont des manières pour chaque organisme d’indexer, c’est-à-dire de désigner, et donc de permettre de revenir à des objets recensés ou recensables (Jeanneret, 2005). La structure des différents catalogues, les propriétés affectées aux éléments ainsi que les valeurs qui leurs sont associées ont fait l’objet d’une réflexion approfondie de la part des spécialistes. C’est donc aussi bien l’organisation documentaire choisie, les langages de description que les valeurs saisies qui incarnent l’expertise et le point de vue de chaque organisation sur ces objets et qui en fixent le sens. À ce titre, ce sont des constructions intellectuelles et pas uniquement des ensembles de notices (Després-Lonnet, 2000) et c’est bien à partir de là que sera modélisé le « domaine de connaissances ».

Cependant, ancré dans l’ingénierie des connaissances, le principe de l’ontologie postule, qu’au-delà de la diversité des positionnements entre recensement des objets et recensement des notions, entre universalisme et particularisme, il serait possible d’abstraire un modèle de connaissance générique. À l’origine des ontologies, il y a bien l’idée, par l’instauration d’un modèle formel commun d’un domaine de connaissance, de résoudre les problèmes de communication, et ainsi assurer des « interopérabilités » entre des individus, des organismes, des systèmes, et ceci avec comme hypothèse qu’ils parlent bien de la même chose, avec « seulement » des points de vue (et donc des langages, des méthodes, des relations conceptuelles) hétérogènes, qui seraient la source principale des malentendus communicationnels. Voilà comment Uschold et Grüninger définissent entre autres le projet ontologique : « Les organisations humaines et les systèmes logiciels doivent communiquer entre eux. Cependant, en raison de contextes et de besoins différents, il peut y avoir une large diversité des points de vue et hypothèses sur ce qui est pourtant, pour l’essentiel, les mêmes sujets. Chacun utilise des jargons différents qui, chacun, peut exprimer des concepts, structures et méthodes divergentes, qui peuvent se chevaucher, avoir du mal à correspondre les uns avec les autres. [...] La manière de traiter ces problèmes est de réduire ou éliminer les confusions terminologiques et conceptuelles pour aboutir à une compréhension partagée. Une telle intercompréhension peut fonctionner comme une structure unificatrice des différents points de vue[8] » (Uschold & Grüninger, 1996)

Il est donc possible de penser le projet ontologique comme un dispositif de médiation technologique qui vise à assurer la mise en commun d’ensembles de données qui seraient incluses dans différentes manières de désigner des objets, puis de mettre en relation ces objets par la mise en relation de leur désignation. Pour l’instant, nous entendons la notion d’objet non comme des objets concrets, même s’ils peuvent être aussi des objets concrets (disques vinyles, partitions, CD, enregistrements vidéos), mais comme ce qui est objectivé par notre acte de connaître.

La difficulté est alors de construire un dispositif de médiation qui, en éliminant « les confusions terminologiques et conceptuelles », en créant une structure « unificatrice des différents points de vue » finisse, non pas par créer des chemins entre différentes données qui ont été fabriquées et existent concrètement dans différentes organisations, mais plutôt par masquer la richesse de ces données derrière un modèle dominant. Le risque est d’autant plus grand que l’ontologie Doremus est une extension du modèle FRBRoo pensé pour « saisir et représenter la sémantique qui sous-tend l’information bibliographique et faciliter l’intégration, la médiation et l’échange d’information bibliographique et muséale[9] » (Leboeuf, 2010). C’est une critique qui avait déjà été adressée au modèle FRBR par Weissenberger en 2015 : « La description de ressources est réflexive. Elle est le reflet de la culture qui fait la description. Les modèles conceptuels sont le reflet des modélisateurs et de la culture d’où ils proviennent. FRBR est le reflet des valeurs et des idées des professionnels des bibliothèques occidentales[10]. » (Weissenberger, 2015).

La difficulté, dans une telle entreprise, est alors de tenir ensemble différents points de vue sur une multiplicité d’objets qui sont semblables, mais non identiques (chaque institution décrit et donc discrimine, définit ces objets différemment) tout en sachant qu’il sera complexe d’offrir à l’usager des entrées permettant d’embrasser, en un regard panoptique sur l’écran, la diversité de ces points de vue. Un des moyens de réfléchir à ce risque est de comprendre la documentation non comme une description objective, mais comme une description « objectivante », qui se construit en réponse aux besoins du dispositif institutionnel, dans les pratiques des professionnels, dans une anticipation raisonnée et raisonnable des usages. En concevant une extension du modèle FRBRoo, nous définissons implicitement ce que recouvrirait ce domaine, en nous appuyant nécessairement sur les visions que les trois institutions portent sur lui et nous devenons donc également prescripteurs de ce qui pourra être dit et de la façon dont ce le pourra.

Une bibliothèque à vocation patrimoniale et conservatrice, une radio diffusant de la musique dans le tissu sémiotique hétérogène de ses émissions, ou encore un lieu de production et de médiation de la musique et de son patrimoine ne peuvent avoir les mêmes objectifs organisationnels. Ils ne peuvent avoir conçu et mis en œuvre les mêmes environnements, ni produit les mêmes écritures documentaires. Ces dernières se sont forgées, se pratiquent et se transforment dans une tension constante entre des normes (locales, nationales et internationales) et des usages anticipés ou constatés, le tout dans la contrainte des temps disponibles pour répertorier, formaliser, nettoyer les «données».

Documenter c’est faire l’expérience du désordre (Denis et Pontille, 2013), pour finalement décider de fixer un état des connaissances dans une négociation constante entre les nécessités de formalisation des écritures, la prise en compte du fonctionnement des systèmes documentaires, l’adaptation aux contraintes institutionnelles et aux contextes organisationnels. Comme l’a montré Béatrice Vacher au cours de ses recherches sur la gestion de l’information en entreprise (Vacher, 2007), les personnes chargées de la documentation doivent « faire avec ». Faire avec le temps dont elles disposent, faire avec ce que les systèmes techniques permettent, faire avec ce que les normes imposent et surtout, pour les institutions chargées de la gestion du patrimoine, faire avec ce qui peut être connu des objets de la culture au moment où ils passent, dans chaque institution, un temps de leur riche, épaisse, complexe et résistante vie sociale, de leur trivialité (Jeanneret, 2008).

Ceci explique par exemple la différence de point de vue entre les ingénieurs chargés de tester la solidité du modèle (qui, pour s’assurer de sa capacité à prendre en compte toutes les dimensions de la description d’une œuvre, remplissent tous les champs, quitte à «ajouter» des données de toutes provenances, comme des vidéo Youtube ou des images de couvertures de disques qui ne proviennent pas des institutions partenaires) et les documentalistes, pour qui l’absence de « données » est aussi une information qu’il convient de préserver, car la description des objets est une source de connaissance nécessairement ancrée dans une problématique institutionnelle particulière et un temps de leur vie triviale.

LES VOCABULAIRES DOCUMENTAIRES, DES SOURCES DE CONNAISSANCES ANCRÉES DANS UN CONTEXTE D’USAGE

Cet ancrage des métadonnées dans des lieux auxquels sont assignées des missions et qui sont nécessairement porteurs d’une complexité organisationnelle particulière, les oriente vers certains usages et certains publics. Les experts revendiquent le regard situé qu’ils portent sur les ressources qu’ils gèrent comme la principale valeur ajoutée de leur travail. Ce qui est dit sur les objets, dans des institutions chargées de la conservation et de la diffusion du patrimoine, est une forme de discours savant, dont l’architecture même est la marque d’une connaissance experte et de la prise en compte des besoins spécifiques de l’institution où elle prend sens.

De ce point de vue, le travail sur le référentiel associé à la classe [Moyen d’expression] a été particulièrement riche en interrogations. Cette classe est conçue pour permettre de décrire les instruments de musique, mais également tous les autres moyens par lesquels il serait possible de produire des sons dans le cadre de l'exécution d’un morceau de musique. Cependant, il ne s’agit pas de décrire un instrument-objet statique tel qu’il le serait par exemple dans le catalogue d’un musée de la musique. Ce qui est ainsi saisi et désigné c’est l'instrument en situation, dans la dynamique qui le lie aux autres éléments qui caractérisent la situation au cours de laquelle il a été mobilisé. La mise en relation dans l’ontologie permet en effet de rendre visibles des temps de la vie d’une œuvre musicale à travers ses diverses inscriptions : musique notée, programmée, interprétée, enregistrée, diffusée, etc.

Pour améliorer l’interopérabilité des données, certaines classes peuvent être associées à des listes appelées « vocabulaires contrôlés » ou référentiels, généralement organisées et structurées sous la forme de thésaurus. Ceci permet d’une part de contrôler la saisie et d’autre part de faciliter les recherches. Le travail du groupe consiste alors à aligner les différents vocabulaires dont chaque organisme dispose.

La première difficulté en ce qui concerne les [Moyens d’expression] a été de déterminer ce qui parmi les multiples ressources disponibles, pouvait effectivement être proposé comme vocabulaire de référence. Il s’est avéré que chaque institution disposait d’au moins deux listes, soit directement associées à ses bases documentaires, soit constituées ou maintenues par elle, même si elles n’étaient pas directement utilisées dans les catalogues. Le thésaurus MIMO par exemple dispose d’une liste très complète d’instruments de musique, créée par un groupe de musées pour classer les instruments. Cette liste n’est pas utilisée pour le catalogage actuellement, mais sert de référence.

Le terme même de référentiel et l’observation d’autres ontologies laissaient penser qu’il fallait disposer d’une liste unique. Il a donc semblé nécessaire de fusionner les listes repérées, afin de disposer de la liste la plus exhaustive possible. Cependant, comme la liste des animaux de l’empereur chinois, citée par Michel Foucault dans l’introduction de son livre « Les mots et les choses » (Foucault, 1966), les organismes possédaient des listes très hétérogènes, qui répondaient à différents besoins, ainsi qu’à leurs normes de catalogage ou à leur organisation interne. Chaque vocabulaire était structuré avec une granularité et dans un système hiérarchique spécifique : le thesaurus Mimo qui comporte 2 480 termes, avait été conçu à la base par un groupe de musées pour classer les instruments qu’ils détenaient, alors que la liste H&S est une classification du début du vingtième siècle, qui s’inspire de la classification décimale de DEWEY utilisée dans les bibliothèques et qui avait au départ pour but de permettre d’insérer tout instrument dans la hiérarchie, quelle qu’en soit la provenance et la connaissance que l’on aurait pu en avoir par son rattachement à une culture. Les typologies d’instruments sont donc relativement différentes. La première distingue par exemple les « instruments à vent » et les « instruments à cordes », quand la seconde distingue cinq grandes classes : les « idiophones », les « membranophones », les « cordophones », les « aérophones » et les « électrophones », classes qui sont ensuite découpées en ne s’attachant qu’aux caractéristiques physiques des instruments.

Comme il était cependant possible de retrouver des noms d’instrument identiques dans chacune des organisations terminologiques, plusieurs méthodes de regroupement ont été suggérées, comme, par exemple, de garder la hiérarchie de la liste la plus complète et d’insérer les termes manquants depuis les autres listes. Mais alors, quelles grandes catégories choisir ? Ou encore de supprimer la hiérarchie pour tout « mettre à plat » et fusionner. Mais comment faire alors la distinction entre un terme relatif à une famille générique dans l’une des organisations et la désignation précise d’un instrument donné dans une autre ? Une liste non hiérarchique aurait par ailleurs comporté un nombre considérable de termes ce qui aurait complexifié la recherche et l’indexation. Aucune méthode n’a finalement paru satisfaisante car toutes auraient abouti à une altération des données les rendant finalement inutilisables, puisqu’elles ne correspondaient alors plus à aucune des logiques professionnelles qui avaient conduit à la production des listes d’origine.

La solution proposée a donc été, comme chaque fois qu’un tel problème d'incompatibilité se pose, d’aligner les référentiels. L’alignement consiste d’abord à rapprocher les termes à l’aide d’algorithmes de recherche de similarités. Les propositions de rapprochements ainsi que les types de liens qui pourraient unir les termes[11] sont ensuite discutés par les spécialistes qui les valident, les affinent ou les refusent, ce qui permet dans le même temps d’améliorer le fonctionnement des algorithmes.

LOGIQUES ORGANISATIONNELLES ET ÉCRITURES DOCUMENTAIRES

Cette réflexion collective demande que chacun se penche sur ses propres outils et donc se questionne et explicite ses choix et ses habitudes professionnelles. Loin de l’idée d’une organisation terminologique parfaitement normée et maîtrisée, chaque liste est porteuse de l’histoire de sa constitution et de son inscription dans un contexte professionnel particulier. Il est possible d’y lire des moments d’évolution institutionnelle, d’adoption de nouvelles règles ou de nouvelles normes, les projets de ceux qui en ont eu la charge à travers le temps…

De plus, les différents membres du collectif appartiennent à des secteurs professionnels, pour lesquels la constitution de catalogues répond à des finalités distinctes. Du point de vue du rapport aux objets décrits, il peut s’agir soit d’en réaliser un inventaire précis, soit de constituer une base référentielle qui répertorie des objets ou des documents que l’on ne détient pas, soit d’indexer une collection, c’est-à-dire d’en faire une description à partir de laquelle il est possible de retourner vers les objets ou les documents.

Ainsi, pour la BnF, chargée du dépôt légal, chaque objet fait partie du patrimoine national. Il doit donc être inventorié et bénéficié d’une description fine qui tienne compte de la moindre de ses variations. Les normes de catalogage sont d’autant plus précisément définies et appliquées que la BnF est l’organisme chargé de la normalisation bibliographique en France. Les vocabulaires spécialisés sont très complets et conçus pour tenir compte de l’extrême variété des types d’objets déposés. Il s’agit moins de pouvoir retourner aux documents que d’en tenir un catalogue à visée patrimoniale. Le vocabulaire descriptif doit donc être pensé pour un usage savant sur le temps long.

Pour les documentalistes de Radio France, l’objectif est de fournir rapidement des documents ou des ressources adaptées aux différents services, ce qui nécessite d’avoir une très bonne connaissance et des collections et des usages prévisionnels. Les acquisitions, comme à la Philharmonie de Paris, se font dans le cadre d’un budget contraint et en fonction d’une politique d’acquisition qui doit répondre aux programmes et aux projets de l’institution. Si les fonds sont très riches, ce n’est pas l’exhaustivité qui est visée, mais l'adéquation aux besoins des collègues ou des usagers. Si l’on reprend l’exemple des instruments de musique, il existe deux listes distinctes qui répondent à deux logiques. D’un côté le thésaurus de la discothèque, qui comporte plus de deux mille entrées avec de très nombreuses relations de synonymies et dont l’objectif est de permettre la description d’enregistrement musicaux qui proviennent du monde entier ; de l’autre la liste alphabétique simple de la documentation sonore, qui répertorie des ressources qui peuvent facilement être repérées via de grandes catégories dans un catalogage plus générique.

Concevoir une liste partagée nécessite donc de passer de logiques locales qui répondent à des besoins spécifiques, à une organisation terminologique apte à répondre à tout type de description. Cependant, le langage, même s’il s’agit d’un langage documentaire, ne peut être considéré comme extérieur à l’activité au sein de laquelle il prend sens. L'abstraire de ces contextes interprétatifs, c’est passer d’une logique descriptive concrète à la construction d’une organisation théorique des savoirs correspondants. De plus, les listes existantes sont des objets statiques, qui constatent un état existant et qui, tout à la fois, proposent et décrivent un monde fini, alors que les référentiels sont conçus dans une approche dynamique qui potentialise des usages projetés.

CONCILIER DES REGARDS DOCUMENTAIRES DIVERGENTS

Le projet de produire des »données ouvertes» repose sur l’idée de leur pouvoir créatif intrinsèque et sur la potentialité de nouveaux usages pour ces »données». Il suffirait pour cela de « créer un environnement documentaire informatisé propice à la réinterprétation des données dans d’autres contextes sociaux » (Labelle & Le Corf, 2012). Les premiers travaux théoriques relatifs à la conception d’ontologies postulaient qu’un domaine de connaissance pourrait être défini par un ensemble de concepts génériques monosémiques associés entre eux par des liens et qui constitueraient une compréhension collective de ce domaine» (Gruber, 1995). Cependant, les recherches récentes insistent sur le caractère fortement contextuel de ces constructions formelles. Ainsi, Jean-Max Noyer attire notre attention sur la diversité des questions relatives à la description et à la représentation des « mémoires numériques hypertextuelles » et sur la nécessité de respecter « la pluralité les types d’écritures dont nous avons besoin pour habiter les multiples espace-temps socio-cognitifs. ». (Noyer, 2012). Plus encore, comme le démontre Bruno Bachimont, une ontologie est dépendante non seulement du domaine, mais aussi de la tâche visée.

« En effet, c’est le contexte de la tâche qui permet de fixer les traits de signification pertinents des concepts sémantiques de manière à annuler les effets du contexte. Par conséquent, il ne peut exister d’ontologie universelle, ni même dans un domaine, une ontologie valant pour toutes les tâches possibles. » (Bachimont, 2000)

La formalisation qui se traduit par une montée en généricité des concepts permet de se détacher de situations, d’applications, d’implantations et de dénominations trop locales ou prises dans des logiques organisationnelles et interprétatives qui empêchent de les conceptualiser ou de les partager sans ambiguïté. Cependant, des termes comme « ontologie » ou « primitive » font penser qu’il serait possible de rester à un niveau d’abstraction a-communicationnel qui, de fait, désocialise les écritures. La formalisation permet de lever des ambiguïtés terminologiques, de « contraindre l’interprétation spontanée » (Bachimont, 2000) afin de parvenir à un accord définitionnel au sein d’un domaine de connaissance. C’est un choix de représentation qui repose sur un point de vue et qui, comme tout modèle, ne conserve de la situation ou de phénomène modélisé que ce qui sert cette théorie. Doremus repose sur une certaine conception de ce que pourrait être une ontologie de la musique. Il est issu d’un regard situé sur le domaine. Ce regard est celui que les institutions chargées de la conservation et de la diffusion du patrimoine culturel ont porté sur les objets, sur les documents sur les pratiques musicales en lien avec leurs missions respectives.

Il s’agit donc de reconnaître que la modélisation n’est qu’une étape dans le processus de circulation sociale des connaissances, une réécriture parmi d’autres et qui doit en permettre d’autres. Les ontologies, comme le web sémantique potentialisent différemment les données existantes, mais il convient de ne pas oublier la continuité des écritures. Les classes, les référentiels, comme les liens sémantiques qui les unissent et plus largement l’ensemble du réseau, sont des indices qui renvoient aux écritures, notamment documentaires, à partir desquelles ils ont été conçus. La description des classes ou la qualification des liens ne peut se faire qu’en référence au domaine qu’ils modélisent. Il faut donc les voir plutôt comme des tentatives de fabriquer des références aux êtres culturels qui permettent à la musique d’exister. La documentation fait partie de la trivialité (Després-Lonnet, 2014), elle permet aux objets de la culture de circuler. Les objets pris dans leurs usages sont des entités vivantes, qui, par définition, sont appelées à se transformer au gré des pratiques qu’ils permettront ou auxquelles ils donneront lieu. S’ils ont un sens, celui-ci peut varier selon les temps, les lieux, les musiques ou encore les logiques institutionnelles.

La conception d’une ontologie repose sur toute une chaîne d’écritures préalables et elle doit, elle aussi, être conçue comme une modalité scripturale qui rend possibles d’autres écritures. Cependant, nous pensons qu’elle ne peut le faire que si son projet est plus clairement énoncé et si, donc, elle parvient à rendre compte des projets éditoriaux sous-jacents. Ainsi, l’ontologie Doremus est une extension du méta-modèle, FRBRoo, dont l’une des particularités est de proposer une description dynamique des objets qu’il représente, en indiquant leurs différents états et les événements qui les ont produits.

Là où le web sémantique postule que les machines pourraient mettre en relation des éléments existants et par là « créer du sens », nous dirions plutôt qu'il ne le peut qu'en disposant par ailleurs de scénarii d’usage utiles pour replacer ce qui est dit dans un contexte interprétatif validant. Une des pistes sur lesquelles nous travaillons actuellement est la création de rôles correspondant à des projets d’usage (programmateur, documentaliste, etc.) et à des points d’entrées différents dans le modèle. Ceci permettrait de représenter les temps de la vie des êtres culturels en les répartissant entre les différents espaces de l’ontologie. La sémantique des relations typées pourrait alors guider le visiteur en l’amenant à comprendre d’où proviennent les données et quelle entreprise de désignation est à l’œuvre dans le réseau qu’il parcourt.

Le projet que nous menons actuellement dans le cadre du programme gouvernemental d'ouverture des données publiques nous permet de mesurer de façon très concrète les enjeux d’une telle perspective pour les institutions du secteur culturel, détentrices des plus importants catalogues français relatifs à la musique classique et traditionnelle.

Comme nous avons pu le montrer à partir de deux questions qui se sont posées au cours de nos réunions de travail, ouvrir ses données ne signifie pas y donner accès dans la forme et selon les logiques d’usage dans lesquelles elles ont été conçues, mais bien les « extérioriser » à la fois théoriquement et matériellement, afin de pouvoir les penser dans d’autres contextes et à d’autres niveaux à la fois organisationnels et conceptuels.

D’un point de vue technico-documentaire, il faut parvenir à une double mise en correspondance, d’une part au niveau des concepts mobilisés par chaque institution et d’autre part au niveau des vocabulaires spécialisés que chacune a constitués en fonction de ses propres besoins. Mais il faut surtout parvenir à construire un modèle conceptuel unique, porteur de ce que pourrait être le « domaine de la musique » à partir de catalogues conçus selon une certaine vision de l’expérience musicale, des artefacts porteurs et médiateurs de cette expérience, ainsi que des pratiques professionnelles qui ont cours au sein de chaque institution. Il faut donc en permanence passer de logiques descriptives ancrées dans des problématiques locales à une logique modélisatrice pensée comme porteuse d’une connaissance globale experte du domaine. Ces passages sont autant de traductions qui ne peuvent se vivre que dans les négociations et ajustements des pratiques et représentations de chacun. Inversement le projet ontologique ne peut prendre sens que s’il renonce à une prétention d’universalité pour prendre en charge les savoirs documentaires de chaque organisation et permettre leur mise en relation. Il s’agit alors de construire un espace de médiation dans la tension incessante entre des pratiques et représentations documentaires nécessairement situées et les contraintes d’un projet de mise en commun.

Le risque majeur que nous avons pu identifier est de concevoir l’ontologie comme un modèle purement théorique et donc postuler qu’il serait possible de produire de la connaissance en reliant des concepts qu’on aurait extraits de discours savants tenus sur des objets de la culture, alors qu’ils sont décrits dans une perspective institutionnelle et professionnelle particulière. Il convient alors de ne pas oublier que, s’il s’agit d’ouvrir des « données », c’est bien qu’elles sont non pas fermées, mais situées quelque part. Ce sont des discours qui correspondent à différents temps de la vie d’êtres culturels, au cours de laquelle certaines connaissances à leur sujet ont été élaborées et certaines informations à leur sujet consignées.

L’étude d’un cas concret permet de montrer que si la perspective d’une ouverture est porteuse d’un projet de démocratisation de l’accès aux savoirs et aux biens communs de la culture, il convient de renoncer à une vision universalisante et a-contextuelle des ontologies. Ceci passe notamment par l’attention qu’il convient de porter à la distinction fondamentale entre les objets et les discours tenus sur ces objets. Les documents, les catalogues, les terminologies spécialisées, aussi bien que l’ontologie sont des procès d’écriture qu’il faut penser dans une continuité scripturaire, qui accompagne et donne sens aux différents moments de la vie triviale des êtres culturels et qui, de lieu en lieu, construit notre patrimoine culturel.

BIBLIOGRAPHIE

Adler, P.A.,& Adler, P. (1987). Membership roles in field research. Newbury Park, CA: Sage

Bachimont B. (2000). Engagement sémantique et engagement ontologique : conception et réalisation d’ontologies en Ingénierie des connaissances. Dans Charlet J. et al (dir.). Ingénierie des connaissances, évolutions récentes et nouveaux défis. Paris : Eyrolles.

Bachimont B. (2006). Qu’est-ce qu’une ontologie ?  Dans Mapelli V et Walter R. (dir.)Technoloangues : le portail des technologies de la langue [en ligne]. Paris : ELDA,  créé en 2003. Repéré à <http://www.technolangue.net/article.php3?id_article=280>

Charlet J., Bachimont B., Troncy R. (2003). Ontologies pour le Web sémantique. Dans Charlet J., Laublet P. & C. Reynaud (dir.), Web sémantique : Rapport final de l’action spécifique 32.  CNRS/STIC.

Denis J. et Pontille D. (2013). Une infrastructure élusive : Aménagements cyclables et troubles de la description dans «OpenStreetMap. Réseaux, n° 178-179, p. 91-125.

Després-Lonnet M. (2014). Temps et lieux de la documentation, transformation des contextes interprétatifs à l’ère d’internet. (Habilitation à diriger des recherches). Lille : Université de Lille. Repéré à <https://tel.archives-ouvertes.fr/tel-01094789/document>

Després-Lonnet M. (2000). Contribution à la conception d’interfaces de consultation de bases de données iconographiques. (Thèse de doctorat). Lille : Université de Lille 3. Repéré à <https://tel.archives-ouvertes.fr/tel-01155546v1/document>.

Domange C. (2013). Ouverture et partage des données publiques culturelles : pour une (r)évolution numérique dans le secteur culturel. Rapport du Département des programmes numériques du Secrétariat Général du Ministère de la Culture et de la Communication. Paris : Ministère de la Culture et de la Communication. Repéré à <http://www.ladocumentationfrancaise.fr/var/storage/rapports-publics/144000037.pdf>.

Foucault, M. (1966). Les mots et les choses : Une archéologie des sciences humaines. Paris : Gallimard.

Galinon-Mélénec B. (dir.) (2011). L’Homme trace. Perspectives anthropologiques des traces contemporaines. Paris : Editions du CNRS.

Gandon, F. (2006). Ontologies informatiques. Dns Petit, A. (dir.). Interstices : explorez les sciences du numérique [en ligne]. Le Chesnay : INRIA. Repéré à  <https://interstices.info/jcms/c_17672/ontologies-informatiques>

Gonzalez-Laporte, C. (2014), Recherche-action participative, collaborative, intervention... Quelles explicitations ? [Rapport de recherche]. Sarreguemines : Labex ITEM.  Repéré à <hal-01022115>

Goody, J. (1979). La raison graphique : La domestication de la pensée sauvage, Paris : les éditions de Minuit.

Gruber T. R. (1995). Toward principles for the design of ontologies used for knowledge sharing? International Journal of Human-Computer Studies, n° 43, p. 907-928.

Jeanneret Y. (2005). Désigner, entre sémiotique et logistique. Dans Kovacs S. et Timimi I. (coord.). Indice, index, indexation. Paris : ADBS.

Jeanneret Y. (2008). Penser la trivialité, vol 1 : La vie triviale des êtres culturels, Paris : Hermès-Lavoisier.

Juanals B. et Minel J.L. (2016), « La construction d’un espace patrimonial partagé dans le Web de données ouvert », In Communication [En ligne], vol. 34/1 | 2016, mis en ligne le 17 août 2016, consulté le 03 mai 2017. Doi : 10.4000/communication.6650

Labelle S., Le Corf J-B. (2012). Modalités de diffusion et processus documentaires, conditions du «détachement» des informations publiques. Analyse des discours législatifs et des portails «open-data» territoriaux ». Les enjeux de l’information et de la communication, n°13/2, p. 209-224.

Latour B.(1996), Ces réseaux que la raison ignore : laboratoires, bibliothèques, collections, In Christian Jacob et Marc Baratin (dir.). Le pouvoir des bibliothèques (p. 23-46). Paris : Albin, Michel.

LeBoeuf P. (2010). From FRBR to FRBRoo through CIDOC CRM. A Common ontology for cultural heritage information. Communication présentée à International Symposium on the Future of Information Organization Research, 4-5 octobre 2010, National Taiwan University, Taipei, Taiwan.

Noyer J-M., Carmes M. (2012).  Le mouvement «Open Data» dans la grande transformation des intelligences collectives et face à la question des écritures, du web sémantique et des ontologies. Communication présenté au Colloque de l’ISKO, 2-4 novembre 2012, Tunisie.

Robert P. (2000). Qu'est-ce qu'une technologie intellectuelle ?  Communication et langages, n°123, 1er trimestre 2000, p. 97-114.

Uschold M., Grüninger M. (1996). Ontologies : Principles, Methods and Applications. Knowledge Engineering Review, vol. 11, n° 2, p. 93-136.

Vacher B. (2007).  Oubli, étourderie, rue et bricolage organisés : arrêt sur théories. Dans Grosjean S. et Bonneville L. (dir.). Repenser la communication des organisations (p. 25-51). Paris : L’Harmattan.

Weissenberger, L. (2015). Toward a universal, meta-theoretical framework for music information classification and retrieval. Journal of Documentation, vol. 71, n° 5, pp. 917- 937.


[1]    « We commit to pro-actively provide high-value information, including raw data, in a timely manner, in formats that the public can easily locate, understand and use ». Open Government Déclaration, septembre 2011, disponible à l’adresse : http://www.opengovpartnership.org/about/open-government-declaration

[2]      MINISTÈRE DE LA CULTURE ET DE LA COMMUNICATION, Feuille de route stratégique : métadonnées culturelles et transition Web 3.0, janvier 2014, disponible en ligne :

     http://www.culturecommunication.gouv.fr/var/culture/storage/pub/feuille_de_route__metadonnees_culturelles_et_transition_web_3_0_janvier_2014/files/docs/all.pdf

[3]    Pour une présentation détaillée de FRBRoo : http://www.cidoc-crm.org/frbroo/

[4] Pour une présentation générale du projet se référer au site : www.doremus.fr

[5] Principalement CIDOC-CRM, Music ontology, FRBR et son extension orientée-objet FRBRoo.

[6] Voir à ce sujet la présentation du projet sur le site de la BnF

 (http://www.bnf.fr/fr/professionnels/modelisation_ontologies/ a.modele_cidoc_crm.html)

[7] International Federation of Library Associations and Institutions

[8]    « People organizations and software systems must communicate between and among themselves. However due to different needs and background contexts there can be widely varying viewpoints and assumptions regarding what is essentially the same subject matter. Each uses different jargon each may have differing, overlapping, and or mismatched concepts, structures and methods [...]. The way to address these problems is to reduce or eliminate conceptual and terminological confusion and come to a shared understanding   Such an understanding can function as a unifying framework for the different viewpoints [...] » (traduit de l’anglais par nos soins).

[9]    « FRBRoo is intended to capture and represent the underlying semantics of bibliographic information and to facilitate the integration, mediation, and interchange of bibliographic and museum information.» (Traduit de l’anglais par nos soins)

[10] « Resource Description is Reflexive. It reflects the culture doing the description. Conceptual models are reflexive of the modelers and the culture from which they came. FRBR is reflective of the values and ideas of Western library practitioners. » (Traduit de l’anglais par nos soins)

[11] L’alignement est effectué par des outils automatiques, qui proposent des liens sémantiques que les experts valident ou affinent. Les relations offrent différents niveaux d’équivalence : exactMatch pour les équivalences exactes, closeMatch pour les équivalences approximatives à un même niveau de granularité ; narrowMatch (lien entre un terme générique et un terme plus spécifique) et broadMatch (lien entre un terme spécifique et son générique) pour les équivalences à un niveau de granularité différents.


Auteurs

Marie DESPRES-LONNET
Université de Lille
Laboratoire GERIICO

Béatrice MICHEAU
ESPE – COMUE Lille Nord de France
Laboratoire GERIICO

Marie DESTANDAU
Philharmonie de Paris


Citer cet article

Despres-Lonnet, M., Micheau, B., et Destandau, M. (2017). Interopérabilité et logiques organisationnelles. Ce qu'ouvrir ses données veut dire. Revue COSSI, n°2-2017 [en ligne].

Articles en relation


Commentaires

  • Aucun commentaire trouvé

Ajouter vos commentaires

Poster un commentaire en tant qu'invité

0