À propos du Glossaurus
Historique du projet
Quelle que soit la discipline, la terminologie d’un groupe donné évolue à travers le temps afin de refléter sa réalité. Dans un domaine comme les arts médiatiques où la pratique est étroitement liée à l’émergence de nouvelles technologies, la terminologie se développe rapidement car les artistes, les critiques, les commissaires et les autres intervenants du domaine ne cessent d’inventer de nouveaux mots ou de nouvelles acceptions à des mots existants. Pour ceux et celles qui sont impliqués dans la conservation et la documentation d’œuvres d’art médiatique, un manque de clarté dans l’emploi des termes ou des difficultés à exprimer adéquatement les traits essentiels de l’identité d’une œuvre peuvent nuire directement aux œuvres et à notre compréhension des enjeux et de la pratique des arts médiatiques.
Mandat du Comité Terminologie
Compte-tenu de cette situation, il est apparu nécessaire de créer au sein de DOCAM un Comité Terminologie. Celui-ci a d’abord conçu un glossaire bilingue qui réunissait pour chaque terme retenu toutes les définitions dignes d’intérêt présentes dans d’autres outils terminologiques tels que ceux du Réseau des médias variables, de V2_ Institute for the Unstable Media, du Groupe de recherche en arts médiatiques de l’UQÀM [1] ou de l’Office québécois de la langue française ainsi que dans diverses publications telles que le numéro thématique de la revue artpress 2 paru en janvier-mars 2009. Les études de cas réalisées par DOCAM ainsi que le contenu du site Web de DOCAM ont également été analysés afin de repérer des termes pertinents. À la suite de la création du glossaire, la deuxième mission du comité était d’élaborer un thésaurus.
Aspect technologique
SKOS
Dès le début du projet, différentes questions se sont posées quant au choix d’un modèle permettant la création d’une structure terminologique de type thésaurus ainsi que l’ajout de notes comme la précision d’un contexte d’emploi, de l’évolution du terme, de sa ou ses définitions. Le comité a décidé d’utiliser le standard SKOS comme base pour notre modèle. SKOS (Simple Knowledge Organisation System, Système simple d’organisation de connaissance) est « une famille de langages formels permettant une représentation standard des thésaurus, classifications ou tout autre type de vocabulaire contrôlé et structuré » [2]. Recommandé par le W3C depuis le 18 août 2009, le standard SKOS permet une interopérabilité en adéquation avec les fins du thésaurus DOCAM et permettra une plus grande réutilisation du travail réalisé au sein de ce comité.
Implémentation du thésaurus basé sur SKOS
SKOS permet la mise en forme de systèmes d’organisation du savoir comme des schèmes de concepts dans lesquels les concepts sont inter-reliés grâce à des relations hiérarchiques et associatives. Selon SKOS, un concept est une idée abstraite ou une notion, décrite par une étiquette préférée et plusieurs autres étiquettes, dans autant de langues que désiré. Ces étiquettes sont les équivalents des termes qui formeraient la structure d’un thésaurus onomastique, mais dans ce modèle, elles sont purement descriptives puisque la structure repose uniquement sur des associations de concepts.
Avec l’aide de la documentation SKOS, le Comité Terminologie a développé un modèle de données et la structure d’une base de données relationnelle pour un thésaurus basé sur des concepts : cet outil a été basé sur SKOS mais n’est pas une implémentation stricte du standard. Il a été décidé qu’un outil en ligne accessible par n’importe quel navigateur était la technologie idéale pour que les chercheurs de DOCAM et l’ensemble de la communauté aient accès au thésaurus. La base de données a été construite en MySQL, les interfaces publiques et d’administration sont en PHP.
Une structure basée sur des concepts comme celle de SKOS nous permet d’éviter les problèmes rencontrés lors du couplage de termes qui peuvent être ambigus ou dont la signification évolue avec le temps. Cependant, un concept peut changer d’étiquette par laquelle on réfère à lui sans que le concept lui-même change de sens ni que le réseau de termes ne se désagrège. Les notes, les définitions et autres informations sont associés aux concepts plutôt qu’aux étiquettes.
Outil
En 2009, différents tests de navigation ont été faits afin de valider l’interface Web du thésaurus la plus pratique pour les futurs utilisateurs. Puis, à la fin du mois de septembre, alors que l’aspect technologique de notre outil était au point, le peuplement du thésaurus a été fait par importation de toutes les données collectées. Enfin, au cours de l’automne 2009, quelques tests ont encore été nécessaires afin de rendre l’interface la plus ergonomique et conviviale pour l’utilisateur.
Aspect terminologique
Autres structures
Nous nous sommes penchés sur l’élaboration d’un thésaurus à facettes. Certaines portions de la hiérarchie ont été basées sur des structures existantes. Par exemple, la facette Manifestation et réception du Thésaurus DOCAM thesaurus reprend en partie le modèle d’interaction proposé par V2_ Institute for the Unstable Media [3]. Et la facette Activités a été élaborée à partir du modèle documentaire développé par le Comité Documentation de DOCAM [4]. Une fois les cinq facettes principales décidées, il a été question du choix des termes proprement dits.
Nomenclature
Les premiers termes faisant partie du thésaurus étaient issus du glossaire. En partant des termes de base du glossaire et de toute la documentation inhérente à DOCAM, une première sélection a été faite. Ensuite, en parcourant des sites de référence en arts médiatiques, des termes ont été retenus, puis nous avons relevé les termes qui leur étaient associés. Constatant que cette première recherche était très large, le Comité Terminologie a décidé de recentrer son étude en identifiant des critères d’admissibilité des termes. Ces critères ont permis de recentrer les recherches et d’éliminer parmi les termes précédemment sélectionnés ceux qui n’étaient pas pertinents dans ce contexte particulier.
Bilinguisme
L’outil étant bilingue, plusieurs rencontres ont été nécessaires entre des chercheurs du comité afin de valider les équivalents traductionnels et de vérifier, encore et toujours, la pertinence des choix de termes en fonction des critères. Afin que l’utilisateur du thésaurus soit le moins possible confronté à des traductions, les définitions étaient recherchées nativement dans les deux langues. Mais il était parfois difficile de trouver une définition stable pour des termes très particuliers mais pourtant pertinents. Aussi certaines définitions ont-elles été rédigées par les membres du comité. Conscients des difficultés d’équivalence entre le français et l’anglais, nous avons également utilisé librement la transcréation, soit la traduction sans la rigueur du mot à mot, afin d’exprimer la définition des concepts dans l’autre langue de façon à ce qu’elle se lise comme si elle était rédigée à l’origine dans la langue cible de la traduction. Le Comité Terminologie a tenté de maintenir une certaine cohérence entre le volet anglophone et le volet francophone du thésaurus. Mais l’éventail des ressources terminologiques dans le domaine des arts médiatiques est bien moins étendu en français qu’en anglais. C’est pourquoi certaines définitions peuvent être plus fournies dans une langue que l’autre. Mais le comité s’est assuré que les deux volets partageaient un contenu informationnel élémentaire.
Harmonisation
De septembre 2008 à septembre 2009, une recherche intensive de termes a été faite et le thésaurus a été entièrement relu à partir de l’outil informatisé. Les catégories et leur contenu respectif dans les deux langues ont été réévalués en ayant une vision d’ensemble du thésaurus : ceci a permis d’harmoniser le thésaurus même s’il reste des imperfections. Même si notre outil n’évoluera plus après janvier 2010, le vocabulaire des arts médiatiques, lui, est en constante mouvance.
Évolution des sens
Il avait été question au début du projet qu’un aspect historique soit ajouté à l’aspect terminologique pur. En fonction de la demande des différents comités, le Comité Terminologie devait intégrer de nouveaux termes ainsi que leur évolution dans le temps, leur glissement de sens, leur modification. Mais il a dû revoir ses ambitions et les Notes d’application (« Scope Notes » dans SKOS) n’ont pas été intégrées.
Arborescence
Thésaurus à facettes
Le thésaurus est constitué de 5 principales facettes : Activités, Agents, Pratique artistique, Composants et Manifestation et réception. Le thésaurus présente des concepts répartis sur une structure de trois à quatre niveaux. Les concepts sont représentés par des étiquettes en français ou en anglais et il est aisé de passer d’une langue à l’autre afin de connaître les équivalents traductionnels. À chaque concept est associée une définition représentative de l’usage du concept et du mot dans l’ensemble de la documentation de DOCAM, et ce, pour chacune des deux langues retenues. Il est possible de chercher un mot en passant directement par l’ordre alphabétique ou bien d’arriver à un concept en passant par la structure hiérarchique du thésaurus. Une troisième manière de naviguer est l’hypertexte : des concepts sont associés entre eux pour permettre une navigation par champ sémantique.
Éléments constitutifs
Comme dans un thésaurus, chaque terme choisi est placé au sein d’une structure qui permet de le relier à de grandes catégories ainsi qu’à d’autres termes proches de son contexte d’utilisation. L’outil permet de visualiser non seulement les termes préférés au sein de DOCAM mais également les termes qui renvoient à la même réalité que le terme préféré, soit les termes non-préférés. Loin de condamner ces emplois, l’outil les mentionne tentant d’inclure certaines pratiques terminologiques périphériques à l’usage docamien. Ils permettent par ailleurs d’augmenter le nombre de requêtes satisfaisantes. Et, comme dans un glossaire, chaque terme est également défini. Les définitions apportent des informations sémantiques et encyclopédiques et leurs références permettent de retrouver le contexte initial de la définition dans un environnement différent de celui de DOCAM.
Ainsi, un concept présente une position dans la structure du thésaurus, un terme préféré et une définition dans les deux langues, des termes non-préférés dans l’une ou l’autre langue ou dans les deux, ainsi que des concepts associés qui permettent de développer la connaissance globale de l’utilisateur sur les arts médiatiques.
Le Comité Terminologie
Président : James Turner
Alain Depocas
Brigitte Kerhervé
Louise Poissant
Assistant(e)s de recherche :
Sarah de Bogui (2006)
Marc Boucher (2006)
Corina MacDonald (2007 – 2009)
Claire Nigay (2008 – 2009)
Laure Guitard (2009)
[1] Liste des ressources terminologiques
[2] Wikipédia, l’encyclopédie libre : http://fr.wikipedia.org/wiki/Simple_Knowledge_Organisation_System (consulté le 29 octobre 2009)
[3] V2_ Institute for the Unstable Media : http://archive.v2.nl/v2_archive/projects/capturing/1_3_metadata.pdf
[4] Voir le modèle de schéma documentaire conçu par le comité Documentation