De l’importance de la structuration des métadonnées des RELs

La Chaire travaille à utiliser l’intelligence artificielle au profit de l’éducation ouverte. Si dans ce blog nous avons surtout rendu compte de questions de fond, de communication scientifique, nous allons aussi essayer de partager des points de vue plus techniques : quelles sont les technologies mises en œuvre ? quelles sont les solutions techniques choisies ? Pour cela, nous donnons aujourd’hui la plume à Corentin, ingénieur sur la Chaire, pour nous en dire plus sur les métadonnées, si utiles aujourd’hui à assurer l’interopérabilité entre les grandes collections de ressources éducatives libres.

Comme nous le rappellent les cinq permissions attribuées aux ressources éducatives libres, dites des 5R, celles-ci permettent entre autres de créer de nouvelles ressources à partir d’existantes. Lorsqu’un enseignant cherche à concevoir une nouvelle ressource, une des étapes pour alimenter la procédure est donc la recherche de RELs cohérentes avec les besoins du projet pédagogique qu’il cherche à mettre en œuvre.

Les outils d’intelligence artificielle existent pour indexer les RELs et évaluer leur pertinence vis-à-vis de ses critères de recherche, puis les rassembler et suggérer les ressources qui font sens d’être jointes à celles sélectionnées. Ces outils reposent sur l’apprentissage des schémas de données récurrents identifiés dans les jeux de ressources existantes : l’exposition de ces schémas sous forme de métadonnées est donc cruciale pour faciliter leur interprétation et leur comparaison.

Métaphore d’iceberg de données.
Image modifiée issue de https://commons.wikimedia.org/wiki/File:Iceberg.jpg
(licence : CC BY-SA 3.0)

Les métadonnées sont des données décrivant les jeux de données, en l’occurrence les ressources éducatives. Elles peuvent être à propos de leur format, de leur pérennité, de leur difficulté ou encore de leurs auteurs. Les métadonnées permettent d’aligner les différentes ressources avec un vocabulaire commun et des définitions consistantes, ce qui facilite leur interprétation et fournit un langage de description commun d’une ressource à l’autre pour cibler rapidement les informations qu’elles véhiculent.

De telles métadonnées peuvent être accessibles sous forme d’annotations répandues dans les pages web hôtes des ressources, ce qui oblige les outils d’IA à effectuer une analyse syntaxique en profondeur de ces pages pour en extraire les métadonnées. Une autre solution est d’exposer ces métadonnées dans des entrepôts respectant des normes internationales. Une de ces normes est OAI-PMH, littéralement le protocole pour moissonnage de métadonnées des archives ouvertes.

OAI Icon — Logo Open Archives Initiative
issu de https://commons.wikimedia.org/wiki/File:OAI-PMH.jpg
(licence : CC BY-SA 4.0)

Développé en 1999 par l’Open Archive Initiative, il définit le périmètre de création et maintenance de dépôts d’enregistrements qui référencent des documents, comme le sont les ressources éducatives libres, pour en assurer leur diffusion et interopérabilité.

Ce protocole tient lieu de passerelle d’échange entre les entrepôts hétérogènes, puisqu’il repose sur des langages standards du Web comme HTTP et XML, et des schémas de métadonnées comme Dublin Core. En quelque sorte, il peut être vu comme un emballage uniforme pour l’échange des ressources, quels que soient les systèmes de gestion dans lesquels celles-ci sont dispersées. Les outils d’IA en amont peuvent donc interroger les points d’accès conformes à OAI-PMH de façon transparente pour collecter et agréger les ressources.

Sauf indication contraire, l’ensemble des contenus de ce site https://chaireunescorelia.univ-nantes.fr/ est mis à disposition selon les termes de la Licence Creative Commons Attribution 4.0 International.

Chaire UNESCO RELIA

Chaire UNESCO - Ressources Éducatives Libres et Intelligence Artificielle

De l’importance de la structuration des métadonnées des RELs

1 Trackback / Pingback