La Chaire est faite de chair et de sang ! Nous commençons à être nombreux à travailler pour la Chaire. Et vous êtes nombreux à travailler avec nous. Nous prenons le temps de présenter les personnes qui font la Chaire, qui font fonctionner les projets, lui donnent de la visibilité.
Aujourd’hui, Andréane Roques.
Andréane, tu nous as rejoints il y a quelques mois. Tu viens de terminer un master à Orléans qui a la particularité d’être sur un sujet très IA (le traitement automatique de la Langue), mais dans le contexte d’une Fac de Sciences Humaines. Ce parcours est atypique. Que crois-tu qu’il t’apporte ?
À l’issue d’une licence de Sciences du Langage, j’ai effectivement choisi de m’orienter vers un master dans le domaine du Traitement Automatique des Langues.
Ce parcours de formation m’a permis d’acquérir des connaissances et des compétences dans deux domaines complémentaires pour l’ingénierie des données : l’informatique et la linguistique.
En effet, l’informatique est indispensable en ingénierie des données, car elle permet d’automatiser la collecte et le traitement de grandes quantités de données. De même, des connaissances en linguistique constituent un atout pour la préparation, le traitement et l’analyse de données, notamment textuelles.
Dès ton arrivée, tu as commencé à travailler en ingénierie des données. Plus particulièrement autour des données éducatives produites par le Ministère de l’Éducation nationale. Et pour être précis, celles contenues dans Édubase. Tu nous en dis plus ?
Oui, Édubase est une banque nationale de scénarios pédagogiques valorisés par les académies et validés par l’inspection. Actuellement, cette base contient environ 13 000 ressources publiées par 34 académies ou organisations. Parmi toutes ces ressources, l’objectif est d’identifier celles que nous considérons comme exploitables, c’est-à-dire qui répondent à 3 critères indispensables. Les ressources doivent ainsi être accessibles techniquement, correctement licenciées et validées par des autorités académiques.
Et le but de ce travail est donc de rassembler, d’assembler les ressources éducatives libres produites dans les collèges et lycées. C’est bien ça ? Et comment savoir si les ressources du catalogue sont bien libres ?
Oui, c’est ça. Il y a également quelques ressources de niveau primaire, mais elles ne sont pas majoritaires.
Concernant la licence, plusieurs étapes sont nécessaires afin de s’assurer qu’une ressource est bien libre. Tout d’abord, il faut rechercher les mentions légales du site sur lequel la ressource est publiée. Parfois, elles sont inexistantes et aucune information n’est disponible concernant les licences. Mais lorsque ces mentions légales existent, une lecture attentive permet généralement d’identifier les autorisations éventuellement accordées en termes de reproduction des contenus ou, au contraire, ce qu’il est interdit de faire. En revanche, nous avons parfois relevé des incohérences qui nous ont empêchés de savoir ce que nous avions le droit de faire ou non.
Ensuite, en fonction des informations fournies dans les mentions légales, il est parfois nécessaire d’effectuer également une vérification au niveau des ressources, par exemple via l’analyse du code source de la page. Cela permet de s’assurer qu’il n’y a aucune information contradictoire avec celles trouvées précédemment.
Et maintenant, où en sommes-nous ?
Ce travail nous a permis de constater que, parmi les 34 académies ou organisations ayant publié des ressources, il n’y en a malheureusement que 2 pour lesquelles les ressources sont exploitables pour nous. Bien que cela ne soit pas à la hauteur de nos espérances, nous travaillons pour l’instant sur ces ressources identifiées, notamment sur leurs métadonnées, leur structure et sur l’identification des liens pertinents qu’elles contiennent.
Tu es également en train de travailler sur un projet qu’on appelle “les mille objets”. Peux-tu nous décrire ce que tu cherches à faire ?
1000 est une œuvre réalisée par le collectif d’artistes Exsitu. Elle est composée de 1000 objets collectés pendant 3 ans, lors d’un tour du monde à vélo.
L’objectif est d’explorer ces objets et leurs métadonnées grâce à l’Intelligence Artificielle, sous la forme de défis. Un de ces défis consiste à développer un outil dont le fonctionnement ressemble à celui du jeu « Qui est-ce ? ». Ainsi, un utilisateur pourra choisir un objet dans l’œuvre. Plusieurs questions concernant les caractéristiques de cet objet lui seront ensuite posées, jusqu’à ce que le système trouve celui qu’il a choisi.
En termes de développement, l’enjeu est d’optimiser ce système afin que l’objet soit trouvé grâce aux réponses de 10 questions maximum.
Merci Andréane. Et bonne continuation !
Sauf indication contraire, l’ensemble des contenus de ce site https://chaireunescorelia.univ-nantes.fr/ est mis à disposition selon les termes de la Licence Creative Commons Attribution 4.0 International.