Retour en haut

Développer des outils basés sur l’IA pour automatiser l’extraction et la synthèse d’informations bibliographiques

  • Stage de 1er cycle
  • Été
  • Bourse offerte

Description

Dans un contexte de production scientifique de plus en plus volumineuse, le besoin d’outils permettant de synthétiser efficacement de grandes quantités d’informations textuelles devient crucial pour les chercheurs. Ce stage s’inscrit dans un projet visant à mobiliser des modèles d’intelligence artificielle (IA), notamment des modèles de langage à grande échelle (LLM – Large Language Models), pour automatiser l’extraction et la synthèse d’informations bibliographiques. L’objectif est de développer des outils permettant de produire des descriptions sommaires et préliminaires de champs spécifiques de la littérature, afin d’assister les chercheurs dans les étapes initiales de leurs revues de la littérature.

La personne recrutée contribuera au développement d’outils (scripts, programmes, applications) destinés à faciliter l’extraction, la synthèse et la visualisation de données issues de grandes bases de données bibliographiques en accès libre (Crossref, OpenAlex, etc.). Ce stage offre également l’opportunité de bénéficier d’une co-supervision entre un professeur universitaire et un chercheur du secteur privé, permettant au stagiaire d’acquérir une perspective à la fois académique et pratique.

Offre de stage n° 2025002

Tâches du stagiaire

En fonction de ses intérêts et compétences, le/la stagiaire pourra participer aux activités suivantes :

  • Effectuer une revue de littérature sur les modèles génératifs d’IA et les LLM en accès libre, adaptés à la synthèse textuelle.
  • Manipuler et analyser des données bibliographiques provenant de bases de données en accès libre.
  • Tester, comparer et valider la performance de différents modèles de langage pour la synthèse et l’extraction d’informations à partir de résumés d’articles scientifiques.
  • Développer des outils de visualisations interactives des données bibliométriques à l’aide de R (Shiny) ou Python (Dash, Plotly).
  • Participer à l’élaboration d’un prototype d’application pour la synthèse automatique d’informations bibliographiques.

Supervision

Le stage sera supervisé par Yacine Boujija, professeur à l’INRS, en co-supervision avec Mouloud Belbahri, Ph.D., chercheur en machine learning à Layer 6.

Exigences particulières pour le stage

  • Étudiant.e de 2ᵉ ou 3ᵉ année de 1er cycle dans une discipline quantitative.
  • Bonne maîtrise de R ou Python.
  • Compétences en méthodologies quantitatives appliquées à la recherche en sciences sociales.
  • Intérêt pour les approches computationnelles en sciences sociales.
  • Capacité à lire, analyser et synthétiser des articles scientifiques en français et en anglais.

Durée du stage

Environ 30 h par semaine, sur 15 semaines entre les mois de mai et d’août 2025.

Lieu du stage

À distance et à Montréal (Centre Urbanisation Culture Société de l’INRS au 385, rue Sherbrooke Est à Montréal.)

Soumettre sa candidature

Les candidat.e.s doivent remplir le formulaire sur la plateforme stages.ucs.inrs.ca. Le dossier doit comprendre une lettre de motivation, un CV et un relevé de notes . Date limite : 1er février 2025