Retour en haut

Une visite guidée à travers le paysage de l’apprentissage par renforcement

30 juin 2022

De 13 h 30 à 14 h 30

Centre Énergie Matériaux Télécommunications

Salle Tudor-Johnston (salle 2024)

1650, boul. Lionel-Boulet

Varennes (Québec)  J3X 1P7

Ouvert à la communauté scientifique

Gratuit

Lien Zoom disponible sur demande

Résumé de la conférence

Il s’agit d’une introduction à certaines des idées de base de l’apprentissage par renforcement – le troisième bras de Machine Learning. On en parle peut-être moins souvent que de l’apprentissage supervisé et non supervisé, mais il est prometteur et nous pose de nombreuses questions sur nos interactions avec le monde. C’est l’étude de la façon dont les agents interagissent avec le monde et en apprennent par essais et erreurs.

Je discuterai de certains des algorithmes les plus fondamentaux de RL, de l’apprentissage basé sur un modèle à l’apprentissage sans modèle, et montrerai certaines des avancées récentes et des défis auxquels nous sommes encore confrontés dans ce domaine.

À propos du conférencier

Jonathan Shock
Jonathan Shock

Jonathan Shock est professeur agrégé au Département de mathématiques et mathématiques appliquées de l’Université de Cape Town et professeur associé à l’INRS. Originaire d’Oxford, en Angleterre, il a terminé son doctorat à l’Université de Southampton en 2005, sur les applications de la théorie des cordes à la compréhension de la chromodynamique quantique. Il a ensuite occupé des postes de recherche postdoctorale à Pékin, Saint-Jacques-de-Compostelle et Munich avant de devenir professeur associé à l’Université de Cape Town dans le département de mathématiques et de mathématiques appliquées en 2013.

Il a un large éventail d’intérêts de recherche et passe beaucoup de temps son temps à superviser des étudiants. Ses intérêts de recherche portent sur l’apprentissage automatique (en particulier l’apprentissage par renforcement), la physique théorique et les neurosciences. Il aime aussi enseigner ! Lorsqu’il ne travaille pas, on peut le trouver dans la cuisine, avec son appareil photo, essayant de faire de l’exercice ou essayant d’améliorer son mandarin.

À propos du CEMDI

Regroupant plusieurs membres issus des communautés étudiante et professorale de l’INRS, l’Infrastructure de conception de matériaux d’énergie computationnelle plateforme(CEMDI, Computational Energy Materials Design Infrastructure) s’efforce de favoriser la découverte de matériaux innovants pour la commercialisation de technologies énergétiques propres et la prévention des changements climatiques grâce à la collaboration et à la recherche informatique avancée.