Apprentissage actif en-ligne d’un classifieur évolutif, application à la reconnaissance de commandes gestuelles
Résumé
L’utilisation de commandes gestuelles est une nouvelle méthode d’interaction sur interface tactile.
Une bonne méthode pour faciliter la mémorisation de ces commandes gestuelles est de laisser l’utilisateur les personnaliser.
Ce contexte applicatif induit une situation d’apprentissage croisé, où l’utilisateur doit mémoriser le jeu de symboles et le système doit apprendre à reconnaitre les différents symboles.
Cela implique un certain nombre de contraintes, à la fois sur le système de reconnaissance de symboles et sur le système de supervision de son apprentissage.
Il faut par exemple que le classifieur puisse apprendre à partir de peu de données, continuer à apprendre pendant son utilisation et suivre toute évolution des données indéfiniment.
Le superviseur doit quant à lui optimiser la coopération entre l’utilisateur et le système de reconnaissance pour minimiser les interactions tout en maximisant l’apprentissage.
Cette thèse présente d’une part, le système d’apprentissage évolutif « Evolve ∞ », capable d’apprendre rapidement à partir de peu de données et de suivre les changements de concepts.
D’autre part, elle introduit le superviseur actif en-ligne « IntuiSup » qui permet d’optimiser la coopération entre le système et l’utilisateur, lors de l’utilisation de commandes gestuelles personnalisées notamment.
Evolve ∞ est un système d’inférence floue, capable d’apprendre rapidement grâce aux capacités génératrices des prémisses des règles, tout en permettant d’obtenir une précision élevée grâce aux capacités discriminantes des conclusions d’ordre un.
L’intégration d’oubli dans le processus d’apprentissage permet de maintenir le gain de l’apprentissage indéfiniment, permettant ainsi l’ajout de classes à n’importe quel moment de l’utilisation du système et garantissant son évolutivité « à vie ».
Le superviseur actif en-ligne IntuiSup permet d’optimiser les interactions avec l’utilisateur pour entrainer un système d’apprentissage lorsque l’utilisateur est dans la boucle.
Il permet de faire évoluer la proportion de données que l’utilisateur doit étiqueter en fonction de la difficulté du problème et de l’évolution de l’environnement (changements de concepts).
L’utilisation d’une méthode de « dopage » de l’apprentissage permet d’optimiser la répartition de ces interactions avec l’utilisateur pour maximiser leur impact sur l’apprentissage.
Composition du jury
– Muriel VISANI, Maître de conférences – HDR à l’Université de La Rochelle, Rapporteur
– Jean-Yves RAMEL, Professeur à l’Ecole Polytechnique de l’Université de Tours, Rapporteur
– Réjean PLAMONDON, Professeur à l’Ecole Polytechnique de Montréal (Canada), Examinateur
– Vincent LEMAIRE, Docteur avec HDR chez Orange Labs, Examinateur
– Eric ANQUETIL, Professeur à l’INSA de Rennes, Directeur