Subvention
Apprentissage par renforcement avec actions, temps et espace d’état continus
La capacité d’un système autonome à s’adapter et à apprendre en ligne de manière utile est un objectif souhaitable pour tout projet de véhicule autonome, en particulier en ce qui concerne le transport autonome de marchandises à l’aide de l’intelligence artificielle (IA) dans des environnements qui comportent de nombreux obstacles. Par ailleurs, tout objectif de projet d’autonomie requiert des systèmes décisionnels qui exploitent cette information visuelle. Ce projet permettra d’étudier, de développer et de démontrer des algorithmes et des systèmes décisionnels basés sur des véhicules autonomes qui pourraient être déployés entre autres sur des systèmes d’avions sans pilote. Bien qu’il existe des algorithmes de prise de décision autonome et d’apprentissage de renforcement en cours de développement actif dans la communauté de recherche, il y a deux raisons d’entreprendre ce projet particulier. Premièrement, le nouveau système de représentation temporelle des unités de mémoire de Legendre (LMU) n’a jamais été appliqué à cette tâche, et il a été démontré que la LMU produit des ordres de grandeur d’amélioration par rapport aux méthodes traditionnelles. Deuxièmement, le système de calcul résultant de ces méthodes pourrait probablement être efficacement mis en œuvre dans le matériel moderne, y compris les processus graphiques (GPU), les unités de traitement de tenseur (TPU) et le calcul neuromorphique.
Données ingérées le 23 avr. 2026.