Subvention

Apprentissage par renforcement avec actions, temps et espace d’état continus

La capacité d’un système autonome à s’adapter et à apprendre en ligne de manière utile est un objectif souhaitable pour tout projet de véhicule autonome, en particulier en ce qui concerne le transport autonome de marchandises à l’aide de l’intelligence artificielle (IA) dans des environnements qui comportent de nombreux obstacles. Par ailleurs, tout objectif de projet d’autonomie requiert des systèmes décisionnels qui exploitent cette information visuelle. Ce projet permettra d’étudier, de développer et de démontrer des algorithmes et des systèmes décisionnels basés sur des véhicules autonomes qui pourraient être déployés entre autres sur des systèmes d’avions sans pilote. Bien qu’il existe des algorithmes de prise de décision autonome et d’apprentissage de renforcement en cours de développement actif dans la communauté de recherche, il y a deux raisons d’entreprendre ce projet particulier. Premièrement, le nouveau système de représentation temporelle des unités de mémoire de Legendre (LMU) n’a jamais été appliqué à cette tâche, et il a été démontré que la LMU produit des ordres de grandeur d’amélioration par rapport aux méthodes traditionnelles. Deuxièmement, le système de calcul résultant de ces méthodes pourrait probablement être efficacement mis en œuvre dans le matériel moderne, y compris les processus graphiques (GPU), les unités de traitement de tenseur (TPU) et le calcul neuromorphique.

FED_GCSubvention

Bénéficiaire

University of Waterloo | University of Waterloo

WATERLOO, ON

Organisme payeur

Conseil national de recherches Canada

Montant

199 870 $

Date d'annonce

17 déc. 2020

Sous-direction

Programme de collaboration en science, en technologie et en innovation - Initiatives de collaboration en R-D

Numéro de dossier

962712

Données ingérées le 23 avr. 2026.