Défi n° 1: les facilitateurs d’automation

automation enablers

Notre vision est celle d’une société que l’automation rendrait plus durable, plus efficace et plus égalitaire. Pour la concrétiser, nous sommes confrontés à un premier défi: mettre au point des facilitateurs d’automation, c’est-à-dire des théories fondamentales, des méthodes de calcul et des pratiques permettant de porter la prochaine génération de systèmes d’automation. Ces travaux auront un impact profond, car ils portent sur toute la durée de vie des systèmes d’automation présents à différentes échelles de la société.

Nos recherches s’articulent autour de quatre thèmes. Le premier répond au besoin d’améliorer l’évolutivité et la robustesse du contrôle basé sur les données: autrement dit, le besoin de trouver des solutions d’automation qui peuvent être intégrées en toute sécurité dans des systèmes impliquant une interaction humaine.

Dans le cadre du deuxième thème, nous recherchons des outils pouvant servir à améliorer l’automation des systèmes cyber-physiques complexes en réseau (comme les systèmes de transport ou d’énergie) en s’appuyant sur la théorie des jeux.

Le troisième thème concerne les outils de calcul qui rendent possible un déploiement fiable à grande échelle. Ce thème est étroitement lié à d’autres activités de recherche du PRN Automation et crée des liens entre les travaux plus théoriques et les plus appliqués.

Enfin, dans le cadre d’un quatrième thème, nous travaillons sur le contrôle en apprentissage continu. Ce terme fait référence à l’adaptabilité des systèmes automatisés complexes qui devront de plus en plus souvent s’autogérer pour réagir aux données entrantes et aux interactions avec d’autres systèmes complexes pendant leur longue durée de vie. 

Découvrez nos recherches en détail.

Thème 1.1: Conception de systèmes autonomes – des données au contrôle

Le domaine des méthodes de contrôle basées sur les données est en pleine évolution, et il existe un besoin pressant d’améliorer leur évolutivité et leur robustesse sans hypothèses restrictives. Ces améliorations sont nécessaires pour assurer l’intégration harmonieuse des solutions d’automation dans les SCS impliquant des interactions humaines

Nous abordons ces défis selon trois axes spécifiques.

Axe A: débrider la puissance du contrôle basé sur les données: polyvalence et évolutivité

Contributeurs: F. Dörfler, G. Ferrari Trecate, C. Jones, M. Kamgarpour, A. Karimi

Même dans les dernières avancées en matière de contrôle, il subsiste un véritable fossé entre la théorie et la pratique. Ce décalage se caractérise par un manque d’applicabilité, une dépendance à des hypothèses invérifiables ou à des paramètres restreints, et des contraintes de robustesse ou de sensibilité au risque non satisfaites.

Axe B: améliorer les stratégies de contrôle robuste pour les incertitudes non conventionnelles

Contributeurs: A. Censi, E. Frazzoli, M. Kamgarpour, A. Karimi, V. Medici

Bien souvent, les approches existantes ne parviennent pas à modéliser les sources d’incertitude dans les systèmes réels, ce qui risque d’entraîner des risques importants en matière de responsabilité et d’éthique.

Axe C: une prise de décision informée par l’humain

Contributeurs: F. Corman, M. Kamgarpour, A. Krause, H. Nax

Il est crucial d’adopter des modèles fiables de préférences utilisateurs et de prise de décision, et ce, à plusieurs égards: pour le développement de systèmes cyber-physiques humains à la fois fiables et équitables, la conception de systèmes d’aide à la décision, et la modélisation et le contrôle des marchés acheteur-vendeur. Les modèles analytiques traditionnels sont souvent insuffisants, mais les approches fondées sur les données souffrent d’échantillonnages inefficaces et d’un manque d’interprétabilité.

 

Thème 1.2: Interconnexion des systèmes autonomes

Des systèmes énergétiques durables aux réseaux de transport mixtes et aux chaînes d’approvisionnement en passant par les systèmes sociaux comme les systèmes de recommandations, les grands défis de notre époque se caractérisent par trois aspects: ils sont sociotechniques, cyberphysiques et connectés en réseau. Nous travaillerons à développer des modèles, des méthodes et des solutions transférables applicables à tous ces domaines. Plus particulièrement, nous nous concentrerons sur les contextes coopératifs, non coopératifs et extrêmement vastes avec la théorie des jeux comme paradigme.

Axe A: prise de décision avec des agents à intérêt personnel

Contributeurs: S. Bolognani, A. Censi, F. Dörfler, E. Frazzoli, N. He, M. Kamgarpour, H. Nax

Nous examinerons une série de cas difficiles de prise de décision multi-agents compétitive: des jeux dans lesquels les joueurs doivent apprendre leurs objectifs, des jeux destinés à l’allocation équitable et efficace d’une ressource partagée sans échange monétaire (jeux «Karma») et des jeux à plusieurs étapes devant être résolus en ligne dans un contexte d’horizon fuyant.

Axe B: interopérabilité et contrôle distribué des systèmes autonomes

Contributeurs: S. Bolognani, F. Dörfler, G. Ferrari Trecate, S. Mastellone, C. Jones

Les questions abordées dans cet axe comprennent des exigences comme les certificats de dissipativité, les aspects numériques de la conception et de l’optimisation du contrôle évolutif, le contrôle distribué et coopératif et l’identification décentralisée des systèmes (pour atténuer les difficultés liées à la protection des informations de modèles propriétaires), en vue notamment d’applications dans les systèmes électriques et ferroviaires.

Axe C: prise de décision dans les espaces mesurés

Contributeurs: A. Censi, F. Dörfler, E. Frazzoli, A. Hannák, N. He, D. Kuhn

Nous prévoyons de modéliser, d’étudier et de concevoir des systèmes dynamiques à grande échelle sur des espaces mesurés. Ce cadre de modélisation convient aux systèmes composés d’une multitude d’agents mais dont le comportement global et la performance sont décrits par le comportement agrégé de ses parties (comme les systèmes de transport ou les chaînes d’approvisionnement mondiales, ainsi que les systèmes sociaux).

 

Thème 1.3: Déploiement fiable à grande échelle: une optimisation omniprésente

Responsable: Colin Jones

Alors que les problèmes auxquels sont confrontés nos sociétés continuent de gagner en ampleur et en complexité et entraînent une multitude d’interactions et de décisions complexes, la demande d’une automation parfaitement sûre, prévisible et fiable se fait de plus en plus pressante. Nous souhaitons développer des méthodologies capables de traduire efficacement la masse de données disponibles en informations exploitables.

Bon nombre des nouvelles approches et méthodes développées dans le cadre du PRN Automation nécessitent de nouveaux outils informatiques. Par conséquent, ce thème viendra recouper de nombreuses activités du PRN et créera des liens entre les projets théoriques et appliqués.

Axe A: méthodes de calcul pour le contrôle basé sur les données

Contributeurs: C. Jones, J. Lygeros, M. Zeilinger

Les méthodes de contrôle basées sur l’optimisation comme la commande prédictive, l’optimisation en temps réel et la planification optimale sont privilégiées pour les systèmes fonctionnant sous diverses contraintes. Nous souhaitons explorer les méthodes de calcul permettant de résoudre les problèmes de contrôle basés sur l’apprentissage automatique ou les modèles prédictifs basés sur des données.

Axe B: co-conception pour la mobilité et la robotique avancée

Contributeurs: A. Censi, E. Frazzoli

Nous étudierons les problèmes de co-conception pour les systèmes interactifs, distribués et à grande échelle en adoptant une approche globale prenant en compte les fonctions et les contraintes du système et l’objectif de concevoir un système minimal pour les tâches prévues. Sur le terrain complexe du «co-design», qui demande de naviguer entre les composants physiques et logiciels, de multiples objectifs entrent en jeu, comme le coût, la consommation d’énergie, la fiabilité et l’acceptation du public.

Axe C: apprentissage par renforcement dans les environnements complexes et multi-agents

Contributeurs: A. Censi, E. Frazzoli, N. He, A. Krause, N. Kiyavash

L’apprentissage par renforcement exploite la capacité des agents à apprendre et à prendre des décisions optimales dans différents environnements. Pour aborder les défis auxquels est confronté l’apprentissage par renforcement dans des environnements complexes (des espaces d’action à croissance exponentielle aux difficultés d’apprentissage de structures de tâches hiérarchiques), nous avons défini trois angles différents.

 

Thème 1.4: Le contrôle en apprentissage continu

Responsable: Andreas Krause

Par le passé, les systèmes de contrôle étaient mis en service, puis immédiatement relégués à l’oubli. Cela ne sera plus le cas à l’avenir: dans un environnement en perpétuelle transformation, ils ne cesseront de recevoir de nouvelles données, informations et mises à jour, et interagiront avec d'autres systèmes eux aussi en constante évolution. Cette nouvelle réalité donne lieu à des défis comme le vieillissement des installations, les systèmes à structure croissante, les interactions avec les humains et les mesures de performance variables dans le temps.

L’objectif principal du contrôle par apprentissage continu («lifelong learning control», ou LLC) est de développer une théorie de l’adaptabilité du contrôle basé sur les données pour les systèmes complexes. Nous nous concentrons sur quatre axes de recherche spécifiques.

Axe A: hypothèses, benchmarks et fondements du LLC

Contributeurs: A. Censi, G. Ferrari Trecate, E. Frazzoli, A. Krause, A. Rupenyan

Notre recherche sur le LLC est ancrée dans des contextes pertinents pour le PRN et vise à établir des bancs d’essai et des benchmarks dans le monde réel. Parmi nos domaines d’application clés, on compte les jumeaux numériques utilisés pour les systèmes de fabrication avancés, les systèmes énergétiques (tels que les parcs éoliens) et les véhicules autonomes.

Axe B: principes d’une «adaptation profonde»

Contributeurs: F. Dörfler, G. Ferrari Trecate, C. Jones, A. Krause, J. Lygeros

Comment rendre possible une adaptation rapide et fiable des systèmes non linéaires variant dans le temps? Quelles sont les garanties de performance adaptées? Comment identifier et suivre en ligne les modèles de systèmes non paramétriques? Comment déployer des contrôleurs minimisant les regrets dans un cadre LLC? Et comment utiliser l’apprentissage par renforcement basé sur un modèle adaptatif pour le LLC?

Axe C: conception de systèmes pour le LLC

Contributeurs: A. Censi, E. Frazzoli, A. Hannák

Au-delà des principes algorithmiques, nous considérons le problème plus vaste de la conception de systèmes fiables pour le LLC. Quelles sont les mises à jour nécessaires pour les modèles/contrôleurs, et à quelles échelles de temps (temps réel, épisodique, événementiel, etc.)? Est-il possible de co-concevoir les composants du système et les contrôleurs associés? Quelles sont les répercussions en matière d’éthique, dans la mesure où l’apprentissage automatique est connu pour amplifier les biais humains préexistants dans la prise de décision – et même en introduire de nouveaux?