Une étape importante dans les systèmes de contrôle par auto-apprentissage

Maintenir une voiture à une vitesse constante est une tâche relativement simple : accélérer quand elle ralentit et décélérer quand elle accélère. Un algorithme qui contrôle la voiture pour accomplir cette tâche ne nécessite que quelques équations mathématiques décrivant le mouvement de la voiture (force égale masse fois accélération, etc.) et des mesures de sa vitesse. Mais de nombreux systèmes du monde réel que les scientifiques cherchent à contrôler sont beaucoup plus complexes et les équations qui les décrivent ne sont parfois même pas entièrement connues. Prenez la propagation d'une maladie virale, par exemple. Décrire mathématiquement et contrôler ce système avec précision peut s'avérer extrêmement difficile, comme l'a montré la pandémie de coronavirus.
Lorsque ces approches traditionnelles du contrôle échouent, une catégorie relativement nouvelle de méthodes, appelées méthodes de contrôle basées sur les données, offre une alternative prometteuse. Elles ne reposent pas sur une description mathématique prédéfinie du système. Au lieu de cela, les algorithmes décrivent mathématiquement le système en se basant sur les modèles qu'ils détectent dans les larges quantités de données collectées. À partir de cette description basée sur les données, les scientifiques peuvent formuler une stratégie de contrôle. Des chercheurs dirigés par l'EPFL et le PRN Automation ont récemment mis au point un nouveau schéma de ce type qui est également robuste aux données inexactes. Leurs résultats ont été publiés dans la revue Proceedings of Machine Learning Research.
Faire face à des mesures inexactes
"Ce qui nous intéresse particulièrement, c'est la tâche de contrôler un système de manière à ce que ses sorties suivent les valeurs souhaitées correspondantes. Nous appelons cela le suivi de référence", explique Liang Xu, premier auteur de l'étude, chercheur postdoctoral à l'EPFL et membre du PRN Automation. Dans l'exemple de la propagation d'une maladie, cela pourrait correspondre à la prise de mesures de contrôle de telle sorte que le nombre d'infections diminue.

En utilisant des outils récemment disponibles pour le contrôle piloté par les données, l'équipe exprime le problème de contrôle comme un problème d'optimisation paramétré par les données disponibles. Pour que cela fonctionne, cependant, les données doivent être d'une certaine qualité. "Dans le cas contraire, il devient beaucoup plus difficile de respecter les valeurs souhaitées - la qualité des informations entrant dans le système déterminera la qualité des données sortantes", explique Liang Xu. Malheureusement, les données du monde réel sont souvent imprécises. "C'est pourquoi notre modèle de contrôle devait également tenir compte de ces imprécisions", explique Mustafa Sahin Turan, co-auteur de l'étude, doctorant à l'EPFL et membre du PRN Automation. Pour mieux prendre en compte les imprécisions des données collectées, l'équipe a formulé un problème de contrôle robuste basé sur l'optimisation, pour lequel elle fournit ensuite des solutions explicites. En conséquence, la méthode de contrôle de l'équipe garantit que la performance de régulation souhaitée est maintenue même en cas d'imprécisions de mesure considérables. L'un des principaux avantages de la méthode de commande directe basée sur les données est qu'elle évite l'étape d'identification du système que les approches de commande conventionnelles requièrent. Cela la rend plus simple et facile à mettre en œuvre.

Préparer l'avenir
"Dans un avenir proche, les applications de ces méthodes de contrôle pilotées par les données seront de plus en plus nombreuses, car les données et la puissance de calcul ainsi que les systèmes complexes seront de plus en plus omniprésents. Notre méthode est une étape importante pour la réalisation de futurs systèmes de contrôle qui apprennent directement des données qu'ils collectent dans leur environnement. Sans exiger de connaissances sur le modèle du système sous-jacent", conclut M. Turan.