Ein wichtiger Schritt in Richtung selbstlernender Regelungsmethoden

Ein Fahrzeug bei konstanter Geschwindigkeit zu halten, ist eine relativ einfache Aufgabe: beschleunigen, wenn es langsamer wird, abbremsen, wenn es schneller fährt. Ein Algorithmus, der das Fahrzeug so steuert, benötigt nur ein paar mathematische Gleichungen, die die Bewegung des Autos beschreiben (wie etwa Kraft gleich Masse mal Beschleunigung), sowie Messungen der Geschwindigkeit. Viele reale Systeme, die Forschende zu regeln versuchen, sind jedoch viel komplexer. Die Gleichungen, die sie beschreiben, sind oft nicht einmal gänzlich bekannt. Zum Beispiel die Ausbreitung einer Viruserkrankung. Dieses System mathematisch genau zu beschreiben und zu regeln kann extrem herausfordernd sein – wie zuletzt die Coronavirus-Pandemie gezeigt hat.
Wenn diese traditionellen Regelungsansätze versagen, bietet eine relativ neue Klasse von Methoden, die sogenannten datengesteuerten Regelungsmethoden, eine vielversprechende Alternative. Sie stützen sich nicht auf eine vordefinierte mathematische Beschreibung des Systems. Stattdessen beschreiben die Algorithmen das System selbst, auf der Grundlage von Mustern, die sie in den riesigen Mengen an gesammelten Daten erkennen. Aus dieser datenbasierten Beschreibung können Forschende dann eine Regelungsstrategie formulieren. Ein Team der EPF Lausanne und des NFS Automation haben nun eine neuartige datengesteuerte Regelungsmethode entwickelt, die robust gegen Messungeauigkeiten ist. Ihre Ergebnisse wurden in der Fachzeitschrift Proceedings of Machine Learning Research veröffentlicht.
Umgehen mit Datenrauschen
«Was uns besonders interessiert, ist die Aufgabe, ein System so zu steuern, dass einige der Outputs bestimmten Sollwerten folgen. Wir nennen dies Referenzverfolgung», sagt Liang Xu, Erstautor der Studie, Postdoktorand an der EPFL und Mitglied des NFS Automation. Am Beispiel einer sich ausbreitenden Krankheit könnte dies bedeuten, dass Massnahmen ergriffen werden, welche die Zahl der Infektionen reduzieren.

Mithilfe von neu verfügbaren Tools für datengesteuerte Regelung, drückten die Forschenden das Regelungsproblem als ein Optimierungsproblem aus, das durch die verfügbaren Daten parametrisiert wird. Damit dies funktioniert, müssen die Daten jedoch eine bestimmte Qualität aufweisen. «Andernfalls wird es viel schwieriger, die gewünschten Werte zu verfolgen – ganz nach dem Motto: Garbage in Garbage out», so Liang Xu. Leider sind Daten aus der realen Welt jedoch oft ungenau. «Deshalb musste unser Methodendesign auch dieses sogenannte Rauschen berücksichtigen», sagt Mustafa Sahin Turan, Mitautor der Studie, Doktorand an der EPFL und Mitglied des NFS Automation. Um das Rauschen in den gesammelten Daten weiter zu berücksichtigen, formulierte das Team ein auf robuster Optimierung basierendes Regelungsproblem, und lieferte dann explizite Lösungen dafür. Die Regelungsmethode des Teams stellt so sicher, dass die gewünschte Regelungsleistung auch bei erheblichen Messungenauigkeiten erhalten bleibt. Die direkte datengesteuerte Regelungsmethode vermeidet daher den Schritt der Systemidentifikation in konventionellen Regelungsansätzen und ist daher einfacher und leicht zu implementieren.

Vorbereiten für die Zukunft
"In naher Zukunft wird es immer mehr Anwendungen für solche datengesteuerten Regelungsmethoden geben, da sowohl Daten und Rechenleistung als auch komplexe Systeme immer allgegenwärtiger werden. Unsere Methode ist ein wichtiger Schritt zur Realisierung zukünftiger Kontrollsysteme, die direkt aus den Daten lernen, die sie aus ihrer Umgebung sammeln. Und zwar ohne Modellkenntnisse über das zugrundeliegende System", so Turan abschliessend.