Challenge 1: Automatisierungs-Enabler

Unsere Vision ist eine Gesellschaft, die durch eine stärkere Automatisierung von mehr Nachhaltigkeit, Effizienz und Gleichberechtigung profitiert. Dieser Schwerpunkt stellt uns vor die erste grundlegende Herausforderung: die Entwicklung von Automatisierungs-Enablern. Darunter verstehen wir grundlegende Theorien sowie Rechentechniken und -praktiken, um die nächste Generation von Automatisierungssystemen voranzutreiben. Diese Forschungsarbeit wird weitreichende Auswirkungen haben, da sie den gesamten Lebenszyklus von Automatisierungssystemen abbildet, die auf gesellschaftlicher Ebene zum Einsatz kommen.
Die Forschungsarbeit in diesem Bereich ist in vier Themen gegliedert. Das erste Thema befasst sich mit dem Bedarf an einer verbesserten Skalierbarkeit und Robustheit in der datengetriebenen Steuerung, in anderen Worten mit dem Bedarf an Automatisierungslösungen, die sicher in Systeme integriert werden können, mit denen der Mensch interagiert.
Das zweite Thema befasst sich mit der Suche nach Werkzeugen zur Verbesserung der Automatisierung von komplexen vernetzten cyber-physischen Systemen (wie Transport- oder Energiesystemen), die auf spieltheoretischen Ansätzen basieren.
Das dritte Thema untersucht Berechnungstools für eine umfassende zuverlässige Umsetzung. Diese Forschungsarbeit steht in enger Wechselwirkung mit anderen Forschungsaktivitäten innerhalb des NFS Automation und bildet eine Brücke zwischen den eher theoretischen und den eher anwendungsorientierten Arbeiten.
Das vierte und letzte Thema befasst sich mit Lifelong Learning Control. Hier geht es um die Anpassungsfähigkeit komplexer automatisierter Systeme, die sich über eine lange Lebensdauer auf Basis neuer Daten und Interaktionen mit anderen Systemen zunehmend selbst regulieren müssen.
Thema 1.1: Entwicklung autonomer Systeme: von Daten zur Steuerung
Leitung: Giancarlo Ferrari Trecate
Der Bereich der datengetriebenen Steuerungsmethoden entwickelt sich rasant. Es besteht ein dringendes Bedürfnis nach einer verbesserten Skalierbarkeit und Robustheit ohne einschränkende Annahmen, um eine reibungslose Integration von Automatisierungslösungen in sicherheitskritische Systeme mit menschlicher Interaktion zu gewährleisten.
Wir gehen diese Herausforderungen mit drei spezifischen Ansätzen an.
Ansatz A: Wir nutzen das Potenzial der datengetriebenen Steuerung: Vielseitigkeit und Skalierbarkeit
Mitwirkende: F. Dörfler, G. Ferrari Trecate, C. Jones, M. Kamgarpour, A. Karimi
Neue Entwicklungen im Bereich Steuerung weisen nach wie vor eine Lücke zwischen Theorie und Praxis auf. Diese zeichnet sich aus durch mangelnde Anwendbarkeit, nicht überprüfbare Annahmen oder eingeschränkte Problemstellungen sowie unzureichende Anforderungen an die Robustheit und die Risikosensitivität.
Ansatz B: Wir treiben die Entwicklung robuster Steuerungsstrategien für unkonventionelle Unsicherheiten voran
Mitwirkende: A. Censi, E. Frazzoli, M. Kamgarpour, A. Karimi, V. Medici
Bestehende Ansätze scheitern oft daran, Quellen der Unsicherheit in realen Systemen abzubilden, was erhebliche Haftungsrisiken sowie ethische Risiken mit sich bringen kann.
Ansatz C: «Human-informed Decision Making»
Mitwirkende: F. Corman, M. Kamgarpour, A. Krause, H. Nax
Mit Blick auf Userpräferenzen und Entscheidungsfindung sind zuverlässige Modelle in vielerlei Hinsicht von entscheidender Bedeutung: für die Entwicklung von cyber-physischen-menschlichen Systemen, die sowohl zuverlässig als auch gerecht sind, für die Entwicklung von System zur Entscheidungsfindung sowie für die Modellierung und Steuerung von Käufer-Verkäufer-Märkten. Während traditionelle analytische Modelle diesen Anforderungen oft nicht gerecht werden, mangelt es bei datengetriebenen Ansätzen an Stichprobeneffizienz und Interpretierbarkeit.
Thema 1.2: Vernetzung autonomer Systeme
Leitung: Florian Dörfler, Saverio Bolognani
Die grossen Herausforderungen unserer Zeit (von nachhaltigen Energiesystemen über gemischte Verkehrsnetze und Lieferketten hin zu sozialen Systemen wie Empfehlungen) zeichnen sich durch ihre sozio-technische, cyber-physische und vernetzte Seite aus. Wir entwickeln übertragbare Modelle, Methoden und Lösungen, die in allen diesen Bereichen Anwendung finden, und konzentrieren uns hauptsächlich auf kooperative, nicht kooperative und extrem grosse Szenarien, wobei wir uns auf die Spieltheorie als Paradigma stützen.
Ansatz A: Entscheidungsfindung mit eigennützigen Agenten
Mitwirkende: S. Bolognani, A. Censi, F. Dörfler, E. Frazzoli, N. He, M. Kamgarpour, H. Nax
Wir lassen eine Reihe herausfordernder Fälle aus dem Bereich kompetitive Entscheidungsfindung in Multi-Agenten-Systemen einfliessen: Spiele, in denen Spielende ihre Ziele zuerst erlernen müssen, Spiele zur fairen und effizienten Verteilung gemeinsamer Ressource ohne monetären Austausch («Karma-Spiele») und mehrstufige Spiele, die online in einem kontinuierlich vorhersagenden Verfahren («Receding Horizon») gelöst werden müssen.
Ansatz B: Interoperabilität und verteilte Steuerung autonomer Systeme
Mitwirkende: S. Bolognani, F. Dörfler, G. Ferrari Trecate, S. Mastellone, C. Jones
Mit Blick auf Anwendungen unter anderem in Energie- und Bahnsystemen stehen Anforderungen wie Dissipativitätszertifikate, numerische Aspekte hinsichtlich skalierbarem Steuerungsdesign und Optimierung, verteilte und kooperative Steuerungen sowie dezentralisierte Systemidentifikationen (um Herausforderungen betreffend geschützte proprietäre Modellinformationen abzuschwächen) im Fokus.
Ansatz C: Entscheidungsfindung in Messräumen
Mitwirkende: A. Censi, F. Dörfler, E. Frazzoli, A. Hannák, N. He, D. Kuhn
Wir planen, grosse dynamische Systeme für Messräume zu modellieren, zu untersuchen und zu entwickeln – ein Modellierungsrahmen, der sich für Systeme bestehend aus einer grossen Vielzahl von Agenten eignet, deren globales Verhalten und deren Leistung jedoch durch das aggregierte Verhalten ihrer Teile bestimmt werden (wie Transportsysteme, globale Lieferketten oder soziale Systeme).
Thema 1.3: Zuverlässige grossflächige Bereitstellung: Vollumfängliche Optimierung
Leitung: Colin Jones
Da gesellschaftliche Herausforderungen, geprägt von unzähligen Interaktionen und komplexen Entscheidungen, immer umfangreicher und komplexer werden, ist die Nachfrage nach vollkommen sicherer, vorhersehbarer und zuverlässiger Automatisierung dringlicher denn je. Unser Ziel ist, Methodologien zu entwickeln, die helfen, diese Fülle an Daten effizient in verwertbare Erkenntnisse umzusetzen.
Viele dieser vom NFS Automation entwickelten neuen Ansätze und Methoden erfordern neue Berechnungstools. Folglich wird dieses Thema für viele Bereiche des NFS Automation von Bedeutung sein und als Brücke zwischen eher theoretischen und eher angewandten Arbeiten agieren.
Ansatz A: Berechnungsmethoden für die datengetriebene Steuerung
Mitwirkende: C. Jones, J. Lygeros, M. Zeilinger
Die bevorzugten Ansätze für Systeme, die unter einer Reihe von Limitationen agieren, sind optimierungsbasierte Steuerungsmethoden wie «Model Predictive Control», Echtzeitoptimierung und optimale Planung. Unser Ziel ist, computergestützte Methoden zu erforschen, um Steuerungsprobleme zu lösen, die sich auf «Machine Learning» oder datengetriebene Vorhersagemodellen stützen.
Ansatz B: Co-Design für Mobilität und fortgeschrittene Robotik
Mitwirkende: A. Censi, E. Frazzoli
Wir untersuchen Co-Design-Probleme für grosse, dezentrale und interaktive Systeme, indem wir einen ganzheitlichen Ansatz verfolgen, der die Systemfunktionen und -einschränkungen sowie das Systemziel in der Entwicklung eines Minimalsystems für die vorgesehenen Aufgaben berücksichtigt. Der Bereich Co-Design, der sowohl physische Komponenten als auch Softwarekomponenten umfasst, ist sehr komplex. Im Fokus stehen mehrere Faktoren wie Kosten, Energieverbrauch, Zuverlässigkeit und öffentliche Akzeptanz.
Ansatz C: «Reinforcement Learning» in komplexen Umgebungen und in Multi-Agenten-Umgebungen
Mitwirkende: A. Censi, E. Frazzoli, N. He, A. Krause, N. Kiyavash
«Reinforcement Learning» nutzt die Fähigkeit von Agenten, innerhalb verschiedener Umgebungen zu lernen und optimale Entscheidungen zu treffen. Wir nehmen uns den Herausforderungen, denen «Reinforcement Learning» in komplexen Umgebungen (von exponentiell wachsenden Handlungsräumen bis hin zu Schwierigkeiten beim Erlernen hierarchischer Aufgabenstrukturen) gegenübersteht, aus drei verschiedenen Richtungen an.
Thema 1.4: «Lifelong Learning Control»
Leitung: Andreas Krause
In der Vergangenheit wurden Steuerungssysteme in Betrieb genommen und gerieten dann wieder in Vergessenheit. Das wird in Zukunft nicht mehr der Fall sein. Zukünftige Steuerungssysteme werden in einer sich ständig verändernden Umgebung agieren, in der sie konstant mit neuen Daten, Informationen und Updates gespiesen werden. Ausserdem stehen sie in Wechselwirkung mit anderen Systemen, die sich ebenfalls konstant verändern. Daraus ergeben sich Herausforderungen hinsichtlich alternder Anlagen, wachsender Dimensionen von Systemen, Interaktionen mit Menschen und zeitlich variierender Leistungskennzahlen.
Das übergeordnete Ziel des Themas «Lifelong Learning Control» (LLC) ist, eine Theorie für datengetriebene Steuerungsanpassungen für komplexe Systeme zu entwickeln. Dabei konzentrieren wir uns auf vier spezifische Forschungsansätze.
Ansatz A: Annahmen, Benchmarks und Grundlagen für LLC
Mitwirkende: A. Censi, G. Ferrari Trecate, E. Frazzoli, A. Krause, A. Rupenyan
Unsere Forschungsarbeit im Bereich LLC ist in für den NFS Automation relevanten Kontexten verankert. Sie zielt darauf ab, reale Testumgebungen und Benchmarks zu etablieren, wobei digitale Zwillinge, die in fortschrittlichen Fertigungssystemen, Energiesystemen (z. B. Windparks) und autonomen Fahrzeugen eingesetzt werden, die wichtigsten Anwendungen sind.
Ansatz B: Grundsätze von «Deep Adaptation»
Mitwirkende: F. Dörfler, G. Ferrari Trecate, C. Jones, A. Krause, J. Lygeros
Wie können wir eine schnelle und zuverlässige Anpassung für nichtlineare zeitvariable Systeme ermöglichen? Was sind geeignete Leistungszusagen? Wie können wir nichtparametrische Systemmodelle online identifizieren und tracken? Wie können wir «Regret-minimising Controllers» in einem LLC-Setting einsetzen? Und wie können wir adaptives modellbasiertes «Reinforcement Learning» für LLC einsetzen?
Ansatz C: Systemdesign für LLC
Mitwirkende: A. Censi, E. Frazzoli, A. Hannák
Wir befassen uns über algorithmische Prinzipien hinaus mit umfassenderen Problemstellungen bezüglich zuverlässigem Systemdesign für LLC. Welche Teile der Modelle / der Steuerung sollten in welchen Zeitintervallen (Echtzeit vs. episodisch vs. ereignisbasiert usw.) aktualisiert werden? Können wir Systemkomponenten und zugehörige Steuerungen parallel entwerfen? Und wie sieht es – in Anbetracht dessen, dass «Machine Learning» dafür bekannt ist, menschliche Bias bei der Entscheidungsfindung zu verstärken oder sogar neue hervorzurufen – mit ethischen Fragestellungen aus?
Themenverwandte Publikationen und Datensätze und News.