baiosphere News

Munich AI Lecture: Synergien zwischen Reinforcement Learning und MPC

Im Rahmen der Munich AI Lectures – unserer Vorlesungsreihe, die durch die Zusammenarbeit mehrerer Münchner Forschungseinrichtungen hochkarätige KI-Expertinnen und Experten nach Bayern zieht – hielt Ludovic Righetti, Professor der New York University (NYU), einen aufschlussreichen Vortrag über die Integration von Model-Predictive Control (MPC) und Reinforcement Learning (RL) in der Robotik. Er leitet das Machines in Motion Laboratory an der NYU, das sich mit den algorithmischen Grundlagen von Roboterbewegungen befasst, die komplexe Fortbewegungs- und Manipulationsaufgaben ermöglichen.

MPC ist ein robuster Rahmen zur Erzeugung einer Vielzahl von Roboterverhalten, welcher zu jedem Zeitschritt ein Optimierungsproblem löst. Zukünftige Zustände werden auf der Grundlage eines Systemmodells vorhersagt . MPC ist zwar leistungsfähig, hat aber Probleme mit der Echtzeit-Optimierung in komplexen Szenarien, wie z. B. Multikontakt-Verhalten bei Manipulation und Fortbewegung. Andererseits zeichnet sich RL durch das Erlernen komplexer Verhaltensweisen aus der Interaktion mit der Umwelt aus. RL kann mit multimodaler Sensorik umgehen und sich an dynamische Veränderungen anpassen, erfordert aber in der Regel umfangreiche Offline-Berechnungen und große Datenmengen für das Training.


Lecture-Teilnehmer stellt eine Frage zu Bewegungsabläufen autonomer Roboter

Ludovic Righetti beantwortet Fragen aus dem Publikum

Ein kombinierter Ansatz

Prof. Righettis Ansatz zeigt, dass Synergien zwischen beiden Methoden deren Stärken effektiv kombinieren. Der Einsatz numerischer Optimierungsmethoden zur Entwicklung zuverlässiger Solver als Teil von MPC, gemeinsam mit Techniken des maschinellen Lernens erlaubt, komplexe, multimodale Eingaben zu verarbeiten und die Verhaltensgenerierung zu beschleunigen. Dieser hybride Ansatz zielt darauf ab, die Beschränkungen der jeweiligen Ansätze zu überwinden. In diesem Zusammenhang ruft er ebenfalls dazu auf, Offenheit bei der Lösungsfindung zu wahren und auch Ansätze anderer Disziplinen einzubeziehen.

Aufruf zu bewusster Forschung

Technologie ist nicht wertneutral; sie formt Möglichkeiten„, so das Statement von Ludovic Righetti im Abschluss seiner Vorlesung. Er ruft dazu auf, dass die nächste Generation ihre Forschung nicht im Vakuum betrachten sollte – Forscherinnen und Forscher müssen sich bewusst sein, wofür ihre Arbeit angewendet werden kann. Sein Appell an das Publikum lautet: Steht gemeinsam für eure Werte ein und schafft Ziele und Randbedingungen für Robotik und KI!

Über Ludovic Righetti

Professor Righetti verfügt über einen reichhaltigen akademischen Hintergrund, da er sein Ingenieurdiplom und seinen Doktortitel in Naturwissenschaften an der Ecole Polytechnique Fédérale de Lausanne erworben hat. Seine Forschungslaufbahn umfasst ein Postdoc-Stipendium an der University of Southern California und die Leitung der Movement Generation and Control Group am Max-Planck-Institut für Intelligente Systeme. Zu seinen Auszeichnungen gehören der Georges Giralt PhD Award 2010, der IEEE Robotics and Automation Society Early Career Award 2016 und der Heinz Maier-Leibnitz-Preis 2016. Weitere Informationen über Ludovic Righettis Forschung und Beiträge finden Sie auf seines Labors Machines in Motion.


Ein Überblick über kommende AI Lectures und Rückblick der bisherigen finden Sie auf der offiziellen Website.