baiosphere News

Munich AI Lecture: Alexei Efros betont die Bedeutung großer Datensätze

Gestern Abend fand im Plenarsaal der Bayerischen Akademie der Wissenschaften in München die Munich AI Lecture mit dem weltweit anerkannten Computer-Vision-Forscher Alexei Efros statt. Efros, Professor an der UC Berkeley und Mitglied des Berkeley Artificial Intelligence Research Lab (BAIR), ist bekannt für seine datengetriebenen Ansätze in Computer Vision und Computer Graphics.  

© Monika Wrba

In seinem Vortrag betonte Efros, dass die Schönheit der Ergebnisse in der KI-Forschung weniger auf komplexen Algorithmen, sondern vielmehr auf großen Datensätzen basiere. „We are (still!) not giving data enough credit,“ erklärte er und führte weiter aus, dass sein Labor kürzlich die Kraft sehr einfacher Algorithmen bei der Verwendung der richtigen Daten demonstriert habe, einschließlich visuellen In-Kontext-Lernens und visueller Datenzuordnung. Hierzu haben er und sein Team kürzlich ein Paper veröffentlicht.

Ein zentrales Thema seines Vortrags war die Diskrepanz zwischen der Verfügbarkeit von Daten in verschiedenen Bereichen der KI. Während Textdaten reichlich vorhanden sind, nimmt die Menge an verfügbaren Daten für Bilder, Videos und insbesondere Robotik stark ab. Efros betonte jedoch auch, dass der Bedarf an Daten relativ betrachtet werden müsse. Beispielsweise sei es seit den 1990er Jahren bekannt, dass in der Computer Vision jedes menschliche Gesicht als lineare Kombination von etwa 200 Trainingsgesichtern dargestellt werden könne. Dies sei besonders beeindruckend im Vergleich zur aktuellen Weltbevölkerung von etwa 8 Milliarden Menschen. 


Moravecsches Paradox

Efros’ Ansichten stehen im Einklang mit dem Moravecschen Paradox, das besagt, dass in der KI die schwierigen Dinge einfach und die einfachen Dinge schwierig sind. Er argumentierte, dass Computer in der Computer Vision so viel visuelle Erfahrung wie möglich sammeln sollten, während die Algorithmen selbst nicht so kompliziert seien.

Die Veranstaltung war zudem Teil des von KI-Ratsmitglied Prof. Björn Ommer organisierten ELLIS-Workshops „Open Problems in Computer Vision & Generative Modelling“, der sich mit den wichtigsten Herausforderungen und künftigen Forschungsrichtungen im Bereich der Computer Vision beschäftigt und noch bis zum 18. Juli in der BAdW stattfindet. Für alle, die gestern nicht live dabei sein konnten, gibt es eine Aufzeichnung der Lecture.


Über den Sprecher

Alexei (Alyosha) Efros ist Professor an der UC Berkeley und Mitglied des Berkeley Artificial Intelligence Research Lab (BAIR). Vor seiner Tätigkeit in Berkeley war er ein Jahrzehnt lang an der Carnegie Mellon University tätig und war zudem mit der École Normale Supérieure/INRIA und der University of Oxford verbunden. Seine Forschung liegt im Bereich der Computer Vision und Computer Graphics, insbesondere an der Schnittstelle beider Disziplinen. Er setzt auf datengetriebene Techniken, um Probleme zu lösen, bei denen große Mengen an nicht gekennzeichneten visuellen Daten zur Verfügung stehen. Efros wurde mit zahlreichen Preisen ausgezeichnet, darunter der ACM Prize in Computing (2016), drei PAMI Helmholtz Test-of-Time Prizes (1999, 2003, 2005) und der PAMI Thomas S. Huang Memorial Prize (2023).