Doch während das Schütten uns Menschen leicht von der Hand geht, ist es für Roboter sehr komplex. Michael Beetz, Professor für Künstliche Intelligenz am Fachbereich für Mathematik und Informatik und Leiter des Instituts für Künstliche Intelligenz (IAI), arbeitet daran, es ihnen beizubringen.
Dass Michael Beetz sich so sehr für das Schütten interessiert, hat nicht nur mit dessen Alltagsrelevanz zu tun. „Das Schütten ist auch ein herausfordernder Forschungsgegenstand, weil es sich um eine unterdeterminierte Aufgabe handelt“, erläutert er. Das bedeutet, dass eine Aufforderung wie „Schütte Cola in ein Glas“ viel Spielraum für Interpretationen lässt und wichtige Informationen nicht enthält. Was für ein Glas sollte der Roboter wählen, wie zähflüssig ist Cola und wie sollte man beim Schütten vorgehen, wenn eine Flüssigkeit schäumt? Auf all diese Fragen muss der Roboter die Antworten kennen, wenn er keine Fehler machen soll. Angesichts der vielen Varianten des Schüttens steht Michael Beetz also vor einer großen Aufgabe. „Mein Ziel ist, dass der Roboter jede beliebige Flüssigkeit aus jedem beliebigen Gefäß schütten kann, in jedem beliebigen Kontext“, sagt er.
2,5 Millionen Euro für die Grundlagenforschung
Die Arbeit von Michael Beetz bewegt sich auf dem Gebiet der Grundlagenforschung. Unterstützung hierfür erhält er seit März 2023 vom Europäischen Forschungsrat (European Research Council, ERC). Dieser fördert die Forschung von Michael Beetz mit einem Advanced Grant: 2,5 Millionen Euro stehen dem Informatiker und seinem Team in einem Zeitraum von fünf Jahren zur Verfügung. An der Forschung beteiligt sind Wissenschaftler:innen der Universität Bremen sowie von den Universitäten Bielefeld und Paderborn.
An bisherige Ansätze und Forschungserfolge auf dem Gebiet der Künstlichen Intelligenz können Michael Beetz und sein Team nur teilweise anknüpfen. „Systeme wie ChatGPT erbringen erstaunliche Leistungen, aber ihnen fehlt ein grundlegendes Verständnis von dem, was sie tun“, sagt Michael Beetz. Alltagsroboter sollten Handlungen aber auf Anhieb richtig umsetzen, denn Fehler könnten gefährlich werden – etwa wenn ein Roboter heißes Wasser verschüttet. Michael Beetz arbeitet daher an Robotern, die verschiedene Handlungsoptionen durchspielen, ehe sie zur Tat schreiten, und die verstehen, wie und warum sie etwas tun.
„Es ist entscheidend, dass Roboter den Kontext von Handlungen verstehen“
Um diesen Idealzustand zu erreichen, möchte Michael Beetz mit der ERC-Förderung das System „FAME“ (Future-oriented cognitive Action Modelling Engine) entwickeln. Dabei handelt es sich um eine Software, die dem Roboter ermöglichen soll, Videos, schriftliche Anweisungen und Handlungen von Menschen zu interpretieren und auf der Grundlage von diesen Informationen eigene Handlungen zu planen und umzusetzen. Wenn ein Roboter dann beispielsweise einen Menschen beobachtet, der Cola in ein Glas gießt, erstellt er einen virtuellen Agenten, der der Person ähnelt – quasi einen digitalen Zwilling. Er reproduziert und interpretiert die Handlung mit dem digitalen Agenten, überträgt sie dann auf sich selbst und speichert den Ablauf für zukünftige Aufgaben.
Um FAME umzusetzen, arbeiten die Forschenden im Team von Michael Beetz an unterschiedlichen Teilaufgaben, beispielsweise der Kontextualisierung von Informationen. „Es ist entscheidend, dass Roboter den Kontext von Handlungen verstehen und fehlende Informationen automatisch ergänzen können“, sagt Michael Beetz. „Stellen Sie sich vor, ein Roboter beobachtet einen Menschen dabei, wie dieser einen Topf mit Nudelwasser abgießt. Vielleicht kann der Roboter aus seiner Perspektive manche Bewegungen nur erahnen oder nicht erkennen, wie viel Wasser im Topf ist.“ Hier reichen die Informationen, die der Roboter über seine Sensoren erhält, nicht aus, um die Situation zu erfassen und für eigene Handlungen zu verarbeiten. Daher soll der Roboter verschiedene Szenarien entwickeln und ermitteln, welches von ihnen am wahrscheinlichsten ist.
Doch Roboter müssen nicht nur Handlungen, sondern auch Anweisungen von Menschen in einen Kontext stellen können – wie bei der eingangs erwähnten Aufforderung, Cola in ein Glas zu gießen. Damit das möglich wird, arbeiten die Forschenden im Team von Michael Beetz an einem weiteren großen Themenkomplex: der mentalen Simulation. Dass der Roboter ein virtuelles Modell einer real beobachteten Situation erstellt, ist dabei nur der erste Schritt. Wichtig ist vor allem, dass der Roboter lernt, die verschiedenen Einzelhandlungen in eine Beziehung zueinander zu setzen. „Er muss kausale Beziehungen herstellen können, etwa zwischen dem Neigen der Flasche und dem Auslaufen der Flüssigkeit“, erklärt Michael Beetz. „Nur wenn er die Handlung auf diese Weise interpretiert, kann er die Informationen nutzen, um später eigene Aktionen zu planen.“
Mit interdisziplinärer Kooperation zum Ziel
Wie Roboter Wissen verarbeiten, ihre Umgebung und ihr Handeln wahrnehmen, untersuchen insbesondere die Forschenden des Bremer Teams. Für die Entwicklung von FAME ist es aber auch entscheidend, die Interaktion zwischen Robotern und Menschen besser zu verstehen. In diesem Gebiet erhält FAME Unterstützung im Rahmen des neu gegründeten “Joint Research Center on Cooperative and Cognition-enabled AI” (CoAI JRC) der Universitäten Bremen, Bielefeld und Paderborn. Zusätzlich forscht Michael Beetz zusammen mit Professor Philipp Cimiano von der Universität Bielefeld an der Fragestellung, wie im Internet vorhandene Anleitungen in für Roboter nutzbare Wissensbasen umgewandelt werden können.
Die Arbeit an FAME lässt die Forschenden nicht zuletzt erkennen, wie erfolgreich das menschliche Gehirn Informationen verarbeitet und Handlungen plant. „Wenn man das bei Robotern reproduzieren will, merkt man erst, was für großartige Leistungen das Gehirn in so variantenreichen und unsicheren physischen und sozialen Situationen vollbringt“, sagt Michael Beetz.