Reinforcement Learning

Googles Roboter reduziert Restmüll deutlich

Robert Klatt

Google Roboter trennt Büromüll )gozreH rednaxelA - ebuTuoY tohsneercS(Foto: © 
Auf den Punkt gebracht
  • Google hat einen Müll trennende Roboter entwickelt, der Wertstoffe und Kompost aus Büromüll entfernen können
  • Die mit dem Reinforcement Learning (RL) trainierten Roboter sortieren den Müll nahezu immer korrekt ein

Google hat Müll trennende Roboter entwickelt, die Wertstoffe und Kompost aus  Büroabfall entfernen können. Der Restmüll konnte dadurch signifikant reduziert werden.

Mountain View (U.S.A.). Ein Team von Google arbeitet laut der Forschungsarbeit Deep RL at Scale: Sorting Waste in Office Buildings with a Fleet of Mobile Manipulators (PDF) seit etwa zwei Jahren an Müll trennenden Robotern. Die 23 Roboter wurden mit der Technik des Reinforcement Learning (RL), also dem verstärkten Lernen, trainiert. Als Trainingsdaten nutzten die Wissenschaftler sowohl reale Daten als auch eine Simulation.

Die Aufgabe für die Roboter bestand darin, innerhalb eines Bürokomplexes zu patrouillieren und Abfalltrennstationen, welche Behälter für Wertstoffe, Kompost und Restabfälle beinhalten, zu inspizieren. Ihre Zielsetzung war es, wiederverwertbare Objekte wie Getränkedosen und Flaschen in den Wertstoffbehälter, kompostierbare Abfälle in den Bioabfallbehälter und sämtliche übrige Materialien in den Restmüllbehälter einzuordnen.

Müll aus unterschiedlichsten Gegenständen

Die Hauptproblem bestand darin, die Roboter dahin gehend zu trainieren, dass sie eine Vielzahl unterschiedlicher Objekte identifizieren und adäquat in die jeweiligen Abfallbehälter einordnen können. Um dies zu erreichen, entwickelten die Ingenieure bei Google ein vierphasiges System zur Optimierung der Fähigkeiten der Roboter bezüglich der korrekten Mülltrennung. In der ersten Phase wurden grundlegende Richtlinien für die Abfalltrennung erstellt, um den Robotern einen ersten Erfahrungsschatz zu vermitteln.

Diese Basis erwies sich jedoch als unzureichend. Daher wurde in der zweiten Phase das System mittels einer Simulation trainiert. Im Anschluss daran durchliefen die Roboter in der dritten Phase ein Lernverfahren mittels Reinforcement Learning an einer Müllstation mit repräsentativen Abfallgegenständen, um das korrekte Sortieren zu erlernen. In der vierten und letzten Phase wurden die Roboter an echten Abfallstationen eingesetzt, um die erworbenen Fähigkeiten zur Mülltrennung zu festigen.

Müll fast immer korrekt einsortiert

Im Laufe des Trainingsprozesses absolvierte das System insgesamt 540.000 Versuche an den Lern-Müllstationen sowie 32.500 Versuche an realen Abfallstationen. Die Gesamtleistung des Systems verbesserte sich kontinuierlich im Zuge der zunehmenden Datenmenge. Die Leistungsfähigkeit des trainierten Systems wurde von den Ingenieuren an einer Müllstation unter kontrollierten Bedingungen evaluiert, wobei es 84 Prozent der Objekte korrekt sortierte.

Des Weiteren erhoben die Ingenieure von Google statistische Daten aus drei Roboter-Einsätzen im Zeitraum von 2021 bis 2022. Die Analyse der Ergebnisse zeigte, dass das Gewicht des Restmülls um etwa 40 bis 50 Prozent reduziert werden konnte. Die durchgeführten Experimente veranschaulichten, dass eine gestufte Reinforcement Learning-Strategie Erfolg versprechend sein kann. Gleichwohl sind die Möglichkeiten hierbei noch nicht vollständig ausgeschöpft. Zukünftig möchten die Google-Ingenieure etwa weitere Informationsquellen wie das Lernen aus Internetvideos in den Trainingsprozess integrieren.

Spannend & Interessant
VGWortpixel