Ein neues Sprachmodell von Google DeepMind namens Gemini Robotics On-Device ermöglicht es Robotern, Aufgaben ohne Internetverbindung auszuführen.
Basierend auf dem Vorgängermodell Gemini Robotics, das im März vorgestellt wurde, hebt der Artikel die Fähigkeit von Gemini Robotics On-Device hervor, Roboterbewegungen zu steuern.
Entwickler können das Modell mit Aufforderungen in natürlicher Sprache für verschiedene Bedürfnisse anpassen. Google behauptet, dass die Leistung des Modells mit der Cloud-Version von Gemini Robotics vergleichbar ist. Obwohl keine spezifischen Konkurrenzmodelle genannt werden, übertrifft das **Gemini Robotics On-Device** andere Geräte in gängigen Benchmarks.
In einem Demonstrationsvideo zeigte Google **Roboter, die Aufgaben wie das Auspacken und Falten von Kleidung ausführen. Obwohl das Modell für ALOHA-Roboter entwickelt wurde, ist es für den zweibeinigen Roboter Franka FR3 von Apptronik und den humanoiden Roboter Apollo angepasst.
Google merkt an, dass der Roboter Franka FR3 erfolgreich Szenarien durchführt, die er bisher nicht kannte, wie etwa die Montage an einem Industrieband. Google DeepMind stellt auch das innovative Gemini Robotics SDK vor.
Das Unternehmen betont die Möglichkeit, Roboter für neue Aufgaben auf dem physischen Simulator MuJoCo zu trainieren, indem 50 bis 100 Aufgaben demonstriert werden. Andere Marktteilnehmer wie Nvidia und Hugging Face engagieren sich ebenfalls im Robotiksegment, indem sie Plattformen und offene Modelle schaffen.