Google: Gemini Robotics-ER 1.6 bringt Instrumentenablesung und räumliches Verständnis
Google hat Gemini Robotics-ER 1.6 mit neuen Fähigkeiten zur Instrumentenablesung sowie verbessertem räumlichen und physikalischen Verständnis veröffentlicht. Die Vorgängerversion 1.5 wird am 30. April abgeschaltet.
Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.
Am 14. April hat Google über den Gemini API Changelog Gemini Robotics-ER 1.6 vorgestellt — eine neue Version des auf Robotik und physische Interaktion mit der Welt spezialisierten Modells.
Neue Fähigkeiten
Das Modell bringt drei wesentliche Verbesserungen:
- Instrumentenablesung — die Fähigkeit, physische Messgeräte, Waagen und Displays zu interpretieren
- Verbessertes räumliches Verständnis — bessere Wahrnehmung des dreidimensionalen Raums und der Beziehungen zwischen Objekten
- Fortgeschrittenes physikalisches Reasoning — genauere Vorhersagen physischer Interaktionen und Konsequenzen von Handlungen
Migrationsfrist
Die Vorgängerversion Gemini Robotics-ER 1.5 wird am 30. April 2026 um 9:00 Uhr PST abgeschaltet. Entwicklungsteams, die Version 1.5 nutzen, müssen innerhalb von zwei Wochen migrieren.
Das große Bild
Dieses Release setzt Googles Fokus auf „Physical AI” fort — ein Bereich, in dem generative Modelle über die digitale Welt hinaus in die physische Realität vordringen. In Kombination mit NVIDIAs RoboLab-Benchmark (letzte Woche veröffentlicht) baut die Branche zügig Infrastruktur für autonome Roboter auf, die physische Umgebungen verstehen und manipulieren können.
Verwandte Nachrichten
arXiv:2605.21006: Off-the-shelf-Persona-Vektoren erreichen 68-98 % der Wirksamkeit von gezieltem Sycophancy-Steering in LLM-Modellen
Black Forest Labs: FLUX Erase übertrifft GPT Image-2 (68,5 %) und Finegrain (63,2 %) bei der promptlosen Objektentfernung
arXiv:2605.19762: ICML-2026-Paper behauptet, Code verbessert nicht das Mathe-Reasoning von LLMs