Erste emerging capabilities in Robotern?
Wenn das stimmt, was im Video behauptet wird und die Bilder autonomes Verhalten in Echtzeit zeigen, dann ist das neu Modell Gen-1 eine echte Revolution in der Robotik.
Ein Startup aus den USA zeigt, dass physische KI den gleichen Skalierungsregeln folgt wie LLMs. Nach guten Versuchen mit kleineren Modellen und weniger Daten haben sie das "Weltmodell" auf geschäfzt 1B Parameter skaliert und mit 500.000h qualitativ hochwertigen Videos trainiert.
Die Mitarbeiter kommen von Google DeepMind, OpenAI, Boston Dynamics und anderen namhaften Firmen. Man kann also davon ausgehen, dass sie wissen was sie tun. Was mich beeindruckt sind die Kennzahlen an denen sie ihren Fortschritt messen:
- Geschwindigkeit
- Zuverlässigkeit
- Improvisation
Gerade letzteres ist in anderen KI Modellen häufig fehlend oder höchstens rudimentär ausgeprägt. Die gezeigten Aufgaben sind durchaus anspruchsvoll, z.B. das Demontieren eines Staubsaugerroboters. Das obligatorische Wäsche zusammenlegen darf natürlich auch nicht fehlen und sieht im Video deutlich flüssiger aus als ich es bisher gesehen habe.
Aus meiner Sicht ist das nur ein kleiner Vorgeschmack auf das, was wir in den nächsten Monaten und Jahren im Bereich Robotik erleben werden. Viele lachen immer noch über die putzigen Tanzvorführungen oder KungFu Shows und glauben eine praktische Nutzbarkeit wäre noch Jahrzehnte entfernt. Ich glaube eher, dass wir ähnlich rasante Entwicklungen sehen werden wie bei LLMs in den letzten 3-4 Jahren. Der ChatGPT-Moment der Robotik liegt schon hinter uns.
Erinnert mich an Gemini Robotics ER 1.5 von Deepmind Lab. https://youtu.be/UALxgn1MnZo?si=KtjgQT_V_3xuQNae
Gibt es für Robotik auch gute Open-Weight- oder Open-Source-Modelle? Apr 6 2 likes