Navzdory ohromujícímu pokroku AI v posledních letech zůstávají roboti tvrdohlavě hloupí a omezení. Ty, které se nacházejí v továrnách a skladech, obvykle procházejí přesnými choreografickými postupy bez větší schopnosti vnímat své okolí nebo se za běhu přizpůsobovat. Těch pár průmyslových robotů, kteří dokážou vidět a uchopit předměty, může dělat jen omezený počet věcí s minimální obratností kvůli nedostatku obecné fyzické inteligence.
Obecněji zdatní roboti by se snad po minimálních ukázkách mohli ujmout mnohem širšího spektra průmyslových úkolů. Roboti budou také potřebovat obecnější schopnosti, aby si poradili s obrovskou variabilitou a nepořádkem lidských domovů.
Všeobecné nadšení z pokroku umělé inteligence se již promítlo do optimismu ohledně velkých nových skoků v robotice. Automobilka Tesla od Elona Muska vyvíjí humanoidního robota s názvem Optimus a Musk nedávno navrhl, že by byl široce dostupný za 20 000 až 25 000 USD a schopný provádět většinu úkolů do roku 2040.
Předchozí snahy naučit roboty dělat náročné úkoly se zaměřovaly na trénování jednoho stroje na jeden úkol, protože učení se zdálo být nepřenosné. Některé nedávné akademické práce ukázaly, že s dostatečným rozsahem a jemným vyladěním lze učení přenášet mezi různými úkoly a roboty. Projekt Google z roku 2023 s názvem Open X-Embodiment zahrnoval sdílení robotického učení mezi 22 různými roboty ve 21 různých výzkumných laboratořích.
Klíčovým problémem strategie, kterou Fyzická inteligence sleduje, je to, že pro trénink není k dispozici stejný rozsah dat robotů jako pro velké jazykové modely ve formě textu. Společnost tedy musí generovat svá vlastní data a přijít s technikami, jak zlepšit učení z omezenějšího souboru dat. K vývoji π0 společnost zkombinovala takzvané modely jazyka vidění, které jsou trénovány na obrázcích i textu, s difúzním modelováním, což je technika vypůjčená z generování obrázků AI, aby umožnila obecnější druh učení.
Aby roboti byli schopni převzít jakoukoli robotickou práci, o kterou je člověk požádá, bude třeba takové učení výrazně rozšířit. „Je před námi ještě dlouhá cesta, ale máme něco, co si můžete představit jako lešení, které ilustruje věci budoucí,“ říká Levine.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com