
Evropští robotici dnes vydala výkonný model umělé inteligence s otevřeným zdrojovým kódem, který funguje jako mozek pro průmyslové roboty – pomáhá jim uchopit věci a manipulovat s nimi s novou obratností.
Nový model SPEAR-1 byl vyvinut výzkumníky z Institutu pro informatiku, umělou inteligenci a technologie (INSAIT) v Bulharsku. Může to pomoci dalším výzkumníkům a startupům budovat a experimentovat s chytřejším hardwarem pro továrny a sklady.
Stejně jako modely jazyků s otevřeným zdrojovým kódem umožnily výzkumníkům a společnostem experimentovat s generativní AI, Martin Vechev, počítačový vědec z INSIAT a ETH Zurich, říká, že SPEAR-1 by měl pomoci robotikům rychle experimentovat a opakovat. „Modely s otevřenou váhou jsou zásadní pro pokrok vtělené AI,“ řekl Vechev pro WIRED před vydáním.
SPEAR-1 se liší od stávajících modelů základů robotů tím, že do svého tréninkového mixu zahrnuje 3D data. To dává modelu lepší pochopení fyzického světa, což usnadňuje pochopení toho, jak se objekty pohybují fyzickým prostorem.
Modely základů robotů jsou obecně postaveny na modelech jazyka vidění (VLM), které mají široký, ale omezený přehled o fyzickém světě, protože trénink má tendenci pocházet z označených 2D obrázků. „Náš přístup řeší nesoulad mezi 3D prostorem, ve kterém robot působí, a znalostmi VLM, které tvoří jádro modelu robotické základny,“ říká Vechev.
SPEAR-1 je zhruba stejně schopný jako modely komerčních základů navržených pro provoz robotů, když se měří na RoboArena, benchmark, který testuje schopnost modelu přimět robota dělat věci, jako je zmáčknout láhev kečupu, zavřít zásuvku a sešívat kusy papíru dohromady.
Závod o to, aby roboty byly chytřejší, už má na kontě miliardy dolarů. Komerční potenciál obecně schopných robotů zplodil vedle fyzické inteligence dobře financované startupy včetně Skild a Generalist. SPEAR-1 je téměř stejně dobrý jako Pi-0.5 od Physical Intelligence, startupu za miliardu dolarů, který založil hvězdný tým výzkumníků v oblasti robotiky.
SPEAR-1 naznačuje, že snaha o vytvoření inteligentnějších robotů může zahrnovat jak uzavřené modely, jako jsou modely od OpenAI, Google a Anthropic, tak i varianty s otevřeným zdrojovým kódem jako Llama, DeepSeek a Qwen.
Robotická inteligence je však stále v plenkách. Model AI je možné vycvičit k ovládání robotického ramene, aby mohl spolehlivě vybírat určité předměty ze stolu. V praxi však bude nutné model přeškolit od nuly, pokud se použije jiný typ robotické paže nebo pokud dojde ke změně objektu nebo prostředí.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com