Nvidia vyrobila jmění dodávající čipy společnostem pracujícím na umělé inteligenci, ale dnes výrobce čipů udělal krok k tomu, aby se sám stal vážnějším výrobcem modelů tím, že uvolnil řadu špičkových otevřených modelů spolu s daty a nástroji, které pomohou inženýrům je používat.
Tento krok, který přichází ve chvíli, kdy společnosti s umělou inteligencí jako OpenAI, Google a Anthropic vyvíjejí stále schopnější vlastní čipy, by mohl být pojistkou proti těmto firmám, které se postupem času odkloní od technologie Nvidia.
Otevřené modely jsou již klíčovou součástí ekosystému umělé inteligence a mnoho výzkumníků a startupů je používá k experimentům, prototypování a sestavování. OpenAI a Google sice nabízejí malé otevřené modely, ale neaktualizují je tak často jako jejich rivalové v Číně. Z tohoto a dalších důvodů jsou v současnosti mnohem populárnější otevřené modely od čínských společností, podle údajů Hugging Face, hostingové platformy pro open source projekty.
Nové modely Nemotron 3 od Nvidie patří k tomu nejlepšímu, co lze stáhnout, upravit a spustit na vlastním hardwaru, podle srovnávacích hodnocení sdílených společností před vydáním.
„Otevřená inovace je základem pokroku v oblasti umělé inteligence,“ uvedl generální ředitel Jensen Huang v prohlášení před zprávou. „S Nemotronem přetváříme pokročilou umělou inteligenci na otevřenou platformu, která vývojářům poskytuje transparentnost a efektivitu, kterou potřebují k vytváření agentních systémů ve velkém měřítku.“
Nvidia zaujímá zcela transparentnější přístup než mnoho jejích amerických rivalů tím, že uvolňuje data používaná k výcviku Nemotronu – skutečnost, která by měla inženýrům pomoci snáze modifikovat modely. Společnost také vydává nástroje, které pomáhají s přizpůsobením a doladěním. To zahrnuje novou hybridní latentní modelovou architekturu expertů, která je podle Nvidie obzvláště dobrá pro vytváření agentů AI, kteří mohou provádět akce na počítačích nebo na webu. Společnost také spouští knihovny, které uživatelům umožňují trénovat agenty, aby dělali věci pomocí posilovacího učení, které zahrnuje poskytování simulovaných modelů odměn a trestů.
Modely Nemotron 3 se dodávají ve třech velikostech: Nano, která má 30 miliard parametrů; Super, který má 100 miliard; a Ultra, která má 500 miliard. Parametry modelu volně korespondují s tím, jak je schopný a jak nepraktický je při běhu. Největší modely jsou tak těžkopádné, že musí běžet na stojanech s drahým hardwarem.
Modelové základy
Kari Ann Briski, viceprezidentka generativního softwaru AI pro podniky ve společnosti Nvidia, uvedla, že otevřené modely jsou pro tvůrce AI důležité ze tří důvodů: Tvůrci stále více potřebují přizpůsobovat modely pro konkrétní úkoly; často pomáhá předat dotazy různým modelům; a je snazší vymáčknout z těchto modelů po tréninku inteligentnější reakce tím, že je necháte provádět jakési simulované uvažování. „Věříme, že open source je základem inovací AI, které pokračují ve zrychlování globální ekonomiky,“ řekl Briski.
Gigant sociálních médií Meta vydal první pokročilé otevřené modely pod názvem Llama v únoru 2023. Jak však konkurence zesílila, Meta signalizovala, že jeho budoucí verze nemusí být open source.
Tento krok je součástí většího trendu v odvětví AI. Během posledního roku americké firmy ustoupily od otevřenosti, staly se tajnějšími ohledně svého výzkumu a zdráhaly se upozorňovat své konkurenty na jejich nejnovější technické triky.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com
