
NVIDIA získala společnost Syntetic Data Gretel pro devět čísel, podle dvou lidí s přímým znalostí dohody.
Akviziční cena přesahuje poslední ocenění Gretel ve výši 320 milionů USD, zdroje tvrdí, že přesné podmínky nákupu zůstávají neznámé. Gretel a jeho tým přibližně 80 zaměstnanců budou složeni do NVIDIA, kde bude její technologie nasazena jako součást rostoucí sady cloudových, generativních AI služeb pro vývojáře.
Akvizice přichází, když Nvidia zavádí nástroje pro generování syntetických dat, aby vývojáři mohli trénovat své vlastní modely AI a doladit je pro konkrétní aplikace. Teoreticky by syntetická data mohla vytvořit téměř nekonečný dodávka školení AI a pomoci vyřešit problém nedostatku dat, který se nad odvětvím AI blíží od doby, kdy Chatgpt v roce 2022 šel mainstream-ačkoli odborníci tvrdí, že používání syntetických dat v generativní AI přichází s vlastními riziky.
Mluvčí NVIDIA se odmítl vyjádřit.
Gretel založil v roce 2019 Alex Watson, John Myers a Ali Golshan, kteří také slouží jako generální ředitel. Startup nabízí platformu syntetických dat a sadu API pro vývojáře, kteří chtějí stavět generativní modely AI, ale nemají přístup k dostatečnému školení nebo mají obavy o ochranu osobních údajů ohledně využití dat skutečných lidí. Gretel nestaví a licence na své vlastní modely Frontier AI, ale jemné tuny existující modely s otevřeným zdrojovým kódem, aby přidaly diferenciální soukromí a bezpečnostní prvky, a poté je balí dohromady, aby je prodali. Společnost získala více než 67 milionů dolarů na financování rizikového kapitálu před akvizicí, podle Pitchbook.
Mluvčí pro Gretel se také odmítl vyjádřit.
Na rozdíl od dat generovaných člověka nebo v reálném světě jsou syntetická data generována počítačem a navržena tak, aby napodobovala data v reálném světě. Zastánci tvrdí, že to činí generování dat potřebných k vytvoření modelů AI škálovatelnějších, méně náročných na práci a dostupnější pro menší nebo méně zdroje vývojářů AI. Ochrana osobních údajů je dalším klíčovým prodejním místem syntetických údajů, což z něj činí přitažlivou možnost pro poskytovatele zdravotní péče, banky a vládní agentury.
NVIDIA již pro vývojáře nabízí nástroje pro syntetické daty po celá léta. V roce 2022 spustil replikátor Omniverse, který dává vývojářům možnost generovat vlastní, fyzicky přesná syntetická 3D data pro školení neuronových sítí. Loni v červnu začala NVIDIA zavádět rodinu otevřených modelů AI, které generují údaje o syntetickém tréninku pro vývojáře, které mají používat při budování nebo jemném doladění LLM. Tyto mini modely, které se nazývají Nemotron-4 340b, mohou vývojáři použít k bubnování syntetických dat pro své vlastní LLMS napříč „zdravotní péčí, financí, výrobou, maloobchodním a každým dalším odvětvím“.
Během své hlavní prezentace na výroční vývojářské konferenci NVIDIA letos v úterý hovořil spoluzakladatel NVIDIA a generální ředitel Jensen Huang o výzvách, kterým průmysl čelí při rychle škálování AI nákladově efektivním způsobem.
„Zaměřujeme se na tři problémy,“ řekl. „Za prvé, jak vyřešíte problém s daty? Jak a kde a kde vytváříte data nezbytná pro trénink AI? Dva, jaká je modelová architektura? A pak tři, jaké jsou zákony o škálování?“ Huang pokračoval popisovat, jak společnost nyní používá generování syntetických dat ve svých robotických platformách.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com