Onlai's O3-Mini je štíhlejší model AI, který udržuje tempo s hlubokým hledáním

Openai zpřístupňuje menší a efektivnější verzi svého nejchytřejšího modelu umělé inteligence zdarma, protože se snaží odpovědět na humbuk a nadšení vířící kolem nové open source nabídky od čínského startupu AI Deepseek.

Společnost Wired dříve uvedla, že OpenAI připravoval nový model s názvem O3-Mini k vydání 31. ledna. Vědci společnosti pracují přesčas, aby se připravili na hlavní čas, podle zdrojů, které hovořily o stavu anonymity.

O3-Mini, který OpenAI škádlil v prosinci, je menší verzí modelu, který obsahuje nejpokročilejší schopnosti AI uvažování jakékoli nabídky OpenAI k dnešnímu dni. Model může narušit obtížné problémy do složek, aby zjistil, jak nejlépe je vyřešit.

„Tento výkonný a rychlý model zvyšuje hranice toho, čeho mohou malé modely dosáhnout,“ uvedla společnost v blogovém příspěvku, který oznámil dostupnost O3-Mini.

OpenAI zpřístupňuje O3-Mini všem Plus, týmu a profesionálům Chatgpt. Uživatelé bezplatné verze ChatGPT budou také schopni vyzkoušet O3-Mini, ale nebudou moci odesílat tolik dotazů, říká společnost.

OpenAI zjevně používá studenty PhD, aby pomohli trénovat nový model nějakou dobu. Před několika týdny začala společnost přijímat studenty počítačové vědy PhD za 100 USD za hodinu za „výzkumnou spolupráci“, která by „zahrnovala práci na nevydaných modelech“, podle e -mailu, který sledoval Wired.

Zdá se, že OpenAI také přijímá studenty PhD s odbornými znalostmi v jiných oblastech prostřednictvím společnosti s názvem Mercor, kterou pravidelně používá k nalezení zaměstnanců pro modelové školení. Nedávné zveřejňování pracovních míst od Mercor na LinkedIn uvádí: „Celkovým cílem tohoto projektu, kterého se můžete stát součástí, je vytvořit náročné vědecké kódovací otázky, jejichž cílem je otestovat schopnosti velkých jazykových modelů při generování kódu pro řešení realistických vědeckých výzkumných problémů. “

Zveřejnění práce dále uvádí příklad problému, který je nápadně podobný problému v benchmarku s názvem Scicode, který je navržen tak, aby otestoval schopnost velkého jazyka řešit složité vědecké problémy.

Zpráva přichází, když Deepseekův R1 pokračuje v americkém technologickém průmyslu. Skutečnost, že takový výkonný model by mohl být uvolněn zdarma, vyvíjí tlak na Google a antropický, aby snížil své ceny.

Podle zdrojů uvnitř společnosti je OpenAI obzvláště dychtivá prokázat, že zůstává v popředí vývoje a komercializace AI.

Model Deepseek volně dostupný model zahrnuje inovace, díky nimž je efektivnější pro vlak i podávání. Zdá se, že společnost ji vyvinula s použitím mnohem méně zdrojů než OpenAI a jiné americké společnosti, které v současné době vytvářejí modely Frontier AI, ačkoli přesné podrobnosti výdajů Deepseeka zůstávají neznámé. OpenAI říká, že věří, že R1 mohl začlenit výstup ze svých modelů do svého tréninku.

Máte tip?

Jste současný nebo bývalý zaměstnanec na OpenAI? Rádi bychom od vás slyšeli. Pomocí nepracovního telefonu nebo počítače bude kontaktovat rytíř na wilt_knight@wired.com nebo na signál prostřednictvím svého uživatelského jména wak01.

Nejnovější model OpenAI nemusí zastínit R1 z hlediska ceny, ale ukazuje, že společnost bude efektivitou součástí svého zaměření vpřed. OpenAI také říká, že model je obzvláště silný v matematice, vědě a kódování.

Společnost říká, že nejnovější model bude také zahrnovat nové funkce, včetně schopnosti využívat vyhledávání na webu, volání funkcí z kódu uživatele a přepínat mezi různými úrovněmi uvažování, které komplikují rychlost pro řešení problémů.

Náhlý vzestup Deepseeka také vyvolal otázky týkající se strategie vlády USA, která omezila nárůst AI Číny. Poslední dvě americké správy zavedly řadu sankcí, které omezují schopnost Číny přístup k nejpokročilejším čipům NVIDIA, které se obvykle používají k vytváření špičkových modelů AI. Deepseek ve svém výzkumu popsal několik typů čipů NVIDIA, ale zůstává nejasné, co přesně bylo použito.

Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com