Je to už něco přes týden, co Deepseek zvýšil svět AI. Zavedení jeho modelu s otevřenou hmotností-pravděpodobně vyškoleno na zlomku specializovaných výpočetních čipů, které vedoucí energetického průmyslu-odstartovali rázové vlny uvnitř OpenAI. Zaměstnanci nejen tvrdili, že uvidí náznaky, že Deepseek „nevhodně destiloval“ Openaiovy modely, aby si vytvořili své vlastní, ale úspěch startupu se Wall Street zpochybnil, zda společnosti jako OpenAI divoce přehnaly Compute.
„Deepseek R1 je moment AI Sputnik,“ napsal Marc Andreessen, jeden z nejvlivnějších a provokativních vynálezců Silicon Valley, na X.
V reakci na to se OpenAI připravuje na spuštění nového modelu dnes před svým původně plánovaným rozvrhem. Model O3-Mini bude debutovat v API i CHAT. Zdroje říkají, že má důvody O1 s rychlostí 4 úrovně. Jinými slovy, je to rychlé, levné, chytré a navržené tak, aby rozdrtilo hlubokého hledání.
Tento okamžik povzbudil zaměstnance OpenAI. Uvnitř společnosti je pocit, že – zejména v konverzaci dominuje Deepseek – musí být Openai efektivnější nebo riskovat, že za jeho nejnovější konkurent klesá.
Část problému pramení z Openia’s Origins jako neziskové výzkumné organizace, než se stane powerhouse hledající zisk. Probíhající boj mezi výzkumem a produktovými skupinami, jak tvrdí zaměstnanci, vyústil v rozvoj mezi týmy pracujícími na pokročilém zdůvodnění a těmi, kteří pracují na chatu. (Mluvčí OpenAI Niko Felix říká, že je to „nesprávné“ a poznamenává, že vůdci těchto týmů, hlavního produktového ředitele Kevina Weila a hlavního výzkumného ředitele Marka Chena, „Seznamte se každý týden a úzce spolupracují s tím, aby se přizpůsobili prioritám produktů a výzkumu.“)
Někteří uvnitř OpenAI chtějí, aby společnost vytvořila sjednocený chatovací produkt, jeden model, který dokáže zjistit, zda otázka vyžaduje pokročilé zdůvodnění. Zatím se to nestalo. Místo toho rozbalovací nabídka v ChatGPT vyzývá uživatele, aby se rozhodli, zda chtějí používat GPT-4O („Skvělé pro většinu otázek“) nebo O1 („Používá pokročilé uvažování“).
Někteří zaměstnanci tvrdí, že zatímco Chat přináší lví podíl na příjmech OpenAI, O1 získá větší pozornost – a výpočetní zdroje – z vedení. „Vedení se nestará o chat,“ říká bývalý zaměstnanec, který pracoval (uhodli jste) chat. „Každý chce pracovat na O1, protože je to sexy, ale základna kódu nebyla postavena pro experimentování, takže neexistuje žádná hybnost.“ Bývalý zaměstnanec požádal, aby zůstal anonymní a smanil dohodu o dojetí.
OpenAI strávil roky experimentováním s posilovacím učením, aby doladil model, který se nakonec stal systémem pokročilého uvažování zvaný O1. (Posilovací učení je proces, který školí modely AI se systémem sankcí a odměn.) Deepseek postavil z posílení práce na učení, který OpenAI byl průkopníkem, aby vytvořil svůj pokročilý systém uvažování, nazvaný R1. „Měli prospěch z vědění, že učení posílení, aplikované na jazykové modely, funguje,“ říká bývalý výzkumný pracovník OpenAI, který není oprávněn veřejně mluvit o společnosti.
„Posílení učení.“ [DeepSeek] Je to podobné tomu, co jsme udělali na OpenAI, “říká další bývalý výzkumný pracovník OpenAI,„ ale udělali to s lepšími daty a čistším zásobníkem. “
Zaměstnanci OpenAI říkají, že výzkum, který šel do O1, byl proveden v kódové základně nazvané „Berry“ Stack, postavený pro rychlost. „Byly tam kompromisy-experimentální přísnost pro propustnost,“ říká bývalý zaměstnanec s přímou znalostí situace.
Tyto kompromisy dávaly smysl pro O1, který byl v podstatě obrovským experimentem, bez ohledu na omezení základny kódu. Pro chat neměli tolik smysl, produkt používaný miliony uživatelů, kteří byli postaveni na jiném a spolehlivějším zásobníku. Když se O1 spustil a stal se produktem, začaly se objevovat trhliny ve vnitřních procesech OpenAI. „Bylo to jako: „Došlo k hlavnímu zpětnému odkusu.“
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com