
OpenAI právě upustil své první modely s otevřenou hmotností za více než pět let. Dva jazykové modely, GPT-OSS-120B a GPT-OSS-20B, mohou běžet lokálně na spotřebitelských zařízeních a být doladěni pro konkrétní účely. Pro OpenAI představují posun daleko od své nedávné strategie zaměření na proprietární vydání, protože společnost se pohybuje směrem k širší a otevřenější skupině modelů AI, které jsou pro uživatele dostupné.
„Jsme nadšeni, že tento model zpřístupňujeme, výsledek miliard dolarů výzkumu, k dispozici světu, aby se AI dostala do rukou nejvíce možných lidí,“ uvedl generální ředitel OpenAI Sam Altman v e -mailovém prohlášení. Jak GPT-OSS-120B, tak GPT-OSS-20B jsou oficiálně k dispozici ke stažení zdarma na objím obličeji, populární hostitelské platformy pro nástroje AI. Posledním modelem s otevřenou hmotností vydaným OpenAI byl GPT-2, v roce 2019.
To, co odlišuje model s otevřenou hmotností, je skutečnost, že jeho „váhy“ jsou veřejně dostupné, což znamená, že kdokoli může nahlédnout do vnitřních parametrů, aby získal představu o tom, jak zpracovává informace. Spíše než podbíjení proprietárních modelů OpenAI s bezplatnou možností, spoluzakladatel Greg Brockman považuje toto vydání za „doplňkové“ placeným službám společnosti, jako je rozhraní pro programování aplikací, které v současné době používá mnoho vývojářů. „Modely s otevřenou hmotností mají velmi odlišnou sadu silných stránek,“ řekl Brockman v briefingu s reportéry. Na rozdíl od ChatGPT můžete spustit model GPT-OSS bez připojení k internetu a za firewallem.
Oba modely GPT-OSS používají přístupy řetězce promyšlených důvodů, které OpenAI poprvé nasadily ve svém modelu O1 loni na podzim. Spíše než jen dávat výstup má tento přístup generativní nástroje AI prochází několika kroky k zodpovězení výzvy. Tyto nové textové modely nejsou multimodální, ale mohou procházet web, volat cloudové modely, aby pomohly s úkoly, provádějí kód a navigaci softwaru jako agent AI. Menší ze dvou modelů, GPT-Oss-20b, je dostatečně kompaktní, aby běžel lokálně na spotřebním zařízení s více než 16 GB paměti.
Dva nové modely z OpenAI jsou k dispozici na základě licence Apache 2.0, což je oblíbená volba pro modely s otevřenou hmotností. U Apache 2.0 lze modely použít pro komerční účely, redistribuovány a zahrnuty jako součást jiného licencovaného softwaru. Vydání modelu s otevřenou hmotností z Alibaba’s QWEN i Mistral také působí pod Apache 2.0.
Veřejně oznámené v březnu bylo vydání těchto otevřených modelů zpočátku zpožděno pro další testování bezpečnosti. Vydání modelu s otevřenou hmotností je potenciálně nebezpečnější než uzavřená verze, protože odstraňuje bariéry kolem, kdo může tento nástroj použít, a kdokoli se může pokusit vyladit verzi GPT-OSS pro nezamýšlené účely.
Kromě hodnocení OpenAI obvykle běží na svých proprietárních modelech, startup přizpůsobil možnost otevřené hmotnosti, aby viděl, jak by jej mohl potenciálně zneužit „špatný herec“, který tento nástroj stáhne. „Vlastně jsme tento model vyladili interně v některých z těchto rizikových oblastí,“ řekl Eric Wallace, výzkumný pracovník v oblasti bezpečnosti v OpenAI, „a měřili jsme, jak vysoko bychom je mohli tlačit.“ V testech OpenAI se model s otevřenou hmotností nedosáhl vysoké úrovně rizika, měřeno jeho rámcem připravenosti.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com