
Rozdíl mezi konvenčním modelem a uvažováním je podobný dvěma typům myšlení popsaných ekonomem Nobelovy ceny Michael Kahneman v knize 2011 Rychle a pomalé myšlení: rychlé a instinktivní myšlení systému-1; a pomalejší úmyslnější myšlení systému-2.
Druh modelu, který umožnil Chatgpt, známý jako LLM, vytváří okamžité reakce na výzvu dotazováním na velkou neuronovou síť. Tyto výstupy mohou být nápadně chytré a soudržné, ale mohou selhat při odpovědi na otázky, které vyžadují odůvodnění krok za krokem, včetně jednoduché aritmetiky.
LLM může být nucen napodobovat deliberativní uvažování, pokud je pokyn přijít s plánem, který pak musí následovat. Tento trik však není vždy spolehlivý a modely se obvykle snaží řešit problémy, které vyžadují rozsáhlé pečlivé plánování. OpenAI, Google a nyní antropic používají metodu strojového učení známou jako učení zesílení, aby se jejich nejnovější modely naučily generovat zdůvodnění, které ukazuje na správné odpovědi. To vyžaduje shromažďování dalších údajů o školení od lidí při řešení konkrétních problémů.
Penn říká, že Claudeův režim uvažování obdržel další údaje o obchodních aplikacích, včetně psaní a fixování kódu, používání počítačů a zodpovězení složitých právních otázek. „Věci, na kterých jsme provedli vylepšení, jsou.“ […] Technické předměty nebo předměty, které vyžadují dlouhé odůvodnění, “říká Penn. „To, co máme od našich zákazníků, je velký zájem o nasazení našich modelů do jejich skutečného pracovního vytížení.“
Antropic říká, že Claude 3.7 je obzvláště dobrý v řešení problémů s kódováním, které vyžadují odůvodnění krok za krokem, a na některých benchmarcích, jako je SWE-Bench, překonává OpenAI O1. Společnost dnes vydává nový nástroj nazvaný Claude Code, speciálně navržený pro tento druh kódování pomocí AI-asistovaného.
„Model je již dobrý v kódování,“ říká Penn. „[But] Další myšlení by bylo dobré pro případy, které by mohly vyžadovat velmi složité plánování – řekněte se na extrémně velkou kódovou základnu pro společnost. “
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com