Noua inteligență artificială de la Anthropic se gândește cât vrei tu. Cum a ajuns să rumege răspunsurile
Anthropic a lansat un nou model de inteligență artificială, Claude 3.7 Sonnet, care introduce un concept inedit: utilizatorii pot decide cât timp AI-ul „gândește” înainte de a oferi un răspuns. Acesta este primul model de raționament hibrid din industrie, capabil să ofere atât răspunsuri rapide, cât și răspunsuri mai elaborate, care necesită un timp de procesare extins.
Această inovație vine într-un moment în care metodele tradiționale de îmbunătățire a performanței AI încep să își atingă limitele. Prin integrarea unui sistem care imită procesele de deducție, Claude 3.7 Sonnet promite răspunsuri mai precise și o interacțiune mai fluidă cu utilizatorii.
Un AI care nu se grăbește, dar știe când să accelereze
Claude 3.7 Sonnet se distinge de alte modele prin faptul că permite utilizatorilor să controleze timpul de gândire. Dacă vrei un răspuns rapid, AI-ul poate livra unul în timp real. Dacă însă ai nevoie de un răspuns mai bine argumentat, poți activa modul de raționament extins, permițând AI-ului să analizeze mai profund problema.
Aceasta este o schimbare majoră față de abordarea clasică a AI-urilor conversaționale, unde utilizatorii sunt obligați să aleagă între modele rapide și modele mai avansate, dar lente. Anthropic vrea să elimine această alegere și să ofere o singură soluție adaptabilă pentru orice tip de întrebare.
Mai mult, compania susține că, în viitor, Claude va putea decide singur cât timp să aloce fiecărei întrebări, exact cum fac oamenii în viața reală.
Performanță superioară și mai puține refuzuri
Anthropic susține că noul model nu doar că este mai flexibil, dar și mai performant. Pe testul SWE-Bench, utilizat pentru a măsura performanțele AI-ului în rezolvarea problemelor de programare, Claude 3.7 Sonnet a obținut o precizie de 62,3%, depășind OpenAI o3-mini, care a avut un scor de 49,3%.
De asemenea, pe testul TAU-Bench, folosit pentru a măsura capacitatea AI-urilor de a interacționa cu utilizatorii și sistemele externe în contexte comerciale, Claude 3.7 Sonnet a atins 81,2%, față de 73,5% pentru OpenAI o1.
Un alt aspect îmbunătățit este capacitatea modelului de a gestiona cererile utilizatorilor fără a refuza nejustificat răspunsuri. Potrivit Anthropic, Claude 3.7 Sonnet respinge solicitările cu 45% mai puțin decât modelul anterior, Claude 3.5 Sonnet.
Acest lucru este important într-un context în care multe laboratoare de AI încep să-și reconsidere strategiile privind restricțiile impuse chatbot-urilor. Un AI care refuză prea multe răspunsuri poate deveni frustrant pentru utilizatori, în timp ce unul care oferă răspunsuri necontrolate poate fi periculos. Anthropic încearcă să găsească un echilibru între cele două extreme.
Un AI transparent: vezi cum „gândește”
O altă noutate a lui Claude 3.7 Sonnet este „scratch pad-ul vizibil”, o funcție care permite utilizatorilor să vadă procesul de raționament al AI-ului. Practic, în timp ce modelul „se gândește” la un răspuns, își notează pașii logici pe care îi urmează.
Această abordare ar putea crește transparența AI-urilor, un subiect sensibil în industrie. Cu toate acestea, Anthropic precizează că anumite părți ale acestui proces ar putea fi ascunse din motive de siguranță și încredere.
Cât costă Claude 3.7 Sonnet?
În ceea ce privește prețul, Claude 3.7 Sonnet este mai scump decât modelele concurente:
• 3 dolari per milion de tokeni de input (aproximativ 750.000 de cuvinte)
• 15 dolari per milion de tokeni de output
Comparativ, OpenAI o3-mini costă 1,10 dolari per milion de tokeni de input și 4,40 dolari per milion de tokeni de output, iar DeepSeek R1 are un tarif și mai mic, de 0,55 dolari pentru input și 2,19 dolari pentru output.
Totuși, trebuie menționat că aceste modele sunt strict AI-uri de raționament, pe când Claude 3.7 Sonnet este hibrid, având atât mod rapid, cât și mod extins de gândire.
Claude Code – AI-ul care îți explică și rescrie codul
Pe lângă lansarea Claude 3.7 Sonnet, Anthropic introduce și Claude Code, un instrument dedicat programatorilor.
Noua funcție permite dezvoltatorilor să ruleze comenzi direct din terminal și să interacționeze cu AI-ul într-un mod mai natural. De exemplu, un utilizator poate introduce o comandă de genul „Explică structura acestui proiect”, iar Claude Code va analiza codul și va furniza un răspuns detaliat.
Mai mult, AI-ul poate modifica codul, testa proiectele pentru erori și chiar face commit-uri automate pe GitHub. Deocamdată, Claude Code este disponibil doar pentru un număr limitat de utilizatori, pe bază de înscriere.
Anthropic încearcă să țină pasul cu OpenAI
Lansarea Claude 3.7 Sonnet vine într-un moment în care companiile de AI se întrec în lansarea de noi modele. Anthropic a adoptat până acum o strategie mai prudentă, axată pe siguranță și control, dar acum încearcă să accelereze ritmul pentru a rămâne competitivă.
Întrebarea este cât timp va reuși să mențină acest avantaj. OpenAI se pregătește să lanseze propriul său model hibrid în „câteva luni”, conform CEO-ului Sam Altman. Dacă OpenAI reușește să creeze un model la fel de performant, dar mai ieftin, Claude 3.7 Sonnet ar putea pierde rapid teren.
Pentru moment, însă, Anthropic are un avantaj clar: un AI care se poate adapta la nevoile utilizatorului, fie că vrea răspunsuri imediate sau o analiză mai aprofundată. Într-o lume în care timpul este esențial, poate că viitorul AI-ului nu este doar despre viteză, ci și despre cât de bine poate „rumege” informațiile înainte de a le livra.