AI-ul face istorie la Olimpiada Internațională de Matematică. Evenimentul nu a fost lipsit de controverse
Inteligența artificială a bifat o nouă performanță impresionantă: modelele dezvoltate de DeepMind (Google) și OpenAI au obținut rezultate echivalente cu medalia de aur la Olimpiada Internațională de Matematică (IMO), competiția considerată vârful provocărilor matematice pentru liceeni.
Totuși, modul în care companiile au gestionat momentul a stârnit discuții aprinse.
IMO este o competiție extrem de riguroasă. Cei mai buni elevi din lume rezolvă, în două zile, șase probleme foarte dificile, în sesiuni de câte 4 ore și jumătate.
Punctajul maxim este 42, iar pentru aur sunt necesare rezultate excepționale. Modelele AI au reușit să rezolve cinci dintre cele șase probleme, obținând 35 de puncte, suficient pentru medalia de aur. La ediția din acest an, dintre cei 630 de participanți umani, doar 67 de elevi au atins același nivel, scrie Gizmodo.
OpenAI nu s-a înscris oficial în cursă
Diferența majoră a fost modul de participare. DeepMind a fost invitată oficial, a respectat toate regulile și a anunțat rezultatele după publicarea oficială a punctajelor elevilor.
OpenAI, în schimb, nu s-a înscris oficial la IMO. A luat problemele după ce au devenit publice, le-a rezolvat intern și a anunțat că a avut performanță de aur înainte de termenul stabilit, ignorând cererea IMO de a nu distrage atenția de la succesul elevilor. Acest gest a fost perceput ca lipsit de fair-play.
Modelele AI nu sunt cele pe care le folosești tu
Mai interesant este că modelele folosite nu sunt aceleași cu cele disponibile publicului. În momentul în care cercetătorii au testat problemele IMO cu versiuni comerciale precum Gemini 2.5 Pro, Grok-4 sau OpenAI o4, rezultatele au fost modeste: maximum 13 puncte, sub pragul de 19 puncte necesar pentru bronz. Aceasta scoate la iveală un decalaj major între modelele „de laborator” și versiunile oferite utilizatorilor obișnuiți.
Reacțiile nu au întârziat. Pe de o parte, realizarea arată clar că AI-ul progresează rapid în raționament matematic complex, un domeniu unde modelele mai vechi aveau dificultăți.
Pe de altă parte, există scepticism privind transparența și etica modului în care companiile își promovează succesele, mai ales când riscă să umbrească munca unor tineri care au concurat corect.
Evenimentul ridică două întrebări importante: de ce aceste modele performante nu sunt accesibile publicului? și cum vor fi reglementate astfel de participări în viitor? Chiar dacă AI-ul poate obține aur la matematică, pare că oamenii încă trebuie să definească regulile jocului.