Tehnologie

Modelele mai vechi de inteligență artificială arată semne de declin cognitiv

Inteligența artificială a devenit o componentă esențială în domeniul medical, ajutând la diagnosticarea rapidă a bolilor și la detectarea anomaliilor în imagini medicale sau seturi de date. Cu toate acestea, un studiu recent publicat pe 20 decembrie 2024 în BMJ ridică semne de întrebare cu privire la fiabilitatea AI pe termen lung.

Cercetătorii au descoperit că modelele mai vechi de inteligență artificială (LLM – Large Language Models) pot manifesta semne de deteriorare cognitivă, similar cu declinul funcțiilor cognitive la oameni.

AI întâmpină un declin cognitiv

Această descoperire contrazice ipoteza conform căreia AI ar putea înlocui complet medicii umani, mai ales în sarcinile ce necesită un grad ridicat de analiză și interpretare vizuală. Dacă modelele de AI încep să „îmbătrânească” și să își piardă din acuratețe, acest lucru ar putea afecta încrederea pacienților și fiabilitatea diagnosticelor automatizate.

Pentru a investiga acest fenomen, cercetătorii au supus mai multe modele AI disponibile publicului – inclusiv ChatGPT (OpenAI), Sonnet (Anthropic) și Gemini (Alphabet) – la testul Montreal Cognitive Assessment (MoCA). Acest test este utilizat în mod obișnuit pentru a detecta începutul demenței sau al bolii Alzheimer la pacienți umani, evaluând capacitățile cognitive în cinci domenii-cheie: atenție, memorie, limbaj, abilități spațiale și funcții executive.

MoCA include sarcini precum desenarea unei anumite ore pe un ceas, scăderea repetată a numărului 7 din 100 sau memorarea unei liste de cuvinte. În cazul oamenilor, un scor de 26 din 30 este considerat normal, indicând absența unui declin cognitiv semnificativ.

Rezultatele testului aplicat pe AI au arătat că modelele recente s-au descurcat bine la sarcini precum atenția, limbajul și recunoașterea obiectelor, dar au avut dificultăți majore la abilitățile vizual-spațiale și funcțiile executive. Cel mai nou model, ChatGPT-4, a obținut scorul de 26/30, ceea ce sugerează performanțe cognitive comparabile cu cele ale unei persoane fără semne de demență. În schimb, Gemini 1.0, un model mai vechi, a obținut doar 16 puncte, ceea ce indică un declin semnificativ al performanței.

Implicațiile declinului AI în domeniul medical

Autorii studiului subliniază că aceste rezultate sunt observaționale, iar modul în care funcționează AI este fundamental diferit de creierul uman. Totuși, descoperirile indică o slăbiciune semnificativă a modelelor AI mai vechi, ceea ce ar putea limita utilizarea lor în medicină.

În special, cercetătorii avertizează că AI nu ar trebui să fie folosit pentru sarcini ce necesită abstracție vizuală și funcții executive avansate, cum ar fi interpretarea imaginilor medicale complexe sau luarea unor decizii clinice critice. Dacă modelele AI devin mai puțin precise pe măsură ce îmbătrânesc, spitalele și clinicile vor trebui să fie extrem de atente în actualizarea continuă a sistemelor bazate pe inteligență artificială.

În plus, această situație deschide o perspectivă inedită și ușor amuzantă: ar putea neurologii umani ajunge să diagnosticheze AIs cu simptome de declin cognitiv? Dacă modelele mai vechi dezvoltă deficiențe în procesarea informației, ar putea exista un viitor în care „medicii” digitali să fie supuși unor evaluări și tratamente pentru „bătrânețea lor artificială”.

În concluzie, deși AI rămâne un instrument puternic în medicină, descoperirile recente demonstrează că aceste sisteme nu sunt infailibile și că performanța lor poate scădea în timp. Acest lucru adaugă o nouă dimensiune discuției despre fiabilitatea AI și arată că, cel puțin pentru moment, medicii umani rămân indispensabili în diagnosticarea și tratarea pacienților.