Tehnologie

xAI, concurentul OpenAI, lansează cea mai recentă versiune a lui Grok, capabil să proceseze imagini

xAI, concurentul OpenAI fondat de Elon Musk, a introdus prima versiune a lui Grok care poate procesa informații vizuale.

Ce poate să facă xAI, concurentul OpenAI

Grok-1.5V este primul model AI multimodal al companiei, care poate procesa nu doar text, ci și „documente, diagrame, grafice, capturi de ecran și fotografii”. În anunțul xAI, au fost prezentate câteva exemple despre cum pot fi folosite capacitățile sale în lumea reală. De exemplu, poți să-i arăți o fotografie cu un diagramă și să ceri lui Grok să o traducă în cod Python, să îl rogi să scrie o poveste bazată pe un desen și chiar să îți explice un meme pe care nu-l poți înțelege. Ei bine, nu toată lumea poate ține pasul cu tot ceea ce internetul scoate.

Noua versiune vine la doar câteva săptămâni după ce compania a dezvăluit Grok-1.5. Acest model a fost proiectat să fie mai bun la programare și matematică decât predecesorul său, precum și să poată procesa contexte mai lungi, astfel încât să poată verifica datele din mai multe surse pentru a înțelege mai bine anumite întrebări. xAI a declarat că testerii săi timpurii și utilizatorii existenți vor putea să se bucure în curând de capacitățile lui Grok-1.5V, deși nu a oferit o cronologie exactă pentru lansarea sa.

Evaluarea performanței AI

În plus față de introducerea lui Grok-1.5V, compania a lansat și un set de date de referință pe care îl numește RealWorldQA. Poți folosi oricare dintre cele 700 de imagini din RealWorldQA pentru a evalua modelele AI: fiecare element vine cu întrebări și răspunsuri pe care le poți verifica ușor, dar care ar putea pune probleme modelelor multimodale precum Grok. xAI a pretins că tehnologia sa a primit cea mai mare notă când compania a testat-o cu RealWorldQA împotriva competitorilor, cum ar fi GPT-4V de la OpenAI și Google Gemini Pro 1.5.

Inteligenta artificiala se concentreaza pe crearea de sisteme sau programe capabile sa simuleze procesele cognitive umane. Aceste sisteme sunt proiectate pentru a lua decizii, a rezolva probleme, a învăța din experiență și a adapta comportamentul în funcție de mediu.

Utilizând tehnici precum învățarea automată, rețelele neurale și prelucrarea limbajului natural, IA poate fi aplicată într-o gamă largă de domenii, inclusiv asistență virtuală, recunoaștere vocală și facială, analiză de date, vehicule autonome și multe altele. Cu toate acestea, progresele rapide în domeniul IA ridică și provocări legate de etica și siguranța utilizării acestei tehnologii, punând accent pe nevoia de reguli și standarde clare pentru utilizarea și dezvoltarea AI într-un mod responsabil și etic.