Tehnologie

Internetul pune scut împotriva inteligenței artificiale. Instrumentul care nu lasă AI-ul să se antreneze „pe spinarea ta”

În ultimii ani, instrumentele bazate pe inteligență artificială, de la chatboți la generatoare de imagini și video, au devenit omniprezente.

Ele par a fi magice, dar în realitate se bazează pe un lucru cât se poate de concret: cantități uriașe de date, majoritatea preluate de pe internet. Conținutul creat de milioane de utilizatori de-a lungul decadelor a fost „aspirat” de AI fără prea multă ceremonie sau consimțământ.

Companiile dezvoltatoare de inteligență artificială, implicate în numeroase procese

Multe companii, de la OpenAI la Google și Anthropic, sunt implicate în acest proces de extragere masivă a datelor, uneori cu acordul unor platforme precum Reddit sau Vox Media, alteori fără nicio permisiune, scrie publicația LifeHacker.

Aceste practici au dus la numeroase procese în instanță, inclusiv intentate de publisheri mari precum Ziff Davis, compania-mamă a publicației menționate anterior.

Cu toate acestea, AI-ul este înfometat și are nevoie de conținut proaspăt. Un studiu din 2024 avertiza că modelele actuale ar putea epuiza sursele publice de date relevante până în 2028.

În acest context, tot mai multe voci din comunitatea tech se ridică împotriva acestei practici considerate abuzive. Nu doar giganții media luptă, ci și dezvoltatori independenți, care găsesc soluții concrete pentru a bloca accesul bot-urilor AI la propriul conținut.

Anubis, un scut digital împotriva AI-ului care scrapează web-ul

Una dintre cele mai interesante inițiative vine din partea dezvoltatoarei Xe Iaso, din Ottawa, Canada. Ea a creat Anubis, un instrument open-source ce permite proprietarilor de site-uri să blocheze automat roboții AI care încearcă să extragă conținut pentru antrenarea modelelor de inteligență artificială.

Anubis funcționează printr-un test inteligent numit de creatoare „uncaptcha”: atunci când un utilizator accesează site-ul, browserul său trebuie să efectueze o serie de calcule criptografice în JavaScript.

Browser-ele moderne, începând cu versiunile lansate din 2022, trec acest test fără probleme, în timp ce majoritatea bot-urilor AI nu pot face față sarcinii, fie pentru că nu rulează JavaScript, fie pentru că ar presupune o investiție prohibitivă în resurse de calcul. Astfel, Anubis permite diferențierea automată între utilizatorii umani și sistemele automate de scraping.

Proiectul a fost descărcat de peste 200.000 de ori de la lansarea sa la începutul lui 2025 și continuă să evolueze. Iaso intenționează să adauge noi funcționalități, inclusiv teste mai puțin solicitante pentru procesoarele utilizatorilor și versiuni care nu se bazează pe JavaScript, pentru a răspunde nevoilor celor preocupați de confidențialitate.

Web-ul devine conștient de valoarea sa

Anubis nu este singurul instrument în lupta contra AI-ului. Companii precum Cloudflare au început să blocheze implicit bot-urile AI și chiar oferă clienților posibilitatea de a percepe taxe companiilor care doresc să extragă date.

Tendința indică o schimbare clară: creatorii de conținut și administratorii de site-uri încep să conștientizeze valoarea muncii lor și să impună limite accesului automatizat.