Revoluția AI în secvențierea proteinelor: Descoperiri esențiale în medicină, arheologie, dar și mediu
Se pare că noi modele bazate pe inteligență artificială pot identifica proteine necunoscute în probe complexe, oferind, astfel, perspective esențiale pentru cercetarea biologică și istorică.
După ce a revoluționat înțelegerea plierii proteinelor, inteligența artificială se impune acum în domeniul secvențierii proteinelor, procesul prin care se identifică proteinele pe baza secvenței de aminoacizi care le compun, scrie Science.org.
Noile sisteme AI, mai rapide și mai eficiente decât metodele clasice, permit detectarea proteinelor necunoscute, chiar și în probe degradate din țesuturi infectate, medii marine sau situri arheologice.
Cea mai recentă inovație, descrisă într-un studiu publicat în Nature Machine Intelligence, provine de la o echipă europeană care a dezvoltat InstaNovo, un model de AI capabil să identifice proteine patogene în răni și compuși proteici produși de microbi marini.
InstaNovo este doar unul dintre cele peste 20 de sisteme AI de acest tip apărute în ultimii patru ani.
„Este clar că în această direcție se îndreaptă domeniul”, afirmă William Noble, cercetător în AI aplicată proteomicii la Universitatea Washington.
Concret, folosirea acestor instrumente s-a extins deja în biologia evoluționistă, unde sunt folosite pentru a analiza proteine antice care pot oferi indicii despre diferențele dintre Homo sapiens și rudele sale dispărute.
Algoritmi inspirați de modelele de limbaj
Spre deosebire de metodele tradiționale, care se bazează pe compararea fragmentelor de peptide cu baze de date existente, noile modele de inteligență artificială, inclusiv Casanovo și InstaNovo, reconstruiesc proteinele analizând toate combinațiile posibile de peptide, chiar și în absența unor corespondențe în baze de date.
Ele folosesc rețele neuronale similare celor care susțin modelele lingvistice precum ChatGPT, pentru a „învăța” sintaxa proteinelor, adică regulile prin care aminoacizii se combină cel mai probabil.
InstaNovo aduce o noutate, și anume un mecanism numit „difuzie”, care introduce și elimină zgomot digital în datele de intrare pentru a rafina rezultatul, o tehnică utilizată și în generarea de imagini de către AI-uri precum DALL-E.
În testele de laborator, InstaNovo și versiunea sa avansată, InstaNovo+, au identificat cu 42% mai multe peptide decât modelul precedent Casanovo.
Aplicat în practică, InstaNovo a detectat peste 1200 de peptide unice în proteina albumină din răni infectate, de zece ori mai multe decât metodele convenționale.
Dintre acestea, 254 erau complet necunoscute în bazele de date existente. Alte peptide au fost asociate cu 52 de proteine bacteriene, demonstrând capacitatea AI-ului de a analiza probe biologice complexe.
Aplicații promițătoare în arheologie și mediu – totul cu inteligența artificială
Noile AI-uri sunt deja folosite în cercetarea arheologică. Matthew Collins, specialist în paleoproteomică la Universitatea Cambridge, utilizează aceste modele pentru a analiza probe vechi de milenii, în care proteinele sunt adesea degradate sau provin de la specii dispărute.
Modelele AI s-au dovedit eficiente în astfel de condiții „imprevizibile”, identificând urme de proteine de iepure în situri neanderthaliene și proteine musculare de pește în vase ceramice antice din Brazilia.
„Aceste instrumente sunt atât de folositoare, încât ne-am mutat întreaga cercetare pe această platformă”, afirmă Collins. „Este o schimbare de paradigmă”, s-a precizat, de asemenea.