ai, crispr, evo 2

Un "ChatGPT per CRISPR", un modello senza precedenti per la biologia che entusiasma ma pone anche problemi etici 

Un modello di intelligenza artificiale capace di progettare e analizzare il codice genetico per tutti i domini della vita segna una svolta nella biologia computazionale. Si tratta di Evo 2, il modello più grande mai sviluppato in questo campo, addestrato su oltre 9,3 trilioni di nucleotidi estratti da 128.000 genomi, coprendo l’intero albero della vita. È stato sviluppato dall’Arc Institute, l’Università di Stanford e il colosso dei semiconduttori NVIDIA: una collaborazione che unisce le più evolute tecnologie informatiche e biotecnologiche e che potrebbe avere un notevole impatto sul futuro della biologia sintetica e della medicina personalizzata

UN MODELLO SENZA PRECEDENTI PER LA BIOLOGIA 

L’immensa mole di dati lo pone alla pari, in termini di scala, con i più potenti modelli generativi di linguaggio, che solo pochi mesi fa sono stati protagonisti del Premio Nobel. Il suo obiettivo è quello di riconoscere schemi genetici che richiederebbero anni di ricerca sperimentale, identificare mutazioni legate a malattie e persino progettare nuovi genomi, lunghi quanto quelli di batteri semplici. 

Per rendere Evo 2 accessibile alla comunità scientifica, l’Arc Institute ha sviluppato Evo Designer, un’interfaccia user-friendly che permette di esplorare le sue potenzialità. Inoltre, il codice sorgente del modello è open source, disponibile su GitHub e integrato nel framework NVIDIA BioNeMo, accelerando così la ricerca in ambito genetico.

COME È STATO ADDESTRATO

L’addestramento del modello ha richiesto mesi di elaborazione. Per gestire l’enorme complessità dei dati, il team di ricerca ha sviluppato una nuova architettura chiamata StripedHyena 2, che ha permesso a Evo 2 di elaborare 30 volte più dati rispetto al suo predecessore e di analizzare otto volte più nucleotidi alla volta.

Il modello ha spinto oltre i limiti della comprensione dei sistemi biologici, perché genera più conoscenze sulla biologia rispetto a qualsiasi altro modello mai sviluppato. Il fatto che sia stato addestrato su 9,3 trilioni di nucleotidi lo rende un modello di intelligenza artificiale su una scala senza precedenti, simile ai grandi modelli di linguaggio come GPT, ma applicato al codice genetico. Non a caso Nature ha definito la sua prima versione, rilasciata ad aprile 2024, un “ChatGPT per CRISPR”.

I primi test indicano che Evo 2 è estremamente accurato nell’identificare le mutazioni genetiche che influenzano la funzione delle proteine e la sopravvivenza degli organismi. Ad esempio, ha raggiunto un’accuratezza superiore al 90% nel prevedere quali mutazioni nel gene BRCA1, legato al tumore al seno, siano benigne o patogene. Questa capacità potrebbe far risparmiare anni di ricerca e milioni di dollari, accelerando la scoperta di terapie genetiche e farmaci.

Evo 2 potrebbe avere applicazioni anche oltre la diagnosi genetica. Se vogliamo ad esempio che una terapia genica si attivi solo nei neuroni o solo nelle cellule epatiche per evitare effetti collaterali, possiamo progettare un elemento genetico che funzioni esclusivamente in quei tipi di cellule.

PRO E CONTRO

Ci sono alcuni aspetti particolarmente interessanti. Anzitutto l'idea che un'AI possa non solo analizzare sequenze genetiche esistenti, ma anche progettare nuovi genomi, apre scenari affascinanti, dalle terapie personalizzate alla creazione di organismi sintetici.

Un secondo aspetto interessante sono le applicazioni mediche concrete: il fatto che Evo 2 sia già in grado di prevedere l'impatto di mutazioni su geni chiave come BRCA1 è un passo avanti per la medicina di precisione. Se queste previsioni si dimostreranno affidabili, potremmo accelerare la scoperta di cure per malattie genetiche senza dover passare per lunghi esperimenti in laboratorio.

In terzo luogo, la collaborazione e l’open source. Il coinvolgimento di istituti come Stanford, l’Università della California - Berkeley, l’Università della California - San Francisco (UCSF) e NVIDIA mostra come la ricerca biologica si stia intrecciando sempre più con l'intelligenza artificiale. E il fatto che il codice e i dati di Evo 2 siano pubblicamente accessibili lo rende ancora più prezioso per la comunità scientifica, stimolando innovazioni future.

Tuttavia, come per ogni tecnologia potente, c’è il problema aperto della sicurezza. Per evitare rischi etici e di biosicurezza, Evo 2 è stato progettato con filtri avanzati, escludendo i patogeni umani dai dati di addestramento e impedendo al modello di generare risposte utili su di essi. È però inevitabile che un sistema capace di scrivere DNA sollevi questioni etiche. Il suo utilizzo dovrà essere attentamente regolamentato per evitare impieghi rischiosi: sarà cruciale monitorarne gli sviluppi e garantire un uso responsabile di una tecnologia così potente.

Infatti, con un sistema come Evo 2 si potrebbero accelerare sviluppi in ambiti come l’eugenetica, il miglioramento delle capacità umane o l’uso della biologia sintetica in ambito militare. La trasparenza e il rispetto di principi etici saranno cruciali per evitare rischi e abusi. Dal momento che il codice è rilasciato in open source, sarà difficile impedire l'uso improprio da parte di chiunque.  Regolamentate. Questa tecnologia attirerà l'attenzione ovunque, anche in Paesi dove sono già stati condotti esperimenti controversi, come la modifica genetica degli embrioni con CRISPR nel caso di He Jiankui in Cina.

Con il contributo incondizionato di

Website by Digitest.net



Questo sito utilizza cookies per il suo funzionamento Maggiori informazioni