Scienza

L’IA crea una nuova proteina fluorescente, simulando 500 milioni di anni di evoluzione: ScienceAlert.

La sintesi di nuove proteine – i mattoni della vita biologica – è un campo scientifico di immenso potenziale,

L’IA crea una nuova proteina fluorescente, simulando 500 milioni di anni di evoluzione: ScienceAlert.

La sintesi di nuove proteine – i mattoni della vita biologica – è un campo scientifico di immenso potenziale, e un nuovo modello di intelligenza artificiale sviluppato promette di creare istruzioni per nuove proteine ben oltre quelle presenti in natura.

Gli scienziati negli Stati Uniti hanno utilizzato il modello EvolutionaryScale Model 3 (ESM3) per sintetizzare una nuova proteina chiamata esmGFP (proteina fluorescente verde), che condivide solo il 58% del suo materiale con il suo parente naturale più vicino tagRFP.

Questo equivale a 500 milioni di anni di evoluzione elaborati dall’IA, stima il team di ricerca, e apre la strada alla creazione di proteine su misura progettate per usi specifici o per sbloccare ulteriori funzioni da proteine esistenti.

Modello di intelligenza artificiale per le proteine
ESM3 utilizza algoritmi di IA per costruire nuove proteine dai suoi dati di addestramento. (EvolutionaryScale)

“Più di tre miliardi di anni di evoluzione hanno prodotto un’immagine della biologia codificata nello spazio delle proteine naturali,” scrivono i ricercatori, guidati da Thomas Hayes, fondatore di EvolutionaryScale a New York, nel loro articolo pubblicato.

“Qui mostriamo che i modelli linguistici addestrati su larga scala su dati evolutivi possono generare proteine funzionali che sono molto distanti dalle proteine conosciute.”

ESM3 è stato addestrato su un impressionante numero di 3,15 miliardi di sequenze di proteine (l’ordine degli aminoacidi in una proteina), 236 milioni di strutture proteiche (le loro forme 3D) e 539 milioni di annotazioni proteiche (etichette descrittive).

Analizzando i modelli in questi vasti bacini di dati, il modello di IA può comprendere cosa funziona e cosa non funziona nella costruzione e funzione delle proteine, nello stesso modo in cui ChatGPT può comporre una nuova poesia che fa rima dopo aver letto milioni di poesie scritte da esseri umani.

Ciò che rende esmGFP particolarmente speciale è che funziona: è fluorescente proprio come il suo parente tagRFP. Le proteine fluorescenti danno a certi organismi marini il loro bagliore, e il loro utilizzo come marcatori ha una grande importanza in medicina e biotecnologia.

“Abbiamo scelto la funzionalità della fluorescenza perché è difficile da ottenere, facile da misurare e uno dei meccanismi più affascinanti in natura,” scrive il team .

Un modello di proteina generato dall'IA che simula 500 milioni di anni di evoluzione biologica
Un rendering di esmGFP, una nuova proteina fluorescente verde generata da ESM3 che è distante da altre proteine fluorescenti trovate in natura. (EvolutionaryScale)

Il modello di IA elimina gran parte del tentativo e errore nella sintesi delle proteine, mentre aggiunge la capacità di esplorare lontano dalle proteine che conosciamo attualmente.

“Le proteine possono essere viste come esistenti all’interno di uno spazio organizzato in cui ogni proteina è vicina a ogni altra che è a un evento mutazionale di distanza,” scrivono i ricercatori. “La struttura dell’evoluzione appare come una rete all’interno di questo spazio, connettendo tutte le proteine attraverso i percorsi che l’evoluzione può seguire tra di esse.”

Perché l’evoluzione si verifichi, il team afferma che ciascuna proteina deve cambiare in quella successiva senza che il sistema di cui fa parte perda la sua funzionalità complessiva. Un modello linguistico riconosce le proteine in questo spazio.

Le proteine progettate da ESM3 devono ancora essere convalidate, sintetizzate e testate, il che richiede tempo, ma il team è fiducioso di poter fare ulteriori progressi in questo senso. In un futuro non troppo lontano potremmo produrre proteine per tutto, dai farmaci ai biomateriali, semplicemente con alcuni suggerimenti intelligenti di IA.

“I modelli linguistici delle proteine non lavorano esplicitamente all’interno dei vincoli fisici dell’evoluzione, ma possono costruire implicitamente un modello della moltitudine di percorsi potenziali che l’evoluzione avrebbe potuto seguire,” spiegano i ricercatori.

La ricerca è stata pubblicata su Science.

About Author

ricercatissimo.it@gmail.com

Leave a Reply

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *