Con le banche dati di Dna
una miniera di conoscenze

di Tommaso Russo*

Sono ormai più di 15 anni che la struttura del DNA delle nostre cellule è stata decifrata. Da quel momento, semplicemente collegandoci ad un sito web, possiamo accedere ad una quantità enorme di informazioni. Come si può facilmente immaginare, l’evoluzione da allora ad oggi è stata velocissima e, per molti versi, sconvolgente. Una vera “rivoluzione informatica” nel campo delle scienze della vita. 

Cerchiamo di farci un’idea di quello che è accaduto. Nelle nostre cellule, ed in quelle di tutti gli organismi viventi, le istruzioni per costruire e regolare tutto ciò che in esse è presente sono contenute in molecole di DNA. Si tratta di lunghissime molecole in cui le istruzioni sono scritte con un alfabeto di sole quattro lettere, A, C, G e T (in ciascuna delle nostre cellule ci sono 46 di queste lunghissime molecole per un totale di alcuni miliardi di lettere). Per essere usate, queste istruzioni sono trascritte in moltissime copie di molecole di RNA, più corte delle molecole di DNA, ma non meno complesse. Nell’uomo, si tratta di circa 30.000 tipi diversi di molecole, anche queste scritte in un alfabeto di quattro lettere. Mi rendo conto che già così è molto complicato, ma cerchiamo di fare un piccolo passo avanti, con un solo esempio semplice (!) tra le decine che potremmo fare. L’esperienza clinica ci dice che due pazienti, affetti da una neoplasia di uno stesso organo, hanno spesso due storie cliniche molto diverse: c’è chi risponde bene ad una terapia e chi invece è resistente; c’è chi sviluppa metastasi dopo l’intervento chirurgico e chi invece non manifesta più la malattia per molti anni. 

Molte volte ciò dipende da specifiche alterazioni (mutazioni) di poche lettere che compongono alcune delle istruzioni di cui stiamo parlando. Ovviamente, è molto utile sapere in anticipo che quel paziente ha poche/molte probabilità di rispondere ad un trattamento. Per identificare queste alterazioni, dal tumore asportato dal chirurgo si estrae l’RNA e, usando macchinari e tecnologie abbastanza sofisticati, in pochi giorni otteniamo tutte le istruzioni presenti nelle cellule del campione. Si tratta di migliaia di tipi diversi di molecole di RNA, ognuna formata da migliaia di lettere. Milioni di lettere da confrontare con le informazioni presenti in una cellula normale o in un altro tumore. È come avere due copie di uno stesso romanzo e cercare in uno dei due uno o pochi errori di stampa. Un banale programma in un piccolo computer portatile lo fa in pochissimo tempo; noi potremmo impiegare anni, con il concreto pericolo che l’errore ci sfugga. Contemporaneamente, il piccolo portatile ci dice anche quante copie delle varie molecole di RNA sono presenti in quel tumore, e quindi se di una certa istruzione ce ne sono più o meno copie rispetto alla corrispondente cellula normale. 

Adesso facciamo un ulteriore piccolo passo avanti. Che complica di molto le cose. Per convincerci che le differenze che abbiamo trovato sono veramente responsabili della resistenza al trattamento o della particolare aggressività di un cancro, dobbiamo rendere il risultato un po’ più robusto. Questa operazione di confronto che ho riassunto viene fatta in molti laboratori sparsi per il mondo, migliaia di volte, su moltissimi pazienti con le più varie patologie tumorali. La gran parte dei risultati di questi confronti è disponibile in banche dati. Si tratta di una miniera di informazioni. Molti ricercatori oggi sono diventati minatori, che con strumenti informatici molto potenti (non basta più un piccolo portatile), esaminano questa enorme quantità di dati. Confrontano, elaborano attraverso complicati metodi statistici, disegnano ipotesi da verificare in laboratorio. Tutto per ottenere nuova conoscenza, che, forse, potrà essere in seguito utile. 

Questo è solo un esempio di quello che accade oggi nel mondo dei “big data” e del “data mining”. E la competizione è, come sempre accade nella ricerca, molto forte. Spesso le buone idee sono un vantaggio, ma non sempre bastano se non sono accompagnate da velocità nella trasmissione dei dati, dalla potenza nella gestione ed elaborazione degli stessi e molto altro. Incredibilmente, tutto questo in una quantità enorme di informazioni, tutte scritte con un alfabeto di sole quattro lettere. 

* Università degli Studi di Napoli Federico II
Sabato 29 Aprile 2017, 21:14 - Ultimo aggiornamento: 29-04-2017 21:14
© RIPRODUZIONE RISERVATA



COMMENTA LA NOTIZIA
0 di 0 commenti presenti