La sequenza di 1000 genomi umani

Conoscete Ozzy Osbourne? Si si, lo so, scusate, siete troppo piccoli...E' un cantante heavy metal, ex leader dei Black Sabbath, che ormai più che sessantenne gode di buona salute, nonostante una vita di eccessi. Perché ve ne parlo? Il suo DNA è stato interamente sequenziato. Intervistato a questo proposito ha dichiarato: "Considerando le piscine di alcolici che ho ingollato nel corso degli anni, per non dire della cocaina, della morfina, dei sonniferi, dell'LSD e degli sciroppi per la tosse, non c'è davvero alcuna ragione medica plausibile per cui io debba essere ancora vivo. Forse il mio DNA potrebbe dire perché." Sembra che alcune varianti del genoma del cantante possano spiegare la sua tolleranza all'alcol, ma al momento non sembra che il DNA di Ozzy abbia dato altre risposte.
Vi parlo di questa notizia perché nel 2000 fu sequenziato il primo genoma umano. Oggi, dopo poco più di dieci anni, la genetica entra in una nuova affascinante fase. In pochi anni, la velocità con cui si sequenzia un intero genoma è enormemente aumentata e se ci sono voluti più di dieci anni per sequenziarne uno, oggi se ne sequenziano a migliaia in poco tempo. Ma a cosa serve conoscere la sequenza delle basi del DNA? Tre miliardi di lettere ACGTCGATTAAGCTAG...messe una dietro l'altra cosa ci dicono?

Ozzy Osbourne
(http://scopridovequando.files.wordpress.com/2010/03/ozzy-osbourne-400a0613.jpg)

Uno dei motivi principali per cui negli anni novanta si decise di sequenziare tutte le lettere del DNA umano fu l'impatto nel settore biomedico. Il sequenziamento doveva portare all'identificazione dei geni che causano malattie nell'uomo ed aprire la strada alle potenziali cure. In realtà, passata l'eccitazione per il primo genoma sequenziato, ci si è accorti che non è sufficiente sequenziare un solo DNA. Anche se il DNA di due uomini è uguale al 99,9 %, la diversità umana va ricercata in quello 0,1 % che resta. Se vogliamo capire perché un uomo è affetto da una malattia e un altro no dobbiamo andare a cercare le variazioni di nucleotidi in quello 0,1 %.
In media ogni 1000 nucleotidi ce n'è uno diverso tra due uomini presi a caso. Dato che in ogni genoma umano ci sono tre miliardi di lettere, tra due uomini scelti a caso ci sono, in media, 3 milioni di nucleotidi diversi. Queste variazioni di singole basi si chiamano SNP (Single Nucleotide Polymorphisms, polimorfismi di singoli nucleotidi). Accanto a queste variazioni ci sono poi i cosiddetti CPN (Copy Number Polymorphisms, polimorfismi del numero di copie), inserzioni, delezioni, inversioni e duplicazioni di parti di DNA. La diversità tra ognuno di noi risiede proprio in queste variazioni tra un genoma e l'altro.

Polimorfismi di singoli nucloeotidi
(http://en.wikipedia.org/wiki/File:Dna-SNP.svg)

Già lo scorso settembre il progetto HapMap 3 aveva pubblicato più di un milione e mezzo di SNPs sequenziando genomi di 11 popolazioni e un migliaio di individui provenienti da tutto il mondo, tra cui i toscani, per l'Italia. Lo scopo di questo progetto è stato quello di indentificare le varianti meno comuni tra le popolazioni umane, perché si pensa che queste possano essere maggiormente coinvolte in varie malattie. Sono stati identificati sia SNPs che CPNs e si è potuto dimostrare che la diversità nelle popolazioni africane comprende anche la maggior parte di quella di tutte le altre popolazioni mondiali. Ciò vuol dire che le varianti che vengono identificate in popolazioni provenienti da tutto il resto del mondo sono quasi sempre presenti anche nelle popolazioni africane, mentre non è vero il contrario. Da un punto di vista evolutivo questo dato conferma l'origine africana della popolazione attuale di Homo sapiens.
Il passo successivo è quello di associare le varianti scoperte (SNPs e CPNs) a malattie o caratteri di interesse nell'uomo. In parole molto semplici, se gli individui affetti da una data malattia hanno in comune le stesse varianti, cioè gli stessi polimorfismi, allora si può concludere che queste varianti (cioè mutazioni) siano la causa della malattia in questione.
Dai dati del progetto HapMap 3 ci si è resi conto che, siccome le varianti interessanti sono molto rare, bisogna sequenziare un grandissmio numero di individui, altrimenti la probabilità di pescare la variante interessante diventa insignificante. Ed ecco arrivare il "The 1000 genomes project" i cui risultati preliminari sono stati illustrati lo scorso 28 ottobre 2010 sulla rivista Nature. La sequenza di centinaia e centinaia di genomi da popolazioni provenienti dai cinque continenti sta generando una massa di informazioni genetiche mai vista prima. Gli scienziati si sono messi già al lavoro per cercare in questo mare di sequenze quelle responsabili di malattie ereditarie, di disturbi complessi come quelli cardiovascolari, l'obesità, il diabete, di tratti della personalità umana e di tutto ciò che può essere utile e interessante studiare.
Solo con i risultati preliminari del progetto sono stati identificati 15 milioni di SNPs, 1 milione di piccole inserzioni e delezioni e 20000 varianti strutturali, prima non note. Il dato più sconcertante da leggere in questi risultati è che ogni persona ha nel proprio genoma circa 250-300 alleli non funzionanti e dalle 50 alle 100 variazioni in qualche modo implicate in malattie genetiche. Insomma siamo vivi per miracolo!
Leggendo tutto questo, cari ragazzi, non possiamo che augurare buon lavoro a tutti gli scienziati che stanno cercando di capire il significato della nostra diversità genetica, cioè di tutte le mutazioni che abbiamo accumulato durante la nostra storia evolutiva. Al tempo stesso è inevitabile una riflessione: eravamo proprio ingenui dieci anni fa quando pensavamo che il sequenziamento di un solo genoma avrebbe risolto tutti i nostri problemi medici! Come al solito la scienza riserva sempre delle grosse sorprese!

Referenze
Elizabeth Pennisi (2010) 1000 Genomes Project Gives New Map Of Genetic Diversity. Science 330: 574-575.

The International HapMap 3 Consortium (2010) Integrating common and rare genetic variation in diverse human populations. Nature 467: 52-58.

The 1000 Genomes Project Consortium (2010) A map of human genome variation from population-scale sequencing. Nature 467: 1061-1073.

Rasmus Nielsen (2010) In search of rare human variants. Nature 467: 1050-1051.

Telmo Pievani (2010) La doppia elica di Ozzie Osbourne. Le Scienze 508: 28.

Manuela Casasoli (manuela_casasoli@yahoo.it)