Sebbene lo Human Genome Project nel 2003 avesse annunciato il completamento del sequenziamento del genoma umano, esistevano ancora numerose regioni del nostro DNA non sequenziate (circa l’8% del totale) a causa di limitazioni tecniche. Gli scienziati del consorzio Telomere-to-Telomere (T2T) hanno ora annunciato al mondo di aver finalmente sequenziato un genoma umano completo utilizzando un innovativo approccio che prevede il sequenziamento di un gran numero di brevi frammenti di DNA sovrapposti.
“La disponibilità di una sequenza genomica completa farà avanzare drasticamente la nostra comprensione della genetica umana”
Il genoma umano rilasciato da T2T – che è un progetto open e community-based – include assemblaggi privi di gap di tutti i cromosomi nel genoma umano tranne Y, è indicato come T2T-CHM13 e fungerà da genoma di riferimento per ricercatori e clinici. T2T-CHM13 include la sequenza di quasi 200 milioni di coppie di basi mancanti nel genoma di riferimento precedentemente utilizzato, GRCh38, pubblicato dal Genome Reference Consortium. Oltre a colmare le lacune nel genoma, il genoma T2T-CHM13 ha anche corretto alcuni errori presenti nel GRCh38. Karen Miga, co-responsabile del consorzio T2T e professoressa presso l’University of California di Santa Cruz, ha dichiarato: “La disponibilità di una sequenza genomica completa farà avanzare drasticamente la nostra comprensione della genetica umana”. Lo studio che descrive il sequenziamento del genoma umano completo è stato pubblicato sulla rivista “Science”.
Il genoma di riferimento GRCh38 era stato generato utilizzando materiale genetico ottenuto da più individui diversi e non rappresenta un insieme completo di cromosomi di un singolo individuo. Per ovviare a questa lacuna, i ricercatori del consorzio T2T hanno utilizzato una linea cellulare chiamata CHM13 derivata da una mola idatiforme completa. Una mola idatiforme completa è una forma di gravidanza non vitale che comporta la formazione di una massa di cellule generalmente composta da due serie di cromosomi identici, inclusi due cromosomi X, derivati dal genitore maschio. L’uso di questa linea cellulare ha reso più facile il sequenziamento del genoma e ha fornito una sequenza completa di un singolo set di cromosomi.
“Capire il centromero come unità è necessario per comprendere gli errori nel movimento dei cromosomi quando le cellule si dividono, che si pensa rappresentino un fattore determinante nel cancro e in alcune altre malattie umane, compresi i difetti alla nascita”
Una regione importante del cromosoma con sequenze mancanti nel genoma GRCh38 è il centromero, che contiene un gran numero di sequenze di DNA ripetute. Il centromero è una regione ristretta del cromosoma che divide il cromosoma in un braccio corto e un braccio lungo. I centromeri svolgono un ruolo importante nella segregazione dei cromosomi tra le cellule figlie durante la divisione cellulare. Utilizzando le tecnologie di sequenziamento avanzate, i ricercatori del consorzio T2T sono stati in grado di sequenziare anche i centromeri e le regioni circostanti i centromeri, che rappresentano il 6,2% dell’intero genoma. Steven Henikoff, biologo molecolare presso il Fred Hutchinson Cancer Center, spiega: “Capire il centromero come unità è necessario per comprendere gli errori nel movimento dei cromosomi quando le cellule si dividono, che si pensa rappresentino un fattore determinante nel cancro e in alcune altre malattie umane, compresi i difetti alla nascita. Quindi finire il lavoro di sequenziamento del genoma umano è importante non solo perché è necessario per comprendere appieno un problema centrale nella genetica, ma anche per l’importanza dei centromeri per la nostra salute”.
Oltre ai centromeri, il genoma T2T-CHM13 include anche la sequenza del braccio corto di cinque cromosomi che erano, in larga misura, non sequenziati. Questi cinque cromosomi sono acrocentrici, con le loro braccia corte sproporzionatamente più corte del loro braccio lungo. Le braccia corte dei cromosomi acrocentrici codificano per le molecole ribosomiali dell’RNA, che non codificano per le proteine ma sono componenti dei ribosomi. I ribosomi sono siti in cui avviene la sintesi proteica, dal che deriva l’importanza del sequenziamento di questi cromosomi acrocentrici per comprendere la regolazione della sintesi proteica. Nel presente studio, i ricercatori hanno sequenziato 9,9 coppie di megabase di DNA che codificano per l’RNA ribosomiale. Brian McStay della National University of Ireland di Galway, spiega: “Le braccia corte dei cinque cromosomi acrocentrici umani sono fondamentali per costruire nucleoli, le strutture più grandi presenti nel nucleo umano. I nucleoli sono le fabbriche dove vengono costruiti i ribosomi, le macchine biologiche che producono le proteine. Una sequenza completa per questi bracci cromosomici darà il via a una nuova era di ricerca su come funzionano i nucleoli nelle cellule umane normali, malate e che invecchiano”.
“Una sequenza completa per questi bracci cromosomici darà il via a una nuova era di ricerca su come funzionano i nucleoli nelle cellule umane normali, malate e che invecchiano”
I ricercatori del consorzio T2T hanno anche utilizzato oltre 3000 campioni di genoma di individui in tutto il mondo e hanno confrontato questi campioni di genoma con i genomi di riferimento T2T-CHM13 e GRCh38. Hanno identificato una serie di varianti geniche associate a diverse patologie (tumori, malattie immunitarie, distrofia muscolare e altre) nelle regioni che mancavano nel genoma di riferimento GRCH38 e sono state in grado di rimuovere le varianti identificate in modo errato da GRCh38. T2T-CHM13 ha aiutato l’identificazione di varianti di questi geni clinicamente rilevanti con una precisione 12 volte maggiore rispetto al genoma GRCh38. Tuttavia, sono necessarie ulteriori ricerche per identificare ulteriori varianti di geni clinicamente rilevanti nelle regioni precedentemente non sequenziate. Justin Zook, ingegnere biomedico presso il National Institute of Standards and Technology, afferma: “Quello che abbiamo scoperto è che questo nuovo riferimento ha migliorato la precisione su tutta la linea”.