Le ripetizioni sono la chiave per comprendere il genoma dell'umanità / Repeats are key to understanding humanity's genome

Le ripetizioni sono la chiave per comprendere il genoma dell'umanità / Repeats are key to understanding humanity's genome


Segnalato dal Dott. Giuseppe Cotellessa / Reported by Dr. Giuseppe Cotellessa



Cromosomi umani (grigi) ricoperti da telomeri / Human chromosomes (gray) covered with telomeres

Era come una mappa di New York a cui mancava tutta Manhattan. Il genoma di riferimento umano ha finalmente riempito tutti i suoi punti vuoti e vedere tutto ciò che ci siamo persi la prima volta è sia ripetitivo che illuminante.


"Ci stiamo rendendo conto che ci sono molte variazioni umane là fuori", afferma la genetista Rachel O'Neill, direttrice dell'Istituto per la genomica dei sistemi di UConn. E in un controintuitivo scherzo del destino, la variazione deriva in gran parte dalle ripetizioni.

Una quantità significativa di materiale genetico umano risulta essere sezioni lunghe e ripetitive che si ripetono più e più volte. Sebbene ogni essere umano abbia alcune ripetizioni, non tutti ne hanno lo stesso numero. E la differenza nel numero di ripetizioni è dove si trova la maggior parte della .

Questa intuizione, che le ripetizioni sono importanti, è una delle molte scoperte significative del progetto Telomere-2-Telomere (T2T), una collaborazione globale tra istituzioni che ha riempito le sezioni mancanti dell'assemblaggio originale del genoma umano. O'Neill è uno dei principali ricercatori su quel progetto ed autore di quattro dei sei articoli T2T pubblicati su Science il 31 marzo.

"Ci sono voluti l'invenzione di nuovi metodi di sequenziamento del DNA e di analisi computazionale, e la dedizione di un notevole gruppo di scienziati, per completare la lettura dell'8% del genoma umano che era troppo complesso e ripetitivo nella sua struttura per essere risolto 20 anni fa. Ne è valsa la pena aspettare: viene rivelata una ricca serie di sorprendenti caratteristiche architettoniche, con importanti conseguenze per la comprensione , della variazione e  ", afferma Francis Collins, consulente scientifico della Casa Bianca ed ex direttore dei National Institutes of Salute.

Per quanto sorprendente fosse all'epoca, l'originale Human Genome Project ha lasciato circa l'8% del genoma in bianco.

"Questo è l'equivalente di un intero cromosoma nel DNA umano", dice O'Neill. Quell'ultimo 8% include numerosi geni ed aree ripetitive. La maggior parte delle sequenze di DNA appena aggiunte erano vicino ai telomeri ripetitivi (estremità lunghe e finali di ciascun cromosoma) ed ai centromeri (sezioni centrali dense di ciascun cromosoma).

Gli spazi vuoti erano il risultato della tecnologia di "lettura breve" utilizzata dal Progetto Genoma Umano. Era l'unica tecnologia per la mappatura del genoma disponibile 20 anni fa e poteva leggere solo l'equivalente di poche parole del codice genetico alla volta. Ad esempio, immagina che una sezione del genoma consistesse nella frase "Tutto il lavoro e niente gioco rende Jack un ragazzo ottuso", ripetuta nove volte di seguito. La tecnologia di lettura breve ne rivelerebbe solo pezzi come "All work", "Jack a", "makes Jack", ecc. I ricercatori hanno messo insieme quelle brevi sezioni per creare la frase "Tutto il lavoro e niente gioco rende Jack un ragazzo ottuso", ma non avevano modo di sapere che fosse stata ripetuta nove volte.

Il progetto T2T, tuttavia, disponeva di strumenti migliori. La nuova tecnologia del DNA a lunga lettura può leggere intere frasi, anche paragrafi, alla volta. Quindi i ricercatori sono stati in grado di vedere grandi porzioni, o anche sezioni complete, di ripetizioni.

"Generare una sequenza davvero priva di gap del  è una pietra miliare importante. Ci sarebbe piaciuto farlo 20 anni fa, ma la tecnologia doveva avanzare. Questo nuovo riferimento è una base davvero solida, senza crepe, su cui capire biologia umana. Non ci sono pezzi mancanti!" dice Bob Waterston, un biologo dell'Università di Washington che ha lavorato all'originale Human Genome Project.

Molti ricercatori e tirocinanti all'inizio della carriera hanno svolto ruoli chiave nel progetto T2T. Alla UConn, Savannah Hoyt, Gabrielle Hartley e Patrick Grady nel laboratorio di Rachel O'Neill e Luke Wojenski nel laboratorio di Leighton Core, sono stati profondamente coinvolti nel lavoro. Uno dei loro principali contributi è stato lo sviluppo di un compendio delle ripetizioni nel genoma. Hanno scoperto che le sezioni ripetitive contenevano elementi mobili, che sono sezioni in grado di saltare da una parte all'altra del genoma (l'esempio classico sono i geni di salto che portano a cambiamenti di colore nei chicchi di mais, come dal rosso al bianco); virus; e nuove ripetizioni che nessuno aveva identificato prima, comprese alcune che portano geni. Alcune delle ripetizioni giganti con 10, 20 o 30 copie si ripetono una dopo l'altra e contengono geni che potrebbero rappresentare gran parte della diversità umana. Nella frase di esempio di prima, immagina che "Jack" sia un gene. Una persona potrebbe averne 5 copie. Un altro potrebbe averne 25.

Il gruppo di T2T ha dato una prima occhiata alle sequenze complete per le parti centrali di ogni cromosoma umano. Chiamati centromeri, uniscono insieme le diverse braccia di ciascun cromosoma a forma di X. Il gruppo di O'Neill ha scoperto che i centromeri contengono elementi mobili noti e nuove ripetizioni. Gran parte del DNA nel centromero sembra essere importante per mantenere le informazioni genetiche di una cellula attraverso le generazioni. È già noto che i centromeri svolgono un ruolo nella replicazione del DNA quando le cellule si riproducono e se spostano la loro posizione nel cromosoma in modo significativo possono dare origine a specie completamente nuove. Le sequenze centromeriche complete e senza gap costruite dal progetto T2T consentiranno una comprensione molto più sfumata dei centromeri umani e di cosa fanno.assemblaggio come punto di partenza per identificare aree interessanti del nostro DNA.

"La prossima fase della ricerca metterà in sequenza i genomi di molte persone diverse per comprendere appieno la diversità umana, le malattie ed il nostro rapporto con i nostri parenti più stretti, gli altri primati", afferma O'Neill.

ENGLISH

It was like a map of New York missing all of Manhattan. The human reference genome finally has all its blank spots filled in, and seeing everything we missed the first time around is both repetitive—and enlightening.

"We're realizing there's a lot of human variation out there," says geneticist Rachel O'Neill, director of UConn's Institute for Systems Genomics. And in a contra-intuitive twist of fate, the variation comes in large part from the repeats.

A significant amount of human genetic material turns out to be long, repetitive sections that occur over and over. Although every human has some repeats, not everyone has the same number of them. And the difference in the number of repeats is where most of  is found.

This insight—that the repeats are important—is one of many significant findings from the Telomere-2-Telomere (T2T) project, a globe spanning collaboration of institutions that filled in the missing sections of the original human genome assembly. O'Neill is a principal investigator on that project, and an author on four of the six T2T papers being published in Science on March 31.

"It took the invention of new methods of DNA sequencing and computational analysis, and the dedication of a remarkable team of scientists, to complete the reading of the 8% of the human genome that was too complex and repetitive in its structure to be resolved 20 years ago. It was worth the wait—a rich array of surprising architectural features is revealed, with major consequences for understanding , variation, and ," says Francis Collins, White House Science Advisor and former director of the National Institutes of Health.

As amazing as it was at the time, the original Human Genome Project left about 8% of the genome blank.

"That's the equivalent of an entire chromosome in human DNA," O'Neill says. That last 8% includes numerous genes and repetitive areas. Most of the newly added DNA sequences were near the repetitive telomeres (long, trailing ends of each chromosome) and centromeres (dense middle sections of each chromosome).

The blanks were a result of the "short-read" technology the Human Genome Project used. It was the only technology for genome mapping available 20 years ago, and it could only read the equivalent of a few words of the genetic code at a time. For example, imagine a section of the genome consisted of the sentence "All work and no play makes Jack a dull boy," repeated nine times in a row. The short read technology would reveal only pieces of it such as "All work", "Jack a", "makes Jack", et cetera. The researchers pieced those short sections together to make the sentence "All work and no play makes Jack a dull boy," but they had no way to know it was repeated nine times.

The T2T project, however, had better tools. The new long-read DNA technology can read entire sentences, even paragraphs, at a time. So the researchers were able to see large chunks, or even full sections, of repeats.

"Generating a truly gapless sequence of the  is a major milestone. We would have loved to have done this 20 years ago, but the technology had to advance. This new reference is a truly solid foundation, without cracks, on which to understand human biology. There are no missing pieces!" says Bob Waterston, a biologist at the University of Washington who worked on the original Human Genome Project.

Many early-career researchers and trainees played pivotal roles in the T2T project. At UConn, Savannah Hoyt, Gabrielle Hartley, and Patrick Grady in Rachel O'Neill's lab, and Luke Wojenski in Leighton Core's lab, were deeply involved in the work. One of their major contributions was developing a compendium of the repeats in the genome. They found the repetitive sections contained mobile elements, which are sections capable of jumping from one part of the genome to the other (the classic example is jumping genes that lead to color changes in corn kernels, such as from red to white); viruses; and new repeats no one had identified before, including some that carry genes. Some of the giant repeats with 10, 20, or 30 copies repeat back-to-back and contain genes that could account for much of human diversity. In the example sentence from earlier, imagine "Jack" is a gene. One person might have 5 copies of it. Another might have 25.

The T2T team got the first look at complete sequences for the central parts of every human chromosome. Called centromeres, they join the different arms of each X-shaped chromosome together. O'Neill's team found that centromeres contain known mobile elements as well as new repeats. Much of the DNA in the centromere seems to be important for maintaining a cell's genetic information through the generations. Centromeres are already known to play a role in DNA replication when cells reproduce, and if they shift their position in the chromosome significantly they can give rise to entirely new species. The complete, gapless centromere sequences constructed by the T2T project will allow a much more nuanced understanding of human centromeres and what they do. The next steps in human genetics research can use the complete T2T  assembly as a jumping off point to identify interesting areas of our DNA.

"The next phase of research will sequence the genomes of many different people to fully grasp human diversity, diseases and our relationship to our closest relatives, the other primates," O'Neill says.

Da:

https://phys.org/news/2022-03-key-humanity-genome.html?utm_source=nwletter&utm_medium=email&utm_campaign=daily-nwletter


Commenti

Post popolari in questo blog

Paracetamolo, ibuprofene o novalgina: quali le differenze? / acetaminophen, ibuprofen, metamizole : what are the differences?

Diminuire l'ossigeno per aumentare la longevità? / Decrease Oxygen to Boost Longevity?

Sci-Fi Eye: il nostro futuro urbano / Sci-Fi Eye: Our Urban Future