AlphaGenome di DeepMind prevede la funzione della variazione genetica, comprese le malattie / DeepMind’s AlphaGenome Predicts Genetic Variation Function, Including Disease
AlphaGenome di DeepMind prevede la funzione della variazione genetica, comprese le malattie / DeepMind’s AlphaGenome Predicts Genetic Variation Function, Including Disease
Segnalato dal Dott. Giuseppe Cotellessa / Reported by Dr. Giuseppe Cotellessa
Piccole variazioni nella sequenza del DNA possono alterare la risposta di un organismo all'ambiente o la suscettibilità alle malattie. Interpretare l'impatto della variazione della sequenza del genoma rimane una sfida per la ricerca. Le varianti non codificanti che si trovano al di fuori delle regioni codificanti per proteine sono particolarmente difficili da interpretare a causa della diversità delle conseguenze molecolari.
Il gruppo di Google DeepMind dietro AlphaFold, vincitore del premio Nobel, ha ora pubblicato su Nature AlphaGenome, un modello di sequenza del DNA che migliora la previsione dell'effetto delle varianti regolatrici per comprendere la funzione del genoma .
Le applicazioni di AlphaGenome includono l'identificazione di nuovi bersagli terapeutici e la progettazione di DNA sintetico con specifiche funzioni regolatorie. Gli autori affermano che AlphaGenome è particolarmente adatto allo studio di varianti rare con effetti potenzialmente significativi, come quelle che causano rare malattie mendeliane.
" Determinare la rilevanza di diverse varianti non codificanti può essere estremamente impegnativo, soprattutto su larga scala", ha affermato Marc Mansour, PhD, professore presso l'University of College London specializzato in neoplasie ematologiche. "Questo strumento fornirà un tassello cruciale del puzzle, consentendoci di stabilire connessioni migliori per comprendere malattie come il cancro".
AlphaGenome prende come input una lunga sequenza di DNA, fino a un milione di coppie di basi, e prevede migliaia di proprietà molecolari che caratterizzano l'attività regolatrice, tra cui le posizioni in cui i geni iniziano e finiscono in diversi tipi di cellule e tessuti, i siti di splicing, la produzione di RNA e l'accessibilità al DNA.
Questo contesto di sequenza estesa è fondamentale per coprire regioni regolate da geni distanti. I modelli precedenti dovevano trovare un compromesso tra lunghezza della sequenza e risoluzione, il che limitava la gamma di modalità modellabili.
In termini di efficienza, AlphaGenome è in grado di valutare l'impatto di una variante genetica su una gamma di proprietà molecolari in un secondo, confrontando le previsioni di sequenze mutate e non mutate.
Molte malattie genetiche rare, come l'atrofia muscolare spinale ed alcune forme di fibrosi cistica, possono essere causate da errori nello splicing dell'RNA. In particolare, AlphaGenome può modellare esplicitamente la posizione ed il livello di espressione di queste giunzioni direttamente dalla sequenza, offrendo approfondimenti sulle conseguenze delle varianti genetiche sullo splicing dell'RNA.
"Per la prima volta, abbiamo un unico modello che unifica il contesto a lungo raggio, la precisione di base e le prestazioni all'avanguardia in un ampio spettro di attività genomiche", ha affermato Caleb Lareau, PhD, ricercatore principale presso il Memorial Sloan Kettering Cancer Center.
I dati di addestramento sono stati ottenuti da grandi consorzi pubblici tra cui ENCODE, GTEX, 4D Nucleome e FANTOM5, che hanno misurato sperimentalmente le proprietà di regolazione genica in centinaia di tipi di cellule e tessuti umani e murini.
In lavori futuri, gli autori sottolineano che catturare accuratamente l'influenza di elementi regolatori a grandi distanze, come quelle che si trovano a 100.000 lettere di DNA, rimane un limite per AlphaGenome. Un'altra priorità è migliorare la capacità del modello di catturare modelli cellulari e tissutali specifici.
Inoltre, AlphaGenome caratterizza le prestazioni su singole varianti genetiche e non è stato convalidato per la previsione del genoma personale. Inoltre, sebbene AlphaGenome preveda risultati molecolari, il modo in cui le variazioni genetiche portano a tratti o malattie complessi coinvolge processi biologici più ampi, come fattori di sviluppo e ambientali, che esulano dall'ambito diretto del modello.
DeepMind ha reso AlphaGenome disponibile per la ricerca non commerciale.
ENGLISH
Small variations in DNA sequence can alter an organism’s response to the environment or susceptibility to disease. Interpreting the impact of genome sequence variation remains a research challenge. Non-coding variants that lie outside of protein-coding regions are particularly difficult to interpret because of the diversity of molecular consequences.
The Google DeepMind team behind Nobel Prize winning AlphaFold has now published AlphaGenome, a DNA sequence model that advances regulatory variant-effect prediction to understand genome function, in Nature.
AlphaGenome’s applications include the identification of new therapeutic targets and design of synthetic DNA with specific regulatory function. The authors state that AlphaGenome is particularly suitable for studying rare variants with potentially large effects, such as those causing rare Mendelian disorders.
“Determining the relevance of different non-coding variants can be extremely challenging, particularly to do at scale,” said Marc Mansour, PhD, a professor at University of College London who focuses on hematological malignancies. “This tool will provide a crucial piece of the puzzle, allowing us to make better connections to understand diseases like cancer.”
AlphaGenome takes a long DNA sequence, up to one million base pairs, as input, and predicts thousands of molecular properties characterizing regulatory activity, including locations of where genes begin and end in different cell types and tissues, splicing sites, RNA production, and DNA accessibility.
This long sequence context is crucial to cover regions that are regulated by distant genes. Previous models had to trade off sequence length and resolution, which limited the range of modalities that could be modeled.
In efficiency, AlphaGenome is reported to score the impact of a genetic variant on a range of molecular properties in one second by comparing predictions of mutated and unmutated sequences.
Many rare genetic diseases, such as spinal muscular atrophy and some forms of cystic fibrosis, can be caused by errors in RNA splicing. Notably, AlphaGenome can explicitly model the location and expression level of these junctions directly from sequence, offering deeper insights about the consequences of genetic variants on RNA splicing.
“For the first time, we have a single model that unifies long-range context, base-level precision and state-of-the-art performance across a whole spectrum of genomic tasks,” said Caleb Lareau, PhD, principal investigator at Memorial Sloan Kettering Cancer Center.
Training data was sourced from large public consortia including ENCODE, GTEX, 4D Nucleome and FANTOM5, which experimentally measured gene regulation properties across hundreds of human and mouse cell types and tissues.
In future work, the authors note that accurately capturing the influence of regulatory elements at large distances, such as those that are 100,000 DNA letters away, remains a limitation for AlphaGenome. Another priority is to improve the model’s ability to capture cell and tissue-specific patterns.
Additionally, AlphaGenome characterizes the performance on individual genetic variants and has not been validated for personal genome prediction. Additionally, while AlphaGenome predicts molecular outcomes, how genetic variations lead to complex traits or diseases involve broader biological processes, such as developmental and environmental factors, that are beyond the direct scope of the model.
DeepMind has made AlphaGenome available for non-commercial research.
Da:
https://www.genengnews.com/topics/artificial-intelligence/deepminds-alphagenome-predicts-genetic-variation-function-including-disease/?_hsenc=p2ANqtz-8ofhHHiqb_KvYNJn2GalVOV4ZHEB0hJWjk0-HXMwfPGni0-rlGKF5E2Ye--urAS73FtukIhIxOE-FzGhUs_8u0UrCNFvtdmN4zhSTskDfXR1LBgkI&_hsmi=401251276
Commenti
Posta un commento