Microproteine e peptidi ampliano i confini del proteoma umano /Microproteins and Peptideins Expand Boundaries of the Human Proteome
Microproteine e peptidi ampliano i confini del proteoma umano / Microproteins and Peptideins Expand Boundaries of the Human Proteome
Un gruppo di ricerca guidato da scienziati del Princess Máxima Center for Pediatric Oncology, della University of Michigan Medical School, dell'EMBL European Bioinformatics Institute e dell'Institute for Systems Biology, ha scoperto più di 1.700 nuove proteine che potrebbero avere implicazioni per le malattie umane, incluso il cancro.
Queste proteine, per lo più di dimensioni molto ridotte, sono state scoperte in quello che viene definito il "proteoma oscuro", ovvero il prodotto genico derivante da sezioni di DNA precedentemente trascurate. Queste proteine possiedono proprietà insolite, che hanno spinto gli scienziati a coniare un nuovo concetto, quello delle peptidi, per comprendere meglio la loro biologia potenzialmente unica. Il co-responsabile della ricerca, Sebastiaan van Heesch, PhD, a capo di un gruppo di ricerca presso il Princess Máxima Center, ha commentato: "Sappiamo che l'attuale panoramica delle proteine riconosciute non offre un quadro completo. Con questo studio, dimostriamo che migliaia di sequenze genetiche trascurate contribuiscono al proteoma oscuro producendo una nuova classe di molecole simili a proteine, le microproteine, che finora erano sfuggite all'attenzione. Tuttavia, per la maggior parte di esse, non sappiamo ancora quale sia la loro funzione".
Il co-responsabile della ricerca e co-autore corrispondente Robert Moritz, PhD, professore e responsabile della proteomica presso l'Institute for Systems Biology, ha inoltre osservato: "La biologia si è a lungo basata su un gruppo relativamente ristretto di proteine ben caratterizzate per spiegare la logica regolatoria della cellula, ma i peptidi suggeriscono che al di sotto di questo strato familiare si trovi un intero strato inesplorato di attori molecolari i cui ruoli funzionali nella regolazione genica, nella segnalazione e nella citopersistenza, molti dei quali stiamo solo iniziando ad immaginare. Date le loro dimensioni ridotte e la diversità dei contesti cellulari in cui compaiono, credo che i peptidi possano rivelarsi tra le molecole regolatorie più versatili ed importanti che abbiamo incontrato finora nella biologia umana. Questa non è la fine di una ricerca, ma l'apertura di un vasto e fertile territorio nuovo che l'intera comunità scientifica potrà esplorare e sfruttare, e non vedo l'ora di vedere cosa la più ampia comunità scientifica scoprirà man mano che queste molecole, e molte altre ancora da confermare, verranno portate alla luce."
Il dottor John Prensner, neuro-oncologo pediatrico presso la Facoltà di Medicina dell'Università del Michigan e co-responsabile della ricerca, insieme a Van Heesch e Moritz, è co-autore senior e co-autore corrispondente dell'articolo pubblicato su Nature dal titolo " Expanding the human proteome with microproteins and peptideins" ( Espansione del proteoma umano con microproteine e peptidi ). Il gruppo sta condividendo le proprie scoperte con gli scienziati di tutto il mondo in un formato open-source per stimolare ulteriori ricerche.
Van Heesch ha aggiunto: “Con il crescente interesse da parte dell'industria e del mondo accademico, i peptidi sono al centro di numerose iniziative per lo sviluppo di farmaci. Allo stesso modo, li vediamo sempre più spesso come attori importanti in diverse patologie, compresi i tumori infantili. Ci auguriamo di ispirare una nuova ondata di ricerca sui peptidi e di svelare nuove conoscenze e bersagli farmacologici in tutta la biologia umana, in particolare per lo sviluppo di immunoterapie cellulari e vaccini contro il cancro”.
Lo studio è opera del consorzio TransCODE, una collaborazione internazionale di oltre 60 ricercatori provenienti da più di 30 istituzioni in tutto il mondo, co-diretta dal Princess Máxima Center for Pediatric Oncology nei Paesi Bassi, dalla University of Michigan Medical School, dall'EMBL European Bioinformatics Institute di Hinxton e dall'Institute for Systems Biology di Seattle.
I geni del DNA forniscono le istruzioni per la produzione di peptidi da parte delle cellule. Storicamente, i peptidi sono stati chiamati proteine se erano sufficientemente lunghi e se esistevano prove del loro ruolo biologico, come ad esempio la presenza della stessa proteina in diverse specie nel corso dell'evoluzione. "I geni che codificano per le proteine sono alla base delle indagini biomediche, compresa la stragrande maggioranza dei programmi di sviluppo di farmaci", hanno scritto gli autori. Un ampio database internazionale di proteine, accuratamente selezionato, contiene circa 19.500 entità.
Ma sempre più scienziati ritengono che la definizione tradizionale di proteina debba essere ampliata. "Negli ultimi anni, si è acceso un acceso dibattito sulla questione se il genoma umano codifichi un numero sostanzialmente maggiore dei circa 19.500 geni canonici che codificano per le proteine", ha continuato lo scienziato. "Pertanto, qualsiasi aggiunta massiccia di geni che codificano per le proteine crea ripercussioni a catena in tutte le bioscienze umane."
Nel loro studio recentemente pubblicato, il gruppo ha analizzato oltre 7.200 sezioni di DNA precedentemente poco studiate, chiamate frame di lettura aperti non canonici (ncORF). Hanno scoperto che circa il 25% di queste sezioni, ovvero più di 1.700, genera molecole simili a proteine rilevabili. Queste proteine, più piccole delle proteine tradizionali, sono definite "microproteine".
Per generare i loro risultati, hanno analizzato 3,7 miliardi di singoli bit di dati grezzi che potrebbero supportare proteine note e precedentemente sconosciute, basandosi su 95.520 esperimenti. "Dimostriamo che circa il 25% di un set di 7.264 ncORF dà origine a peptidi rilevabili in un'analisi su larga scala di 95.520 esperimenti di proteomica", hanno scritto. Il processo ha richiesto circa 20.000 ore di lavoro ininterrotto da parte dei computer. Hanno trovato 1.785 microproteine, un numero che a prima vista aumenterebbe i database proteici di quasi il 10%.
Moritz ha inoltre spiegato: "Utilizzando la nostra collaudata Trans Proteomic Pipeline su quasi 100.000 esperimenti di spettrometria di massa, comprendenti 3,7 miliardi di spettri – derivati dai dati di spettrometria di massa pubblicamente disponibili a livello mondiale, con i risultati archiviati in PeptideAtlas presso l'ISB affinché la comunità scientifica possa visualizzarli e condividerli – siamo stati in grado di confermare, con elevata certezza, l'esistenza di oltre 1.700 di questi peptidi di nuova identificazione che altrimenti sarebbero rimasti in gran parte invisibili alla scienza."
Ma la maggior parte di queste 1.785 microproteine non assomigliava alle altre 19.500 proteine tradizionali. Ad esempio, erano molto piccole: il 65% era composto da meno di 50 amminoacidi, rispetto a meno dell'1% delle 19.500 precedentemente catalogate. Esaminando più attentamente le microproteine, i ricercatori hanno notato che solo poche, forse una dozzina, assomigliavano alle proteine tradizionali. Il gruppo ha quindi trascorso più di un anno cercando di dare un senso alla restante massa.
Collaborando con esperti di proteine di tutto il mondo nell'ambito del consorzio TransCODE, gli scienziati hanno coniato un nuovo concetto biologico, che hanno chiamato peptideina. Per decenni, la comunità scientifica ha avuto una visione binaria del rapporto tra DNA umano e proteine umane: un dato frammento di DNA o produce una proteina oppure no. Nel loro nuovo studio, gli scienziati propongono una terza possibilità, ovvero che il DNA possa produrre una proteina, una peptide, oppure nessuna delle due.
Il gruppo ha definito la peptideina come una molecola simile ad una proteina presente nelle cellule, ovvero composta da amminoacidi, proprio come le proteine. Tuttavia, il ruolo della peptideina è ambiguo. Forse ha una funzione nella normale biologia umana, forse no; questa è la differenza fondamentale rispetto alle proteine tradizionali, per le quali si ritiene che tutte abbiano una funzione nella normale biologia umana, anche se i dettagli di tale funzione non sono ancora del tutto noti. "Per promuovere la ricerca biologica su questi ncORF, ci avvaliamo del termine emergente di peptideina, che definiamo come un ORF con traduzione dell'RNA e sintesi proteica sperimentalmente confermate, ma per il quale i dati sono attualmente insufficienti per rivendicare lo status convenzionale di gene codificante per proteine", hanno affermato i ricercatori nel loro rapporto.
È importante sottolineare che questa definizione di peptide lascia aperta la possibilità che in futuro venga classificato come "proteina", a patto che gli scienziati raccolgano ulteriori prove a riguardo. Per iniziare a esplorare questa ipotesi, il gruppo ha cercato i peptidi senza i quali le cellule non possono sopravvivere. Questi cosiddetti peptidi pan-essenziali potrebbero rappresentare importanti bersagli farmacologici per il trattamento del cancro e di altre patologie.
Utilizzando la tecnica di editing genetico CRISPR su larga scala, gli scienziati hanno individuato sei peptidi promettenti. Ad esempio, uno di questi era un peptide prodotto da OLMALINC, una sequenza genetica che si riteneva non producesse proteine. Quando i ricercatori hanno disattivato questo gene, l'85% di oltre 485 linee cellulari tumorali ha mostrato una ridotta sopravvivenza. I ricercatori hanno confermato che questo effetto deriva dal peptide stesso, non dalla molecola di RNA a cui è legato, e hanno scoperto che svolge un ruolo nella divisione cellulare e nella risposta al danno al DNA. "Il nostro lavoro mette in luce c10riboseqorf92 (nel trascritto OLMALINC)", hanno commentato. "...sebbene non disponiamo ancora di prove sufficienti che questo ncORF codifichi una proteina a tutti gli effetti, i suoi fenotipi basati su CRISPR nel contesto delle cellule tumorali sono intriganti."
Molti dei peptidi recentemente scoperti vengono presentati sulla superficie cellulare per essere riconosciuti dal sistema immunitario, il che li rende potenziali bersagli per l'immunoterapia contro il cancro. Diverse di queste molecole, presentate al sistema immunitario, sono già in fase di sviluppo come potenziali bersagli farmacologici, e sia il mondo accademico che quello industriale mostrano un crescente interesse nello sfruttare questa nuova classe di antigeni tumorali. I peptidi potrebbero inoltre far luce su malattie genetiche che l'analisi genetica convenzionale non è stata in grado di spiegare, semplicemente perché la diagnostica genetica ignorava che queste molecole fossero codificate dal genoma umano.
I membri del consorzio avevano precedentemente scoperto un ruolo essenziale per una microproteina, ASNSD1-uORF, nei bambini affetti da una forma ad alto rischio di tumore cerebrale, il medulloblastoma. Gli scienziati del Centro Principessa Máxima stanno ora conducendo ulteriori ricerche per determinarne il ruolo in altri tumori pediatrici con l'oncogene MYC attivato, come il neuroblastoma.
Van Heesch ha commentato: "È stato davvero speciale discutere e decidere cosa fare con questa nuova classe di molecole, dato che avevamo raccolto sufficienti prove preliminari per sospettare che potessero essere diffuse in diversi tipi di cellule e tessuti. Classificando queste molecole dalla funzionalità sconosciuta come peptidi, abbiamo dato loro un posto formale nei database di riferimento, in modo che la comunità scientifica più ampia possa studiarle."
Nel loro articolo, i ricercatori hanno concluso: "L'estensione del proteoma ancora da scoprire è una delle questioni centrali della biomedicina umana. Questo lavoro riflette la collaborazione tra diversi consorzi, tra cui il TransCODE Consortium, il progetto HUPO-HPP/PeptideAtlas, il progetto di immunopeptidomica HIPP ed il gruppo di annotazione genica GENCODE, al fine di sviluppare un approccio generalizzabile per comprendere quali ncORF possano essere interpretati come codificanti proteine... Grazie ai nostri sforzi, inseriamo microproteine e molecole proteiche alternative nell'annotazione genica di riferimento, definendole come geni codificanti proteine o peptidi, un nuovo concetto che si riferisce a molecole proteiche confermate di conseguenza indeterminata."
Prensner ha aggiunto: "Stiamo appena iniziando a capire cosa questo 'proteoma oscuro' ha da offrire. È come il trailer di un film. Vediamo i contorni di una visione rivoluzionaria della biologia umana. Siamo incredibilmente entusiasti del fatto che i prossimi anni apriranno nuove porte per contribuire a risolvere e curare malattie umane come il cancro".
Moritz ha inoltre affermato: "Il nostro lavoro collaborativo rappresenta il culmine di decenni di investimenti da parte di agenzie di finanziamento federali nella costruzione dell'infrastruttura computazionale e di dati necessaria per analizzare il proteoma su una scala davvero senza precedenti presso l'Istituto di Biologia dei Sistemi... Ciò che mi entusiasma di più non è semplicemente l'esistenza di queste molecole, ma ciò che la loro esistenza implica."
I ricercatori stanno rendendo pubblici tutti gli ncORF, i peptidi e gli spettri tramite PeptideAtlas
ENGLISH
A research team led by scientists at the Princess Máxima Center for Pediatric Oncology, the University of Michigan Medical School, EMBL European Bioinformatics Institute, and the Institute for Systems Biology, has uncovered more than 1,700 new proteins that could have implications for human diseases, including cancer.
Mostly very small, these proteins have been discovered in what’s known as the “dark proteome,” which covers gene products from previously overlooked sections of DNA. These proteins have unusual properties, motivating scientists to coin a new concept, peptideins, to help understand their potentially unique biology. Research co-lead Sebastiaan van Heesch, PhD, a group leader at the Princess Máxima Center, commented, “We know that the current overview of recognized proteins doesn’t capture the full picture. With this study, we show that thousands of overlooked genetic sequences contribute to the dark proteome by producing a new class of protein-like molecules, microproteins, that had been missed before now. But for most of them, we don’t yet know what they do.”
Research co-lead and co-corresponding author Robert Moritz, PhD, professor and head of proteomics at the Institute for Systems Biology, further noted, “Biology has long relied on a relatively small cast of well-characterized proteins to explain the regulatory logic of the cell, but peptideins suggest that beneath that familiar layer lies an entire untapped layer of molecular actors whose functional roles in gene regulation, signaling, and cytopersistence, many we are only beginning to imagine. Given their smaller size and the diversity of cellular contexts in which they appear, I believe peptideins may prove to be among the most versatile and consequential regulatory molecules we have yet encountered in human biology. This is not the end of a search—it is the opening of a vast and fertile new territory for the entire scientific community to explore and exploit, and I look forward to seeing what the broader scientific community uncovers as these molecules, and many more that are yet to be confirmed, are brought into the light.”
Research co-lead John Prensner, MD, pediatric neurooncologist at the University of Michigan Medical School, together with Van Heesch and Moritz, are co-senior and co-corresponding authors of the researchers’ published paper in Nature titled “Expanding the human proteome with microproteins and peptideins.” The team is sharing its discoveries with scientists worldwide in an open-source format to stimulate further research.
Van Heesch added, “With growing interest in industry and academia, peptideins are at the center of multiple drug development initiatives. Similarly, we see them increasingly turning up as important players in diseases, including childhood cancers. We hope to inspire a new wave of research into peptideins and to unlock new insights and drug targets across human biology, particularly for the development of cellular immunotherapies and cancer vaccines.”
The study is the work of the TransCODE Consortium, an international collaboration of more than 60 researchers at over 30 institutions worldwide, co-led by the Princess Máxima Center for Pediatric Oncology in the Netherlands, the University of Michigan Medical School, the EMBL European Bioinformatics Institute in Hinxton, and the Institute for Systems Biology in Seattle.
Genes in DNA provide the recipe for cells to produce peptides. Historically, peptides have been called proteins if they are long enough and have existing evidence for a biological role, such as the appearance of the same protein across species in evolution. “Protein-coding genes are the bedrock of biomedical investigations, including the overwhelming majority of drug development programs,” the authors wrote. A large, curated international database of proteins contains some 19,500 entities.
But increasingly, scientists believe the traditional definition of a protein needs to be broadened. “Whether the human genome encodes substantially more than the approximately 19,500 canonical protein-coding genes has sparked a spirited debate in recent years,” the scientist continued. “Therefore, any wholesale addition of protein-coding genes creates ripple effects across human bioscience.”
Through their newly reported study the team looked at more than 7,200 previously understudied sections of the DNA called non-canonical open reading frames (ncORFs). They found that some 25% of these sections—more than 1,700—generated detectable protein-like molecules. These proteins, smaller than traditional proteins, are referred to as “microproteins.”
Generating their results involved looking at 3.7 billion individual bits of raw data that may support known and previously unknown proteins—drawing upon 95,520 experiments. “We show that about 25% of a set of 7,264 ncORFs gives rise to detectable peptides in a large-scale analysis of 95,520 proteomics experiments,” they wrote. The process took around 20,000 hours for computers to complete, working non-stop. They found 1,785 microproteins, a number that at first glance would increase the protein databases by nearly 10%.
Moritz further explained, “By deploying our battle-hardened Trans Proteomic Pipeline across nearly 100,000 mass spectrometry experiments encompassing 3.7 billion spectra—derived from the world’s collective publicly available mass spectrometry data, with the results housed within PeptideAtlas at ISB for the scientific community to view and share—we were able to confirm, with high confidence, the existence of more than 1,700 of these newly identified peptideins that would otherwise have largely remained invisible to science.”
But most of these 1,785 microproteins didn’t resemble the other 19,500 traditional proteins. For example, they were very small: 65% were fewer than 50 amino acids in length, compared to less than 1% of the 19,500 previously catalogued. Looking more closely at the microproteins the investigators saw that only a few—perhaps a dozen—resembled the traditional proteins. The team then spent more than a year trying to make sense out of the remaining bulk.
Working with protein experts from across the globe in the TransCODE consortium, the scientists coined a new biological concept, which they coined peptidein. For decades, the research community has had a binary view of the relationship between human DNA and human proteins. A given piece of DNA either does or does not produce a protein. In their new study, the scientists propose a third choice, which is that DNA could make a protein, a peptidein, or neither.
The team defined a peptidein as existing in cells as a protein-like molecule, meaning that it is made of amino acids, as are proteins. But the role of a peptidein is ambiguous. Perhaps it has a function in normal human biology, or perhaps not; this is the key distinction with traditional proteins, where all are believed to have a function in normal human biology even if the details of that function are not fully known yet. “To advance these ncORFs in biological inquiry, we invoke the emerging umbrella term of peptidein, which we define as an ORF with experimentally confirmed RNA translation and protein synthesis, but for which the data are currently insufficient to claim conventional protein-coding gene status,” the investigators stated in their report.
Importantly, this definition of peptidein leaves the door open for it to become a ‘protein’ in the future—that is, if scientists gather more evidence on it. To start exploring this idea, the team searched for peptideins without which cells cannot survive. These so-called pan-essential peptideins can be important candidate drug targets in cancer and other diseases.
Using large-scale CRISPR gene editing, the scientists found six peptideins that looked promising. For example, one of these was a peptidein produced from OLMALINC, a genetic sequence previously thought not to produce proteins. When the researchers switched this gene off, 85% of more than 485 cancer cell lines showed impaired survival. The researchers confirmed that this effect comes from the peptidein itself, not the RNA molecule it sits on, and found that it plays a role in cell division and DNA damage response. “Our work here highlights c10riboseqorf92 (in the OLMALINC transcript),” they commented. “… while we do not yet have sufficient evidence that this ncORF encodes a bona fide protein, its CRISPR-based phenotypes in the context of cancer cells are intriguing.”
Many of the newly detected peptideins are presented on cell surfaces for recognition by the immune system, making them potential targets for cancer immunotherapy. A number of such molecules presented to the immune system are already under development as drug targets, and there is growing interest from both academia and industry in exploiting this new class of cancer antigens. Peptideins could also shed light on genetic diseases that conventional gene analysis has been unable to explain, simply because genetic diagnostics were unaware that these molecules were encoded by the human genome.
Members of the consortium had previously uncovered an essential role for a microprotein, ASNSD1-uORF, in children with a high-risk form of the brain cancer, medulloblastoma. Scientists at the Princess Máxima Center are now carrying out further research to determine its role in additional pediatric cancers with the activated MYC oncogene, such as neuroblastoma.
van Heesch commented, “It felt really special to discuss and decide what to do with this new class of molecules, as we had gathered enough early evidence to suspect that they might be widespread across cell types and tissues. By classifying these molecules of unknown functionality as peptideins, we’ve given them a formal place in reference databases so the wider community can study them.”
In their paper the researchers concluded, “The extent of the undiscovered proteome is one of the central questions in human biomedicine. This work reflects the multi-consortium collaboration between the TransCODE Consortium, the HUPO-HPP/PeptideAtlas project, the HIPP immunopeptidomics project and the GENCODE gene annotation group to coalesce a generalizable approach towards understanding which ncORFs can be understood as encoding proteins … Through our efforts, we bring microproteins and alternative protein molecules into reference gene annotation by defining them as either a protein-coding gene or a peptidein, a new concept referring to confirmed protein molecules of indeterminate consequence.”
Prensner added, “We’re just beginning to see what this ‘dark proteome’ has to offer. It’s like the trailer to a movie. We see the outline of a game-changing view of human biology. We’re incredibly excited that the coming years will open new doors to help solve and treat human diseases such as cancer.”
Moritz further stated, “Our collaborative work represents a culmination of decades of investment from federal funding agencies in building the computational and data infrastructure needed to interrogate the proteome at truly unprecedented scale at the Institute for Systems Biology … What excites me most is not simply that these molecules exist, but what their existence implies.”
The researchers are making we make all ncORFs, peptides and spectra publicly available through PeptideAtlas.
Da:
https://www.genengnews.com/topics/omics/microproteins-and-peptideins-expand-boundaries-of-the-human-proteome/?_hsenc=p2ANqtz-8JOEmx2925iOGj-F9wAPgGcXdOSaw3X36bOcHYewQ20yCbWiyABSNbV-YjTtXNBxV5yZy8O4TqHSEAHS52Lfi5h2L2a6l61Awak734aqH4FhNpFHw&_hsmi=417693905
Commenti
Posta un commento