Un algoritmo ha scoperto quasi 200 nuovi sistemi Crispr / An algorithm discovered nearly 200 new Crispr systems
Un algoritmo ha scoperto quasi 200 nuovi sistemi Crispr / An algorithm discovered nearly 200 new Crispr systems
Segnalato dal Dott. Giuseppe Cotellessa / Reported by Dr. Giuseppe Cotellessa
Lo hanno creato i ricercatori dell’Mit. I sistemi individuati sembrano promettenti per applicazioni che vanno dall’editing genetico alla diagnostica.
Crispr-cas9 è stata una delle grandi scoperte degli ultimi decenni. Una scoperta da Nobel, che ha rivoluzionato il mondo dell’ingegneria genetica, e si appresta a fare altrettanto con quello della medicina: è di queste settimane, infatti, la notizia dell’approvazione – che vede in questo caso il Regno Unito apripista – della prima terapia genica (ex vivo, cioè un trapianto di cellule modificate geneticamente) basata su Crispr, che dovrebbe aiutare i pazienti colpiti dalle forme più gravi di anemia falciforme e betatalassemia. Mentre questa tecnologia si fa ormai sempre più matura, uno dei suoi pionieri, il biochimico Feng Zhang del Massachusetts Institute of Technology, continua invece a lavorare indefessamente per innovarla. La sua ultima fatica, appena pubblicata su Science, è un algoritmo che ha permesso di scovare quasi 200 nuovi sistemi Crispr mai identificati prima, molti dei quali sembrano già estremamente promettenti per applicazioni che vanno dalla diagnostica, all’editing genetico ad elevatissima precisione.
L'immunità batterica
L’evoluzione di Crispr-Cas9 in una tecnica di taglia e cuci genetico ha origini lontane, nella scoperta di una famiglia di brevi segmenti di Dna ripetuti all’interno del genoma di diversi tipi di batteri archei. Ribattezzate “clustered regularly interspaced short palindromic repeats”, e più note con l’acronimo Crispr, queste sequenze vennero riconosciute col tempo come un meccanismo di difesa importante con cui i batteri combattono i loro principali predatori: i virus noti come batteriofagi. Fondamentalmente, si tratta di meccanismi molecolari che permettono a questi organismi unicellulari di riconoscere il materiale genetico dei virus con cui entra in contatto, e di conferire questa capacità anche ai suoi discendenti. Lavorando di concerto con proteine come Cas9, questi sistemi sono in grado di riconoscere e distruggere i virus in vari modi, e rappresentano quindi un peculiare sistema di immunità acquisita ed ereditaria.
Bene, perché questa lunga premessa? Il fatto è che Crispr-Cas9 è solo uno dei sistemi Crispr esistenti, e più precisamente quello che grazie al lavoro dei due premi Nobel Emmanuelle Charpentier e Jennifer Doudna è stato modificato con successo fino a trasformarlo in un sistema con cui è possibile eliminare, modificare o inserire nel Dna praticamente qualunque sequenza genica. Di sistemi Crispr ne esistono quindi una molteplicità, nascosti nel Dna di milioni di batteri. E solo una frazione ad oggi è stata identificata, e studiata per testarne le potenzialità. È qui, ovviamente, che entra in gioco il nuovo lavoro di Feng Zhang, che come dicevamo è uno dei pionieri dello studio dei sistemi Crispr (tanto che in passato è rimasto invischiato nella battaglia per il brevetto di questa tecnologia miliardaria). Frustrati per la lentezza con cui precedevano le scoperte di nuove sequenze Crispr, Zhang e il suo gruppo di ricerca all’Mit hanno infatti deciso di prendere in prestito alcune delle tecniche utilizzate nello studio del big data, per sviluppare un algoritmo in grado di scoprirle da solo all’interno degli enormi database che raccolgono le sequenze di Dna batterico identificate dai ricercatori di tutto il mondo.
L’algoritmo
L’approccio scelto da Zhang e colleghi è mutuato dai metodi di analisi utilizzati per trovare somiglianze tra oggetti come immagini o brani musicali, per applicazioni come il data mining o il machine learning, e ha permesso ai ricercatori di analizzare in breve tempo miliardi di proteine e di sequenze geniche, concentrandosi sull’identificazione di sequenze simili associate ai sistemi Crispr, che potessero essere raggruppate tra loro. In questo modo, il lavoro di analisi è durato appena qualche settimana, mentre avrebbe richiesto mesi utilizzando tecniche di analisi più tradizionali. I 500 milioni di cluster (raggruppamenti) restituiti dall’algoritmo sono quindi stati studiati più a fondo, e alla fine i ricercatori si sono trovati tra le mani circa 130mila geni associati in qualche modo con i sistemi Crispr, di cui 188 non erano mai stati identificati in precedenza.
Non contenti, i ricercatori guidati da Zhang hanno deciso di sintetizzare e studiare alcuni dei nuovi sistemi Crispr nel loro laboratorio. La maggior parte appartengono alle sei categorie già note in precedenza, ma hanno caratteristiche uniche che li rendono promettenti candidati per future applicazioni pratiche. Un esempio sono diverse varianti del sistema catalogato come di “tipo 1”, composte da un Rna guida (la porzione che identifica il gene su cui va ad agire l’enzima Cas9) formato da 32 basi: 12 in più rispetto ai sistemi simili già noti. Essendo più lunga, la guida ha il potenziale di rivelarsi anche più precisa nell’identificare il suo bersaglio, se trasformata in uno strumento di editing genetico, riducendo il numero di modifiche “off target” (che possono provocare alterazioni indesiderate, e potenzialmente pericolose, in porzioni del Dna diverse da quelle scelte), uno dei problemi che si affrontano con le attuali tecnologie. Essendo comunque di lunghezza contenuta, i nuovi sistemi possono essere utilizzati con le stesse tecnologie sviluppate per Crispr-Cas9. Due di questi sono già stati sperimentati in vitro, dimostrando che possono effettivamente modificare breve porzioni di Dna.
Altri dei nuovi sistemi possiedono proprietà utili a scopo diagnostico (sono in grado di liberare il gene bersaglio dai filamenti di Dna, rendendolo facilmente identificabile). E uno appartiene invece a una nuova classe, che i ricercatori hanno battezzato di “tipo 7”, che ha come bersaglio non il Dna, ma l’Rna, e potrebbe quindi aprire le porte ad una miriade di applicazioni completamente nuove per l’ingegneria genetica. Solo il tempo, chiaramente, ci dirà se qualcuna di queste scoperte troverà realmente applicazione in medicina, o in qualche altro campo. L’algoritmo sviluppato dai ricercatori del Mit comunque è di per sé un’invenzione di valore: può essere utilizzato da chiunque per cercare nuovi geni e proteine, anche non collegate ai sistemi Crispr.
ENGLISH
MIT researchers created it. The identified systems appear promising for applications ranging from gene editing to diagnostics.
Crispr-cas9 was one of the great discoveries of the last decades. A Nobel discovery, which has revolutionized the world of genetic engineering, and is preparing to do the same with that of medicine: in recent weeks, in fact, the news of the approval - with the United Kingdom leading the way in this case - of the first gene therapy (ex vivo, i.e. a transplant of genetically modified cells) based on Crispr, which should help patients affected by the most severe forms of sickle cell anemia and betathalassemia. While this technology is now becoming more and more mature, one of its pioneers, the biochemist Feng Zhang of the Massachusetts Institute of Technology, continues to work tirelessly to innovate it. His latest work, just published in Science, is an algorithm that has made it possible to find almost 200 new Crispr systems never identified before, many of which already seem extremely promising for applications ranging from diagnostics to very high precision gene editing.
Bacterial immunity
The evolution of Crispr-Cas9 into a genetic cutting and sewing technique has distant origins, in the discovery of a family of short repeated DNA segments within the genome of different types of archaeal bacteria. Renamed “clustered regularly interspaced short palindromic repeats”, and better known by the acronym Crispr, these sequences became recognized over time as an important defense mechanism with which bacteria fight their main predators: viruses known as bacteriophages. Fundamentally, these are molecular mechanisms that allow these unicellular organisms to recognize the genetic material of the viruses with which they come into contact, and to confer this ability on their descendants as well. Working in concert with proteins such as Cas9, these systems are able to recognize and destroy viruses in various ways, and therefore represent a unique system of acquired and inherited immunity.
Well, why this long premise? The fact is that Crispr-Cas9 is only one of the existing Crispr systems, and more precisely the one which, thanks to the work of the two Nobel Prize winners Emmanuelle Charpentier and Jennifer Doudna, has been successfully modified to the point of transforming it into a system with which it is possible to eliminate, modify or insert practically any gene sequence into DNA. There are therefore a variety of Crispr systems, hidden in the DNA of millions of bacteria. And only a fraction has been identified to date and studied to test its potential. It is here, obviously, that the new work of Feng Zhang comes into play, who as we said is one of the pioneers of the study of Crispr systems (so much so that in the past he remained entangled in the battle for the patent of this billion-dollar technology). Frustrated by the slow pace with which the discoveries of new CRISPR sequences preceded, Zhang and his research group at MIT decided to borrow some of the techniques used in the study of big data, to develop an algorithm capable of discovering them from only within the enormous databases that collect the bacterial DNA sequences identified by researchers from all over the world.
The algorithm
The approach chosen by Zhang and colleagues is borrowed from the analysis methods used to find similarities between objects such as images or songs, for applications such as data mining or machine learning, and has allowed researchers to analyze billions of proteins in a short time and gene sequences, focusing on the identification of similar sequences associated with Crispr systems, which could be grouped together. In this way, the analysis work lasted just a few weeks, whereas it would have taken months using more traditional analysis techniques. The 500 million clusters returned by the algorithm were then studied more thoroughly, and in the end the researchers found in their hands around 130 thousand genes associated in some way with Crispr systems, of which 188 had never been previously identified.
Not satisfied, the researchers led by Zhang decided to synthesize and study some of the new Crispr systems in their laboratory. Most belong to the six previously known categories, but have unique characteristics that make them promising candidates for future practical applications. An example are various variants of the system cataloged as "type 1", composed of a guide RNA (the portion that identifies the gene on which the Cas9 enzyme acts) made up of 32 bases: 12 more than similar systems already known. Being longer, the guide has the potential to also prove more precise in identifying its target, if transformed into a gene editing tool, reducing the number of “off target” modifications (which can cause unwanted, and potentially dangerous, alterations in portions of the DNA other than those chosen), one of the problems faced with current technologies. However, being of limited length, the new systems can be used with the same technologies developed for Crispr-Cas9. Two of these have already been tested in vitro, demonstrating that they can effectively modify short portions of DNA.
Other of the new systems possess properties useful for diagnostic purposes (they are able to free the target gene from the DNA strands, making it easily identifiable). And one instead belongs to a new class, which researchers have named "type 7", which targets not DNA, but RNA, and could therefore open the doors to a myriad of completely new applications for engineering genetics. Only time, of course, will tell whether any of these discoveries will actually find application in medicine, or in some other field. However, the algorithm developed by MIT researchers is in itself a valuable invention: it can be used by anyone to search for new genes and proteins, even those not connected to Crispr systems.
Da:
https://outlook.live.com/mail/0/inbox/id/AQQkADAwATM3ZmYAZS05N2E2LTFiYzAtMDACLTAwCgAQANDXi1TpX4VJk3XwLNjJUr4%3D
Commenti
Posta un commento