Selezione delle dimensioni di nuova generazione per un flusso di lavoro di sequenziamento a lettura lunga ottimizzato / Next-Generation Size Selection for Optimized Long-Read Sequencing Workflow

Selezione delle dimensioni di nuova generazione per un flusso di lavoro di sequenziamento a lettura lunga ottimizzatoNext-Generation Size Selection for Optimized Long-Read Sequencing Workflow


Segnalato dal Dott. Giuseppe Cotellessa / Reported by Dr. Giuseppe Cotellessa



La tecnologia Ranger di Yourgene Health può consentire una selezione precisa delle dimensioni per preparare le librerie di DNA PacBio SMRTbell per il sequenziamento ad alta fedeltà.

L'analisi del genoma intero svolge un ruolo fondamentale nello sviluppo di diagnosi, terapie e vaccini salvavita, con un crescente interesse per le regioni non codificanti e le varianti strutturali, che possono avere un impatto sull'attività genica e fornire nuove informazioni sulla patogenesi delle malattie.

Alcune regioni genomiche sono più difficili da sequenziare. I centromeri ed i telomeri contengono sequenze altamente ripetitive; le regioni ricche di AT o GC rispondono male ai protocolli di amplificazione richiesti da alcune piattaforme; e le sequenze palindromiche o le strutture a forcina sono difficili da denaturare, rendendo tali regioni difficili per gli strumenti di sequenziamento che includono una fase di denaturazione. Inoltre, le lunghe letture che sequenziano attraverso regioni ripetute e riarrangiamenti strutturali semplificano la definizione di cambiamenti nel genoma che in genere abbiamo trovato difficili da ricostruire con gli strumenti bioinformatici associati alle tecnologie di sequenziamento a lettura corta.

Sequenziamento a lettura lunga in tempo reale di singole molecole

In particolare, il sequenziamento a lettura lunga potrebbe contribuire a far progredire la genomica risolvendo alcune delle regioni più difficili del genoma umano, individuando posizioni precedentemente inaccessibili e dando un senso ai deserti di materiale non codificante. Attraverso l'utilizzo di frammenti più lunghi, potrebbe essere rivelato l'intero spettro di variazione genetica, offrendo un contesto più ampio e dando opportunità per la scoperta di nuovi meccanismi di malattia.

Il sequenziamento a lettura lunga offre diversi vantaggi rispetto ad altri metodi di sequenziamento di nuova generazione, il più ovvio dei quali è la lunghezza effettiva della sequenza. Può anche gestire regioni contenenti ripetizioni e varianti strutturali e può definire la metilazione da campioni di DNA nativi.

Il sequenziamento a lettura lunga produce dati genomici generando singole letture di lunghezza compresa tra 1.000 e 20.000 nucleotidi o più, mentre la maggior parte delle tecnologie di sequenziamento a lettura breve utilizza frammenti lunghi da 50 a 300 basi e spesso perdono informazioni genetiche vitali durante il processo di amplificazione.

l sequenziamento Single Molecule Real-Time (SMRT) di PacBio utilizza singole molecole di DNA immobilizzate su un chip nanofluidico in pozzetti miniaturizzati, noti come guide d'onda a modalità zero (ZMW). Una polimerasi incorpora nucleotidi marcati e l'emissione di luce viene misurata in tempo reale.

Il formato della libreria SMRTbell prevede di tappare entrambi i lati dei frammenti di DNA con adattatori hairpin ligati, dove si attaccano i primer di sequenziamento. Ciò crea un modello circolare per la navigazione della polimerasi. Questi possono essere costruiti per librerie di lunghezze di inserto variabili, da 250 bp ad oltre 25.000 bp.

Il sequenziamento circolare consensuale, ovvero la capacità di sequenziare la stessa molecola di DNA più volte e quindi generare lunghe letture ad alta fedeltà (HiFi), è esclusivo del sistema SMRT e aiuta a massimizzare la precisione mediante il riferimento incrociato di ogni copia della molecola con numerose altre copie.

Superare le sfide della frammentazione del DNA

Tutto il DNA è soggetto a frammentazione, sia che derivi da una matrice biologica o sia creato durante la sintesi genica; pertanto, qualsiasi campione di DNA conterrà una gamma di dimensioni di frammenti. Per sfruttare davvero i veri vantaggi del sequenziamento di lunghe letture, è necessario rimuovere questi frammenti più corti, che altrimenti potrebbero essere sequenziati preferibilmente.

La selezione delle dimensioni del DNA può escludere frammenti corti, massimizzando la resa dei dati grazie alla garanzia che i frammenti con il contenuto informativo più elevato non vengano bloccati nell'accesso ai centri di rilevamento (ad esempio, ZMW) da frammenti di DNA più corti.

Soluzioni di selezione dimensionale di nuova generazione

 Iniziare con frammenti puliti e di lunghezza appropriata per le letture HiFi può accelerare la ricerca riducendo il tempo di elaborazione dei dati e di calcolo necessario dopo il sequenziamento. Ranger Technology di Yourgene Health è un processo protetto da brevetto per automatizzare l'analisi del DNA basata sull'elettroforesi e la selezione dimensionale. Il suo sistema di visione artificiale a fluorescenza e gli algoritmi di analisi delle immagini forniscono un'interpretazione in tempo reale del processo di separazione del DNA.

Per i protocolli di selezione delle dimensioni, la tensione è modulata per canale per controllare la migrazione del DNA e consentire l'arrivo sincronizzato delle dimensioni desiderate dei frammenti nei pozzetti di estrazione. Le rese di recupero sono costantemente superiori al 70%, mentre i volumi di estrazione possono essere mantenuti al di sotto dei 50 µL per garantire un'elevata concentrazione di DNA per l'elaborazione a valle.

Ranger Technology alimenta una varietà di piattaforme di preparazione di campioni di DNA. Tra queste, LightBench, uno strumento tre in uno che offre frazioni di dimensioni di DNA automatizzate, quindi la pulizia delle perle e la selezione, l'analisi della lunghezza dei frammenti e la concentrazione e la quantificazione fluorometrica.

LightBench aderisce alla specifica Standardization in Lab Automation (SiLA 2). Come tale, può essere azionato manualmente od integrato in un flusso di lavoro completamente automatizzato con gestori di liquidi di terze parti, fornendo una soluzione di selezione delle dimensioni scalabile per il sequenziamento a lettura lunga.

Arricchimento delle librerie di sequenziamento a lettura lunga

La selezione delle dimensioni di nuova generazione è stata valutata in un benchmarking sperimentale di 84 campioni di DNA genomico umano da sangue fresco per la preparazione della libreria di sequenziamento HiFi long-read. Il software Ranger Technology è stato impostato secondo le raccomandazioni del produttore per LightBench. I campioni sono stati combinati con Dual Dye Loading Buffer contenente un marcatore da 7 kb (CG-14000-31-31), miscelati accuratamente e centrifugati per rimuovere eventuali bolle d'aria. La cassetta è stata preparata ed il tampone in eccesso è stato rimosso dal serbatoio prima di caricare i campioni nei pozzetti. Dopo l'elettroforesi, i campioni sono stati estratti utilizzando l'array In-Channel Filter. Le frazioni selezionate in base alle dimensioni sono state quindi pulite con microsfere e le distribuzioni di concentrazione e lunghezza dei frammenti sono state valutate prima del sequenziamento.

Utilizzando LightBench, i ricercatori hanno potuto ottenere rese costanti per i cutoff da 8 kb e 10 kb su tutti i campioni con zero guasti. Il cutoff da 8 kb ha prodotto un recupero medio di circa l'83% della libreria di campane SMRT di input, mentre il cutoff da 10 kb ha recuperato una media di circa il 67%.

Dopo la preparazione della libreria e la selezione delle dimensioni con LightBench, 84 campioni sono stati sequenziati sulla piattaforma Revio (PacBio). La lunghezza media di lettura HiFi era di 18.517,5 bp e la resa media dei dati HiFi era di 101,27 Gb/cellula SMRT.

Questi risultati dimostrano che escludendo frammenti più piccoli, gli input di lettura lunga vengono ottimizzati per fornire lunghezze di lettura HiFi medie maggiori e rese di dati superiori a 100 Gb, dimostrando che LightBench è un metodo di selezione delle dimensioni efficace sul sistema Revio.

Rivoluzionare il flusso di lavoro del sequenziamento a lettura lunga

I casi d'uso del sequenziamento dell'intero genoma sono caratterizzati dalla necessità di elevate rese di dati per raggiungere un'adeguata profondità di copertura.

La selezione delle dimensioni di nuova generazione ha consentito un maggiore recupero di frammenti lunghi (>10 kb) e ha eliminato contemporaneamente frammenti più piccoli che sarebbero stati sequenziati preferibilmente. Anche le opzioni automatizzate, flessibili ed ad alta produttività sono essenziali per soddisfare la domanda e garantire che venga recuperato materiale sufficiente per il sequenziamento. Le dimensioni precise ed accurate aiutano anche a ridurre la variabilità da campione a campione e da esecuzione ad esecuzione.

L'utilizzo di strumenti di selezione delle dimensioni di nuova generazione che forniscono un arricchimento dinamico del target del DNA offre precisione, scalabilità e automazione per consentire flussi di lavoro più rapidi e a basso costo, essenziali per massimizzare la resa dei dati dal sequenziamento a lettura lunga.

ENGLISH

Yourgene Health’s Ranger Technology can enable precise size selection to prepare PacBio SMRTbell DNA libraries for high-fidelity sequencing.

Whole genome analysis plays a critical role in the development of life-saving diagnostics, therapeutics, and vaccines, with growing interest in noncoding regions and Whole genome analysis plays a critical role in the development of life-saving diagnostics, therapeutics, and vaccines, with growing interest in noncoding regions and structural variants, which may impact gene activity and provide novel insights into disease pathogenesis.

Some genomic regions are more difficult to sequence. Centromeres and telomeres contain highly repetitive sequences; regions that are AT- or GC-rich respond poorly to the amplification protocols required by some platforms; and palindromic sequences or hairpin structures are difficult to denature, making such regions challenging for sequencing tools that include a denaturation step. In addition, long reads that sequence through repeat regions and structural rearrangements make it easier to define changes in the genome that we have typically found challenging to reconstruct with the bioinformatics tools associated with short-read sequencing technologies.

Single-molecule real-time long-read sequencing

Long-read sequencing, in particular, could help to advance genomics by resolving some of the most challenging regions of the human genome, discerning previously inaccessible locations and making sense of the deserts of noncoding material. Through the utilization of longer fragments, the full spectrum of genetic variation could be revealed, offering greater context and giving opportunities for the discovery of novel mechanisms of disease.

Long-read sequencing provides several advantages compared to other next-generation sequencing methods—the most obvious being the actual sequence length. It can also manage regions containing repeats and structural variants, and it can define methylation from native DNA samples.

Long-read sequencing produces genomic data by generating individual reads ranging from 1,000 to 20,000 nucleotides or more in length, while most short-read sequencing technologies use fragments that are 50 to 300 bases long and often lose vital genetic information through the amplification process.

Single Molecule Real-Time (SMRT) sequencing from PacBio uses single molecules of DNA immobilized on a nanofluidic chip in miniaturized wells, known as zero-mode waveguides (ZMWs). A polymerase incorporates labeled nucleotides, and light emission is measured in real time.

The SMRTbell library format involves capping both sides of the DNA fragments with ligated hairpin adapters, where the sequencing primers attach. This creates a circular template for the polymerase to navigate. These can be constructed for libraries of varying insert lengths—from 250 bp to greater than 25,000 bp.

Circular consensus sequencing—the ability to sequence the same DNA molecule multiple times and thereby generate long high-fidelity (HiFi) reads—is unique to the SMRT system and helps to maximize accuracy by cross-referencing each copy of the molecule against numerous other copies.

Overcoming DNA fragmentation challenges

All DNA is prone to fragmentation, whether it is derived from a biological matrix or created during gene synthesis; thus, any DNA sample will contain a range of fragment sizes. To really exploit the true benefits of long read sequencing, it is necessary to remove these shorter fragments, which might other wise be sequenced preferentially.

DNA size selection can exclude short fragments, maximizing data yields by ensuring that those fragments with the most informational content are not blocked from accessing detection centers (for example, ZMWs) by shorter DNA fragments.

Next-generation size-selection solutions Starting with clean, appropriate-length fragments for HiFi reads can accelerate research by reducing the computation and data processing time needed post-sequencing. Ranger Technology from Yourgene Health is a patent-protected process for automating electrophoresis-based DNA analysis and size selection. Its fluorescence machine vision system and image analysis algorithms provide real-time interpretation of the DNA separation process.

For size-selection protocols, the volt age is modulated per channel to control migration of DNA and allow for the synchronized arrival of the desired fragment sizes at extraction wells. Recovery yields are consistently over 70%, while extraction volumes can be kept to under 50µL volumes to ensure a high concentration of DNA for downstream processing.

Ranger Technology powers a variety of DNA sample preparation platforms. This includes LightBench, a three-in-one instrument offering automated DNA size fractions were then bead-cleaned, and the selection, fragment length analysis, and concentration and fluorometric quantification.

The LightBench adheres to the Standardization in Lab Automation (SiLA 2) specification. As such, it can be operated manually or integrated into a fully auto mated workflow with third-party liquid handlers, providing a scalable size-selection solution for long-read sequencing.

Enriching long-read sequencing libraries

Next-generation size selection was assessed in an experimental benchmarking of 84 human genomic DNA samples from fresh blood for HiFi long-read sequencing library preparation. The Ranger Technology software was set up according to the manufacturer’s recommendations for LightBench. The samples were combined with Dual Dye Loading Buffer containing a 7 kb marker (CG-14000-31-31), mixed thoroughly and centrifuged to remove any air bubbles. The cassette was prepared, and the excess buffer was removed from the reservoir before loading the samples into the wells. Following electrophoresis, samples were extracted using the In-Channel Filter array. The size-selected fractions were then bead-cleaned, and the concentration and fragment-length distributions were assessed prior to sequencing.

Using the LightBench enabled researchers to achieve consistent yields for 8 kb and 10 kb cutoffs across all samples with zero failures. The 8 kb cutoff yielded an average recovery of about 83% of the input SMRT bell library, while the 10 kb cutoff recovered an average of about 67%.

After library preparation and size selection with the LightBench, 84 samples were sequenced on the Revio platform (PacBio). The mean HiFi read length was 18,517.5 bp, and the mean HiFi data yield was 101.27 Gb/SMRT cell.

These results show that by excluding small er fragments, long-read inputs are optimized to deliver increased mean HiFi read lengths and data yields of more than 100 Gb, demonstrating that the LightBench is an effective size-selection method on the Revio system.

Revolutionizing long-read sequencing workflow

Whole genome sequencing use cases are characterized by a need for high data yields to achieve appropriate depth of coverage.

Next-generation size selection enabled increased recovery of long fragments (>10 kb) and simultaneously eliminated smaller fragments that would be preferentially sequenced. Automated, flexible, and high-throughput options are also essential to accommodate demand and ensure enough material is recovered for sequencing. Precise and accurate sizing also helps to reduce sample- to-sample and run-to-run variability.

Utilization of next-generation size-selection instruments that deliver dynamic target enrichment of DNA offer precision, scale, and automation to enable faster, lower-cost workflows that are crucial for maximizing data yields from long-read sequencing.


Da:

https://www.genengnews.com/resources/tutorials/next-generation-size-selection-for-optimized-long-read-sequencing-workflow/

Commenti

Post popolari in questo blog

Paracetamolo, ibuprofene o novalgina: quali le differenze? / acetaminophen, ibuprofen, metamizole : what are the differences?

I farmaci per l'ADHD riducono il rischio di autolesionismo del 17% e quello di criminalità del 13% / ADHD Medications Cut Risk of Self-Harm by 17% and Crime by 13%

SGLT-2 consente di raggiungere un tasso di remissione del diabete più elevato / Moderate Calorie Restriction Plus SGLT-2 Achieves Higher Diabetes Remission Rate