Analytical pitfalls and challenges in clinical metabolomics / Insidie analitiche e sfide nella metabolomica clinica

 Analytical pitfalls and challenges in clinical metabolomicsInsidie analitiche e sfide nella metabolomica clinica


Segnalato dal Dott. Giuseppe Cotellessa / Reported by Dr. Giuseppe Cotellessa



Background

 Already in the 1940s, the concept that every individual has a metabolic pattern reflected by its bodily fluids has been investigated by Roger Williams and his associates, who at that time had to rely on paper chromatography. Technical achievements, particularly in the field of analytical chemistry, allowed Dalgliesh et al. to later carry out the first GC–MS-based analysis of urine, marking the beginning of what is known today as MS-based metabolomics . However, it took more than 30 years before the terms metabolome and metabolomics were coined. Nowadays, metabolomics is integrated into the ‘omics’ cascade from genome, transcriptome and proteome to metabolome. Strictly speaking, metabolomics has been distinguished from metabonomics. Metabolomics is defined as the ‘global unbiased analysis of the metabolites present within a biological system in an identified and quantified manner’, while metabonomics refers to the ‘quantitative measurement of the multiparametric time-related metabolic response of a complex (multicellular) system to a pathophysiological stimulus or genetic modification’. Within the field of metabolomics, it is generally accepted to further discriminate between targeted and untargeted metabolomics. Targeted approaches encompass the quantitative measurements of a selection of known metabolites involved in given biochemical pathway(s), while untargeted metabolomics is defined as the global unbiased analysis of all small molecules that constitute the metabolome. Nontargeted approaches may be further divided into metabolic profiling, which focuses on specific classes of compounds, and metabolic fingerprinting, which represents a global approach based on the measurement of metabolic patterns (‘fingerprints’). Metabolomics forms an important tool for the systemwide understanding of biological processes and the discovery of novel molecular disease markers. From a clinical perspective, metabolomics and clinical chemistry form two complementary fields, where metabolomics is ideally applied for the generation of new hypotheses and disease mechanisms, while clinical chemistry subsequently follows up such processes, enabling the accurate determination and validation of diagnostic markers. In clinical chemistry, numerous guidelines addressing good laboratory practice and accurate validation procedures for markers of interest are available. Likewise, an increasing number of protocols and guidelines have been published over the last decade in clinical metabolomics. However, the more hypothesis-driven nature of clinical metabolomics does not allow for the simple adaptation of clinical chemistry guidelines. Although there is certain overlap between the analytical challenges, the complex field of clinical metabolomics presents its own specific pitfalls and challenges. A proper knowledge of such challenges is therefore essential to generate adequate and reliable results and allows for appropriate biological interpretation. This review describes the multiple potential pitfalls encountered in untargeted and targeted clinical metabolomics linked to sample collection and preparation, compounds separation, MS and NMR detection, as well as data analysis; and discusses strategies to tackle such challenges.

 Sample collection & preparation 

The results expected from a metabolomics study are greatly impacted by the experimental design, since an inappropriate study design may lead to misleading statistical outcomes and, subsequently, inaccurate biological interpretations . Appropriate collection, handling, storage and preparation of the samples are crucial for the generation of reliable data since sample contamination, degradation or low analyte recovery will have a significant effect on the analytical results. Experimental design Study design Association (case–control) studies, which aim at finding significant associations between metabolome, clinical factors and a specific disease or health status, represent by far the majority of metabolomics experiments. In order to highlight these subtle associations with high confidence, the potential confounding factors between cases and controls including gender, age, ethnicity, BMI, diet, lifestyle (e.g., smoking habits, physical activity, etc.), health status or medications/ xenobiotics should be as similar as possible. The lipidome is particularly affected by the gender (higher plasma concentrations for triglycerides, ceramides, gangliosides and phospholipids in male), BMI, medications (e.g., statins) and the diet. Some of these confounders, such as age and gender, are easily controlled but a full control and knowledge of all factors is difficult. Ideally, the selected subjects should therefore be admitted to a clinic, so that environmental factors are restricted to their minimal, which remain difficult and costly in large-scale studies. The number of subjects required for a specific study to produce meaningful outcomes with a high degree of confidence is difficult to estimate, notably in untargeted metabolomics cohorts. In principle, a power calculation can be used to estimate the number of samples required for a study. However, in the majority of untargeted studies, the number of features of interest expected is a priori unknown. Moreover, the biological and analytical variability of the samples within a group is usually undefined at the time of recruitment. In such cases, the number of subjects can be estimated based on previous studies, or ideally on a pilot study. The inclusion of biological replicates is also recommended and preferred over analytical replicates since biological variance usually exceeds the analytical one. 

Sampling conditions 

Various biological materials have been already analyzed in metabolomics studies. The large majority of human metabolomics studies consists of the analysis of urine and/or blood-derived samples, which will be solely discussed hereafter. Plasma and serum metabolomics involve some important considerations. First, a consistent sampling site throughout the whole study is essential since venous and artery blood have shown a different metabolic composition . Furthermore, circadian oscillations can significantly influence the metabolome, particularly for lipids that can present large circadian fluctuations. Finally, serum and plasma also differ in their metabolic composition, for instance in amino acids and carbohydrate levels. The metabolic profile of plasma samples is also influenced by the anticoagulant used during sample collection, namely, heparin, citrate or EDTA. For instance, heparin may lead to ion suppression, while citrate plasma presents lower levels for some lipid classes. EDTA shows the advantage to chelate the potential divalent metal cations present in the sample that may accelerate the hydrolysis of important energy metabolites, but may also lead to ion suppression. Urine represents an attractive matrix for metabolomics studies as its composition can be vastly affected during diseases. Compared to blood-derived matrices, the composition of urine is influenced to a greater extent by environmental factors. Moreover, urine samples present substantial concentration differences, requiring additional normalization steps during data analysis. An alternative practical solution relies on the 24-h collection of urine, which is nonetheless hardly applicable in clinical practice. The time point of urine collection during micturition may significantly affect the urinary composition, mainly due to bacterial contamination. A mid-stream urine sample is usually favored, except when studying urinary tract infections where first-void volume is preferred. Finally, in large-scale human metabolomics studies, samples are frequently collected at different sites. It is therefore important to provide written procedures or guidelines to all researchers, clinicians and laboratory staff involved in the project to ensure the highest reproducibility throughout sample collection and handling. Multiple errors can indeed already occur at this stage, for example, use of improper containers or wrong storage of collected samples, particularly when home sampling is allowed in the study protocol. 

Analytical workflow 

In clinical metabolomics, the outcome of a biological study relies heavily on the analytical quality of the acquired data. In case of unreliable experiments, the analytical variability will contribute significantly to the total variability, hampering valid comparisons between populations. This is particularly true for untargeted approaches where semiquantitative data of largely unknown analytes are gathered. Numerous strategies can be implemented to prevent batch effects and obtain high-quality data throughout the entire study. Since chromatographic and MS performance may decrease over time, it is recommended to divide larger studies into smaller batches and plan routine maintenance in-between, such as cleaning of ionization source components, tuning/recalibrating the mass analyzer, change of GC injector liners, etc. In order to ensure repeatability and reproducibility among all batches, the analytical workflow should include prior randomization of samples, repeated injections of blank samples and multiple injection of quality controls (QCs) throughout the analytical batch. Randomization lowers the risk of bias and ensures that no correlation between metabolite levels and analysis order is introduced. The distribution of the samples in each batch should be carefully controlled to ensure that no bias has been introduced during the randomization. The injection of blank samples (i.e., prepared blank solvents) prior to samples is recommended to stabilize the system and monitor the potential contaminants present. In lipids analysis using LC–MS, blank injections are also recommended within the batches to avoid possible carryover since some lipid compounds such as fatty acids tend to stick to the stationary phase. QC samples typically consist of a pooled mixture obtained by mixing one aliquot of all samples, subject to the same preanalytical and analytical conditions. If the sample volume is too low, the QC can also be a commercial alternative with a representative composition. QCs have multiple roles, including equilibrating the analytical platform, controlling the signal intensity prior to starting a sequence, estimating the intermediate precision between batches and allowing for postanalysis signal correction and normalization within or between batches. For the latter, a filtering step is typically introduced during the data analysis where metabolic features with an excessive signal drift (relative standard deviation for peak areas >30%) are removed from the data matrix. QCs are typically injected at the beginning of a sequence prior to the first sample, intermittently through the run (every 5–12 injections), and at the end of the sequence.  In addition to multiple injections of QCs, the instrumental reproducibility can also be monitored by employing internal standards (IS), which should be selected according to the expected compound classes. Sample storage Sample storage conditions strongly impact the qualitative and quantitative metabolome due to chemical and enzymatic degradation. Numerous classes of compounds may be affected by inadequate handling and storage of collected samples, notably the energy metabolites, fatty acids undergoing autoxidative processes, amino acids or biomarkers such as malondialdehyde. Since a relatively long time may elapse between the collection of the samples and their analysis, multiple parameters must be monitored to lower the risks for degradation and interconversion, including temperature, light, humidity, time span, quenching and number of freeze–thaw cycles. The quenching step, in other words, the rapid inhibition of metabolic activity, is essential to avoid any residual enzymatic activity. This is particularly relevant in blood-derived samples that, compared arge variability of stationary phase chemistries commercially available in many different formats (e.g., SPE cartridges, 96-well plates) enables for a tailored sample preparation. For instance, hydrophobic sorbents are particularly well suited for sample cleanup (desalting and delipidation) and enrichment of analytes with low polarity, while mixed-mode sorbents containing cationic or anionic moieties lead to excellent recoveries and preconcentration for polar and/or ionized compounds. Besides analytical errors, the sample preparation step also increases the potential risk for compounds degradation. During the entire procedure, analytes are subject to contact with air and light, and possibly with elevated temperature. In order to compensate for all analytical errors and ensure accurate data, targeted approaches require the addition of IS. Isotopically labeled IS, especially 13C-labeled, are recommended. Nevertheless, in most of the studies, labeled IS cannot be used for every compound due to high costs or because they are not commercially available. In such cases, the labeled standards should be carefully selected to correct not only for analytical errors during the sample preparation step but also for potential MS ion suppression/enhancement. 

Chromatographic & electrophoretic techniques

 A separation step is generally performed prior to MS detection using chromatographic (i.e., GC and LC) or electrophoretic techniques (i.e., CE). All techniques present specific benefits and limitations discussed hereafter. 

GC 

GC has been the first separation technique used in metabolomics and remains very popular. Separation in GC is achieved by fractionally vaporizing the analytes using temperature gradients while guiding an inert carrier gas (i.e., helium, nitrogen or hydrogen) over the stationary phase. Hence, separation is mainly driven by differences in the evaporation temperature. This process is obviously linked to an intrinsic evaporability of the analytes, which may lead to degradation of thermolabile components. Nevertheless, GC shows advances particularly in terms of separation efficiency. This superior separation efficiency is explained by the absence of eddy-diffusion during the chromatographic separation compared with LC. However, GC presents three main pitfalls: first, the possible loss of thermolabile analytes, as previously mentioned; second, a rather cumbersome sample preparation step, particularly due to the need of analyte derivatization and third, a generally higher variability compared with LC-based metabolomics. 

Thermal degradation 

Fang et al. recently published a controversial study where the authors argued that elevated temperatures such as the ones during GC analysis severely altered the analyzed metabolome. In this study, LC–MS was used to compare heated and nonheated plasma samples, thereby trying to mimic GC conditions. According to the authors, up to 40% of the heated compounds were destroyed, modified or degraded. This study caused much discussion, as it questioned the long-standing and prominent role of GC–MS, particularly in exploratory metabolomics. Although the claims of the study might be rather far-fetched, it underlined the crucial point of analyte degradation during GC–MS analysis. However, not only thermal exposure of analytes can jeopardize the successful implementation of GC–MS analysis in clinical metabolomics but also other practical factors such as the use of different carrier gases, differences in the applied inlet liners (i.e., differential liner design), different injection techniques (i.e., hot needle versus cold needle injection) or the presence of impurities in the liner or on the column head. Some of the aforementioned points have been previously investigated. Practical recommendations for ensuring reliable GC–MS-based metabolomics data include the use of a consistent liner design (i.e., tapered, goose neck or double goose neck), the constant use of deactivated inlet liners as well as glass wool, a regular maintenance schedule, injection of system suitability tests and/or QCs, regular change of GC columns and the use of the highest quality derivatization reagents and solvents.

 Sample preparation 

GC-based metabolomics analysis usually involves a twostep sample preparation procedure where keto functionalities are first derivatized using pyridine methoxylamine followed by silylation with either N-methyl-N-trimethylsilyl-trifluoroacetamide (MSTFA) or N-methyl-N-dimethyl-tert-butyl-bistrifluoroacetamide (MtBSTFA). It is well known that MtBSTFA forming tert-butyldimethylsilyl derivatives give rise to more intense and information-rich fragment ions especially when using electron ionization (EI). Unfortunately, the derivatization efficiency of MtBSTFA is rather poor, particularly for secondary and tertiary alcohols, likely due to sterical hindrance potentially leading to partial derivatization. On the other hand, the stability of trimethylsilylesters obtained by the derivatization of carboxylic acids with MSTFA is several orders of magnitude lower than for their tert-butyldimethylsilyl counter parts, fostering the use of MtBSTFA. A tight control and, if possible, automation of the derivatization procedures is recommended as some derivatives (e.g., trimethylsilyl esters) are well known to rather rapidly undergo degradation over time, necessitating equal post-derivatization periods . A possible alternative to silylation reagents may be the use of chloroformate or methylation reagents. Some of the aforementioned pitfalls were addressed by Villas Boas et al., who investigated compound methylation using methylchloroformate as an alternative derivatization strategy. The authors concluded that methylation is superior to trimethylsilylation; however, further detailed studies are required to evaluate the use of alternative derivatization protocols.

 LC

 Compared to GC, LC allows for the direct analysis of rather polar and thermolabile compounds without the need for derivatization and adds additional selectivity through interactions between stationary and mobile phases. Among all the chromatographic modes that can be used in metabolomics and lipidomics, reversed-phase LC (RPLC) remains the gold standard while an increasing amount of metabolomics studies are performed using HILIC. Over the last decade, RPLC–MS has become very competitive in multiple fields along with the development of innovative technologies such as the use of stationary phases equipped with superficially porous particles (core–shell technology) or sub 2-μm fully porous particles (ultrahigh pressure LC, UHPLC). Both approaches provide fast and high-resolution separations (increased peak capacity), which allows for high-throughput analysis of closely related metabolites.

 Reversed phase LC 

The large majority of RPLC metabolomics studies involve the combination of an octadecyl-modified stationary phase (C18) with an aqueous-organic mobile phase composed of either MeOH or MeCN containing 0.1% formic acid. This simple and versatile combination leads to acceptable peak shapes for most metabolites, good ionization efficiency in the positive ESI mode and excellent retention time repeatability. In metabolomics, RPLC shows two major drawbacks, namely, a possible ion suppression particularly caused by phospholipids in plasma/serum analysis (matrix effects) and a poor retention of highly polar components, especially in urine analysis . Moreover, the use of formic acid in the mobile phase may lead to a relatively poor sensitivity in negative ESI mode. Finally, compared with GC–MS, RPLC–MS suffers from a lack of commercially available spectral libraries that makes compounds identification rather complex in untargeted approaches. In-house-built libraries containing both retention and spectral information thus offer a valuable tool for metabolite identification. Hydrophilic interaction chromatography In HILIC chromatographic mode, a polar stationary phase (i.e., bare silica or silica modified by functional groups such as diol, amine, amide or zwitterionic moieties) is used with a relatively hydrophobic mobile phase composed of an aqueous-organic mixture (usually MeCN with volatile buffers), forming a waterenriched layer of partially immobilized eluent on the stationary phase. The retention mechanisms are rather complex and involve hydrophilic partitioning, dipole– dipole interaction, hydrogen bonds and electrostatic interaction. HILIC shows several advantages that render this technique particularly interesting in metabolomics, such as an enhanced MS signal due to a better eluent desolvation, the possibility of directly injecting organic extracts usually obtained by PP or extraction, and an orthogonal selectivity compared with RPLC . However, HILIC remains rarely used in this field. This reluctance is likely explained by the complex mechanisms that render HILIC less flexible and not as straightforward as RPLC. The major drawbacks of this technique rely on the higher variability in the retention times, the longer equilibration times and the poorer peak shapes observed. However, high-quality data can be ensured provided that good practice is followed during the analytical workflow, including a careful selection of the sample diluent and volume of injection, the use of volatile salt buffers at a fixed and repeatable pH value and ionic strength, the investigation of the matrix effects and the adequate data preprocessing parameters in untargeted approaches. These aspects have been recently discussed by Kohler et al. in a practical review. Capillary electrophoresis CE is a miniaturized technique where charged compounds are separated according to their charge-to-size ratio in an electrically conductive liquid phase (background electrolyte) under the influence of an electric field. The hyphenation of CE with MS provides interesting advantages for metabolomics applications including a high selectivity and separation efficiency, especially for polar and/or charged compounds which show a poor retention in RPLC; an orthogonal mechanism of separation compared with chromatographic techniques, leading to complementary metabolic coverage; the separation of chiral compounds; its applicability to volume-limited samples and the possibility for single-cell metabolomics. However, compared with other MS-based techniques, CE–MS is little used in metabolomics; it suffers from a lower overall sensitivity and a poor reproducibility in migration times due to adsorption of matrix material on the capillary surface. Moreover, the commercial systems are not equipped with autosamplers adapted for high-throughput analysis and feature a lower injection repeatability compared with LC systems. The latter drawbacks foster the systematic use of IS to correct the injection variability. Finally, CE–MS coupling is not as straightforward as LC–MS or GC–MS and requires additional practical expertise to obtain a stable MS signal and reliable data. The limitations differ depending on the interface used for CE–MS hyphenation. There are currently two different interfaces commercially available, namely, the sheath-liquid and the porous tip sheathless interface. The sheath-liquid interface is typically considered more stable, repeatable and cost effective but suffers from a lower sensitivity due to dilution of the CE effluent with the sheath liquid. On the other hand, the commercial sheathless interface provides a higher sensitivity and separation efficiency but at higher costs, and with less robustness and flexibility. Today, the optimal CE–MS setup for metabolomics approaches relies on a combination of sheath-liquid interface, online preconcentration techniques, systematic use of IS, regular injection of QCs, use of electrophoretic mobility instead of migration times, adequate postanalysis alignment of the data and sufficient practical expertise. The limitations of the technique certainly explain the reluctance in using it in metabolomics. It is only with further developments in CE instrumentation, notably with a stable and sensitive CE–MS interface, that this technique might be fully exploited as a complementary tool in addition to chromatographic techniques. 

MS

 MS has been largely used in metabolomics and remains the gold standard detection technique after chromatographic or electrophoretic separation. It is only due to the high-information content of MS data that identification and quantification of hundreds to thousands of analytes in a single analytical run can be achieved. The major ionization techniques used in MS-based metabolomics are EI, chemical ionization (CI), ESI and atmospheric pressure chemical ionization (APCI). While EI and CI are typically used in combination with GC, APCI can be used in combination with GC, LC and CE; and ESI with LC and CE.

 Ionization techniques 

Historically, EI was the first ionization technique employed for MS experiments. In EI, electrons emitted by a heated tungsten filament are accelerated. These electrons get into close proximity with the neutral molecules eluting from typically a GC column, leading to the formation of radical ions and charged fragments. EI is generally described as a ‘hard’ ionization technique; this can be very useful analyzing neutral molecules, although certain analytes such as esters or ketocarboxylic acids can undergo severe fragmentation. This may render the obtained spectral data very difficult to interpret when only low molecular-weight fragments are observed. Nevertheless, the major advantage of EI is its highly standardized and repeatable performance. Over the years, this has led to extensive spectral libraries containing more than 250,000 compounds, which make GC–EI–MS a very attractive technology for identifying unknown metabolites of interest. Traditionally, a kinetic energy of 70 eV is used for EI, allowing for high spectral comparison. However, many modern GC–EI–MS instruments offer the possibility to modify this value, thereby changing the energy content of the emitted electrons. Although there have been some reports showing that reducing the electron energy causes less fragmentation, this usually also severely decreases the overall sensitivity. CI is considered a ‘soft’ ionization technique where a reactant gas (frequently methane) is used in combination with an EI source, causing formation of primary ions stemming from the reagent gas. The formed reagent gas ions subsequently ionize the molecules of interest, mainly by collisional processes. Compared to EI, CI therefore frequently allows the determination of the molecular ion. CI in negative mode has, for example, been widely used for the analysis of fatty acids, while its use in metabolomics studies has remained rather limited. This may be explained by the lack of spectral libraries since most of them are built with GC–EI–MS data. ESI is certainly the most widely applied ionization technique for LC–MS-based metabolomics. Although the detailed mechanisms of the ESI process are not fully understood yet, it is commonly accepted that initially an electrospray dispersion of a liquid in a nozzle generates charged droplets when forming the so-called Taylor cone. When charged droplets are generated, the solvent starts to evaporate, leading to an increase in charge density of the droplet. At one point, the so-called Rayleigh limit will be exceeded leading to formation of secondary droplets in the form of a Taylor cone from the primary droplets. This process is repeated leading to the formation of very small droplets, being the primary source of ions detected in an MS. Advantages of ESI are a straightforward hyphenation to LC and CE, its high ionization efficiency, virtually no restriction in mass range and the direct ionization of liquids. However, ESI may be prone to significant matrix effects, particularly jeopardizing quantitative bioanalysis. Multiple studies have already addressed the strategies to ensure accurate quantitation, making ESI the most important ionization technique in modern bioanalysis despite its limitations. In clinical metabolomics, matrix effects are not only jeopardizing the study outcome but they can also lead to misinterpretations. In their study, Giera and colleagues investigated the lipid profile of osteo- and rheumatoid arthritis patients. Based on PCA and partial least-squares discriminant analysis (PLS-DA) of the LC–ESI–MS data acquired in negative ESI mode, the clustering between synovial fluid samples was initially hypothesized to possibly be linked to the sphingomyleoid SM(d18:2/16:0), which was ranked as the third most important variable responsible for samples classification. However, after selective hydrolysis of phosphatidylcholines, no difference could statistically be observed between the samples as emphasized by the PCA scores plot shown in Figure 2B. This unexpected outcome was explained by the presence of oxidized phospholipids which overlaid SM(d18:2/16:0). Hence, the coelution of oxidized phospholipids with SM(d18:2/16:0) led to ion suppression, particularly in the negative ESI mode. The strong ion suppression of SM(d18:2/16:0) severely influenced the statistical model, causing the model to be based on the ion suppression effect instead of the compound itself. APCI is a ‘soft’ ionization technique usually coupled to LC for the ionization of less polar and neutral compounds but it has also been hyphenated to both CE and GC. In APCI, the liquid or gaseous eluent flows through a heated nebulizer; the obtained mixture of hot liquid and vapors expands into the atmospheric pressure interface where it is ionized by a corona discharge, leading to a proton transfer from the solvent molecules to the analytes. In contrast with ESI, which relies on a liquid-phase ionization, APCI ionization occurs in the gas phase. GC–APCI–MS has been scarcely reported in metabolomics studies even though it shows less fragmentation than EI and, in some cases, is more sensitive than EI and CI. The main limitation of GC–APCI–MS in metabolomics applications, shared by LC–APCI–MS as well as GC–CI–MS, is the lack of spectral libraries for compound identification. A web-based library for GC–APCI–MS containing retention indices and MS(/MS) spectra for a range of endogenous and exogenous compounds (>150 compounds) has been presented by Pacchiarotta et al.. However, as ionization using APCI is more conditiondependent (e.g., humidity, temperature, flow conditions, source geometry, cone voltages, etc.) than EI, comparison of spectra between different instruments might be limited. 

Mass analyzers 

Depending on the purpose of the study, a wide range of mass analyzers are used in clinical metabolomics, notably high-resolution MS such as quadrupole timeof-flight (qToF) or Orbitrap analyzers, as well as quadrupoles, ion traps and other hybrid instruments. Each mass analyzer shows advantages and limitations; therefore, many studies involve the use of more than one system to gather complementary information . In targeted studies, mainly triple quadrupole or quadrupole linear ion trap mass analyzers are used due to their high sensitivity and selectivity, particularly when used in selective reaction monitoring (SRM) mode. Although the combination of LC with highly selective SRM transitions delivers a high degree of selectivity, it remains insufficient for discriminating geometrical isomers that show identical tandem mass spectra (see the ‘Stereoisomers & chirality’ section). In untargeted metabolomics, qToF systems are largely employed as they provide high mass resolution and accuracy, as well as high scan speed. Notably, the obtained high-resolution spectral data are beneficial for compound identification, facilitating database searches and generation of elemental composition. However, based on recent studies, the unambiguous identification of compounds of interest should not solely rely on high-resolution MS, but should always include tandem mass spectra measurement, and ideally comparison of retention times and MS(/MS) spectra with authentic synthetic standard material. 

Stereoisomers & chirality 

Stereoisomers (including geometrical isomers), diastereomers, as well as enantiomers play crucial biological roles, rendering their separation and correct assignment highly important in clinical metabolomics. As an example, the diastereomers and geometrical isomers 5S,12S-diHETE and LTB4 do not only arise out from different pathways but also show a large difference in their respective biological activity. As such substances show identical tandem mass spectra and, in many cases, similar retention behavior, additional dimensions of separation are needed, for instance differential mobility spectrometry (DMS). DMS has recently shown to facilitate the separation of lipids as well as isomers from the leukotriene and protectin classes. Another relevant example concerns d- and l-lactic acids, of which only d-lactic acid appears to be linked to the short bowel syndrome. Therefore, it is of high importance for understanding the biological relevance of stereochemical isomers to ensure their separation and correct assignment. Both points have recently been underlined by Struys in the context of  the analysis of d- and l-2-hydroxyglutarate where only d-2-hydroxyglutarate plays a crucial role in cancer. While diastereomers and geometrical isomers usually present different physicochemical properties, which allow for their separation by chromatography, this is not the case for enantiomers. Enantiomer separation requires the use of chiral stationary phases or the addition of a chiral selector in the CE background electrolyte. Although modern chiral phases allow the separation of various enantiomers, the choice of the optimal column chemistry or chiral selector remains an empirical process and the retention/migration behavior of enantiomers cannot be predicted. Even if some reports have been recently published about chiral metabolomics (including NMR-based analysis), much work still needs to be done. However, chiral gas-phase separations, NMR shift reagents, chiral CE and derivatization reagents are certainly a way forward.

 NMR spectroscopy

 NMR is complementary to MS in clinical metabolomics. In NMR, the interaction of the magnetic dipole of atomic nuclei with an applied magnetic field is used to probe the chemical environment of those nuclei. This results in an isotope-specific NMR spectrum, where the position of the peaks in the spectrum is characteristic of the chemical group containing the nuclei. Notably, the peak area is linearly related to the number of nuclei in the sample, and thus the metabolite concentration. NMR is a nondestructive technique and requires a relatively simple sample preparation. Although NMR has been successfully hyphenated to LC, clinical metabolomics studies usually involve direct NMR measurements. Considering the low dispersion of chemical shifts as compared with the peak width, this approach leads to relatively crowded but very reproducible spectra. A common limitation of NMR is its relatively low sensitivity compared with MS-based techniques. The magnetic polarization of the nuclei is given by the population difference of the nuclear energy levels that are determined by the orientation of the nuclear magnetic dipole. The energy difference of these levels is small, leading to a tiny population difference of these energy levels at room temperature. This results in a relatively low sensitivity even for the isotopes with the best properties, in other words, the spin-½ nuclei with large magnetogyric ratios (1 H and 19F). The sensitivity can be improved by using very strong superconducting magnets and cryoprobes that operate the receiver circuitry at low temperatures to reduce electronic noise. Typically, multiple scans are accumulated to further improve the S/N ratio. After relaxation, allowing the spin system for returning to thermal equilibrium (ca. few seconds), scans can be repeated to a certain extent (S/N ratio ∼ n½) to increase the sensitivity. However, metabolites with concentrations lower than 1 μM will usually be below the detection limit. The number of metabolites visible in the proton ( 1 H)-NMR spectrum ranges from about 50 in serum/ plasma samples  to roughly 200 in urine.The number of peaks that a metabolite generates is determined by the number of nonequivalent protons in the molecule. Additionally, the magnetic moment of the nuclei is transferred by the bonding electrons to neighboring nuclei by the J coupling. This coupling splits each peak into doublets, triplets, quadruplets or other multiplets of varying complexity. In a commonly used NMR system with a 14 Tesla magnet, the proton spectrum is 6 kHz wide. With an average peak width of 1 Hz, J couplings of 15 Hz and multiple peaks for each metabolite, peak overlap is common. Whatever the matrix, water is by far the molecule with the highest concentration. In turn, the protons of water dominate the NMR spectrum unless special care is taken to suppress the water signals, such as using a combination of water presaturation and pulsed field gradients. A low irradiation field strength is used to generate the presaturation for the water signal; however, the metabolite peaks near the water signal are also affected and reduced in intensity. Moreover, the peaks from protons that exchange with water can be lower than expected as a result of the water presaturation. In case of urine analysis, the sample pH can affect the chemical shift of certain peaks, particularly those close to nitrogen with the exception of quaternary ammonium salts. The addition of phosphate buffer during the sample preparation stabilizes the pH but because the final mixture is a compromise between metabolite concentration and pH stability, some peaks will still show significant shifts. Alignment algorithms exist to compensate the peak shifts due to these effects but compared with chromatogram/electropherogram alignment, other nearby peaks do not necessarily shift to the same extent or even the same direction. The salt concentration affects the inductance of the radio frequency (RF) coil, influencing the RF strengths of the pulses and the signal-to-noise of the recorded signal. Automatic tuning and matching of the RF circuitry and automatic pulse calibration before every measurement are essential, but the excitation bandwidth and free induction decay (FID) reception performance of the probe will still be different from sample to sample depending on the salt concentration. Because of the difficulty of deconvoluting the peaks to quantify individual metabolites, NMR metabolomics studies are often performed in a nontargeted and nonquantitative fashion. Therefore, even if some signals cannot be reliably deconvoluted or assigned to a metabolite, they can still contribute to the diagnostic models. An NMR spectrum routinely consists of several ten thousand points to accurately describe the shapes of the various peaks. In order to limit the number of variables, a so-called binning procedure is applied, which divides the whole spectrum in specific intervals prior to integration. There are different strategies for setting the location of the interval edges. The simplest approach is to use equidistant binning, where consecutive patches of spectrum of equal size define the bins, but shows the risk that a bin edge falls on top of a peak. A better approach is adaptive binning, in which an algorithm tries to find the optimal positions of the bin edges, ensuring that most peaks entirely fall in one bin. Binning methods include information from unidentified and unresolved metabolites, but this does not ensure the generation of better models in metabolomics. Indeed, in many cohorts, participants may be on different medication regimes. In the case of indiscriminate inclusion of bins, all the exogenous metabolites will be also included in the model. In these situations, the quantification of only those metabolites that can be reliably assigned and deconvoluted should be performed. Several software tools have been developed to aid with the fitting and deconvolution of NMR peaks, both freely available (e.g., BATMAN) or commercial (AMIX by Bruker Corporation or Chenomx by Chenomx Inc.). Peak identification requires some ingenuity in NMR metabolomics. The functional group to which the proton belongs roughly determines the area of the spectrum where the peak appears. Databases exist that list the chemical shifts of the peaks of most metabolites in pure solutions, notably the Human Metabolome Database, the Biological Magnetic Resonance Data Bank, the Madison Metabolomics Consortium Database and databases that are supplied with the commercial software packages Chenomx and AMIX. However, since the solvent, the pH and the salt concentration affect the exact chemical shift, the position of a peak in a biofluid can be different from those in standard solutions, rendering the identification challenging. The multiplicity of the peak may give additional information but increases the likelihood of peak overlap. Hence, in addition to a standard 1D spectrum, a 2D J-resolved spectrum is usually recorded for every sample that separates the effects of the chemical shift interaction and the J-coupling into two different spectral dimensions, significantly reducing peak overlap. Nevertheless, several peaks with the same multiplicity often appear near each other. For example, the branched chain amino acids all produce doublets around 1 ppm. NMR offers a wide range of different pulse sequences that can help identifying metabolites by showing the connectivity of a proton to both nearby and remote protons, or to neighboring carbon atoms. These more complex pulse sequences typically yield multidimensional spectra from which a connectivity network can be extracted that is often unique for a specific metabolite. Databases include information on 2D spectra, and software tools exist to aid with the assignment of the 2D crosspeakS. These 2D spectra also take longer to record and are, therefore, usually only applied on specific samples even if some metabolomics studies have been performed using 2D experiments routinely. Since different peaks from the same metabolite respond in identical ways to concentration variations, finding high correlations between the peak areas of different resonances over cohorts can also be used to assign peaks to metabolites, a method named statistical total correlation spectroscopy (STOCSY) . Compounds identification may be eventually confirmed by spiking standards in the studied matrix. NMR also represents a powerful tool in quantitative metabolomics. Indeed, in most cases, the peak area is linearly related to the number of equivalent protons that generate the peak. However, inaccurate quantitation may result when the metabolite has different properties than the reference compound, for example, different relaxation behavior, attenuation by the presaturation field or lower excitation efficiency for the nuclear spins of the reference peak. Some metabolites, or even the reference compound itself, can associate with macromolecules or supramolecular assemblies present in the sample, for example, the commonly used reference compound trimethylsilyl propionate (TSP) with albumin and lipoproteins in serum. Other methods use an electronically generated reference signal or a combination of a reference sample and the length of the excitation pulse, which is inversely proportional to the sensitivity of the receiver circuitry. 

Conclusion 

Over the last decade, metabolomics-based strategies have shown their relevance in clinical research, providing innovative tools to better understand pathophysiological processes, disease mechanisms and offering new strategies for improved diagnosis, prognosis and the discovery of new therapeutic targets. However, the results of multiple studies have been influenced by unexpected issues during the analytical process. This review highlights the analytical challenges and pitfalls that may be encountered in every step of the analytical process, from study design to data analysis, and provides some solutions to tackle these challenges in both NMR- and MS-based clinical metabolomics. The clinical outcome of metabolomics studies strongly relies on  the quality and accuracy of the acquired data. A careful study design including all the crucial steps should therefore be planned prior to the actual start of the study and the sample collection, ensuring highest data quality and lowest analytical variability. Even though a successful biomarker discovery does not necessarily mean that the validation stage will be rewarding, it certainly positively impacts the success rate of the latter. 

Future perspective 

Metabolomics has been showing its interest and promises for improved biomarker discovery for a large range of diseases, notably cardiovascular disorders, diabetes, metabolic syndrome, cancer, gastrointestinal diseases, infectious diseases, as well as neurological and psychiatric disorders. It has been paving the way for personalized health strategies for the development of novel and adequate therapies and the implementation of tailormade and efficient diagnosis approaches. Nevertheless, despite its potential, the translation of metabolomics findings to personalized diagnostic and prognostic medicine is still at an early stage. Various biomarkers or metabolic patterns have been already highlighted in multiple diseases but not validated and used in clinic applications so far. Massive efforts have been put into the discovery phase, efforts that are now also expected for improving the validation of biomarker candidates. Today’s literature is overloaded with novel biomarker candidates that, for the large majority of them, do not reach the validation phase. Cross-disciplinary efforts, translational collaborations between academic institutions, pharmaceutical agencies and diagnostic companies, as well as standardization of procedures are crucial to move forwards. Precision medicine is a translational discipline involving multiple scientific communities; the clinical community remains largely unfamiliar with the field of metabolomics. By better understanding the analytical process underlying metabolomics studies, it will certainly help clinicians to foresee its importance in clinical research.

ITALIANO

Conoscenze di base

 Già negli anni Quaranta, il concetto che ogni individuo abbia uno schema metabolico riflesso dai suoi fluidi corporei è stato indagato da Roger Williams e dai suoi collaboratori, che a quel tempo dovevano fare affidamento sulla cromatografia su carta. I risultati tecnici, in particolare nel campo della chimica analitica, hanno consentito a Dalgliesh et al. per eseguire successivamente la prima analisi delle urine basata su GC-MS, segnando l'inizio di quella che oggi è conosciuta come metabolomica basata sulla SM. Tuttavia, ci sono voluti più di 30 anni prima che i termini metaboloma e metabolomica fossero coniati. Al giorno d'oggi, la metabolomica è integrata nella cascata "omica" dal genoma, trascrittoma e proteoma al metaboloma. A rigor di termini, la metabolomica è stata distinta dalla metabonomica. La metabolomica è definita come "l'analisi globale imparziale dei metaboliti presenti all'interno di un sistema biologico in modo identificato e quantificato", mentre la metabonomia si riferisce alla "misurazione quantitativa della risposta metabolica multiparametrica correlata al tempo di un sistema complesso (multicellulare) a un stimolo fisiopatologico o modificazione genetica ”. Nel campo della metabolomica, è generalmente accettato di discriminare ulteriormente tra metabolomica mirata e non mirata. Gli approcci mirati comprendono le misurazioni quantitative di una selezione di metaboliti noti coinvolti in determinate vie biochimiche, mentre la metabolomica non mirata è definita come l'analisi imparziale globale di tutte le piccole molecole che costituiscono il metaboloma. Gli approcci non mirati possono essere ulteriormente suddivisi in profili metabolici, che si concentrano su classi specifiche di composti, e impronta metabolica, che rappresenta un approccio globale basato sulla misurazione dei modelli metabolici ("impronte digitali"). La metabolomica costituisce uno strumento importante per la comprensione a livello di sistema dei processi biologici e la scoperta di nuovi marcatori di malattie molecolari. Da un punto di vista clinico, la metabolomica e la chimica clinica formano due campi complementari, in cui la metabolomica è idealmente applicata per la generazione di nuove ipotesi e meccanismi di malattia, mentre la chimica clinica successivamente segue tali processi, consentendo la determinazione accurata e la convalida dei marcatori diagnostici. In chimica clinica, sono disponibili numerose linee guida riguardanti la buona pratica di laboratorio ed accurate procedure di convalida per i marker di interesse. Allo stesso modo, nell'ultimo decennio è stato pubblicato un numero crescente di protocolli e linee guida nella metabolomica clinica. Tuttavia, la natura maggiormente basata sulle ipotesi della metabolomica clinica non consente il semplice adattamento delle linee guida di chimica clinica. Sebbene vi sia una certa sovrapposizione tra le sfide analitiche, il complesso campo della metabolomica clinica presenta le proprie insidie ​​e sfide specifiche. Una conoscenza adeguata di tali sfide è quindi essenziale per generare risultati adeguati ed affidabili e consente un'interpretazione biologica appropriata. Questa recensione descrive le molteplici potenziali insidie ​​incontrate nella metabolomica clinica non mirata e mirata legata alla raccolta e preparazione del campione, alla separazione dei composti, alla rilevazione di MS e NMR, nonché all'analisi dei dati; e discute le strategie per affrontare tali sfide.

Raccolta e preparazione dei campioni

I risultati attesi da uno studio di metabolomica sono fortemente influenzati dal progetto sperimentale, poiché un progetto di studio inappropriato può portare a risultati statistici fuorvianti e, di conseguenza, a interpretazioni biologiche imprecise. La raccolta, la manipolazione, la conservazione e la preparazione appropriate dei campioni sono fondamentali per la generazione di dati affidabili poiché la contaminazione del campione, la degradazione od il basso recupero di analiti avranno un effetto significativo sui risultati analitici.

 Progetto sperimentale Progetto dello studio

 Gli studi dell'Associazione (caso-controllo), che mirano a trovare associazioni significative tra metaboloma, fattori clinici ed una specifica malattia o stato di salute, rappresentano di gran lunga la maggior parte degli esperimenti di metabolomica. Al fine di evidenziare queste sottili associazioni con elevata sicurezza, i potenziali fattori di confusione tra casi e controlli inclusi sesso, età, etnia, BMI, dieta, stile di vita (p. Es., Abitudine al fumo, attività fisica, ecc.), stato di salute o farmaci / xenobiotici dovrebbe essere il più simile possibile. Il lipidoma è particolarmente influenzato dal sesso (concentrazioni plasmatiche più elevate di trigliceridi, ceramidi, gangliosidi e fosfolipidi nei maschi), BMI, farmaci (ad es. statine) e dieta. Alcuni di questi fattori di confusione, come l'età e il sesso, sono facilmente controllabili, ma è difficile controllare e conoscere tutti i fattori. Idealmente, i soggetti selezionati dovrebbero quindi essere ricoverati in una clinica, in modo che i fattori ambientali siano limitati al loro minimo, che rimangono difficili e costosi negli studi su larga scala. Il numero di soggetti necessari per uno studio specifico per produrre risultati significativi con un alto grado di fiducia è difficile da stimare, in particolare nelle coorti metabolomiche non mirate. In linea di principio, è possibile utilizzare un calcolo della potenza per stimare il numero di campioni necessari per uno studio. Tuttavia, nella maggior parte degli studi non mirati, il numero di caratteristiche di interesse atteso è a priori sconosciuto. Inoltre, la variabilità biologica e analitica dei campioni all'interno di un gruppo è solitamente indefinita al momento del reclutamento. In questi casi, il numero di soggetti può essere stimato sulla base di studi precedenti o, idealmente, su uno studio pilota. L'inclusione di repliche biologiche è inoltre raccomandata e preferita rispetto alle repliche analitiche poiché la varianza biologica di solito supera quella analitica.

Condizioni di campionamento

Vari materiali biologici sono già stati analizzati negli studi di metabolomica. La grande maggioranza degli studi di metabolomica umana consiste nell'analisi di campioni di urina e / o sangue, che verranno discussi esclusivamente in seguito. La metabolomica del plasma e del siero implica alcune considerazioni importanti. In primo luogo, un sito di campionamento coerente durante l'intero studio è essenziale poiché il sangue venoso e arterioso hanno mostrato una composizione metabolica diversa. 

Inoltre, le oscillazioni circadiane possono influenzare in modo significativo il metaboloma, in particolare per i lipidi che possono presentare ampie fluttuazioni circadiane. 

Infine, il siero e il plasma differiscono anche nella loro composizione metabolica, ad esempio nei livelli di aminoacidi e carboidrati. Il profilo metabolico dei campioni di plasma è anche influenzato dall'anticoagulante utilizzato durante la raccolta del campione, ovvero eparina, citrato o EDTA. Ad esempio, l'eparina può portare alla soppressione ionica, mentre il plasma citrato presenta livelli inferiori per alcune classi di lipidi. L'EDTA mostra il vantaggio di chelare i potenziali cationi metallici bivalenti presenti nel campione che possono accelerare l'idrolisi di importanti metaboliti energetici, ma può anche portare alla soppressione ionica. L'urina rappresenta una matrice interessante per gli studi di metabolomica poiché la sua composizione può essere notevolmente influenzata durante le malattie.

 Rispetto alle matrici derivate dal sangue, la composizione dell'urina è influenzata in misura maggiore da fattori ambientali. Inoltre, i campioni di urina presentano differenze di concentrazione sostanziali, che richiedono ulteriori passaggi di normalizzazione durante l'analisi dei dati. Una soluzione pratica alternativa si basa sulla raccolta delle urine nelle 24 ore, che tuttavia è difficilmente applicabile nella pratica clinica. Il punto temporale della raccolta dell'urina durante la minzione può influire in modo significativo sulla composizione urinaria, principalmente a causa della contaminazione batterica. Di solito è preferibile un campione di urina a flusso intermedio, tranne quando si studiano le infezioni del tratto urinario dove è preferito il volume del primo vuoto. Infine, negli studi di metabolomica umana su larga scala, i campioni vengono spesso raccolti in siti diversi. È quindi importante fornire procedure scritte o linee guida a tutti i ricercatori, medici e personale di laboratorio coinvolti nel progetto per garantire la massima riproducibilità durante la raccolta e la manipolazione dei campioni. In questa fase possono infatti già verificarsi più errori, ad esempio l'uso di contenitori impropri o l'errata conservazione dei campioni raccolti, in particolare quando il campionamento domiciliare è consentito nel protocollo di studio.

Flusso di lavoro analitico

Nella metabolomica clinica, il risultato di uno studio biologico si basa fortemente sulla qualità analitica dei dati acquisiti. In caso di esperimenti inaffidabili, la variabilità analitica contribuirà in modo significativo alla variabilità totale, ostacolando confronti validi tra le popolazioni. Ciò è particolarmente vero per approcci non mirati in cui vengono raccolti dati semiquantitativi di analiti in gran parte sconosciuti. È possibile implementare numerose strategie per prevenire gli effetti di fondo e ottenere dati di alta qualità durante l'intero studio. Poiché le prestazioni cromatografiche e MS possono diminuire nel tempo, si consiglia di suddividere studi più grandi in lotti più piccoli e pianificare la manutenzione ordinaria intermedia, come la pulizia dei componenti della sorgente di ionizzazione, la messa a punto / ricalibrazione dell'analizzatore di massa, il cambio dei rivestimenti degli iniettori GC, ecc Al fine di garantire la ripetibilità e la riproducibilità tra tutti i lotti, il flusso di lavoro analitico dovrebbe includere la randomizzazione preventiva dei campioni, iniezioni ripetute di campioni bianchi ed iniezioni multiple di controlli di qualità (QC) in tutto il lotto analitico. La randomizzazione riduce il rischio di deriva e garantisce che non venga introdotta alcuna correlazione tra i livelli dei metaboliti e l'ordine di analisi. La distribuzione dei campioni in ciascun lotto deve essere attentamente controllata per garantire che non siano stati introdotte derive durante la randomizzazione. Si consiglia di iniettare campioni bianchi (cioè solventi bianchi preparati) prima dei campioni per stabilizzare il sistema e monitorare i potenziali contaminanti presenti. Nell'analisi dei lipidi mediante LC-MS, si raccomandano anche iniezioni di bianco all'interno dei lotti per evitare il possibile trasportatori poiché alcuni composti lipidici come gli acidi grassi tendono ad aderire alla fase stazionaria. I campioni QC sono tipicamente costituiti da una miscela unita ottenuta miscelando un'aliquota di tutti i campioni, soggetta alle stesse condizioni preanalitiche e analitiche. Se il volume del campione è troppo basso, il QC può anche essere un'alternativa commerciale con una composizione rappresentativa. I controlli di qualità hanno più ruoli, tra cui l'equilibrio della piattaforma analitica, il controllo dell'intensità del segnale prima di avviare una sequenza, la stima della precisione intermedia tra i lotti e la possibilità di correggere e normalizzare il segnale postanalisi all'interno o tra i lotti. Per quest'ultimo, una fase di filtraggio viene tipicamente introdotta durante l'analisi dei dati in cui le caratteristiche metaboliche con un'eccessiva deriva del segnale (deviazione standard relativa per le aree dei picchi> 30%) vengono rimosse dalla matrice dei dati. I QC vengono in genere iniettati all'inizio di una sequenza prima del primo campione, a intermittenza durante il ciclo (ogni 5–12 iniezioni) e alla fine della sequenza. Oltre a iniezioni multiple di QC, la riproducibilità strumentale può anche essere monitorata impiegando standard interni (IS), che dovrebbero essere selezionati in base alle classi di composti previste. 

Conservazione dei campioni

 Le condizioni di conservazione dei campioni hanno un forte impatto sul metaboloma qualitativo e quantitativo a causa della degradazione chimica ed enzimatica. Numerose classi di composti possono essere influenzate da una manipolazione e conservazione inadeguate dei campioni raccolti, in particolare i metaboliti energetici, gli acidi grassi sottoposti a processi autoossidativi, gli amminoacidi o i biomarcatori come la malondialdeide. Poiché può trascorrere un tempo relativamente lungo tra la raccolta dei campioni e la loro analisi, è necessario monitorare più parametri per ridurre i rischi di degrado e interconversione, inclusi temperatura, luce, umidità, intervallo di tempo, tempra e numero di cicli di gelo-disgelo. La fase di decadimento, ovvero la rapida inibizione dell'attività metabolica, è fondamentale per evitare ogni residua attività enzimatica. Ciò è particolarmente rilevante nei campioni derivati ​​dal sangue che, confrontata con la variabilità delle sostanze chimiche in fase stazionaria disponibili in commercio in molti formati diversi (ad esempio, cartucce SPE, piastre a 96 pozzetti) consente una preparazione del campione su misura. Ad esempio, gli adsorbenti idrofobici sono particolarmente adatti per la pulizia dei campioni (desalificazione e delipidazione) e l'arricchimento di analiti con bassa polarità, mentre gli adsorbenti in modalità mista contenenti parti cationiche o anioniche portano a recuperi e preconcentrazione eccellenti per composti polari e / o ionizzati. Oltre agli errori analitici, la fase di preparazione del campione aumenta anche il potenziale rischio di degradazione dei composti.

Durante l'intera procedura, gli analiti sono soggetti a contatto con aria e luce, e possibilmente con temperature elevate. Per compensare tutti gli errori analitici e garantire dati accurati, approcci mirati richiedono l'aggiunta di IS. Si consigliano IS etichettato isotopicamente, specialmente etichettato 13C. Tuttavia, nella maggior parte degli studi, l'etichetta IS non può essere utilizzata per ogni composto a causa dei costi elevati o perché non sono disponibili in commercio. In questi casi, gli standard etichettati devono essere selezionati con cura per correggere non solo gli errori analitici durante la fase di preparazione del campione, ma anche la potenziale soppressione / potenziamento degli ioni MS.


Tecniche cromatografiche ed elettroforetiche


 Una fase di separazione viene generalmente eseguita prima del rilevamento di MS utilizzando tecniche cromatografiche (cioè GC e LC) o elettroforetiche (cioè CE). Tutte le tecniche presentano vantaggi e limiti specifici discussi di seguito.

GC

La GC è stata la prima tecnica di separazione utilizzata nella metabolomica e rimane molto popolare. La separazione in GC si ottiene vaporizzando frazionalmente gli analiti utilizzando gradienti di temperatura mentre si guida un gas di trasporto inerte (cioè, elio, azoto o idrogeno) sulla fase stazionaria. Pertanto, la separazione è principalmente determinata dalle differenze nella temperatura di evaporazione. Questo processo è ovviamente legato ad un'intrinseca evaporabilità degli analiti, che può portare alla degradazione dei componenti termolabili. Tuttavia, GC mostra progressi in particolare in termini di efficienza di separazione. Questa efficienza di separazione superiore è spiegata dall'assenza di diffusione parassita durante la separazione cromatografica rispetto alla LC. Tuttavia, GC presenta tre principali insidie: in primo luogo, la possibile perdita di analiti termolabili, come accennato in precedenza; secondo, una fase di preparazione del campione piuttosto macchinosa, in particolare a causa della necessità di derivatizzazione dell'analita e terzo, una variabilità generalmente più elevata rispetto alla metabolomica basata su LC.

Degradazione termica

Fang et al. hanno recentemente pubblicato uno studio controverso in cui gli autori hanno sostenuto che temperature elevate come quelle durante l'analisi GC alteravano gravemente il metaboloma analizzato. In questo studio, LC-MS è stato utilizzato per confrontare campioni di plasma riscaldati e non riscaldati, cercando di imitare le condizioni GC. Secondo gli autori, fino al 40% dei composti riscaldati è stato distrutto, modificato o degradato. Questo studio ha suscitato molte discussioni, poiché metteva in dubbio il ruolo di lunga data e preminente della GC-MS, in particolare nella metabolomica esplorativa. Sebbene le affermazioni dello studio possano essere piuttosto inverosimili, ha sottolineato il punto cruciale della degradazione degli analiti durante l'analisi GC-MS. Tuttavia, non solo l'esposizione termica degli analiti può compromettere il successo dell'implementazione dell'analisi GC-MS nella metabolomica clinica, ma anche altri fattori pratici come l'uso di diversi gas di trasporto, differenze nei rivestimenti di ingresso applicati (cioè, design del rivestimento differenziale), diversi tecniche di iniezione (ad es. iniezione con ago caldo rispetto a iniezione con ago freddo) o presenza di impurità nel rivestimento o sulla testa della colonna. Alcuni dei punti sopra menzionati sono stati precedentemente indagati. Le raccomandazioni pratiche per garantire dati metabolomici basati su GC-MS affidabili includono l'uso di un design del rivestimento coerente (ad esempio, conico, collo d'oca o doppio collo d'oca), l'uso costante di rivestimenti di ingresso disattivati ​​e lana di vetro, un programma di manutenzione regolare , iniezione di test di idoneità del sistema e / o QC, cambio regolare delle colonne GC e utilizzo di reagenti e solventi di derivatizzazione della massima qualità.

Preparazione del campione

L'analisi metabolomica basata su GC di solito comporta una procedura di preparazione del campione in due fasi in cui le funzionalità cheto vengono prima derivatizzate utilizzando piridina metossilammina seguita dalla sililazione con N-metil-N-trimetilsilil-trifluoroacetamide (MSTFA) o N-metil-N-dimetil-terz-butile -bistrifluoroacetamide (MtBSTFA). È ben noto che MtBSTFA che formano derivati ​​terz-butildimetilsililici danno origine a ioni frammenti più intensi e ricchi di informazioni, specialmente quando si utilizza la ionizzazione elettronica (EI). Sfortunatamente, l'efficienza di derivatizzazione di MtBSTFA è piuttosto scarsa, in particolare per gli alcoli secondari e terziari, probabilmente a causa di ostacoli sterici che potenzialmente portano a una derivatizzazione parziale. D'altra parte, la stabilità dei trimetilsilileteri ottenuta dalla derivatizzazione di acidi carbossilici con MSTFA è inferiore di diversi ordini di grandezza rispetto alle loro controparti terz-butildimetilsililiche, favorendo l'uso di MtBSTFA. Si raccomanda uno stretto controllo e, se possibile, l'automazione delle procedure di derivatizzazione poiché è ben noto che alcuni derivati ​​(ad esempio, esteri di trimetilsilil) subiscono una degradazione piuttosto rapida nel tempo, richiedendo uguali periodi di post-derivatizzazione. 

Una possibile alternativa ai reagenti di sililazione può essere l'uso di cloroformiato o reagenti di metilazione. Alcune delle insidie ​​di cui sopra sono state affrontate da Villas Boas et al., che hanno studiato la metilazione dei composti utilizzando metilcloroformiato come strategia di derivatizzazione alternativa. Gli autori hanno concluso che la metilazione è superiore alla trimetilsililazione; tuttavia, sono necessari ulteriori studi dettagliati per valutare l'uso di protocolli di derivatizzazione alternativi.

 LC

Rispetto al GC, LC consente l'analisi diretta di composti piuttosto polari e termolabili senza la necessità di derivatizzazione e aggiunge ulteriore selettività attraverso le interazioni tra fasi stazionarie e mobili. Tra tutte le modalità cromatografiche che possono essere utilizzate in metabolomica e lipidomica, la LC in fase inversa (RPLC) rimane il gold standard mentre un numero crescente di studi metabolomici viene eseguito utilizzando HILIC. Nell'ultimo decennio, RPLC-MS è diventato molto competitivo in molteplici campi insieme allo sviluppo di tecnologie innovative come l'uso di fasi stazionarie dotate di particelle superficialmente porose (tecnologia core-shell) o di particelle completamente porose inferiori a 2 μm (ultra alte pressione LC, UHPLC). Entrambi gli approcci forniscono separazioni veloci e ad alta risoluzione (maggiore capacità di picco), che consente un'analisi ad alto rendimento di metaboliti strettamente correlati.

Fase inversa LC

La grande maggioranza degli studi sulla metabolomica dell'RPLC prevede la combinazione di una fase stazionaria modificata con ottadecile (C18) con una fase mobile acquoso-organica composta da MeOH o MeCN contenente lo 0,1% di acido formico. Questa combinazione semplice e versatile porta a forme di picco accettabili per la maggior parte dei metaboliti, una buona efficienza di ionizzazione nella modalità ESI positiva ed un'eccellente ripetibilità del tempo di ritenzione. Nella metabolomica, RPLC mostra due principali inconvenienti, vale a dire, una possibile soppressione ionica particolarmente causata dai fosfolipidi nell'analisi del plasma / siero (effetti matrice) e una scarsa ritenzione di componenti altamente polari, specialmente nell'analisi delle urine. Inoltre, l'uso di acido formico nella fase mobile può portare a una sensibilità relativamente scarsa in modalità ESI negativa. Infine, rispetto a GC-MS, RPLC-MS soffre di una mancanza di librerie spettrali disponibili in commercio che rende l'identificazione dei composti piuttosto complessa in approcci non mirati. Le librerie costruite internamente contenenti sia la ritenzione che le informazioni spettrali offrono quindi uno strumento prezioso per l'identificazione dei metaboliti. 

Cromatografia di interazione idrofila

In modalità cromatografica HILIC, una fase stazionaria polare (cioè silice nuda o silice modificata da gruppi funzionali come diolo, ammina, ammide o frazioni zwitterioniche) viene utilizzata con una fase mobile relativamente idrofoba composta da una miscela acquoso-organica ( solitamente MeCN con tamponi volatili), formando uno strato arricchito in acqua di eluente parzialmente immobilizzato sulla fase stazionaria. I meccanismi di ritenzione sono piuttosto complessi e coinvolgono il partizionamento idrofilo, l'interazione dipolo-dipolo, i legami idrogeno e l'interazione elettrostatica. HILIC mostra diversi vantaggi che rendono questa tecnica particolarmente interessante nella metabolomica, come un segnale MS potenziato dovuto ad una migliore desolvatazione dell'eluente, la possibilità di iniettare direttamente estratti organici solitamente ottenuti per PP o estrazione, e una selettività ortogonale rispetto a RPLC. Tuttavia, HILIC rimane usato raramente in questo campo. Questa riluttanza è probabilmente spiegata dai complessi meccanismi che rendono HILIC meno flessibile e non così semplice come RPLC. I principali inconvenienti di questa tecnica dipendono dalla maggiore variabilità dei tempi di ritenzione, dai tempi di equilibrio più lunghi e dalle forme dei picchi più scarse osservate. Tuttavia, è possibile garantire dati di alta qualità a condizione che durante il flusso di lavoro analitico venga seguita una buona pratica, compresa un'attenta selezione del diluente del campione e del volume di iniezione, l'uso di tamponi salini volatili a un valore di pH fisso e ripetibile e forza ionica, lo studio degli effetti matrice e degli adeguati parametri di preelaborazione dei dati in approcci non mirati. Questi aspetti sono stati recentemente discussi da Kohler et al. in una revisione pratica. L'elettroforesi capillare CE è una tecnica miniaturizzata in cui i composti caricati vengono separati in base al loro rapporto carica-dimensione in una fase liquida elettricamente conduttiva (elettrolita di fondo) sotto l'influenza di un campo elettrico. La sillabazione di CE con MS fornisce interessanti vantaggi per applicazioni metabolomiche tra cui un'elevata selettività ed efficienza di separazione, specialmente per composti polari e / o carichi che mostrano una scarsa ritenzione in RPLC; un meccanismo di separazione ortogonale rispetto alle tecniche cromatografiche, che porta a una copertura metabolica complementare; la separazione di composti chirali; la sua applicabilità a campioni con volume limitato e la possibilità di metabolomica unicellulare. Tuttavia, rispetto ad altre tecniche basate sulla SM, la CE – MS è poco utilizzata nella metabolomica; soffre di una minore sensibilità complessiva e di una scarsa riproducibilità dei tempi di migrazione dovuta all'adsorbimento del materiale di matrice sulla superficie capillare. Inoltre, i sistemi commerciali non sono dotati di autocampionatori adattati per analisi ad alto rendimento e presentano una ripetibilità di iniezione inferiore rispetto ai sistemi LC. Questi ultimi inconvenienti favoriscono l'uso sistematico dell'IS per correggere la variabilità dell'iniezione. Infine, l'accoppiamento CE-MS non è così semplice come LC-MS o GC-MS e richiede ulteriori competenze pratiche per ottenere un segnale MS stabile e dati affidabili. Le limitazioni variano a seconda dell'interfaccia utilizzata per la sillabazione CE – MS. Attualmente sono disponibili in commercio due diverse interfacce, vale a dire, l'interfaccia guaina-liquido e la punta porosa senza guaina. L'interfaccia guaina-liquido è tipicamente considerata più stabile, ripetibile ed economica, ma soffre di una minore sensibilità dovuta alla diluizione dell'effluente CE con il liquido della guaina. D'altra parte, l'interfaccia commerciale senza guaina fornisce una maggiore sensibilità ed efficienza di separazione ma a costi più elevati e con meno robustezza e flessibilità. Oggi, la configurazione ottimale CE-MS per gli approcci metabolomici si basa su una combinazione di interfaccia guaina-liquido, tecniche di preconcentrazione online, uso sistematico di IS, iniezione regolare di QC, uso della mobilità elettroforetica al posto dei tempi di migrazione, adeguato allineamento postanalisi dei dati e sufficiente esperienza pratica. I limiti della tecnica spiegano certamente la riluttanza nell'usarla in metabolomica. È solo con ulteriori sviluppi nella strumentazione CE, in particolare con un'interfaccia CE-MS stabile e sensibile, che questa tecnica potrebbe essere pienamente sfruttata come strumento complementare oltre alle tecniche cromatografiche.

SM

La SM è stata ampiamente utilizzata nella metabolomica e rimane la tecnica di rilevamento gold standard dopo la separazione cromatografica o elettroforetica. È solo grazie all'elevato contenuto di informazioni dei dati della SM che è possibile ottenere l'identificazione e la quantificazione da centinaia a migliaia di analiti in una singola corsa analitica. Le principali tecniche di ionizzazione utilizzate nella metabolomica basata sulla SM sono EI, ionizzazione chimica (CI), ESI e ionizzazione chimica a pressione atmosferica (APCI). Mentre EI e CI sono tipicamente usati in combinazione con GC, APCI può essere usato in combinazione con GC, LC e CE; ed ESI con LC e CE.

Tecniche di ionizzazione

Storicamente, l'EI è stata la prima tecnica di ionizzazione impiegata per gli esperimenti sulla SM. In EI, gli elettroni emessi da un filamento di tungsteno riscaldato vengono accelerati. Questi elettroni entrano in stretta vicinanza con le molecole neutre che eluiscono tipicamente da una colonna GC, portando alla formazione di ioni radicali e frammenti carichi. L'EI è generalmente descritta come una tecnica di ionizzazione "dura"; questo può essere molto utile analizzando molecole neutre, sebbene alcuni analiti come esteri o acidi chetocarbossilici possano subire una grave frammentazione. Ciò può rendere i dati spettrali ottenuti molto difficili da interpretare quando si osservano solo frammenti a basso peso molecolare. Tuttavia, il principale vantaggio di EI è la sua prestazione altamente standardizzata e ripetibile. Nel corso degli anni, ciò ha portato a vaste librerie spettrali contenenti oltre 250.000 composti, che rendono GC – EI – MS una tecnologia molto interessante per l'identificazione di metaboliti sconosciuti di interesse. Tradizionalmente, un'energia cinetica di 70 eV viene utilizzata per EI, consentendo un elevato confronto spettrale. Tuttavia, molti moderni strumenti GC-EI-MS offrono la possibilità di modificare questo valore, cambiando così il contenuto energetico degli elettroni emessi. Sebbene ci siano stati alcuni rapporti che dimostrano che la riduzione dell'energia degli elettroni provoca una minore frammentazione, questo di solito riduce anche gravemente la sensibilità complessiva. La CI è considerata una tecnica di ionizzazione "morbida" in cui un gas reagente (spesso metano) viene utilizzato in combinazione con una sorgente EI, provocando la formazione di ioni primari derivanti dal gas reagente. Gli ioni di gas reagente formati successivamente ionizzano le molecole di interesse, principalmente mediante processi collisionali. Rispetto a EI, CI consente quindi frequentemente la determinazione dello ione molecolare. La CI in modalità negativa è stata, ad esempio, ampiamente utilizzata per l'analisi degli acidi grassi, mentre il suo utilizzo negli studi di metabolomica è rimasto piuttosto limitato. Ciò può essere spiegato dalla mancanza di librerie spettrali poiché la maggior parte di esse sono costruite con dati GC – EI – MS. L'ESI è sicuramente la tecnica di ionizzazione più ampiamente applicata per la metabolomica basata su LC-MS. Sebbene i meccanismi dettagliati del processo ESI non siano ancora completamente compresi, è comunemente accettato che inizialmente una dispersione elettrospray di un liquido in un ugello generi goccioline cariche durante la formazione del cosiddetto cono di Taylor. Quando vengono generate goccioline cariche, il solvente inizia ad evaporare, portando ad un aumento della densità di carica della gocciolina. Ad un certo punto, il cosiddetto limite di Rayleigh verrà superato portando alla formazione di goccioline secondarie sotto forma di un cono di Taylor dalle goccioline primarie. Questo processo si ripete portando alla formazione di goccioline molto piccole, essendo la fonte primaria di ioni rilevata in una SM. I vantaggi di ESI sono una semplice sillabazione di LC e CE, la sua elevata efficienza di ionizzazione, virtualmente nessuna restrizione nella gamma di massa e la ionizzazione diretta dei liquidi. Tuttavia, l'ESI può essere soggetto a significativi effetti di matrice, in particolare mettendo a repentaglio la bioanalisi quantitativa. Diversi studi hanno già affrontato le strategie per garantire una quantificazione accurata, rendendo ESI la tecnica di ionizzazione più importante nella bioanalisi moderna nonostante i suoi limiti. Nella metabolomica clinica, gli effetti della matrice non solo mettono a repentaglio il risultato dello studio, ma possono anche portare a interpretazioni errate. Nel loro studio, Giera e colleghi hanno studiato il profilo lipidico dei pazienti con artrite reumatoide e osteoide. Sulla base della PCA e dell'analisi discriminante dei minimi quadrati parziali (PLS-DA) dei dati LC-ESI-MS acquisiti in modalità ESI negativa, è stato inizialmente ipotizzato che il raggruppamento tra campioni di liquido sinoviale potesse essere collegato allo sfingomiloide SM (d18: 2 / 16: 0), che è stata classificata come la terza variabile più importante responsabile della classificazione dei campioni. Tuttavia, dopo l'idrolisi selettiva delle fosfatidilcoline, non è stato possibile osservare statisticamente alcuna differenza tra i campioni, come sottolineato dal grafico dei punteggi PCA. Questo risultato inaspettato è stato spiegato dalla presenza di fosfolipidi ossidati che si sovrapponevano a SM (d18: 2/16: 0). Quindi, la coeluizione di fosfolipidi ossidati con SM (d18: 2/16: 0) ha portato alla soppressione ionica, in particolare nella modalità ESI negativa. La forte soppressione ionica di SM (d18: 2/16: 0) ha gravemente influenzato il modello statistico, facendo sì che il modello si basi sull'effetto di soppressione ionica anziché sul composto stesso. APCI è una tecnica di ionizzazione "morbida" solitamente accoppiata a LC per la ionizzazione di composti meno polari e neutri, ma è stata anche sillabata sia con CE che con GC. In APCI, l'eluente liquido o gassoso scorre attraverso un nebulizzatore riscaldato; la miscela ottenuta di liquido caldo e vapori si espande nell'interfaccia della pressione atmosferica dove viene ionizzata da una scarica a corona, determinando un trasferimento protonico dalle molecole di solvente agli analiti. A differenza di ESI, che si basa su una ionizzazione in fase liquida, la ionizzazione APCI si verifica in fase gassosa. GC – APCI – MS è stato scarsamente riportato negli studi di metabolomica anche se mostra meno frammentazione di EI e, in alcuni casi, è più sensibile di EI e CI. La principale limitazione di GC-APCI-MS nelle applicazioni di metabolomica, condivisa da LC-APCI-MS e GC-CI-MS, è la mancanza di librerie spettrali per l'identificazione dei composti. Una libreria basata sul web per GC-APCI-MS contenente indici di ritenzione e spettri MS (/ MS) per una gamma di composti endogeni ed esogeni (> 150 composti) è stata presentata da Pacchiarotta et al. più dipendente dalle condizioni (ad es. umidità, temperatura, condizioni di flusso, geometria della sorgente, tensioni coniche, ecc.) rispetto a EI, il confronto degli spettri tra diversi strumenti potrebbe essere limitato.

Analizzatori di massa

A seconda dello scopo dello studio, una vasta gamma di analizzatori di massa viene utilizzata nella metabolomica clinica, in particolare MS ad alta risoluzione come gli analizzatori quadrupoli timeof-flight (qToF) o Orbitrap, nonché quadrupoli, trappole ioniche e altri strumenti ibridi. Ogni analizzatore di massa mostra vantaggi e limitazioni; quindi, molti studi prevedono l'uso di più di un sistema per raccogliere informazioni complementari. Negli studi mirati, vengono utilizzati principalmente analizzatori di massa a trappola ionica lineare a triplo quadrupolo o quadrupolo a causa della loro elevata sensibilità e selettività, in particolare se utilizzati in modalità di monitoraggio della reazione selettiva (SRM). Sebbene la combinazione di LC con transizioni SRM altamente selettive fornisca un alto grado di selettività, rimane insufficiente per discriminare isomeri geometrici che mostrano spettri di massa tandem identici (vedere la sezione "Stereoisomeri e chiralità"). Nella metabolomica non mirata, i sistemi qToF sono ampiamente utilizzati in quanto forniscono un'elevata risoluzione e precisione di massa, nonché un'elevata velocità di scansione. In particolare, i dati spettrali ad alta risoluzione ottenuti sono utili per l'identificazione dei composti, facilitando le ricerche nel database e la generazione della composizione elementare. Tuttavia, sulla base di studi recenti, l'identificazione inequivocabile dei composti di interesse non dovrebbe basarsi esclusivamente sulla SM ad alta risoluzione, ma dovrebbe sempre includere la misurazione degli spettri di massa in tandem e, idealmente, il confronto dei tempi di ritenzione e degli spettri MS (/ MS) con autentici standard sintetici Materiale.

Stereoisomeri e chiralità

Gli stereoisomeri (inclusi gli isomeri geometrici), i diastereomeri e gli enantiomeri svolgono ruoli biologici cruciali, rendendo la loro separazione e corretta assegnazione molto importanti nella metabolomica clinica. Ad esempio, i diastereomeri e gli isomeri geometrici 5S, 12S-diHETE e LTB4 non solo derivano da percorsi diversi, ma mostrano anche una grande differenza nella rispettiva attività biologica. Poiché tali sostanze mostrano spettri di massa tandem identici e, in molti casi, comportamento di ritenzione simile, sono necessarie ulteriori dimensioni di separazione, ad esempio la spettrometria di mobilità differenziale (DMS). Il DMS ha recentemente dimostrato di facilitare la separazione dei lipidi e degli isomeri dalle classi di leucotriene e protette. Un altro esempio rilevante riguarda gli acidi d- e l-lattico, di cui solo l'acido d-lattico sembra essere collegato alla sindrome dell'intestino corto. Pertanto, è di grande importanza per comprendere la rilevanza biologica degli isomeri stereochimici per garantire la loro separazione e corretta assegnazione. Entrambi i punti sono stati recentemente sottolineati da Struys nel contesto dell'analisi del d- e dell'l-2-idrossiglutarato dove solo il d-2-idrossiglutarato gioca un ruolo cruciale nel cancro. Mentre i diastereomeri e gli isomeri geometrici di solito presentano proprietà fisico-chimiche diverse, che consentono la loro separazione mediante cromatografia, questo non è il caso degli enantiomeri. La separazione degli enantiomeri richiede l'uso di fasi stazionarie chirali o l'aggiunta di un selettore chirale nell'elettrolita di fondo CE. Sebbene le moderne fasi chirali consentano la separazione di vari enantiomeri, la scelta della chimica ottimale della colonna o del selettore chirale rimane un processo empirico e il comportamento di ritenzione / migrazione degli enantiomeri non può essere previsto. Anche se alcuni rapporti sono stati recentemente pubblicati sulla metabolomica chirale (inclusa l'analisi basata su NMR), resta ancora molto lavoro da fare. Tuttavia, separazioni chirali in fase gassosa, reagenti di spostamento NMR, CE chirale e reagenti di derivatizzazione sono certamente una via da seguire.

 Spettroscopia NMR

La NMR è complementare alla SM nella metabolomica clinica. In NMR, l'interazione del dipolo magnetico dei nuclei atomici con un campo magnetico applicato viene utilizzata per sondare l'ambiente chimico di quei nuclei. Ciò si traduce in uno spettro NMR isotopo-specifico, in cui la posizione dei picchi nello spettro è caratteristica del gruppo chimico contenente i nuclei. In particolare, l'area del picco è linearmente correlata al numero di nuclei nel campione e quindi alla concentrazione del metabolita. La NMR è una tecnica non distruttiva e richiede una preparazione del campione relativamente semplice. Sebbene NMR sia stato sillabato con successo in LC, gli studi di metabolomica clinica di solito comportano misurazioni NMR dirette. Considerando la bassa dispersione dei cambiamenti chimici rispetto all'ampiezza del picco, questo approccio porta a spettri relativamente affollati ma molto riproducibili. Una limitazione comune dell'NMR è la sua sensibilità relativamente bassa rispetto alle tecniche basate su MS. La polarizzazione magnetica dei nuclei è data dalla differenza di popolazione dei livelli di energia nucleare che sono determinati dall'orientamento del dipolo magnetico nucleare. La differenza di energia di questi livelli è piccola, portando a una piccola differenza di popolazione di questi livelli di energia a temperatura ambiente. Ciò si traduce in una sensibilità relativamente bassa anche per gli isotopi con le migliori proprietà, in altre parole, i nuclei di spin ½ con grandi rapporti magnetogirici (1 H e 19F). La sensibilità può essere migliorata utilizzando magneti superconduttori molto potenti e crio-sonde che azionano i circuiti del ricevitore a basse temperature per ridurre il rumore elettronico. In genere, vengono accumulate più scansioni per migliorare ulteriormente il rapporto S / N. Dopo il rilassamento, consentendo al sistema di rotazione di tornare all'equilibrio termico (ca. pochi secondi), le scansioni possono essere ripetute in una certa misura (rapporto S / N ∼ n½) per aumentare la sensibilità. Tuttavia, i metaboliti con concentrazioni inferiori a 1 μM saranno generalmente inferiori al limite di rilevamento. Il numero di metaboliti visibili nello spettro protone (1 H) -NMR varia da circa 50 nei campioni di siero / plasma a circa 200 nelle urine. Il numero di picchi generati da un metabolita è determinato dal numero di protoni non equivalenti nella molecola. Inoltre, il momento magnetico dei nuclei viene trasferito dagli elettroni di legame ai nuclei vicini mediante l'accoppiamento J. Questo accoppiamento divide ogni picco in doppietti, terzine, quadruple o altri multipli di varia complessità. In un sistema NMR comunemente usato con un magnete da 14 Tesla, lo spettro del protone è largo 6 kHz. Con una larghezza di picco media di 1 Hz, accoppiamenti J di 15 Hz e più picchi per ogni metabolita, la sovrapposizione dei picchi è comune. Qualunque sia la matrice, l'acqua è di gran lunga la molecola con la più alta concentrazione. A loro volta, i protoni dell'acqua dominano lo spettro NMR a meno che non si presti particolare attenzione a sopprimere i segnali dell'acqua, ad esempio utilizzando una combinazione di presaturazione dell'acqua e gradienti di campo pulsato. Per generare la presaturazione per il segnale dell'acqua viene utilizzata un'intensità di campo a bassa irradiazione; tuttavia, anche i picchi del metabolita vicino al segnale dell'acqua vengono influenzati e ridotti di intensità. Inoltre, i picchi dei protoni che scambiano con l'acqua possono essere inferiori al previsto a causa della presaturazione dell'acqua. In caso di analisi delle urine, il pH del campione può influenzare lo spostamento chimico di alcuni picchi, in particolare quelli vicini all'azoto ad eccezione dei sali di ammonio quaternario. L'aggiunta di tampone fosfato durante la preparazione del campione stabilizza il pH ma poiché la miscela finale è un compromesso tra la concentrazione del metabolita e la stabilità del pH, alcuni picchi mostreranno comunque variazioni significative. Esistono algoritmi di allineamento per compensare le variazioni di picco dovute a questi effetti, ma rispetto all'allineamento cromatogramma / elettroferogramma, gli altri picchi vicini non si spostano necessariamente nella stessa misura o addirittura nella stessa direzione. La concentrazione di sale influenza l'induttanza della bobina a radiofrequenza (RF), influenzando le intensità RF degli impulsi e il rapporto segnale-rumore del segnale registrato. La sintonizzazione e l'adattamento automatici dei circuiti RF e la calibrazione automatica degli impulsi prima di ogni misurazione sono essenziali, ma la larghezza di banda di eccitazione e le prestazioni di ricezione del decadimento libero (FID) della sonda saranno comunque diverse da campione a campione a seconda della concentrazione di sale. A causa della difficoltà di deconvoluzione dei picchi per quantificare i singoli metaboliti, gli studi di metabolomica NMR vengono spesso eseguiti in modo non mirato e non quantitativo. Pertanto, anche se alcuni segnali non possono essere deconvoluti o assegnati in modo affidabile a un metabolita, possono comunque contribuire ai modelli diagnostici. Uno spettro NMR consiste abitualmente di diverse diecimila punti per descrivere accuratamente le forme dei vari picchi. Per limitare il numero di variabili viene applicata una cosiddetta procedura di binning, che divide l'intero spettro in intervalli specifici prima dell'integrazione. Esistono diverse strategie per impostare la posizione dei bordi dell'intervallo. L'approccio più semplice consiste nell'utilizzare il binning equidistante, dove patch consecutive di spettro di uguale dimensione definiscono i bin, ma mostra il rischio che il bordo di un bin cada sopra un picco. Un approccio migliore è il binning adattivo, in cui un algoritmo cerca di trovare le posizioni ottimali dei bordi del bin, assicurando che la maggior parte dei picchi ricada interamente in un bin. I metodi di categorizzazione includono informazioni da metaboliti non identificati e non risolti, ma ciò non garantisce la generazione di modelli migliori in metabolomica. In effetti, in molte coorti, i partecipanti possono essere sottoposti a diversi regimi terapeutici. In caso di inclusione indiscriminata di bin, saranno inclusi nel modello anche tutti i metaboliti esogeni. In queste situazioni, deve essere eseguita la quantificazione dei soli metaboliti che possono essere assegnati e deconvoluti in modo affidabile. Diversi strumenti software sono stati sviluppati per aiutare con l'adattamento e la deconvoluzione dei picchi NMR, entrambi disponibili gratuitamente (ad esempio, BATMAN) o commerciali (AMIX di Bruker Corporation o Chenomx di Chenomx Inc.). L'identificazione dei picchi richiede una certa ingegnosità nella metabolomica NMR. Il gruppo funzionale a cui appartiene il protone determina approssimativamente l'area dello spettro in cui appare il picco. Esistono database che elencano gli spostamenti chimici dei picchi della maggior parte dei metaboliti in soluzioni pure, in particolare il database del metaboloma umano, la banca dati di risonanza magnetica biologica, il database del consorzio Madison Metabolomics e database forniti con i pacchetti software commerciali Chenomx e AMIX. Tuttavia, poiché il solvente, il pH e la concentrazione di sale influenzano l'esatto spostamento chimico, la posizione di un picco in un biofluido può essere diversa da quella nelle soluzioni standard, rendendo difficile l'identificazione. La molteplicità del picco può fornire informazioni aggiuntive ma aumenta la probabilità di sovrapposizione dei picchi. Quindi, oltre a uno spettro 1D standard, uno spettro risolto J 2D viene solitamente registrato per ogni campione che separa gli effetti dell'interazione di spostamento chimico e dell'accoppiamento J in due diverse dimensioni spettrali, riducendo significativamente la sovrapposizione dei picchi. Tuttavia, diversi picchi con la stessa molteplicità appaiono spesso l'uno vicino all'altro. Ad esempio, gli amminoacidi a catena ramificata producono tutti doppietti intorno a 1 ppm. NMR offre una vasta gamma di diverse sequenze di impulsi che possono aiutare a identificare i metaboliti mostrando la connettività di un protone a protoni vicini e remoti, o ad atomi di carbonio vicini. Queste sequenze di impulsi più complesse producono tipicamente spettri multidimensionali da cui è possibile estrarre una rete di connettività che è spesso unica per un metabolita specifico. I database includono informazioni sugli spettri 2D ed esistono strumenti software per aiutare con l'assegnazione dei crosspeak 2D. Questi spettri 2D richiedono anche più tempo per la registrazione e, pertanto, vengono solitamente applicati solo su campioni specifici anche se alcuni studi di metabolomica sono stati eseguiti utilizzando esperimenti 2D di routine. Poiché picchi diversi dallo stesso metabolita rispondono in modo identico alle variazioni di concentrazione, la ricerca di correlazioni elevate tra le aree dei picchi di risonanze diverse su coorti può essere utilizzata anche per assegnare picchi ai metaboliti, un metodo denominato Spettroscopia di correlazione totale statistica (STOCSY). L'identificazione dei composti può essere infine confermata aggiungendo standard nella matrice studiata. L'NMR rappresenta anche un potente strumento nella metabolomica quantitativa. Infatti, nella maggior parte dei casi, l'area del picco è linearmente correlata al numero di protoni equivalenti che generano il picco. Tuttavia, una quantificazione imprecisa può risultare quando il metabolita ha proprietà diverse rispetto al composto di riferimento, ad esempio, comportamento di rilassamento diverso, attenuazione da parte del campo di presaturazione o efficienza di eccitazione inferiore per gli spin nucleari del picco di riferimento. Alcuni metaboliti, o anche il composto di riferimento stesso, possono associarsi a macromolecole o assemblaggi supramolecolari presenti nel campione, ad esempio, il composto di riferimento comunemente usato trimetilsilil propionato (TSP) con albumina e lipoproteine ​​nel siero. Altri metodi utilizzano un segnale di riferimento generato elettronicamente o una combinazione di un campione di riferimento e la lunghezza dell'impulso di eccitazione, che è inversamente proporzionale alla sensibilità del circuito del ricevitore.

Conclusione

Nell'ultimo decennio, le strategie basate sulla metabolomica hanno dimostrato la loro rilevanza nella ricerca clinica, fornendo strumenti innovativi per comprendere meglio i processi fisiopatologici, i meccanismi delle malattie ed offrendo nuove strategie per migliorare la diagnosi, la prognosi e la scoperta di nuovi bersagli terapeutici. Tuttavia, i risultati di più studi sono stati influenzati da problemi imprevisti durante il processo analitico. Questa recensione evidenzia le sfide analitiche e le insidie ​​che possono essere incontrate in ogni fase del processo analitico, dalla progettazione dello studio all'analisi dei dati, e fornisce alcune soluzioni per affrontare queste sfide nella metabolomica clinica basata sulla NMR e sulla SM. Il risultato clinico degli studi di metabolomica si basa fortemente sulla qualità e l'accuratezza dei dati acquisiti. Un attento progetto dello studio che includa tutte le fasi cruciali dovrebbe quindi essere pianificato prima dell'effettivo inizio dello studio e della raccolta del campione, garantendo la massima qualità dei dati e la più bassa variabilità analitica. Anche se una scoperta di biomarcatori di successo non significa necessariamente che la fase di convalida sarà gratificante, ha sicuramente un impatto positivo sul tasso di successo di quest'ultima.

 Prospettive future

 La metabolomica ha mostrato il suo interesse e promette di migliorare la scoperta di biomarcatori per una vasta gamma di malattie, in particolare disturbi cardiovascolari, diabete, sindrome metabolica, cancro, malattie gastrointestinali, malattie infettive e disturbi neurologici e psichiatrici. Ha aperto la strada a strategie sanitarie personalizzate per lo sviluppo di terapie nuove e adeguate e per l'implementazione di approcci diagnostici su misura ed efficienti. Tuttavia, nonostante il suo potenziale, la traduzione dei risultati della metabolomica in medicina diagnostica e prognostica personalizzata è ancora in una fase iniziale. Vari biomarcatori o pattern metabolici sono già stati evidenziati in più malattie ma finora non sono stati convalidati e utilizzati nelle applicazioni cliniche. Sono stati compiuti enormi sforzi nella fase di scoperta, sforzi che ora sono previsti anche per migliorare la convalida dei candidati biomarcatori. La letteratura odierna è sovraccarica di nuovi biomarcatori candidati che, per la grande maggioranza di loro, non raggiungono la fase di convalida. Gli sforzi interdisciplinari, le collaborazioni traslazionali tra istituzioni accademiche, agenzie farmaceutiche ed aziende diagnostiche, nonché la standardizzazione delle procedure sono fondamentali per andare avanti. La medicina di precisione è una disciplina traslazionale che coinvolge più comunità scientifiche; la comunità clinica rimane in gran parte senza familiarità con il campo della metabolomica. Comprendendo meglio il processo analitico alla base degli studi di metabolomica, aiuterà sicuramente i medici a prevedere la sua importanza nella ricerca clinica.


Da:

https://f.hubspotusercontent10.net/hubfs/6893718/BZ%20-%20editors%20picks%20eBook%20images/BZ%20Editor%E2%80%99s%20Picks_The%20future%20of%20metabolomics.pdf?__hssc=78901003.3.1605830373472&__hstc=78901003.71c9d29221247064a81ec754f77a5c45.1604177660081.1604186039157.1605830373472.3&__hsfp=1932217370&hsCtaTracking=78e895a5-8584-4c13-b1e6-288c9553a3ab%7Cc42cf633-c258-4403-9b8f-6e16dee4727e


Commenti

Post popolari in questo blog

Paracetamolo, ibuprofene o novalgina: quali le differenze? / acetaminophen, ibuprofen, metamizole : what are the differences?

Diminuire l'ossigeno per aumentare la longevità? / Decrease Oxygen to Boost Longevity?

Sci-Fi Eye: il nostro futuro urbano / Sci-Fi Eye: Our Urban Future