Metabolon

Pourquoi Metabolon?

Metabolon: L'étalon-or de la métabolomique exploitable

Le goulot d'étranglement pour la plupart des praticiens de la métabolomique reste l'identification précise des métabolites à partir des données brutes.

Les fournisseurs de services métabolomiques affirment tous que leurs plateformes peuvent identifier des milliers (ou des centaines de milliers) de "biomarqueurs" ou de "caractéristiques" dans leurs produits respectifs. Cependant, une part importante de ces métabolites est "identifiée sur la base de critères minimaux, voire inexistants, pour une identité précise", ce qui entraîne une identification incorrecte des métabolites et, par conséquent, une interprétation erronée des données expérimentales.

Nous aborderons ici les sujets suivants :

  • Définir les termes clés utilisés par les fournisseurs de services métabolomiques (universitaires et commerciaux).
  • Souligner les principales différences entre les terminologies (par exemple, caractéristiques, biomarqueurs, annotations/identifications).
  • Décrire les processus nécessaires à l'identification précise des métabolites.
  • Discuter de l'importance des niveaux de confiance d'annotation standard établis par l'industrie, utilisés pour minimiser ou éliminer la variabilité des méthodes d'annotation entre les plates-formes, améliorant ainsi la précision de l'identification des métabolites.
  • Démontrer pourquoi une identification très précise des métabolites est essentielle pour tirer des conclusions biologiques fiables à partir d'ensembles de données métabolomiques et l'applicabilité de ces connaissances dans la découverte de médicaments.

Le défi de la métabolomique

La métabolomique est un domaine qui progresse rapidement et qui permet d'obtenir des informations mécanistes, fonctionnelles et exploitables sur la complexité des systèmes biologiques.1,2 En effet, plusieurs tests cliniques destinés à surveiller la santé humaine sont basés sur de petites molécules ou métabolites, tels que le glucose, le cholestérol, la créatinine et d'autres. En exploitant la puissance de la métabolomique, les chercheurs peuvent découvrir des informations inestimables sur les mécanismes sous-jacents de la maladie et développer des empreintes phénotypiques plus précises pour évaluer le risque individuel de maladie.2

Néanmoins, l'annotation précise des métabolites (c'est-à-dire leur identification) et l'utilisation d'outils bioinformatiques appropriés pour soutenir l'identification précise restent un défi important pour de nombreuses personnes dans ce domaine. L'étape cruciale de la conversion des données brutes de spectrométrie de masse (SM) en une identification précise des métabolites est à la base du succès de toute question scientifique posée. En l'absence d'identifications précises, basées sur des mesures rigoureuses et factuelles, seules des conclusions inexactes peuvent être tirées.

Plusieurs facteurs contribuent aux difficultés liées à l'identification précise des métabolites à partir des données de la spectrométrie de masse, notamment les limites inhérentes aux performances du matériel, la vitesse d'acquisition des données et le coût, quel que soit le fournisseur de services. Les méthodes plus rapides et moins coûteuses fourniront probablement moins de métabolites avec une précision moindre. Si l'objectif d'une étude métabolomique est d'obtenir des informations scientifiques significatives, l'identification des métabolites doit être précise pour faciliter l'interprétation des données.

Comprendre les défis à relever pour atteindre une telle précision est primordial pour les chercheurs qui cherchent à exploiter tout le potentiel de la métabolomique et à réaliser des percées dans la recherche sur les maladies. Chez Metabolon, nous avons passé plus de 20 ans à optimiser l'identification des métabolites, à améliorer l'efficacité des processus grâce à l'automatisation et à intégrer l'apprentissage automatique dans l'identification des métabolites, garantissant ainsi la génération des données les plus précises et de la plus haute qualité sur le marché.

Plateformes métabolomiques

Les plateformes analytiques telles que la spectrométrie de masse et la résonance magnétique nucléaire (RMN) se sont imposées comme les plateformes dominantes permettant la détection robuste de nombreux métabolites. La couverture la plus complète des métabolites est généralement obtenue par une approche non ciblée utilisant la chromatographie liquide à haute performance (CLHP) couplée à la spectrométrie de masse à haute résolution (HRAM), communément appelée CLHP-MS ou LC-MS. La LC-MS est capable de détecter en routine des milliers de composés chimiques uniques, offrant ainsi une large couverture des métabolites biologiquement pertinents.3

Un pipeline métabolomique LC-MS non ciblé typique nécessite un traitement rigoureux des données brutes au cours d'une série d'étapes :

  1. Extraction de caractéristiques (y compris l'ion parent/moléculaire, les isotopes et la détection des adduits)
  2. Caractéristique Temps de rétention Alignement des pics
  3. Surface sous la courbe pour chaque caractéristique
  4. Annotation/identification des caractéristiques
  5. Analyse statistique
  6. Interprétation des données

Un ensemble de données typique contient jusqu'à des dizaines de milliers de caractéristiques (paires masse-charge et temps de rétention (m/z-RT)). Celles-ci correspondent à un mélange complexe d'adduits nonidentifiés4,5 , de fragments in-source, de multimères, de véritables ions moléculaires et d'un vaste assortiment d'isotopes uniquement différenciables par le temps de rétention.6 Bien que les stratégies commencent à diverger à l'étape 6, ces caractéristiques d'ions non moléculaires sont systématiquement la source de nombreuses erreurs d'identification.

Caractéristiques des métabolites par rapport à l'annotation

Bien qu'il soit difficile d'obtenir des informations biologiques à partir de caractéristiques métaboliques non identifiées, la plupart des fournisseurs de services métabolomiques mettent l'accent sur le nombre de caractéristiques qu'ils peuvent détecter, que ces caractéristiques puissent être identifiées ou non. Mais le nombre de caractéristiques détectées/rapportées par métabolite n'est pas une grande mesure de la valeur étant donné que toutes les caractéristiques détectées ne correspondent pas à l'ion parent (ion moléculaire) d'un métabolite connu. De nombreuses caractéristiques représentent des artefacts de la méthodologie utilisée et comprennent des artefacts d'ionisation moléculaire tels que des adduits, des fragments dans la source, des chimères, des multimères et du bruit de fond (figure 1)..

Les utilisateurs obtiennent généralement une liste de ces artefacts ainsi que de toutes les autres caractéristiques détectées à la fin de l'étape 3, avec l'hypothèse possible que toutes les caractéristiques, y compris les artefacts, représentent des ions parents et qu'ils tenteront donc de les identifier. Le nombre d'identifications erronées dans ce flux de travail typique est devenu si important en raison de ces hypothèses que la communauté de la métabolomique a établi des mesures sur les caractéristiques des éléments qui représentent une identification suffisamment rigoureuse pour être utilisée universellement dans l'identification des métabolites.7

Bibliothèque Metabolon vs. autres

Figure 1. Spectre LC-MS du glucose, montrant l'ion parent et les fragments in-source ainsi que les adduits de chlore et de formiate. Tous ces éléments constituent des "caractéristiques".

L'annotation est le processus qui consiste à attribuer une identité ou un nom spécifique à une caractéristique détectée. Une liste de nombreuses caractéristiques peut correspondre à un seul métabolite (figure 1). Il s'agit d'une étape essentielle de l'analyse métabolomique qui permet aux chercheurs d'identifier avec précision les métabolites présents dans leurs échantillons et de faire progresser leurs études.

Pour distinguer les différents niveaux de confiance dans la précision des annotations, la metabolomics standards initiative (MSI) a proposé en 2007 quatre niveaux d'identification7 , qui ont ensuite été étendus à cinq niveaux (Figure 2).8 À l'intérieur dechaque niveau, l'approche de l'annotation des métabolites est différente et dépend du niveau de confiance requis par les normes établies.

niveaux d'identification des métabolites

Figure 2. Les niveaux d'identification qui ont été établis pour assurer la confiance dans les annotations. Le niveau 1 est le plus rigoureux, exigeant m/z, RT et MS/MS d'une caractéristique mesurée par rapport à un étalon chimique authentique.

Chez Metabolon,

nous offrons la plus grande bibliothèque de niveau 1 dans l'industrie de la métabolomique.

Le processus d'annotation

L'annotation des candidats métabolites est un processus qui prend du temps et qui repose sur la comparaison des masses avec toutes les normes authentifiées réalisées en interne ou facilement disponibles dans des bases de données externes, puis sur la confirmation de ces correspondances par d'autres caractéristiques, telles que le temps de rétention (RT). La spectrométrie de masse en tandem (MS2 ou MSn) peut être utilisée pour obtenir des informations structurelles supplémentaires permettant de confirmer l'identité du métabolite. Des bases de données de structures moléculaires étendues, facilement disponibles et accessibles (par exemplePubchem9,HMDB10,KEGG11, ChemSpider12) et des bases de données de spectres de fragmentation (par exempleMetlin13,GNPS14,MassBank15 et NIST16) peuvent contribuer à l'identification des métabolites ; toutefois, les spectres de fragmentation des métabolites sont très spécifiques à l'instrument et à l'environnement, de sorte qu'il peut être difficile de trouver des correspondances spectrales exactes dans ces bases de données existantes.

Pour faciliter l'indexation de ces bases de données à grande échelle, des outils d'annotation logiciels (par exemple,XCMS17 ,GNPS14 ,SIRIUS18 et MS-DIAL19) ont été mis au point et intégrés dans les flux de travail de la métabolomique computationnelle. Toutefois, l'utilisation de ces outils d'annotation pose des problèmes majeurs, car la plupart de ces algorithmes nécessitent de multiples seuils ajustables et des paramètres de coupure qui peuvent varier considérablement d'un utilisateur à l'autre.20 Par conséquent, des listes de pics très différentes peuvent être générées à partir d'un seul ensemble de données brutes en fonction de l'algorithme et des paramètres utilisés. Ces problèmes sont préjudiciables, en particulier pour les grands ensembles de données où un manque de reproductibilité peut avoir un impact profond sur l'interprétabilité.21 En outre, aucune de ces bases de données n'utilise la RT dans le cadre du processus d'annotation, un problème particulier compte tenu de la rareté des isomères structurels ayant la même formule moléculaire, la même masse et les mêmes caractéristiques de fragmentation. Parmi les exemples notables, on peut citer la famille des hydroxy-butyrates et des hexoses, parmi beaucoup d'autres qui ne peuvent être identifiés avec précision sans l'utilisation du temps de rétention. Les résultats générés sans le temps de rétention sont sujets à des taux d'erreur d'identification significativement plus élevés.

Qu'est-ce que l'étalon-or ?

Actuellement, l'étalon-or pour l'annotation des métabolites consiste à faire correspondre au moins deux propriétés physiochimiques (par exemple, la valeur m/z exacte, le RT et le MS/MS) d'une caractéristique mesurée avec des normes chimiques authentiques mesurées à l'aide de la même plateforme LC-MS, des mêmes paramètres d'acquisition de données et des mêmes protocoles de préparation des échantillons (par exemple, méthodes chromatographiques, modes d'ionisation et énergies de collision).7,22,23 Ce type d'annotation est appelé niveau 1 et permet une interprétation biologique avec un degré de confiance élevé.

Qu'est-ce qui différencie Metabolon des autres ?

Metabolon propose la plus grande bibliothèque de niveau 1 de l'industrie de la métabolomique. Notre bibliothèque propriétaire a été construite et conservée pendant plus de 20 ans et contient plus de 5 400 entrées. La grande majorité des entrées de notre bibliothèque sont de niveau 1, soit environ 85 % (~4 600 entrées) ; cependant, certaines sont de niveau 2 (environ 15 %, soit environ 800 entrées) en raison de l'absence de normes commerciales permettant de se qualifier pour le niveau 1. Metabolon fournit des informations précises et exploitables pour les enquêtes scientifiques ou cliniques de ses clients grâce à l'étendue inégalée de sa bibliothèque et aux niveaux de confiance des annotations les plus élevés de l'industrie.

D'autres fournisseurs affirment qu'ils peuvent analyser un grand nombre de biomarqueurs de petites molécules ou qu'ils disposent d'une base de données de plus de 200 000 caractéristiques. Cela signifie que vous pouvez obtenir une liste de paires m/z-RT sans annotations, ou que les algorithmes des fournisseurs de services ont été développés pour exploiter des bases de données bien connues telles que HMDB, GNPS ou KEGG. D'autres fournisseurs de services sacrifient la spécificité et la résolution des composés au profit de la rapidité d'acquisition. Dans chacun de ces cas, les mesures spectrales métabolomiques sont la somme de plusieurs composés ; malgré cela, certains fournisseurs de services spécifieront une seule annotation à partir d'une mesure qui est la somme totale de cinq isomères différents. En reprenant l'exemple du glucose de la figure 1, Metabolon signalera le métabolite annoté, mais d'autres fournisseurs fourniront une affectation incorrecte aux caractéristiques, comme le montre la figure 3.

L'identification des métabolites par Metabolon illustrée et comparée à d'autres fournisseurs de services métabolomiques

Figure 3. Comparaison de la façon dont les caractéristiques et les métabolites sont signalés à l'aide d'un spectre LC-MS de glucose. Metabolon ne signale qu'un métabolite annoté qui a été associé à un étalon authentique. D'autres fournisseurs de services affirment que tous les signaux sont des composés uniques et en signalent un grand nombre de manière incorrecte.

Bien que certaines de ces pratiques puissent fournir une résolution métabolomique suffisante pour les travaux basés sur la découverte, il existe des limitations majeures concernant la reproductibilité, et elles doivent être abordées avec prudence compte tenu de la confiance dans l'interprétation biologique. La plateforme deMetabolonfournit de loin l'identification la plus précise des métabolites directement liée aux normes correspondantes, garantissant ainsi la plus haute qualité des données communiquées aux clients.

Qu'est-ce que cela signifie pour l'avenir ?

Pourquoi les annotations de niveau 1 sont-elles importantes ? La FDA a récemment changé le visage du développement de médicaments en supprimant l'exigence d'essais précliniques sur des modèles animaux non pertinents. De plus en plus, les développeurs de médicaments s'orientent vers la constitution d'un ensemble de données contenant des biomarqueurs soutenant la sélection des patients et les meilleurs indicateurs d'efficacité. De nombreuses données suggèrent que les essais qui utilisent des biomarqueurs et des sélections de patients ont un succès global plus élevé que les essais sans biomarqueurs.24

Metabolon a de solides antécédents en matière de soutien aux décisions clés des sociétés pharmaceutiques et biopharmaceutiques tout au long du processus, de la découverte aux essais cliniques.25 Ayant exécuté plus de 10 000 projets au cours des 20 dernières années, Metabolon est en mesure d'exploiter ses données reproductibles et rigoureuses dans un cadre réglementaire, tout en se concentrant sur la compréhension des besoins du client et en apportant son soutien à la réussite de ses programmes. Les clients actuels et passés comprennent des entreprises pharmaceutiques et biotechnologiques, des universitaires et des segments de marché appliqués.

En résumé, Metabolon dispose de la plus grande bibliothèque d'annotations de niveau 1 construite sur la base du temps de rétention et de la résolution des composés, essentiels pour permettre des découvertes biologiques significatives et exploitables. Respectant les normes de l'industrie, notre bibliothèque minimise les faux positifs, garantit la précision scientifique et clinique dans la découverte de biomarqueurs et soutient les applications de médecine de précision. Avec Metabolon, vous pouvez être sûr que vos résultats comporteront le plus grand nombre possible d'annotations de niveau 1.

Définitions

Adduit : Un adduit est un artefact du processus d'ionisation nécessaire à la détection des molécules par spectrométrie de masse. Les adduits se forment lorsque deux ou plusieurs espèces, présentes ensemble dans la chambre d'ionisation, interagissent entre elles, généralement par attraction électrostatique, et apparaissent comme une nouvelle espèce de masse distincte. En LC-MS, chaque balayage dans les données brutes peut contenir plusieurs ions provenant de ces adduits. Les adduits typiques comprennent les adduits de sodium, les adduits d'ammonium et les adduits de bicarbonate. Il existe même des cas où deux molécules distinctes co-éluées interagissent et s'ionisent sous la forme d'une nouvelle masse, appelée adduits chimères. 

Chromatographes : instruments analytiques utilisés pour séparer les métabolites en fonction de leurs propriétés physiques et chimiques, qui transmettent ensuite les métabolites séparés au spectromètre de masse pour détection.

Composé : Molécule présente dans un échantillon biologique qui peut être détectée et quantifiée à l'aide de techniques analytiques telles que la spectrométrie de masse et la spectroscopie RMN.

Fragments en source : Fragments de métabolites générés lors de l'ionisation par électrospray (ESI) dans l'analyse LC-MS. Les fragments in-source (ISF) peuvent poser un problème dans les expériences de métabolomique par SM, car un métabolite peut produire plusieurs caractéristiques, chacune correspondant à un fragment différent. Les ISF peuvent conduire à une annotation erronée des métabolites dans le cadre de la métabolomique non ciblée, ce qui entraîne une interprétation erronée du mécanisme biologique sous-jacent.

Isotope : Atomes du même élément qui ont le même nombre de protons dans le noyau mais un nombre différent de neutrons et donc le même numéro atomique mais un numéro de masse différent. Ils ont un comportement chimique presque identique mais des propriétés physiques différentes.

Isotopologues : Molécules qui diffèrent par leur composition isotopique, en particulier par le nombre et la position des isotopes.

Bibliothèque : Une collection de données spectrales et de métadonnées associées pour des métabolites connus.

Métabolite : Une petite molécule substrat, intermédiaire ou produit du métabolisme qui peut être détectée et quantifiée à l'aide de techniques analytiques telles que la spectrométrie de masse et la spectroscopie RMN.

Multimères :copies multiples d'un même métabolite qui interagissent entre elles et forment une nouvelle espèce ionique pendant le processus d'ionisation. Les multimères peuvent être considérés comme des adduits où l'adduction se produit entre deux molécules identiques. À l'instar des adduits, des fragments in-source et des isotopes, ces artefacts d'ionisation supplémentaires peuvent compliquer l'identification et la quantification des métabolites. Les multimères peuvent également se former pendant la préparation des échantillons, mais ils sont alors le résultat de réactions chimiques qui forment de nouvelles liaisons. La plupart des multimères détectés par spectrométrie de masse apparaissent pendant l'ionisation.

Détection des pics : La détection des pics est une étape clé du prétraitement des données métabolomiques non ciblées générées à partir de la haute résolution (LC-MS). Il s'agit d'identifier les pics individuels dans la dimension du temps de rétention des données LC-MS. Ces pics sont appelés pics chromatographiques pour les distinguer des pics de masse (c'est-à-dire les pics dans un spectre le long de la dimension mz).

Alignement des pics : Le processus d'alignement des pics dans plusieurs échantillons pour tenir compte des changements subtils dans le temps de rétention, une étape de prétraitement cruciale en métabolomique.

Temps de rétention : Le temps de rétention est un paramètre clé de la métabolomique basée sur la LC-MS qui fait référence au temps nécessaire à un métabolite pour traverser une colonne de chromatographie et y être élué. Le temps de rétention est utilisé pour l'annotation et l'identification des métabolites.

Correction du temps de rétention : Méthode utilisée en métabolomique basée sur la LC-MS pour corriger les variations du temps de rétention entre différents échantillons. La correction du temps de rétention est importante car de petites variations du temps de rétention peuvent entraîner une identification et une quantification incorrectes des métabolites.

Spectre : Il s'agit de l'ensemble des données obtenues à partir d'un spectromètre de masse ou d'un spectromètre de résonance magnétique nucléaire.

Références

1. Liu, X et. et Locasale, J. W. Metabolomics : A Primer. Trends Biochem. Sci 2017 ;. 42(4) :, 274-284 (2017).

2. Zhang, A., Sun, H., Wang, P., Han, Y. et Wang, X.et al. Modern analytical techniques in metabolomics analysis. Analyst 2012;137(2) :, 293-300 (2012).

3. Kind, T, Tsugawa H, Cajka T et al. et al. Identification of small molecules using accurate mass MS/MS search. Mass Spectrom. Rev 2018 ;. 37(4) :, 513-532. (2018).

4. Alonso, A., Marsal, S. et Julià, A. Analytical Methods in Untargeted Metabolomics : State of the Art in 2015. Front. Bioeng. Biotechnol 2015 ;. 3:23., (2015).

5. Li, Z, Lu Y, Guo Y et al. et al. Comprehensive evaluation of untargeted metabolomics data processing software in feature detection, quantification and discriminating marker selection. Anal. Chim. Acta 2018 ; 1029 :, 50-57 (2018).

6. Graça, G, Cai Y, Lau CHE et al. et al. Automated Annotation of Untargeted All-Ion Fragmentation LC-MS Metabolomics Data with MetaboAnnotatoR. Anal. Chem 2022 ;. 94(8) :, 3446-3455 (2022).

7. Sumner, L. W, Amberg. Barrett D et al. Proposed minimum reporting standards for chemical analysis. Metabolomics 2007;3(3):211–221.

8. Schymanski EL, Jeon J, Gulde R et al. Identifying Small Molecules via High Resolution Mass Spectrometry : Communicating Confidence. Environ Sci Technol 2014;48(4):2097-2098.

9. Kim S, Chen J, Cheng T et al. PubChem 2019 update : improved access to chemical data. Nucleic Acids Res 2019;47(D1):D1102-D1109.

10. Wishart DS, Feunang YD, Marcu A et al. HMDB 4.0 : la base de données du métabolome humain pour 2018. Nucleic Acids Res 2018;46(D1):D608-D617.

11. Kanehisa M, Sato Y, Kawashima M et al. KEGG as a reference resource for gene and protein annotation. Nucleic Acids Res 2016;44(D1):D457-D462.

12. Pence He et Williams A. ChemSpider : An Online Chemical Information Resource. J Chem Educ 2010;87(11):1123-1124.

13. Xue J, Guijas C, Benton HP et al. METLIN MS2 molecular standards database : a broad chemical and biological resource. Nat Methods 2020;17(10):953-954.

14. Wang M Carver JJ, Phelan V et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nat Biotechnol 2016;34(8):828-837.

15. Horai H, Arita M, Kanaya S et al. MassBank : a public repository for sharing mass spectral data for life sciences. J Mass Spectrom 2010;45(7):703-14.

16. Le centre de données de spectrométrie de masse du NIST. NIST Standard Reference Database 1A. 2014. https://www.nist.gov/system/files/documents/srd/NIST1aVer22Man.pdf ; consulté le 28 juin 2023.

17. Forsberg EM, Huan T, Rinehart D et al. Data processing, multi-omic pathway mapping, and metabolite activity analysis using XCMS Online. Nat Protoc 2018;13(4):633-651.

18. Dührkop K, Fleischauer M, Ludwig M et al. SIRIUS 4 : un outil rapide pour transformer les spectres de masse en tandem en informations sur la structure des métabolites. Nat Methods 2019;16(4):299-302.

19. Tsugawa H, Nakabayashi R, Mori T et al. Une approche cheminformatique pour caractériser les métabolomes dans les organismes marqués par des isotopes stables. Nat Methods 2019;16(4):295-298.

20. Domingo-Almenara X Montenegro-Burke JF, Benton HP et al. Annotation : a computational solution for streamlining metabolomics analysis. Anal Chem 2018;90(1):480-489.

21. Zulfiqar Z, Gadelha L, Steinbeck C et al. MAW : the reproducible Metabolome Annotation Workflow for untargeted tandem mass spectrometry. J Cheminformatics 2023;15(1):32.

22. Broeckling CD, Ganna A, Layer M et al. Enabling Efficient and Confident Annotation of LC-MS Metabolomics Data through MS1 Spectrum and Time Prediction. Anal Chem 2016;88(18):9226-9234.

23. Lu Y, Pang Z, Xia J. Comprehensive investigation of pathway enrichment methods for functional interpretation of LC-MS global metabolomics data. Brief Bioinform 2023;24(1):bbac553.

24. Wong CH, Siah KW, et Lo AW. Estimation des taux de réussite des essais cliniques et des paramètres connexes. Biostatistics 2019;20(2):273–286.

25. https://www.metabolon

Nous contacter

Parler avec un expert

Demandez un devis pour nos services, obtenez plus d'informations sur les types d'échantillons et les procédures de manipulation, demandez une lettre de soutien ou posez une question sur la façon dont la métabolomique peut faire avancer votre recherche.

Siège social

617 Davis Drive, Suite 100
Morrisville, NC 27560

Adresse postale :
P.O. Box 110407
Research Triangle Park, NC 27709

+1 (919) 572-1711

+1 (919) 572-1721