¿Por qué Metabolon?
Metabolon: El patrón oro de la metabolómica procesable
El cuello de botella para la mayoría de los profesionales de la metabolómica sigue siendo la identificación precisa de metabolitos a partir de datos brutos.
Los proveedores de servicios metabolómicos afirman universalmente que sus plataformas pueden identificar miles (o cientos de miles) de "biomarcadores" o "características" en sus respectivos productos. Sin embargo, una parte significativa de esos metabolitos se "identifican basándose en criterios mínimos o incluso inexistentes para una identidad precisa", lo que da lugar a una identificación incorrecta de los metabolitos y a la consiguiente interpretación errónea de los datos experimentales.
Aquí cubriremos:
- Definir los términos clave utilizados por los proveedores de servicios metabolómicos (tanto académicos como comerciales).
- Destacar las principales diferencias entre terminologías (por ejemplo, características, biomarcadores, anotación/identificaciones).
- Describir los procesos necesarios para la identificación precisa de metabolitos.
- Discutir la importancia de los niveles de confianza de anotación estándar establecidos por la industria utilizados para minimizar o eliminar la variabilidad en los métodos de anotación entre plataformas, mejorando la precisión de la identificación de metabolitos.
- Demostrar por qué la identificación precisa de metabolitos es fundamental para extraer conclusiones biológicas fiables a partir de conjuntos de datos metabolómicos y la aplicabilidad de estos conocimientos en el descubrimiento de fármacos.
El reto de la metabolómica
La metabolómica es un campo en rápido avance que permite comprender la complejidad de los sistemas biológicos desde el punto de vista mecánico, funcional y práctico.1,2 De hecho, varias pruebas clínicas para controlar la salud humana se basan en pequeñas moléculas o metabolitos, como la glucosa, el colesterol y la creatinina, entre otros. Aprovechando el poder de la metabolómica, los investigadores pueden descubrir valiosos conocimientos sobre los mecanismos subyacentes de las enfermedades y desarrollar huellas fenotípicas más precisas para evaluar el riesgo individual de enfermedad.2
Sin embargo, la anotación precisa de metabolitos (es decir, su identificación) y el uso de herramientas bioinformáticas adecuadas para ello siguen siendo un reto importante para muchos en este campo. El paso crucial de convertir los datos brutos de espectrometría de masas (EM) en una identificación precisa de metabolitos es la base del éxito de cualquier pregunta científica que se plantee. Sin identificaciones precisas, basadas en métricas rigurosas y contrastadas, sólo se pueden extraer conclusiones imprecisas.
Varios factores contribuyen a los retos asociados a la identificación precisa de metabolitos a partir de datos de EM, como las limitaciones inherentes al rendimiento del hardware, la velocidad de adquisición de datos y el coste, independientemente del proveedor de servicios. Los métodos más rápidos y menos costosos probablemente proporcionarán menos metabolitos con menor precisión. Si el objetivo de un estudio metabolómico es lograr un conocimiento científico significativo, la identificación de metabolitos debe ser precisa para facilitar la interpretación de datos procesables.
Comprender los desafíos para lograr tal precisión es primordial para los investigadores que buscan liberar todo el potencial de la metabolómica e impulsar avances en la investigación de enfermedades. En Metabolon, llevamos más de 20 años optimizando la identificación de metabolitos, impulsando una mayor eficiencia de los procesos con la automatización e incorporando el aprendizaje automático a la identificación de metabolitos, lo que garantiza la generación de datos de mayor calidad y precisión del mercado.
Plataformas metabolómicas
Plataformas analíticas como la espectrometría de masas y la resonancia magnética nuclear (RMN) se han convertido en las plataformas dominantes que permiten la detección robusta de numerosos metabolitos. La cobertura más completa de metabolitos se consigue normalmente mediante un enfoque no selectivo que utiliza la cromatografía líquida de alto rendimiento (HPLC) acoplada a la espectrometría de masas de alta resolución y precisión (HRAM), comúnmente denominada HPLC-MS o LC-MS. La LC-MS es capaz de detectar de forma rutinaria miles de compuestos químicos únicos, proporcionando una amplia cobertura de metabolitos biológicamente relevantes.3
Un proceso típico de metabolómica LC-MS no dirigida requiere un procesamiento riguroso de los datos brutos en una serie de pasos:
- Extracción de características (incluye detección de iones parentales/moleculares, isótopos y aductos)
- Alineación de picos por tiempo de retención
- Área bajo la curva de cada característica
- Anotación/identificación de características
- Análisis estadístico
- Interpretación de los datos
Un conjunto de datos típico contiene hasta decenas de miles de características (pares masa-carga y tiempo de retención (m/z-RT)). Estas corresponden a una compleja mezcla de aductos noidentificados4,5 , fragmentos en la fuente, multímeros, iones moleculares verdaderos y una amplia variedad de isótopos que solo se diferencian por el tiempo deretención6.
Características de los metabolitos frente a la anotación
Aunque es difícil obtener información biológica a partir de características de metabolitos no identificados, la mayoría de los proveedores de servicios metabolómicos ponen mucho énfasis en el número de características que pueden detectar, independientemente de si esas características se pueden identificar o no. Sin embargo, el número de características detectadas o notificadas por metabolito no es una gran medida de valor, dado que no todas las características detectadas corresponden al ion parental (ion molecular) de un metabolito conocido. Muchas características representan artefactos de la metodología utilizada e incluyen artefactos de ionización molecular como aductos, fragmentos en la fuente, quimeras, multímeros y ruido de fondo (Figura 1)..
Los usuarios suelen adquirir una lista de estos artefactos junto con todas las demás características detectadas al final del paso 3 con la posible suposición de que todas las características, incluidos los artefactos, representan iones parentales y, por tanto, intentarán identificarlos. El número de identificaciones erróneas en este flujo de trabajo típico llegó a ser tan frecuente debido a estas suposiciones que la comunidad metabolómica estableció métricas sobre las características de los rasgos que representan una identificación de rigor suficiente para ser utilizada universalmente en la identificación de metabolitos.7
Figura 1. Espectro LC-MS de glucosa Espectro LC-MS de glucosa, que muestra el ion padre y los fragmentos en la fuente junto con aductos de cloro y formiato. Todos ellos constituyen "características".
La anotación se refiere al proceso de asignar una identidad o nombre específico a un rasgo detectado. Una lista de muchos rasgos puede corresponder a un solo metabolito (Figura 1). Se trata de un paso fundamental en el análisis metabolómico que permite a los investigadores identificar con precisión los metabolitos presentes en sus muestras y avanzar en sus estudios.
Para distinguir entre los niveles de confianza en la precisión de la anotación, la iniciativa de normas metabolómicas (MSI) propuso en 2007 cuatro niveles deidentificación7, que posteriormente se ampliaron a cinco niveles (Figura 2).8 Dentro decada nivel, el enfoque de la anotación de metabolitos es diferente y depende del nivel de confianza exigido por las normas establecidas.
Figura 2. Los niveles de identificación que se establecieron para proporcionar confianza en las anotaciones. El nivel 1 es el más estricto y requiere m/z, RT y MS/MS de una característica medida frente a un patrón químico auténtico.
En Metabolon,
ofrecemos la mayor biblioteca de nivel 1 del sector de la metabolómica.
El proceso de anotación
La anotación de metabolitos candidatos es un proceso que requiere mucho tiempo y que se basa en la comparación de masas con todos los patrones autentificados realizados internamente o disponibles en bases de datos externas, y en el apoyo de esas comparaciones con otras características, como el tiempo de retención (TR). La espectrometría de masas en tándem (MS2 o MSn) puede utilizarse para obtener información estructural adicional que confirme la identidad del metabolito. Las bases de datos estructurales moleculares (por ejemplo, Pubchem,9 HMDB,10 KEGG,11 ChemSpider12) y las bases de datos espectrales de fragmentación (por ejemplo, Metlin,13 GNPS,14 MassBank,15 y NIST16), amplias, fácilmente disponibles y accesibles, pueden ayudar aún más en la identificación de metabolitos; sin embargo, los espectros de fragmentación de metabolitos son muy específicos del instrumento y del entorno, por lo que encontrar coincidencias espectrales exactas con estas bases de datos existentes puede ser un reto.
Para ayudar a indexar estas bases de datos a gran escala, se han desarrollado herramientas informáticas de anotación (p. ej., XCMS,17 GNPS,14 SIRIUS,18 y MS-DIAL19) que se han integrado en flujos de trabajo de metabolómica computacional. Sin embargo, surgen problemas importantes al utilizar estas herramientas de anotación, ya que la mayoría de estos algoritmos requieren múltiples umbrales ajustables y parámetros de corte que pueden variar significativamente entre los usuarios.20 En consecuencia, se pueden generar listas de picos muy diferentes a partir de un único conjunto de datos brutos en función del algoritmo y los parámetros utilizados. Además, ninguna de estas bases de datos utiliza RT como parte del proceso de anotación, un problema particular dada la escasez de isómeros estructurales con la misma fórmula molecular, masa y características de fragmentación. Ejemplos notables incluyen la familia de hidroxibutiratos y hexosas, entre muchos otros que no pueden ser identificados con precisión sin el uso del tiempo de retención. Los resultados generados sin RT están sujetos a tasas de identificación errónea significativamente más altas.
¿Qué es el patrón oro?
En la actualidad, la regla de oro para la anotación de metabolitos consiste en comparar al menos dos propiedades fisicoquímicas (p. ej., valor m/z exacto, RT y MS/MS) de una característica medida con estándares químicos auténticos medidos utilizando la misma plataforma LC-MS, parámetros de adquisición de datos y protocolos de preparación de muestras (p. ej., métodos cromatográficos, modos de ionización y energías de colisión).7,22,23 Este tipo de anotación se designa Nivel 1 y permite la interpretación biológica con un alto grado de confianza.
¿Qué diferencia a Metabolon del resto?
En Metabolon, ofrecemos la mayor biblioteca de Nivel 1 en la industria metabolómica. Nuestra biblioteca patentada ha sido construida y curada durante más de 20 años y contiene más de 5.400 entradas. La gran mayoría de las entradas de nuestra biblioteca son de Nivel 1, lo que supone aproximadamente el 85% (~4.600 entradas); sin embargo, algunas son de Nivel 2 (aproximadamente el 15%, lo que supone unas 800 entradas) debido a la falta de estándares comerciales disponibles para calificar para el Nivel 1. Metabolon ofrece información precisa y muy útil para las investigaciones científicas o clínicas de nuestros clientes gracias a la amplitud inigualable de nuestra biblioteca y a los niveles de confianza de las anotaciones, líderes en el sector.
Otros proveedores afirman que pueden escanear un gran número de biomarcadores de moléculas pequeñas o que tienen una base de datos curada de más de 200.000 características. Esto significa que puede obtener una lista de características de pares m/z-RT sin anotaciones, o que los algoritmos de los proveedores de servicios se han desarrollado para aprovechar bases de datos bien conocidas como HMDB, GNPS o KEGG. Otros proveedores de servicios sacrifican la especificidad y la resolución de los compuestos por la velocidad de adquisición. El resultado en cada uno de estos casos es que las mediciones espectrales metabolómicas son la suma de múltiples compuestos; aun así, algunos proveedores de servicios especificarán una única anotación de una medición que es la suma total de cinco isómeros diferentes. Usando el ejemplo de la glucosa de la Figura 1, Metabolon informará del metabolito anotado, sin embargo otros proveedores proporcionarán la asignación incorrecta a las características como se ve en la Figura 3.
Figura 3. Una comparación de cómo las características y metabolitos son reportados usando un espectro LC-MS de glucosa. Metabolon informará sólo de un metabolito anotado que haya sido emparejado con un estándar auténtico. Otros proveedores de servicios afirman que todas las señales son compuestos únicos e informarán de muchos incorrectamente.
Aunque algunas de estas prácticas pueden proporcionar una resolución metabolómica suficiente para el trabajo basado en el descubrimiento, existen limitaciones importantes en cuanto a la reproducibilidad, y deben abordarse con precaución teniendo en cuenta la confianza en la interpretación biológica. La plataforma deMetabolonproporciona, con diferencia, la identificación de metabolitos más precisa directamente vinculada a los estándares correspondientes, lo que garantiza la máxima calidad de los datos comunicados a los clientes.
¿Qué significa esto para el futuro?
¿Por qué son importantes las anotaciones de nivel 1? Recientemente, la FDA ha cambiado la fisonomía del desarrollo de fármacos al eliminar el requisito de realizar ensayos preclínicos en modelos animales no pertinentes. Cada vez más, los desarrolladores de fármacos avanzan hacia la creación de un paquete de datos que contenga biomarcadores que apoyen la selección de pacientes y los mejores indicadores de eficacia. Hay pruebas considerables que sugieren que los ensayos que utilizan biomarcadores y selecciones de pacientes tienen un mayor éxito global que los ensayos sin biomarcadores.24
Metabolon cuenta con una sólida trayectoria en el apoyo a las decisiones clave de empresas farmacéuticas y biofarmacéuticas a lo largo del proceso que va desde el descubrimiento hasta los ensayos clínicos.25 Tras haber ejecutado más de 10.000 proyectos en los últimos 20 años, Metabolon es capaz de aprovechar sus datos reproducibles y rigurosos en un entorno normativo, al tiempo que proporciona un enfoque singular en la comprensión de las necesidades del cliente y la prestación de apoyo para el éxito de sus programas. Entre los clientes actuales y pasados se encuentran empresas farmacéuticas/biotecnológicas, instituciones académicas y segmentos de mercado aplicados.
En resumen, Metabolon cuenta con la mayor biblioteca de anotaciones de nivel 1 basada en el tiempo de retención y la resolución de compuestos, esenciales para obtener información biológica significativa y procesable. Adhiriéndose a los estándares de la industria, nuestra biblioteca minimiza los falsos positivos, asegura la precisión científica y clínica en el descubrimiento de biomarcadores y apoya las aplicaciones de medicina de precisión. Con Metabolon, puede estar seguro de que sus resultados tendrán el máximo número posible de anotaciones de Nivel 1.
Definiciones
Aducto: Un aducto es una molécula formada por la combinación de dos o más moléculas, normalmente a través de una reacción química. En LC-MS, cada pico en los datos brutos puede representar un ion, aducto, fragmento o isótopo de un metabolito, y un metabolito puede estar representado por varios picos. La anotación de aductos es especialmente difícil, ya que la misma diferencia de masa entre picos puede deberse a la formación de aductos, a la fragmentación o al etiquetado isotópico.
Cromatógrafos: Instrumentos analíticos utilizados para separar e identificar metabolitos en función de sus propiedades físicas y químicas.
Compuesto: Molécula presente en una muestra biológica que puede detectarse y cuantificarse mediante técnicas analíticas como la espectrometría de masas y la espectroscopia de RMN.
Fragmentos en la fuente: Fragmentos de metabolitos que se generan durante la ionización por electrospray (ESI) en el análisis LC-MS. Los fragmentos en la fuente (ISF) pueden suponer un reto en los experimentos de EM metabolómica porque un metabolito puede producir múltiples características, cada una correspondiente a un fragmento diferente. Los ISF pueden dar lugar a una falsa anotación de metabolitos en metabolómica no dirigida, lo que induce a una interpretación errónea del mecanismo biológico subyacente.
Isótopo: Átomos del mismo elemento que tienen el mismo número de protones en el núcleo pero distinto número de neutrones y, por tanto, el mismo número atómico pero distinto número másico. Tienen un comportamiento químico casi idéntico pero propiedades físicas diferentes.
Isotopólogos: Moléculas que difieren en su composición isotópica, concretamente en el número y la posición de los isótopos.
Biblioteca: Una colección de datos espectrales y metadatos asociados para metabolitos conocidos.
Metabolito: Pequeña molécula sustrato, intermedio o producto del metabolismo que puede detectarse y cuantificarse mediante técnicas analíticas como la espectrometría de masas y la espectroscopia de RMN.
Multímeros:Múltiples copias de un único metabolito, que pueden complicar la identificación y cuantificación de metabolitos. Los multímeros pueden formarse durante la preparación de la muestra o durante el proceso de ionización en la metabolómica basada en la espectrometría de masas.
Detección de picos: La detección de picos es un paso clave en el preprocesamiento de datos metabolómicos no dirigidos generados a partir de alta resolución (LC-MS). Se trata del proceso de identificación de picos individuales en la dimensión del tiempo de retención de los datos LC-MS. Estos picos se denominan picos cromatográficos para distinguirlos de los picos de masa (es decir, picos dentro de un espectro a lo largo de la dimensión mz).
Alineación de picos: El proceso de alinear los picos de múltiples muestras para tener en cuenta los cambios sutiles en el tiempo de retención, un paso crucial del preprocesamiento en metabolómica.
Tiempo de retención: El tiempo de retención es un parámetro clave en la metabolómica basada en LC-MS que se refiere al tiempo que tarda un metabolito en recorrer y eluir de una columna cromatográfica. El tiempo de retención se utiliza en la anotación e identificación de metabolitos.
Corrección del tiempo de retención: Método utilizado en la metabolómica basada en LC-MS para corregir las variaciones del tiempo de retención en diferentes muestras. La corrección del tiempo de retención es importante porque pequeñas variaciones en el tiempo de retención pueden conducir a una identificación y cuantificación incorrectas de los metabolitos.
Espectro: Se refiere a la recopilación de datos obtenidos de un espectrómetro de masas o de un espectrómetro de RMN magnética nuclear.
Referencias
1. Liu, X. y Locasale, J. W. Metabolomics: A Primer. Trends Biochem. Sci 2017;. 42(4):, 274-284 (2017).
2. Zhang, A., Sun, H., Wang, P., Han, Y. y Wang, X.et al. Técnicas analíticas modernas en el análisis metabolómico. Analyst 2012;137(2):, 293-300 (2012).
3. Kind, T, Tsugawa H, Cajka T et al. Identificación de moléculas pequeñas mediante búsqueda MS/MS de masa precisa. Mass Spectrom. Rev 2018;. 37(4):, 513-532. (2018).
4. Alonso, A., Marsal, S. y Julià, A. Analytical Methods in Untargeted Metabolomics: Estado del arte en 2015. Front. Bioeng. Biotechnol 2015;. 3:23., (2015).
5. Li, Z, Lu Y, Guo Y et al. Evaluación exhaustiva del software de procesamiento de datos metabolómicos no dirigidos en la detección de características, la cuantificación y la selección de marcadores discriminatorios. Anal. Chim. Acta 2018; 1029:, 50-57 (2018).
6. Graça, G, Cai Y, Lau CHE et al. Automated Annotation of Untargeted All-Ion Fragmentation LC-MS Metabolomics Data with MetaboAnnotatoR. Anal. Chem 2022;. 94(8):, 3446-3455 (2022).
7. Sumner, L. W, Amberg. Barrett D et al. Proposed minimum reporting standards for chemical analysis. Metabolomics 2007;3(3):211–221.
8. Schymanski EL, Jeon J, Gulde R et al. Identifying Small Molecules via High Resolution Mass Spectrometry: Comunicando Confianza. Environ Sci Technol 2014;48(4):2097-2098.
9. Kim S, Chen J, Cheng T et al. Actualización de PubChem 2019: acceso mejorado a los datos químicos. Nucleic Acids Res 2019;47(D1):D1102-D1109.
10. Wishart DS, Feunang YD, Marcu A et al. HMDB 4.0: la base de datos del metaboloma humano para 2018. Nucleic Acids Res 2018;46(D1):D608-D617.
11. Kanehisa M, Sato Y, Kawashima M et al. KEGG como recurso de referencia para la anotación de genes y proteínas. Nucleic Acids Res 2016;44(D1):D457-D462.
12. Pence He y Williams A. ChemSpider: An Online Chemical Information Resource. J Chem Educ 2010;87(11):1123-1124.
13. Xue J, Guijas C, Benton HP et al. METLIN MS2 molecular standards database: a broad chemical and biological resource. Nat Methods 2020;17(10):953-954.
14. Wang M Carver JJ, Phelan V et al. Sharing and community curation of mass spectrometry data with Global Natural Products Social Molecular Networking. Nat Biotechnol 2016;34(8):828-837.
15. Horai H, Arita M, Kanaya S et al. MassBank: a public repository for sharing mass spectral data for life sciences. J Mass Spectrom 2010;45(7):703-14.
16. El Centro de Datos de Espectrometría de Masas del NIST. Base de datos de referencia estándar 1A del NIST. 2014. https://www.nist.gov/system/files/documents/srd/NIST1aVer22Man.pdf; consultado el 28 de junio de 2023.
17. Forsberg EM, Huan T, Rinehart D et al. Procesamiento de datos, mapeo de vías multiómicas y análisis de actividad de metabolitos utilizando XCMS Online. Nat Protoc 2018;13(4):633-651.
18. Dührkop K, Fleischauer M, Ludwig M et al. SIRIUS 4: una herramienta rápida para convertir espectros de masas en tándem en información sobre la estructura de metabolitos. Nat Methods 2019;16(4):299-302.
19. Tsugawa H, Nakabayashi R, Mori T et al. Un enfoque quimioinformático para caracterizar metabolomas en organismos marcados con isótopos estables. Nat Methods 2019;16(4):295-298.
20. Domingo-Almenara X Montenegro-Burke JF, Benton HP et al. Anotación: una solución computacional para agilizar el análisis metabolómico. Anal Chem 2018;90(1):480-489.
21. Zulfiqar Z, Gadelha L, Steinbeck C et al. MAW: the reproducible Metabolome Annotation Workflow for untargeted tandem mass spectrometry. J Cheminformatics 2023;15(1):32.
22. Broeckling CD, Ganna A, Layer M et al. Enabling Efficient and Confident Annotation of LC-MS Metabolomics Data through MS1 Spectrum and Time Prediction. Anal Chem 2016;88(18):9226-9234.
23. Lu Y, Pang Z, Xia J. Comprehensive investigation of pathway enrichment methods for functional interpretation of LC-MS global metabolomics data. Brief Bioinform 2023;24(1):bbac553.
24. Wong CH, Siah KW, y Lo AW. Estimación de las tasas de éxito de los ensayos clínicos y parámetros relacionados. Biostatistics 2019;20(2):273–286.
25. https://www.metabolon
Póngase en contacto con nosotros
Hable con un experto
Solicite un presupuesto para nuestros servicios, obtenga más información sobre tipos de muestras y procedimientos de manipulación, solicite una carta de apoyo o envíe una pregunta sobre cómo la metabolómica puede hacer avanzar su investigación.
Sede social
617 Davis Drive, Suite 100
Morrisville, NC 27560
Dirección postal:
P.O. Box 110407
Research Triangle Park, NC 27709
+1 (919) 572-1711