Portail d'assistance

Méthodes statistiques et terminologie

Calculs statistiques

Les analyses statistiques sont effectuées sur les données imputées normalisées par lots et log-transformées à l'aide du pipeline interne de Metabolon, qui utilise R(http://cran.r-project.org/) pour effectuer des calculs statistiques via une interface utilisateur Jupyter Notebooks. Vous trouverez ci-dessous des exemples de tests de signification et de méthodes de classification fréquemment utilisés, suivis d'une discussion sur les seuils de signification des valeurs p et q.

Test t à deux échantillons de Welch

Un test t de Welch à deux échantillons est utilisé pour vérifier si deux moyennes inconnues sont différentes de deux populations indépendantes.

Cette version du test t à deux échantillons tient compte des variances inégales (la variance est le carré de l'écart-type) et présente une distribution t approximative avec des degrés de liberté estimés à l'aide de l'approximation de Satterthwaite. Nous utilisons généralement un test bilatéral (qui vérifie si les moyennes sont différentes) plutôt qu'un test unilatéral (qui vérifie si une moyenne est supérieure à l'autre).

ANOVA à deux voies

Lors d'un test de signification de l'analyse de la variance (ANOVA), on suppose que la variance est la même dans toutes les populations.

Dans une ANOVA à deux voies, trois tests statistiques sont généralement effectués : l'effet principal de chaque facteur individuellement et celui de l'interaction. Supposons que nous ayons deux facteurs, A et B, où A représente le génotype et B le régime alimentaire dans une étude sur la souris. Supposons que chacun de ces facteurs ait deux niveaux (A : type sauvage, knock out ; B : régime standard, régime riche en graisses). Dans cet exemple, il existe quatre combinaisons possibles ("traitements") : A1B1, A1B2, A2B1 et A2B2. Le test F de l'ANOVA globale donne la valeur p pour tester si les quatre moyennes sont égales ou si au moins une paire est différente.

Cependant, nous nous intéressons également aux effets individuels du génotype et du régime alimentaire. Un effet principal est un contraste qui teste un facteur sur tous les niveaux de l'autre facteur. Ainsi, l'effet principal A compare (A1B1 + A1B2)/2 à (A2B1 + A2B2)/2, et l'effet principal B compare (A1B1 + A2B2)/2 à (A1B2 + A2B2)/2. L'interaction est un contraste qui teste si la différence moyenne pour un facteur dépend du niveau de l'autre facteur, soit (A1B2 + A2B1)/2 vs (A1B1 + A2B2)/2.

Quelques exemples de graphiques sont présentés ci-dessous. Le premier graphique illustre un effet principal B qui ne dépend pas du niveau de A, il n'y a donc pas d'effet principal A ni d'interaction. Dans le deuxième graphique, la différence moyenne pour B est la même à chaque niveau de A, et la différence moyenne pour A est la même à chaque niveau de B, ce qui indique l'absence d'interaction statistique. Le dernier graphique illustre les effets principaux pour A et B ainsi qu'une interaction : l'effet de B dépend du niveau de A (0 pour A1 mais 2 pour A2) ; en d'autres termes, l'effet du régime alimentaire dépend du génotype. En outre, l'interprétation des effets principaux dépend de l'existence ou non d'une interaction.

Figure1 Effet principal

Valeurs p

Pour les tests de signification statistique, les valeurs p sont fournies. Plus la valeur p est faible, plus la preuve que l'hypothèse nulle (typiquement que deux moyennes de population sont égales) est fausse est grande. Si la "signification statistique" est déclarée pour des valeurs p inférieures à 0,05, la conclusion erronée selon laquelle les moyennes sont différentes alors qu'elles sont en fait identiques est tirée dans 5 % des cas.

La valeur p est la probabilité que la statistique du test soit au moins aussi extrême que celle observée dans cette expérience, étant donné que l'hypothèse nulle est vraie. Par conséquent, plus la statistique est extrême, plus la valeur p est faible et plus les données vont à l'encontre de l'hypothèse nulle.

valeurs q

Un niveau de signification de 0,05 correspond au taux de faux positifs lorsqu'il n'y a qu'un seul test. Cependant, pour un grand nombre de tests, les faux positifs doivent être pris en compte. Il existe différentes méthodes pour corriger les tests multiples. Les méthodes les plus anciennes sont les ajustements du taux d'erreur par famille (Bonferroni, Tukey, etc.), mais elles tendent à être extrêmement conservatrices pour un très grand nombre de tests.

Avec les réseaux de gènes, l'utilisation du taux de fausse découverte (FDR) est plus courante. Les ajustements du taux d'erreur par famille offrent un degré élevé de certitude qu'il n'y a pas de fausses découvertes. Cependant, avec les méthodes FDR, un petit nombre de fausses découvertes peut être pris en compte. Le FDR pour un ensemble donné de composés peut être estimé à l'aide de la valeur q1.

To interpret the q-value, the data must first be sorted by the p-value, then the significance cutoff (typically p < 0.05) must be chosen. The q-value gives the false discovery rate for the selected list (i.e., an estimate of the proportion of false discoveries for the list of compounds whose p-value is below the significance cutoff). In Table 1 below, if the whole list is declared significant, then the false discovery rate is approximately 10%. If everything from Compound 079 and above is declared significant, then the false discovery rate is approximately 2.5%.

Figure2 Valeurs Q

Tableau 1. Exemple d'interprétation de la valeur q.

Variabilité des instruments et des processus

La variabilité des instruments est déterminée en calculant l'écart-type relatif médian (RSD) pour les étalons internes qui sont ajoutés à chaque échantillon avant d'être injectés dans les spectromètres de masse. La variabilité globale du processus est déterminée en calculant l'écart-type relatif médian pour tous les métabolites endogènes (c'est-à-dire les étalons non instrumentaux) présents dans 100 % des échantillons de la matrice client, qui sont des réplicats techniques d'échantillons de clients regroupés. Les valeurs RSD se trouvent dans le fichier Heatmap Excell, téléchargé à partir de l'onglet "Data &Integration" du portail.

Références

  1. Storey J et Tibshirani R. Statistical significance for genomewide studies. Proc Natl Acad Sci USA 2003;100(16):9440-9445.

Découvrez comment Metabolon peut vous aider à obtenir des informations précliniques et cliniques.

Nous contacter

Parler avec un expert

Demandez un devis pour nos services, obtenez plus d'informations sur les types d'échantillons et les procédures de manipulation, demandez une lettre de soutien ou posez une question sur la façon dont la métabolomique peut faire avancer votre recherche.

Siège social

617 Davis Drive, Suite 100
Morrisville, NC 27560

Adresse postale :
P.O. Box 110407
Research Triangle Park, NC 27709

+1 (919) 572-1721

Références

1. Zgoda-Pols, J.R., et al., Une analyse métabolomique révèle une élévation du sulfate de 3-indoxyle dans le plasma et le cerveau lors d'une lésion rénale aiguë d'origine chimique chez la souris : étude des agonistes des récepteurs de l'acide nicotinique. Toxicol Appl Pharmacol, 2011. 255(1) : p. 48-56.

2. Bryant, J.A., et al., L'impact d'un traitement oral à base de microbiome purifié sur le microbiome gastro-intestinal. Nat Med, 2026. 32(1) : p. 186-196

3. McGovern, B. H., et al., « SER-109, un médicament expérimental ciblant le microbiome visant à réduire les récidives après une infection à Clostridioides difficile : enseignements tirés d'un essai de phase II ». Clin Infect Dis, 2021, 72(12), p. 2132-2140.

4. Feuerstadt, P., et al., SER-109, un traitement oral à base de microbiome contre les infections récurrentes à Clostridioides difficile. N Engl J Med, 2022. 386(3) : p. 220-229.

5. Hu, Z., et al., La métabolomique ciblée met en évidence de nouveaux biomarqueurs diagnostiques du cancer colorectal. Mol Oncol, 2025. 19(6) : p. 1737-1750.

6. Butler, F.M., et al., Les habitudes alimentaires végétariennes et les métabolites liés à l'alimentation sont associés à la fonction rénale dans la cohorte de l'étude Adventist Health Study-2. J Ren Nutr, 2025.

7. Stanford, J., et al., « Profilage métabolomique et évaluation de la qualité de l'alimentation dans le cadre d'un essai croisé randomisé portant sur des régimes alimentaires sains et courants ». Mol Nutr Food Res, 2025. 69(23) : p. e70271.

8. O’Connor, L.E., et al., Profilage métabolomique d’un régime alimentaire ultra-transformé dans le cadre d’un essai alimentaire croisé randomisé et contrôlé mené à domicile. J Nutr, 2023. 153(8) : p. 2181-2192.

9. Fritsch, D.A., et al., La fonction du microbiome est à la base de l'efficacité d'une intervention alimentaire enrichie en fibres chez les chiens souffrant de diarrhée chronique du gros intestin. BMC Vet Res, 2022. 18(1) : p. 245.

10. Leal, L.N., et al., « Un apport nutritionnel adéquat avant le sevrage améliore la productivité laitière et réduit le risque d'abattage chez les vaches Holstein ». J Dairy Sci, 2025. 108(6) : p. 5875-5888.

11. Ahsin, M., et al., La santé des sols et des pâturages est à l'origine de l'amélioration de la densité nutritionnelle de la viande bovine, telle que déterminée par la métabolomique non ciblée dans les systèmes d'élevage bovin nourri à l'herbe du sud des États-Unis. NPJ Sci Food, 2025. 9(1) : p. 151.

12. Yin, W., et al., Profil lipidique plasmatique chez différentes espèces pour l'identification de modèles animaux optimaux de la dyslipidémie humaine. J Lipid Res, 2012. 53(1) : p. 51-65.

13. Porter, F. D., et al., Les produits d'oxydation du cholestérol constituent des biomarqueurs sanguins sensibles et spécifiques de la maladie de Niemann-Pick de type C1. Sci Transl Med, 2010. 2(56) : p. 56ra81.

14. Needham, B. D., et al., Profils des métabolites plasmatiques et fécaux dans les troubles du spectre autistique. Biol Psychiatry, 2021. 89(5) : p. 451-462

15. Li, C., et al., L'estradiol et mTORC2 agissent en synergie pour favoriser la biosynthèse des prostaglandines et la tumorigenèse dans les cellules LAM déficientes en TSC2. J Exp Med, 2014. 211(1) : p. 15-28.

16. Green, P.G., et al., Flexibilité métabolique et remodelage inverse du cœur défaillant chez l'homme. Eur Heart J, 2025. 46(25) : p. 2422-2433.

17. Maekawa, H., et al., L'inhibition du SGLT2 protège la fonction rénale grâce à une répression épigénétique, dépendante de la SAM, des gènes inflammatoires en cas de stress métabolique. J Clin Invest, 2025. 135(19).

18. Wu, D., et al., Des criblages intégrés révèlent que la déplétion en nucléotides guaniniques, rendue irréversible par le ciblage de l'IMPDH2, inhibe le cancer du pancréas et potentialise l'inhibition de KRAS. Gut, 2026.

19. Schwerdtfeger, L.A., et al., Le microbiote intestinal et ses métabolites sont associés à la progression de la sclérose en plaques. Cell Rep Med, 2025. 6(4) : p. 102055.

20. Wu, H., et al., Dynamique du microbiome et du métabolome associée à un mauvais contrôle glycémique et aux réactions aux changements de mode de vie. Nat Med, 2025. 31(7) : p. 2222-2231.

21. Jacobs, J.P., et al., La thérapie cognitivo-comportementale pour le syndrome du côlon irritable entraîne des modifications bidirectionnelles de l'axe cerveau-intestin-microbiome associées à une amélioration des symptômes gastro-intestinaux. Microbiome, 2021. 9(1) : p. 236.

22. Pietzner, M., et al., « Les métabolites plasmatiques pour cartographier les voies métaboliques dans la multimorbidité liée aux maladies non transmissibles ». Nat Med, 2021. 27(3) : p. 471-479.

23. Faquih, T.O., et al., « Prédiction métabolomique robuste de l'âge à partir d'un large éventail de métabolites ». J Gerontol A Biol Sci Med Sci, 2025, vol. 80, n° 3.

24. Scherer, N., et al., « L'association de la métabolomique et du séquençage de l'exome met en évidence des effets graduels de variants hétérozygotes rares et délétères sur la fonction des gènes et les traits humains ». Nat Genet, 2025. 57(1) : p. 193-205.

25. Holmes, Z.C., et al., Une analyse métabolomique non ciblée du lait maternel provenant de mères en bonne santé met en évidence les facteurs à l'origine de la variabilité des métabolites. Sci Rep, 2024. 14(1) : p. 20827.

26. Titz, B., et al., Implications des facteurs de confusion oculaires pour les analyses protéomiques et métabolomiques de l'humeur aqueuse dans les maladies rétiniennes. Transl Vis Sci Technol, 2024. 13(6) : p. 17.

27. Bloom, S.M., et al., La dépendance en cystéine de Lactobacillus iners constitue une cible thérapeutique potentielle pour la modulation du microbiote vaginal. Nat Microbiol, 2022. 7(3) : p. 434-450.

28. Leimer, E.M., et al., Profil lipidique du liquide synovial humain à la suite d'une fracture intra-articulaire de la cheville. J Orthop Res, 2017. 35(3) : p. 657-666.