Guide de la multiomique
Chapitre 3 - Génomique
Dans ce chapitre, nous donnons un bref aperçu de la génomique - la modalité omique qui s'intéresse au contenu du génome - et des domaines connexes, notamment l'épigénomique et la métagénomique. Nous aborderons l'évolution des technologies d'étude du génome, les considérations expérimentales pratiques et quelques études de cas pour la génomique dans les flux de travail de la multiomique.
Qu'est-ce que la génomique ?
Le génome comprend l'ensemble de l'ADN d'un organisme.1 La génomique est l'étude du génome, le plus souvent par le séquençage, l'assemblage et l'analyse à haut débit. Outre les lettres A, C, T et G, l'ADN peut être modifié ; l'étude des modifications du génome est appelée épigénomique. Les capacités d'étude de la métagénomique et de l'épigénomique ont évolué en même temps que la technologie de la génomique.
Comment la génomique est-elle étudiée ?
Il existe plusieurs approches différentes pour étudier le génome, qui ont évolué pendant près de 50 ans. C'est d'ailleurs un exercice amusant que d'examiner l'histoire des méthodes de séquençage du génome et la façon dont elles ont fait progresser notre compréhension du génome et de la biologie dans son ensemble.
Séquençage Sanger
En 1977, Frederick Sanger a publié sa méthode pour déterminer efficacement l'ordre des bases nucléotidiques dans l'ADN3. Le séquençage Sanger utilise des nucléotides terminateurs fluorescents qui sont incorporés dans le brin d'ADN en croissance, le marquant avec un fluorophore unicolore. Les fragments d'ADN marqués sont électrophorisés dans un gel pour les séparer par taille et la couleur à chaque taille indique l'ordre des bases. Des séquenceurs automatisés basés sur ce principe ont été rapidement mis au point, rendant le séquençage Sanger accessible. Le projet du génome humain, achevé en 2003, a utilisé le séquençage Sanger pour assembler le premier atlas du génome humain4-8.
Le séquençage Sanger est encore couramment utilisé dans les flux de travail de routine en biologie moléculaire, que ce soit pour vérifier une seule séquence ou pour analyser un petit nombre de gènes. Il est peu coûteux pour les petits projets, peut fournir de longues lectures et ne nécessite pas de connaissances avancées en bioinformatique.
Séquençage de nouvelle génération (2e génération)
Le séquençage de nouvelle génération (NGS) a été développé à la fin des années 19909. Le NGS partage les principes du séquençage Sanger (incorporation d'un nucléotide à la fois pour l'analyse), mais il est massivement parallélisé9. Le NGS utilise des amorces aléatoires pour générer des lectures courtes (50-300 pb), qui sont ensuite assemblées à l'aide de la bio-informatique et d'un génome de référence9,10.
La NGS est relativement peu coûteuse, le coût par base étant inférieur à celui du séquençage Sanger, et le séquençage d'un génome entier est passé d'un projet pluriannuel coûtant des centaines de millions de dollars à un projet pluri-hebdomadaire coûtant quelques milliers de dollars. La NGS utilise la PCR pour l'amplification au lieu du clonage bactérien laborieux10,11; toutefois, cela impose des limites, telles que la faible amplification des régions riches en GC, la classification erronée des régions répétées comme un contig unique et la faible discrimination des variations structurelles (SNV)11.
Séquençage de troisième génération
Le séquençage de troisième génération (TGS) s'est attaqué aux limites des lectures courtes de la NGS en générant des lectures longues, parfois jusqu'à la longueur d'une gigabase11. Les méthodes de TGS comprennent la plateforme de séquençage SMRT de PacBio et le séquençage Nanopore11. Les méthodes TGS impliquent une synthèse basée sur un seul et long brin d'ADN modèle et sont plus sujettes aux erreurs que les méthodes NGS car elles manquent de profondeur de séquençage. Cependant, la TGS est capable de séquencer des régions complexes et a été utilisée pour combler des lacunes dans le projet du génome humain, ajoutant plus d'un mégaoctet de séquence11. La TGS mesure la synthèse de l'ADN en temps réel, contrairement aux méthodes NGS qui utilisent une approche "incorporation et pause". La TGS mesure donc non seulement la séquence de nucléotides, mais aussi la cinétique d'incorporation, ce qui peut être utilisé pour étudier directement l'épigénomique11.
L'étude de l'épigénome
La parallélisation massive de la NGS a permis d'étudier plus que les séquences génétiques ; elle a également élargi les techniques d'étude de l'épigénome. L'épigénome englobe les modifications chimiques de l'ADN et des protéines associées à l'ADN qui sont héréditaires et contrôlent l'expression des gènes, notamment la méthylation de l'ADN, les modifications des histones, la compaction de la chromatine et l'organisation nucléaire12,13.
La NGS a permis l'essor de méthodes permettant d'étudier différentes formes de modifications épigénétiques. Outre les approches basées sur les microréseaux, le séquençage au bisulfite (BS-seq) permet d'analyser les cytosines méthylées à l'échelle du génome13. Les méthodes d'analyse du génome contenu dans la chromatine ouverte ou condensée comprennent le séquençage après digestion de la chromatine ouverte (DNase-seq) ou le marquage de la chromatine ouverte à l'aide de la transposase Tn5 (ATAC-seq). Le séquençage par immunoprécipitation de la chromatine (ChIP-seq) a été utilisé pour identifier les régions génomiques associées à la compaction de la chromatine. La comparaison des séquences obtenues par ces techniques avec le séquençage du génome entier donne des indications sur la position des nucléosomes et des régions dépourvues de nucléosomes14. La TGS a permis l'interrogation directe des modifications épigénomiques en même temps que le séquençage, sans qu'il soit nécessaire de recourir au bisulfite ou à un traitement enzymatique11.
Autres sujets en génomique
La métagénomique - le séquençage et l'analyse de l'ensemble des génomes microbiens d'un échantillon - et la génomique unicellulaire sont deux techniques génomiques supplémentaires qui seront abordées dans les chapitres ultérieurs du guide (voir les chapitres 7 et 8). Chacune de ces méthodes a été utilisée seule ou dans le cadre d'études multidomiques pour faire progresser notre compréhension de la biologie, de la santé et de la maladie.
Utilisations modernes de la génomique en multiomique : Études de cas
Metabolon a travaillé avec plusieurs clients et collaborateurs pour réaliser une variété d'études de recherche multiomique sur un large éventail de sujets. Nous présentons ci-dessous quelques études de cas clés illustrant l'utilisation de la génomique et de la métabolomique avec d'autres données omiques.
La caractérisation protéogénomique révèle des vulnérabilités thérapeutiques dans l'adénocarcinome pulmonaire
En oncologie, le phénotypage des tumeurs et la multiomique peuvent aider à identifier des stratégies thérapeutiques pour différents sous-types de tumeurs. Au-delà de la simple identification des mutations conductrices et passagères, une étude multiomique portant sur 110 échantillons d'adénocarcinome pulmonaire a combiné la génomique avec la protéomique et la métabolomique pour comprendre les conséquences des variations génomiques15. Par exemple, une découverte clé a été que les mutations de RB1, un gène suppresseur de tumeur, augmentaient les niveaux de protéine CDK4, ce qui pourrait contribuer à la résistance du cancer du poumon mutant RB1 aux inhibiteurs CDK4/6.
Les études d'association à l'échelle du génome des métabolites chez les hommes finlandais identifient des loci pertinents pour la maladie
L'intégration de la génomique dans un flux de travail multiomique renforce l'impact des résultats génomiques et permet d'identifier des biomarqueurs de risque de maladie. Étant donné que les gènes codent pour des protéines qui catalysent des réactions, il s'ensuit que les variations génomiques ont un impact sur le métabolome - ces relations peuvent être mises en évidence en étudiant les deux dans le cadre d'un flux de travail multiomique. Une étude analysant 1391 métabolites plasmatiques avec des études d'association pangénomique (GWAS) parallèles sur 6136 hommes adultes finlandais a identifié 277 gènes causaux et 303 nouvelles associations (figure 1)16. La figure 2 montre comment plusieurs loci génomiques peuvent être associés au même métabolite par des actions uniques dans la génération ou la métabolisation (dans ce cas) de la N-acétyl-kynurénine.
Figure 1. Flux de travail multiomique pour Yin et al. 2022, impliquant la colocalisation des variations génomiques et des métabolites par cartographie fine, randomisation mendélienne et liens établis à partir de la littérature.
L'étude a identifié des liens de causalité entre le métabolome et le génome, notamment une relation de causalité entre une variante intronique du gène ABCG8 et les niveaux réduits du métabolite campestérol comme contribuant à la formation de calculs biliaires. et les niveaux réduits du métabolite campestérol comme contribuant à la formation de calculs biliaires. L'analyse a également mis en évidence la colocalisation d'une protéine de transport SERPINA1 avec le métabolite N-acétylglucosaminylasparagine et les maladies du foie, y compris la cholestase.
Figure 2. Trait loci associé au métabolite N-acétyl-kynurénine16.
Analyse du séquençage du génome entier du métabolome humain dans des populations multiethniques
Les flux de travail multiomiques intégrant la génomique peuvent aider à identifier les relations entre les métabolites et les variantes du génome. Cette étude17 a analysé 1666 métabolites circulants chez 11 840 adultes d'ascendance africaine, européenne et hispanique. Les résultats ont permis de valider 761 paires variants-métabolites découvertes précédemment et d'identifier 1975 nouvelles associations (figure 3). Soixante-dix-neuf paires de 65 nouvelles paires uniques variant-métabolite ont été reproduites, et 73 d'entre elles étaient conservées à travers les ascendances avec un sens de variation préservé. Trois de ces nouvelles paires ont été localisées sur le chromosome X, et 13 niveaux de métabolites ont été associés au risque de résultats phénotypiques défavorables, notamment le diabète de type 2 et la dégénérescence maculaire. L'étude a également révélé que les variantes rares sont généralement plus puissantes que les variantes communes, les variantes rares ayant en moyenne un effet 6,2 fois plus important sur les métabolites apparentés que les variantes communes.
Conclusions
La génomique est un outil puissant et un point d'ancrage pour de nombreuses autres formes de génomique. Les progrès du séquençage ont permis de séquencer rapidement et à peu de frais des génomes entiers, ce qui permet aux chercheurs d'examiner les relations complexes entre de multiples gènes, métabolites et autres biomolécules. Bien qu'il reste des défis à relever, le rythme des progrès continuera à nous éclairer sur le fonctionnement de systèmes biologiques complexes, que ce soit au sein d'un seul organisme ou dans des échantillons environnementaux.
Lire la suite - Chapitre 4 - Transcriptomique
Ce chapitre définit la transcriptomique, la modalité qui s'intéresse à l'ARN messager (ARNm). Nous discuterons des techniques utilisées et des applications des connaissances acquises grâce à la transcriptomique.
Références
- Un bref guide de la génomique. Consulté le 15 juillet 2024. https://www.genome.gov/about-genomics/fact-sheets/A-Brief-Guide-to-Genomics
- Thomas T, Gilbert J, Meyer F. Metagenomics - a guide from sampling to data analysis. Microb Informatics Exp. 2012;2(1):3. doi:10.1186/2042-5783-2-3
- Sanger F, Nicklen S, Coulson AR. Séquençage de l'ADN avec des inhibiteurs de terminaison de chaîne. Proc Natl Acad Sci USA. 1977;74(12):5463-5467. doi:10.1073/pnas.74.12.5463
- Shendure J, Mitra RD, Varma C, Church GM. Technologies de séquençage avancées : méthodes et objectifs. Nat Rev Genet. 2004;5(5):335-344. doi:10.1038/nrg1325
- Smith LM, Sanders JZ, Kaiser RJ, et al. Détection de la fluorescence dans l'analyse automatisée des séquences d'ADN. Nature. 1986;321(6071):674-679. doi:10.1038/321674a0
- Watson JD, Cook-Deegan RM. Origines du projet du génome humain. FASEB j. 1991;5(1):8-11. doi:10.1096/fasebj.5.1.1991595
- Green ED, Watson JD, Collins FS. Projet du génome humain : Vingt-cinq ans de grande biologie. Nature. 2015;526(7571):29-31. doi:10.1038/526029a
- Consortium international de séquençage du génome humain. Finalisation de la séquence euchromatique du génome humain. Nature. 2004;431(7011):931-945. doi:10.1038/nature03001
- Shendure J, Ji H. Séquençage de l'ADN de nouvelle génération. Nat Biotechnol. 2008;26(10):1135-1145. doi:10.1038/nbt1486
- Shendure J, Findlay GM, Snyder MW. Médecine génomique : progrès, pièges et promesses. Cell. 2019;177(1):45-57. doi:10.1016/j.cell.2019.02.003
- Van Dijk EL, Jaszczyszyn Y, Naquin D, Thermes C. La troisième révolution dans la technologie du séquençage. Trends in Genetics. 2018;34(9):666-681. doi:10.1016/j.tig.2018.05.008
- Fiche d'information sur l'épigénomique. Institut national de recherche sur le génome humain. Consulté le 15 juillet 2024. https://www.genome.gov/about-genomics/fact-sheets/Epigenomics-Fact-Sheet
- Mehrmohamadi M, Sepehri MH, Nazer N, Norouzi MR. Aperçu comparatif des méthodes de profilage épigénomique. Front Cell Dev Biol. 2021;9. doi:10.3389/fcell.2021.714687
- Buenrostro JD, Wu B, Chang HY, Greenleaf WJ. ATAC-seq : une méthode pour évaluer l'accessibilité de la chromatine à l'échelle du génome. CP Molecular Biology. 2015;109(1). doi:10.1002/0471142727.mb2129s109
- Gillette MA, Satpathy S, Cao S, et al. La caractérisation protéogénomique révèle des vulnérabilités thérapeutiques dans l'adénocarcinome pulmonaire. Cell. 2020;182(1):200-225.e35. doi:10.1016/j.cell.2020.06.013
- Yin X, Chan LS, Bose D, et al. Genome-wide association studies of metabolites in Finnish men identify disease-relevant loci. Nat Commun. 2022;13(1):1644. doi:10.1038/s41467-022-29143-5
- Feofanova EV, Brown MR, Alkis T, et al. Whole-genome sequencing analysis of human metabolome in multi-ethnic populations. Nat Commun. 2023;14(1):3111. doi:10.1038/s41467-023-38800-2
Table des matières
Télécharger le guide au format PDF
Partager ce chapitre
Découvrez comment Metabolon peut vous aider à obtenir des informations précliniques et cliniques.
Nous contacter
Parler avec un expert
Demandez un devis pour nos services, obtenez plus d'informations sur les types d'échantillons et les procédures de manipulation, demandez une lettre de soutien ou posez une question sur la façon dont la métabolomique peut faire avancer votre recherche.