Bioinformatische Analyse und funktionelle Charakterisierung von strukturellen Genvarianten in ADME-Genen in humaner Leber

Doctoral thesis German OPEN
Tremmel, Roman (2016)
  • Publisher: Fakultät Naturwissenschaften. Institut für Biologische Chemie und Ernährungswissenschaft
  • Subject: Pharmakogenetik | Kopienzahlvariation | Leber | Arzneimittel | Metabolismus | Phänotyp | Assoziation | Sequenzanalyse <Chemie> | Pharmakogenomik | dosis-abhängige | Expression | NGS | Exonsequenzierung | Pharmacogenetics | CNV | human liver | drug metabolism | exonsequencing | Life sciences
    • ddc: ddc:570

Die Pharmakogenetik beschreibt die Untersuchung von interindividuellen genetischen Unterschieden, welche die Wirkung von Medikamenten und die Reaktion auf xenobioti-sche Substanzen beeinflussen. Ein Großteil dieser Variabilität beruht auf Unterschieden im hepatischen Arzneimittelmetabolismus. Die daran beteiligten Enzyme, Transporter und Rezeptoren sind in die Prozesse der Absorption, der Distribution, des Metabolismus und der Exkretion involviert und werden als ADME-Gengruppe zusammengefasst. Neben den genetischen Faktoren können auch Einflüsse aus der Umwelt und endogene Faktoren, wie das Geschlecht, das Alter, Entzündungsreaktionen und andere Faktoren die Expression und die Aktivität der ADME-Gene ändern. Sind die Einflüsse so groß, dass das therapeutische Fenster eines Medikaments verlassen wird, kann das Ansprechen auf das Medikament ausbleiben oder unerwünschte Arzneimittelwirkungen und gegebenenfalls Toxizität können auftreten. Das humane Genom eines bestimmten Individuums unterscheidet sich neuesten Daten zufolge im Vergleich zum Referenzgenom an 4,1 bis 5 Millionen Positionen. Davon sind mehr als 99,9% Einzelbasenpolymorphismen (single nucleotide polymorphism; SNP) oder kleine Insertionen und Deletionen. Daneben kommen bis zu 2.500 strukturelle Varianten pro Person vor, die insgesamt ca. 20 Millionen Basen einschließen und somit auf DNA-Basis mehr zur Variabilität des Genoms beitragen als die SNPs (1000 Genome Project, 2015). In der Gruppe der strukturellen Varianten finden sich auch Kopienzahlvariationen (copy number variations; CNV), per Definition mindestens 1kb lange duplizierte oder deletierte DNA Segmente. Beobachtungen zur Funktionalität der CNVs in der Fruchtfliege, der Maus und im Menschen fanden neben CNVs, die einen Einfluss auf den Phänotyp zeigten (dosis-sensitiv), auch CNVs, deren Einfluss umge-kehrt (dosis-umgekehrt) oder komplett abwesend war (dosis-insensitiv). CNVs, die den Arzneimittelmetabolismus beeinflussen, wurden zum Beispiel für das Phase I Gen CYP2D6 gezeigt. Eine verminderte oder erhöhte Kopienzahl des Gens wirkt sich direkt sowohl auf die mRNA und Proteinexpression, als auch auf die Enzymaktivität aus. So ist der Metabolismus der CYP2D6 Substrate Codein (Opioid) oder Tamoxifen (selekti-ver Östrogenrezeptormodulator) in Trägern dieser Varianten im Vergleich zu Trägern mit zwei Kopien signifikant verändert. Eine im Vorfeld durchgeführte Genotypisierung kann deswegen in Zukunft helfen, die Medikamentendosis Genotyp-abhängig anzu-passen. Diese Arbeit beschäftigt sich mit der Fragestellung, ob weitere ADME-Gene CNVs aufweisen und ob diese genetischen Varianten einen funktionellen Einfluss auf den Phänotyp und Arzneimittelmetabolismus haben. Dazu wurde systematisch das Vorkommen von CNVs der wichtigsten ADME-Gene (n=340) in drei unabhängigen Datensätzen untersucht. In einer öffentlichen Datenbank für genomische strukturelle Varianten (DGV; dgv.tcag.ca) wurde die Position der AD-ME-Gene mit den dort beschriebenen CNV-Positionen aus HapMap-Proben abgegli-chen. Zusätzlich wurden in gesunden (n=269) und malignen (n=351) humanen Leber-proben des TCGA-Projektes (http://cancergenome.nih.gov/) prozessierte SNP-Mikrochipdaten ausgewertet. In einer am IKP Stuttgart etablierten Biobank (IKP148), die 150 Leberproben mit europäischer Herkunft und vollständiger klinischer und demo-graphischer Dokumentation umfasst, wurde mit Hilfe eines ADME-panelbasierten next generation Exonsequenzierungsprojektes (NGS) die Kopienzahl der 340 ADME-Gene detektiert. Dafür wurde eine Methode entwickelt und ein bioinformatischer Arbeitsablauf angewendet, der die Abdeckung der einzelnen Sequenzierungen auswertet und daraus die relative Kopienzahl für jedes Gen und Exon bestimmt. Die Ergebnisse wurden mittels real time PCR und spezifischen TaqMan CNV-Assays validiert. Für die funktionelle Assoziationsanalyse wurde in 50 gesunden TCGA-Leberproben auf Gen-expressionswerte einer RNA-Sequenzierung zurückgegriffen. In lymphoblastoiden Zell-linien der HapMap-Proben (LCL) und den IKP148-Leberproben wurden normalisierte Intensitäten eines Expressionsmikrochips zur funktionellen Analyse verwendet. Zusätz-lich lagen in den Leberproben (IKP148) bereits Protein und Enzymaktivitätsdaten für einzelne ADME-Gene vor. Weitere Proteinexpressionsdaten wurden mit WesternBlot Analysen bestimmt. Mit diesem systematischen Ansatz konnten alle bekannten, pharmakologisch wichtigen CNVs in Phase I und II Genen, wie CYP2A6, CYP2D6, GSTM1, GSTT1, SULT1A1 und UGT2B17 in allen untersuchten Datensätzen bestätigt werden. Weitere CNVs, die teil-weise bereits bekannt waren oder noch nicht als funktionell beschrieben wurden, fan-den sich ebenfalls in der Phase I und II Gruppe, wie CES1, CYP2E1, CYP21A2, UGT2B15 und UGT2B28. Seltene CNVs (<1%) betrafen überwiegend Transporterge-ne, wie zum Beispiel ABCA2, SLC2A4 und SLC47A1. Zudem wurden in den Leberpro-ben (IKP148) mit der NGS-Methode CYP2A6 und CYP2D6 CNVs feinkartiert. Mit einer Auflösung auf Exonebene wurden Hybridallele der beiden Gene mit dem jeweiligen Pseudogen festgestellt und bestätigt. Auch die funktionelle Analyse bestätigte die posi-tive Assoziation von CNVs der Gene CYP2A6, CYP2D6, GSTM1, GSTT1, SULT1A1 und UGT2B17 mit der mRNA Expression in allen drei Kohorten. In den IKP148-Leberproben wurde mit der Kombination aller genetischen Informationen aus dem ADME-panelbasierten NGS-Datensatz gezeigt, dass die genetischen Faktoren 11% bzw. 53% der Variabilität der CYP2A6 und CYP2D6 Enzymaktivität erklären. Im Gegensatz dazu war die mRNA Expression der Gene CES1 oder CYP2E1 in ge-sundem Lebergewebe (IKP148 und TCGA) und in den LCLs nicht von der Kopienzahl abhängig. Eine detailliertere Analyse des CYP2E1 Gens und der detektierten CNVs mit der Proteinexpression und Enzymaktivität bestätigte die Unabhängigkeit von der Gen-dosis in den IKP148-Leberproben. Diese Dosiskompensation kann prinzipiell durch verschiedene Mechanismen erklärt werden. Neben gewebe- und tumorspezifischen Faktoren könnten gelinkte genetische Varianten, eine starke posttranskriptionelle und posttranslationale Regulation wie z.B. mit Hilfe von miRNAs, ein unvollständiger Ein-schluss der regulatorischen und kodierenden Sequenzen in der strukturellen Variante, Hybridgene, eine monoallelische Expression, negative Rückkopplung oder epigeneti-sche Faktoren für das Ausbleiben des CNV-Effektes verantwortlich sein. In dieser Ar-beit wurde mittels einer Haplotypanalyse in der CYP2E1 Region SNPs identifiziert, die mit der Genduplikation gelinkt waren und tendenziell die Expression in Individuen mit europäischer Herkunft negativ beeinflussten. Mit in silico Methoden wurde eine Bezie-hung zwischen einem der zur Duplikation gelinkten SNPs in der 3&#x92;UTR mit zusätzlichen miRNA Bindestellen vorhergesagt. Die daran bindenden miRNAs sind möglicherweise für die Regulation zusätzlicher Kopien verantwortlich. Der Einfluss von CNVs auf die mRNA Expression anderer Gene, wie CYP21A2, UGT2B25 und UGT2B28, war inkonsistent. Obwohl CYP21A2 Deletionen mit einem verminderten Expressionsphänotyp assoziiert waren, zeigten Duplikationen keinen Einfluss (IKP148). Eine Assoziation von UGT2B28 CNVs wurde nur in LCLs nicht aber in Lebergewebe (IKP148 und TCGA) gefunden. Insgesamt wurde in den IKP148-Proben in 7 von 17 Genen, in den TCGA-Leberproben in 2 von 12 und in den LCLs in 3 von 14 Genen ein Einfluss der CNVs auf die Expression gefunden. Im TCGA-Krebsgewebe waren nahezu alle 340 ADME-Gene von CNVs betroffen und mehr als 30% der CNVs zeigten einen signifikanten Effekt auf die mRNA Expression. Im Rahmen von Kooperationsprojekten wurden weitere Polymorphismen und Phänoty-pen von CYP2E1 und SULT1A1 analysiert. CYP2E1: Dieser Teil der Arbeit befasst sich mit Faktoren, die das Risiko einer Erkran-kung an Schilddrüsenkrebs (differentiated thyroid carcinoma; DTC) verändern. Es ist bekannt, dass die Progression von DTC durch das Zusammenspiel von genetischen Faktoren, Umwelteinflüssen, wie ionisierende Strahlung, vorhergegangene Erkrankun-gen der Schilddrüse und unnatürliche Hormonspiegel, beeinflusst wird. Acrylamid, das mit der Nahrung aufgenommen wird, gilt als potentieller neuer Faktor in der DTC Ent-stehung. Da Acrylamid von CYP2E1 zum karzinogenen Glycidamid metabolisiert wird und diese Reaktion vermutlich abhängig vom CYP2E1 Genotyp ist, wurde untersucht, ob Varianten von CYP2E1 das DTC Risiko beeinflussen können. Dafür wurde in einer Fall-Kontroll-Studie eines Kooperationspartners (Prof. Dr. Stefano Landi, Universität von Pisa, Pisa, Italien) ein Tag-SNP Verfahren gewählt und der SNP rs2480258, der Varianten im Intron acht und der 3&#x92;UTR von CYP2E1 abdeckt, als Risiko SNP identifi-ziert. Anschließend wurde untersucht, ob der Tag-SNP die Expression und Aktivität von CYP2E1 in humanem Gewebe beeinflusst. Dazu wurden in den Leberproben (IKP148) die Genotypen des tag-SNP durch ein Imputierungsverfahren bestimmt und mit den CYP2E1 Phänotypen korreliert. Es zeigte sich, dass das A Allel des tag-SNPs, welches mit einem höheren DTC-Risiko assoziiert war, die mRNA, die Proteinexpression und die Enzymaktivität reduziert. Eine in silico Analyse zum möglichen molekularen Mechanismus prognostizierte, dass eine miRNA (miR570) die CYP2E1 Transkripte in Trägern des A Allels reduziert. Dieses Ergebnis deutet darauf hin, dass die interindi-viduelle CYP2E1 Aktivität sowie Acrylamid (ähnlich dem Glycidamid) das Risiko für die Entstehung von DTC beeinflussen. SULT1A1: Methyleugenol, ein Sekundärmetabolit aus Kräutern wie Lorbeer und Basili-kum, wird im humanen Organismus über eine Sulfatierung zu einem reaktiven Metabo-liten aktiviert, welcher DNA kovalent binden kann. Die entstehenden DNA-Addukte sind mutagen und können bei ineffektiver DNA-Reparatur ein Auslöser von Karzinogenese sein. In Mäusen wurde von einem Kooperationspartner (Prof. Dr. Hans-Rudolf Glatt, Deutschen Institut für Ernährungsforschung Potsdam-Rehbrücke (DIfE), Nuthetal, Deutschland) bereits gezeigt, dass der Metabolismus in der Leber abläuft und haupt-sächlich das Phase II Enzym SULT1A1 daran beteiligt ist. Um diese Ergebnisse in hu-manen Proben nachzuvollziehen, wurden vom Kooperationspartner in 121 der 150 Leberproben (IKP148) die Methyleugenol DNA-Adduktspiegel gemessen. In dieser Arbeit wurde zusätzlich die SULT1A1 Proteinmenge in den IKP148-Leberproben be-stimmt. Die SULT1A1 mRNA und Proteinexpression korrelierten jeweils signifikant mit den DNA-Adduktmessungen, d.h. je höher die SULT1A1 Expression, desto höher wa-ren die Adduktspiegel. Dies bestätigte in humanen Leberproben die in vivo Rolle von SULT1A1 im Methyleugenolmetabolismus. Wie oben bereits angedeutet, kamen in den Leberproben Träger von ein, zwei, drei, vier und fünf SULT1A1 Genkopien vor. Dabei waren Deletionen seltener (4%) als Duplikationen (36%) zu beobachten. Die Kopienzahl korrelierte signifikant mit der SULT1A1 mRNA und Proteinexpression. Diese Er-gebnisse sind in Einklang zu früheren Studien, die einen Effekt der Kopienzahl auf die Enzymaktivität aufzeigten. Die Methyleugenol DNA-Adduktspiegel waren ebenfalls zur SULT1A1 Kopienzahl assoziiert. Träger von mehr als drei Genkopien hatten ein 2,8-fach höheres DNA-Adduktlevel als Träger mit nur einer SULT1A1 Genkopie. Träger mehrerer SULT1A1 Kopien können daher unter Umständen leichter, schneller und öfter ein kritisches DNA-Adduktlevel erreichen, das zu einem höheren Krebsrisiko führen kann. Weiterführende Fall-Kontroll-Studien sollten daher, neben der Menge an aufge-nommenem Methyleugenol, die SULT1A1 Kopienzahl berücksichtigen. Pharmacogenetics is the study about inter-individual genetic variation that influences the response to drugs and other xenobiotics. A major part of this variation is due to hepatic drug metabolism with enzymes, transporters and receptors involved in the ab-sorption, distribution, metabolism and the excretion of drugs, xenobiotics and endoge-nous substances and collectively defined as ADME-genes. Genetic factors along with environmental and endogenous factors, including gender, age, inflammation processes and others are known to influence the expression and activity of ADME-genes. These influences can affect drug response, side effects or toxicity. According to newly published data, the human genome of any subject differs from a reference genome at 4.1 to 5.0 million positions. More than 99.9% of these differences are single nucleotide polymorphisms (SNP) or short insertions or deletions. Further-more, a person carries up to 2,500 structural variants, including copy number variations (CNV) affecting ~20 million bases (1000 Genomes Project Consortium et al., 2015). Thus structural variants affect more bases than SNPs. Per definition the CNVs are du-plicated or deleted DNA segments greater than 1kb and it was shown that they cover at least 12-30% of the human genome. Genome-wide studies investigating the function-ality of CNVs in the fruit fly, the mouse and in humans showed that there are genes whose expression is clearly affected by CNVs (dosage-sensitve), but also genes show-ing lower expression with increased copy number (dosage reversed) or genes without any expression alterations despite different copy number (dosage-insensitive). A prominent example of CNVs influencing drug metabolism is the phase I gene CYP2D6. Carriers of reduced or amplified gene copies show significantly altered ex-pression and enzyme activity levels and also a different drug metabolism of substrates like codeine (opioid) or tamoxifen (selective estrogen receptor antagonist) in compari-son to carriers with normal copy status of two. Genotyping of CYP2D6 gene copy num-ber may thus help to adjust drug dosage in a genotype dependent manner. In this work I investigated if further ADME-genes are affected by CNVs and if these variants have a functional impact on the expression phenotype and drug metabolism. The distribution of CNVs in the most important ADME-genes (n=340) was investigated in three independent cohorts using CNV data in a public accessible database of ge-nomic variants (DGV; dgv.tcag.ca), processed SNP microarray data of paired samples of healthy (n=269) and tumor (n=351) liver tissue of the TCGA project (http://cancergenome.nih.gov/) and ADME-panel based exon next generation sequenc-ing (NGS) applied on 150 well documented human liver samples of an in-house cohort (IKP148). For the NGS data analysis a method was developed and optimized to esti-mate the relative copy number of the ADME genes or every single exon via the read depth. The results were validated using qPCR with specific TaqMan assays. RNA-sequencing data of 50 healthy TCGA liver samples, and normalised expression data from microarray experiments applied to lymphoblastoid cell lines (LCL) from the HapMap samples and the 150 human liver samples (IKP148) were used to analyse the association between CNVs and the mRNA expression. Furthermore, in the IKP148 liver samples protein and enzymatic activity levels were available or measured using West-ernBlot and mass spectrometry for selected ADME-genes. All pharmacologically important CNVs of phase I and phase II genes, including CYP2A6, CYP2D6, GSTM1, GSTT1, SULT1A1 and UGT2B17 could be confirmed in all datasets. CNVs which were known, but so far not functionally assessed were found in the phase I and II genes CES1, CYP2E1, CYP21A2, UGT2B15 and UGT2B28. In this work rare CNVs (<1%) were mainly found for transporters like ABCA2, SLC2A4 and SLC47A1. The analysis of the read depth in the IKP148 samples data revealed hybrid genes for CYP2A6 and CYP2D6 with their pseudogenes and allowed a fine mapping of the different alleles. The functional analysis further confirmed the positive association between CNVs and the mRNA expression of CYP2A6, CYP2D6, GSTM1, GSTT1, SULT1A1 and UGT2B17 in all three cohorts. The combination of all data from the NGS project in the IKP148 liver subjects, including SNP and CNV genotypes showed that 11% and 53% of the variability of CYP2A6 and CYP2D6 enzyme activity were explained by the genetic factors. In contrast the mRNA expression of the genes CES1 and CYP2E1 was not dependent of the CNV pattern in healthy liver tissue (IKP148 and TCGA) and lymphoblastoid cell lines. A detailed analysis of the protein and enzyme activity levels (chlorzoxazone-6-hydroxylation) of CYP2E1 confirmed the dosage-insensitivity in the IKP148 liver sub-jects. The dosage compensation can be principally explained by different mechanisms and could be tissue or tumor specific. Furthermore, CNV-linked genetic variants, altered miRNA regulation, incomplete inclusion of regulatory elements or coding sequences, hybridgenes, monoallelic expression, feedback loops or epigenetics could be factors which mask the CNV effect. In this work a haplotype analysis of the CYP2E1 region identified SNPs which were linked to the duplication and a reduced expression phenotype in persons with European ancestry. Using in silico prediction tools we found a relation of one of the linked SNPs in the 3&#x92;UTR with additional predicted miRNA bind-ing sites potentially regulating additional CYP2E1 gene copies. The CNV influence on the mRNA expression of the genes CYP21A2, UGT2B25 and UGT2B28 was inconsistent. Although CYP21A2 deletions were associated with a de-creased expression, gene duplications showed normal expression levels compared to samples with two copies. A significant influence of UGT2B28 CNVs was found in LCLs but not in human liver samples (IKP148 and TCGA). In total 7 of 17, 2 of 12 and 3 of 14 ADME genes showed a significant association between expression and CNV type in the IKP148, TCGA and LCLs of the HapMap samples, respectively. In the TCGA cancer tissue nearly all ADME-genes carry CNVs and in 30% of the genes a significant correlation was observed. With cooperation partners further polymorphisms and phenotypes of SULT1A1 and CYP2E1 were analyzed. CYP2E1: In this part of the thesis factors influencing the risk of developing differentiat-ed thyroid carcinoma (DTC) were investigated. Known risk factors for the progression of DTC are genetic and environmental factors, including ionizing radiations, previous thyroid diseases, and hormone factors. It has been speculated that dietary acrylamide intake correlates with the DTC formation. The acrylamide molecule is metabolized by CYP2E1 to the reactive carcinogenic glycidamide. The enzymatic reaction is probably dependent on the CYP2E1 genotype. Together with a cooperation partner (Prof. Dr. Landi, University of Pisa, Pisa, Italy) we investigated, whether CYP2E1 variants influ-ence the DTC risk. Prof. Landi and colleagues used a case-control-cohort and a haplo-type approach and observed a significant association between a tag-SNP rs2480258 (A allele), which covers variants in intron eight and the 3&#x92;UTR, and an increased DTC risk. In the human liver samples (IKP148) the rs2480258 genotypes were assessed using an imputation analysis and it was shown that particularly the A allele of the SNP reduce significantly the mRNA and protein expression and the enzyme activity. An in silico prediction for the molecular mechanism suggested that miR570 specifically down regulates the transcripts in carriers of the A allele. These results indicated that the inter-individual CYP2E1 activity as well as acrylamide (similar to glycidamide) influences the risk for DTC. SULT1A1: Methyleugenol, a secondary metabolite present in herbs such as basil or laurel is metabolized in humans by sulfation to a reactive product which can covalently bind to DNA. The resulting DNA adducts are mutagenic and can promote carcinogene-sis. Our cooperation partner Prof. Dr. Hans-Rudolf Glatt (German Institute for Human Nutrition Potsdam-Rehbruecke (DIfE), Nuthetal, Germany) had shown, that the meth-yleugenol metabolism takes place in the liver of mice and is mainly catalyzed by the phase II enzyme SULT1A1. To investigate these facts in humans, the methyleugenol DNA-adduct levels were measured by the cooperation partner in liver tissues (n=121; IKP148) using mass spectrometry. In this work the SULT1A1 protein levels were de-termined using western blot analysis and the relation between the DNA adducts as well as the SULT1A1 expression and the SULT1A1 CNVs was assessed. The SULT1A1 mRNA and protein expression were significantly correlated to the DNA adducts, e.g. higher SULT1A1 expression resulted in higher adduct levels. This emphasized the role of SULT1A1 in the in vivo metabolism in human liver samples. As mentioned above, there were individuals (IKP148) carrying one, two, three, four and five copies of SULT1A1. Deletions were found less frequent (4%) than duplications (36%). The CNVs were significantly associated with the SULT1A1 mRNA and protein expression. This result was consistent to previous studies investigating the association between SULT1A1 CNVs and enzyme activity. The methyleugenol DNA adduct levels were also significantly associated to the SULT1A1 copy number. Carriers of at least three gene copies exhibited a 2.8-fold higher DNA adduct level compared to donors carrying only one SULT1A1 gene copy. As a consequence this could mean that individuals with mul-tiple SULT1A1 copies reach faster, more often and more easily critical and ultimate adduct levels which increase the risk for developing cancer. Future studies should clari-fy whether methyleugenol intake as well as the individual SULT1A1 CNV make-up in-fluences the risk of cancer.
Share - Bookmark