KOHDENNETTU MISEQ- EKSONISEKVENSOINTI KÄYTTÄEN SEQCAP- GEENIKIRJASTOASETELMAA JA ALZHEIMERIN TAUTITAPAUKSIA Tiina Karkiainen Opinnäytetyö Lääketieteen koulutusohjelma Itä-Suomen yliopisto Terveystieteiden tiedekunta Kliinisen lääketieteen yksikkö / Neurologia Joulukuu 2014 ITÄ- SUOMEN YLIOPISTO, Terveystieteiden tiedekunta Lääketieteen laitos Lääketieteen koulutusohjelma KARKIAINEN TIINA: Kohdennettu MiSeq- eksonisekvensointi käyttäen SeqCap- geenikirjastoasetelmaa ja Alzheimerin tautitapauksia Opinnäytetutkielma: 41 sivua Tutkielman ohjaajat: dosentti Seppo Helisalmi, professori Hilkka Soininen Tutkielman tarkastaja: professori Mikko Hiltunen, professori Hilkka Soininen Joulukuu 2014 Avainsanat: neurologia, Alzheimerin tauti, genetiikka, NGS Alzheimerin tauti (AT) on vaiheittain etenevä hermostorappeumasairaus, jolle tyypillisiä patologisia muutoksia ovat amyloidiplakit ja neurofibrillivyyhdit. AT:n harvinaisemman familiaalisen muodon periytyminen noudattaa Mendeliaalista mallia ja taudin puhkeaminen johtuu kausaalisista mutaatiosta, joita on toistaiseksi löydetty kolmesta eri geenistä. Nämä kausaaliset mutaatiot preseniliini-1 (PSEN1), preseniliini- 2 (PSEN2) ja amyloidiprekursoriproteiini (APP) geeneissä johtavat muutoksiin β-amyloidituotannossa, ja tämän uskotaan olevan keskeinen osa taudin syntymekanismia. Lisäksi on löydetty lukuisia pienemmän riskivaikutuksen omaavia geenimuutoksia, jotka ovat yleisiä populaatiotasolla. Nämä muutokset yhdessä ympäristötekijöiden kanssa saavat aikaan huomattavasti yleisemmän monitekijäisen AT:n tautimuodon. Vaikka tietämys AT:n genetiikasta on kasvanut merkittävästi sitten koko genomin kattavien assosiaatiotutkimusten myötä, on osa taudin periytymisestä vielä tuntematonta. Uuden sukupolven sekvensointi menetelmien (NGS = Next Generation Sequencing) avulla voidaan tutkimuksen resoluutiota ja kattavuutta säätää siten, että voidaan paitsi sekvensoida useita kokonaisia genomeja tehokkaasti, myös sekvensoida valikoituja alueita suurella resoluutiolla harvinaisempien muuttujien havaitsemiseksi. Tässä tutkimuksessa testattiin menetelmää DNA kirjaston rakentamiseksi. Tutkittavana olivat viisi eri näytettä suomalaisista AT- suvuista, joista kahdessa oli aiemmin toisella tekniikalla havaittu APP- geenialueen duplikaatio ja kolmessa Pro264Leu- mutaatio PSEN1- geenissä. Geenikirjaston rakentamiseksi käytettiin kohdennettua NGSsekvensointia, jossa oli valikoituna joukko neurologisiin sairauksiin liittyviä geenejä. Itse sekvensointi suoritettiin Illumina MiSeq- sekvensointilaitteella. Sekvensointiajon tuloksia tarkasteltiin erilaisten muuttujien avulla. MiSeq- sekvensaattorin kyky havaita variantteja oli hyvä (neuropaneelilla n.2000 varianttia/näyte). Kolmessa näytteessä esiintyvä Pro264Leu PSEN-1 mutaatio voitiin havaita tällä tekniikalla. Sen sijaan APP- geenialueen duplikaatiota ei pystytty havaitsemaan, viitaten siihen, että käyttämällämme sekvensointimetodilla ei voida tutkia isoja kromosomaalisia muutoksia, kuten isoja deleetioita tai insertioita. Vähintään 15 kertaa luettujen emästen osuus on noin 99 prosenttia kussakin näytteessä, joten luennan tarkkuus oli erittäin hyvä, ja sekvensointituloksia voidaan pitää luotettavina. UNIVERSITY OF EASTERN FINLAND, Faculty of Health Sciences School of Medicine Medicine KARKIAINEN TIINA: Targeted MiSeq exon sequencing by using SeqCap gene library protocol and Alzheimer’s disease cases. Thesis: 41 pages Tutors: Docent Seppo Helisalmi, Professor Hilkka Soininen Examiner: Professor Mikko Hiltunen, Professor Hilkka Soininen December 2014 Keywords: neurology, Alzheimer’s disease, genetics, NGS Alzheimer`s disease (AD) is a progressive neurodegenerative disease. Amyloid plaques and neurofibrillary tangles are typical neuropathological changes in AD. The genetics of the familial form of AD is characterized by Mendelian inheritance. Causative highly penetrant mutations in presenilin-1- (PSEN1), presenilin 2- (PSEN2) and amyloid precursor protein- (APP) genes result in changes of β-amyloid production, which is considered to play a central role in pathogenesis of the AD. In addition, there has been found several common low- risk variants, which act together with environmental factors to cause more common multifactorial from of the disease. Even though the knowledge on AD has increased since genome wide association studies, is the part of the genetics of AD still unknown. Next generation sequencing (NGS) - technology provides feasible resolution and coverage enabling the sequencing of several entire genomes in a single run, or targeted sequencing particular region of the genome with high resolution to identify rare variants. In the present study, we tested a method for DNA library preparation. We examined five samples from Finnish AD families. Two samples included APP- duplication and three Pro264Leu mutation in PSEN1- gene previously identified by another techniques. To construct gene library, we used targeted approach to select genes linked to neurological diseases. Sequencing was performed with MiSeq- sequencing platform. The results of the sequencing were assessed alongside with different quality values. The ability of MiSeq- sequencer to detect variants is good (in our neuropanel, about 2000 variants/sample were identified). Pro264Leu PSEN-1 mutation, which was presented in three samples, was detected by this approach. Instead, APP-gene region duplication was not detected, suggesting that large genomic alterations, such as deletions and insertions are not detectable with this approach. In each sample, about 99 percent of the bases were read at least 15 times, so the results of the NGS-sequencing can be considered reliable. SISÄLTÖ 1. JOHDANTO ................................................................................................................................. 5 2. KIRJALLISUUSKATSAUS ............................................................................................................... 6 2.1 Epidemiologia ........................................................................................................................... 6 2.2 Kliiniset oireet ja neuropatologiset muutokset........................................................................ 9 2.3 Genetiikka .............................................................................................................................. 13 2.3.1 Kausaaliset mutaatiot...................................................................................................... 13 2.3.2 Riskigeenit ....................................................................................................................... 14 2. 4 Uuden sukupolven sekvensointi menetelmät ....................................................................... 16 2.4.1 Yleistä .............................................................................................................................. 17 2.4.2 Käyttömahdollisuudet ..................................................................................................... 18 3. AINEISTO JA MENETELMÄT .......................................................................................................... 20 3.1 Tutkimustarkoitus .................................................................................................................. 20 3.2 Tutkimusmateriaali ................................................................................................................ 20 3.3 Menetelmät............................................................................................................................ 22 3.3.1 DNA- kirjaston rakentaminen.......................................................................................... 22 3.3.2. Klustereiden muodostaminen MiSeq- sekvensointilaitteella ........................................ 27 3.3.3 Sekvensointi synteesin kautta ......................................................................................... 29 3.4 Analysointi vaihe .................................................................................................................... 30 4. TULOKSET ..................................................................................................................................... 31 5. POHDINTA .................................................................................................................................... 34 VIITTEET ............................................................................................................................................ 36 5 1. JOHDANTO Alzheimerin tauti (AT) on yleisin dementian syy, ja se käsittää 60- 80 prosenttia dementiatapauksista. AT:n yleisin varhainen oire on lähimuistin heikkeneminen, sillä tautiin liittyvät patologiset aivomuutokset alkavat oppimisen ja muistin kannalta keskeisiltä alueilta (Alzheimer`s Association, 2014). Taudille tyypillisiä patologisia muutoksia ovat hyperfosforyloituneesta tau- proteiinista muodostuneet solunsisäiset neurofibrillivyyhdit ja solunulkoiset β- amyloidista muodostuneet plakit (Bettens ym. 2013). AT:n patologiset muutokset etenevät vaiheittain ja samaan tahtiin kliinisten oireiden kanssa (Braak H, Braak E 1991 ). Vain pieni osa tautitapauksista johtuu kausaalisista mutaatioista amyloidiprekursoriproteiini (APP)-, preseniliini- 1 (PSEN1) ja preseniliini- 2(PSEN2) geeneissä. Sen sijaan suurimmalla osalla taudin puhkeamiseen vaikuttavat sekä geneettiset että ympäristötekijät. Koko genomin kattavien assosiaatiotutkimusten (GWA= Genome Wide Association) avulla on löydetty suurella esiintymistaajuudella esiintyviä mutaatiota, jotka nostavat riskiä sairastua vain vähän (Bettens ym. 2013). Uuden sukupolven sekvensointi menetelmät (NGS= Next Generation Sequencing) mahdollistavat kokonaisten genomien sekvensoinnin aiempaa nopeammin, tarkemmin ja edullisemmin. Lisäksi sekvensoinnin tarkkuutta voidaan säätää siten, että sekvensoidaan pienempiä alueita suurella tarkkuudella. Tällöin on mahdollista löytää harvinaisempia mutaatioita (Illumina 2013a) Tässä opinnäytetyössä tarkasteltiin NGS- menetelmän tehokkuutta ja luotettavuutta, sekä pohdittiin sen hyötyjä ja haittoja. Tutkimuksessa sekvensoitiin viiden eri henkilön näytteet, joilla kaikilla tiedettiin olevan kausaalinen AT- mutaatio, joko APP- tai PSEN1- geenissä. Sekvensoinnissa käytettiin uuden sukupolven MiSeq- sekvensointilaitetta. Potilaiden näytteistä rakennettiin geenikirjasto, ja neuropaneelin avulla valikoitiin sekvensoitavaksi joukko neurologisiin sairauksiin tai häiriöihin liittyviä geenejä. Kyseiset valikoidut alueet sekvensoitiin suurella tarkkuudella, kyseessä on siis kohdennettu sekvensointi. Sekvensointiajon tuloksia tarkasteltiin erilaisten muuttujien ja hyvyysarvojen avulla. 6 2. KIRJALLISUUSKATSAUS 2.1 Epidemiologia Dementian esiintyvyys maailmalaajuisesti vuonna 2013 oli arvioilta 44.4 miljoonaa. AT on yleisin dementian syy. Väestön ikääntyessä dementiaa sairastavien määrän odotetaan kasvavan edelleen ja vuonna 2030 tapausten määrän ennustetaan olevan 75,6 miljoonaa ja vuonna 2050 jopa 135,5 miljoonaa. Vuosittain uusia tapauksia on 7,7 miljoonaa. Kasvun odotetaan olevan voimakasta etenkin kehittyvissä maissa (Prince ym. 2013). Vuonna 2005 tehdyn tutkimuksen mukaan eniten dementiaa sairastavia oli Pohjois-Amerikassa ja LänsiEuroopassa. Näiden jälkeen tulivat Latinalainen Amerikka, Kiina ja sen läntiset Välimeren naapurit (Ferri ym. 2005). Edellisestä poiketen uudempien analyysien mukaan 62 % dementiaa sairastavista elää matala- tai keskituloisissa maissa ja osuuden on arvioitu kasva- Miljoonaa dementiaa sairastavaa van vuoteen 2050 mennessä 71 prosenttiin (Prince ym. 2013) (kuva 1). Vuosi KUVA 1. Dementian esiintyminen matala- ja keskituloissa( low and middle income countries) sekä korkeatuloisissa (high income countries) maissa. Muokattu lähde Prince ym. 2013. Dementiaa sairastavien määrän kasvun odotetaan olevan voimakasta seuraavien vuosikymmenien aikana eteenkin matala- ja keskituloisissa maissa. Vuonna 2010 dementian aiheuttamat kustannukset maailmanlaajuisesti olivat noin 604 miljardia Yhdysvaltain dollaria. 70 prosenttia tästä summasta käytetään Länsi- Euroopassa ja Pohjois- Amerikassa. Matala- ja keskituloisten maiden kustannukset ovat sitä vastoin yhteensä vain noin 11 prosenttia kokonaissummasta. Näissä maissa kustannukset henkilöä 7 kohden ovat siis merkittävästi pienemmät kuin korkeamman tulotason maissa (Prince ym. 2013). Monet dementiaa sairastavista ovat vailla pätevää diagnoosia. Korkeamman elintason maissa 20- 50 prosenttia dementiatapauksista tunnistetaan ja dokumentoidaan. Matalamman elintason maissa tilanne on tätäkin huonompi. Asianmukaisen hoidon ja tuen saaminen edellyttää kunnollista diagnoosia (WHO). AT:n esiintyvyys kasvaa merkittävästi iän myötä, eteenkin 65 ikävuoden jälkeen (Kuva 2). Riski sairastua kasvaa 15 kertaiseksi 65 ja 80 ikävuoden välillä (Evans ym. 1989). AT:ia sairastavista vain noin 1-5 prosenttia edustaa varhaista familiaalista muotoa, joka alkaa alle 65 vuotiaana, ja loput 95 prosenttia edustaa myöhäisempää yli 65 vuotiaana alkavaa monitekijäistä muotoa. Sekä varhaiseen että myöhäiseen muotoon liittyy periytyvä alttius sairastumiseen. Henkilöllä, jonka ensimmäisen asteen sukulaisella on myöhäinen AT, on kaksinkertainen riski sairastua verrattuna henkilöön, jonka ensimmäisen asteen sukulaisella ei ole AT: ia (Reiz ja Mayeux 2014). Geneettisten tekijöiden lisäksi myös ympäristö ja elintavat vaikuttavat AT:n puhkeamiseen. Vuosittainen ilmaantuminen (per 100 henkilöä/ vuosi) KUVA 2. AT:n esiintyminen ikäluokittain. Lähde Mayeux ja Stern 2012. Vuosittain ilmaantuvien uusien AT- tapausten määrä kasvaa etenkin 65- ikävuoden jälkeen. Sydän- ja verisuonisairaudet ja niihin liittyvät tekijät kuten tyypin kaksi diabetes, tupakointi, ylipaino, korkea verenpaine ja dyslipidemiat eli rasva-aineenvaihdunnan häiriöt ovat eniten raportoidut AT:n riskitekijät (Mayeux ja Stern 2012). Tarkkaa mekanismia sydänja verisuonisairauksien ja AT:n välillä ei tunneta. On arveltu että muistioireet voivat johtua joko aivomuutosten aiheuttamista suorista vaurioista muistin kannalta keskeisillä alueilla 8 tai kudosvaurioiden aiheuttamasta Aβ:n pitoisuuden noususta, mikä voi puolestaan johtaa tulehdusreaktioon ja sitä kautta kognition heikkenemiseen. (Reiz ja Mayeux 2014). Kohonnut verenpaine keski-iässä (40- 60 vuotta) nostaa lievän kognitiivisen heikentymän (MCI= Mild Cognitive Impairement), dementian ja AT:n riskiä myöhempinä ikävuosina. Kohonneen verenpaineen uskotaan lisäävän aivo-veriesteen läpäisevyyttä, jolloin aivoihin pääsee enemmän proteiineja. (Kalaria RN 2010) Proteiinien kerääntyminen puolestaan johtaa soluvaurioihin, synapsien ja neuronien toiminnan häiriöihin ja Aβ:n kerääntymiseen johtaen tajunnan heikkenemiseen (Deane ym 2004). Myöhemmällä iällä korkeammalla verenpaineella on arvioitu olevan vastakkainen vaikutus, ja sen on katsottu jopa suojaavan AT:lta. Tämä selittynee sillä, että verenpaine laskee sairauden kehossa aiheuttamien muutosten johdosta (Reiz & Mayeux 2014). Tyypin kaksi diabetes lähes kaksinkertaistaa riskin sairastua (Leibson ym. 1997, Luchsinger 2001). Sekä aivoverenkiertoon liittyvät tekijät että hyperinsulinemia eli insuliinin ylimäärä, mikä johtaa Aβ:n kasautumiseen, ovat mahdollisia mekanismeja (Luchsinger ym. 2008). Myös aivovammojen on katsottu nostavan Aβ- tasoja. Lisäksi masennukseen liittyvien aivokemiallisten muutosten on arveltu nopeuttavan AT:n patologian kehittymistä (Pirttilä ja Erkinjuntti 2006). Sairastumisriskiä kasvattavien tekijöiden lisäksi on olemassa myös joitain mahdollisia AT:lta suojaavia tekijöitä. Kognitiivisesti stimuloivat aktiviteetit, kuten lukeminen tai oppiminen, mahdollisesti vähentävät riskiä sairastua. Sekä nuoremmalla että vanhemmalla iällä älyllisellä ja sosiaalisella aktiivisuudella on todettu olevan suotuisia vaikutuksia myöhemmän iän kognitiiviseen suorituskykyyn (Carlson ym. 2008, Fratiglioni ym. 2004). Koulutus ja älylliset aktiviteetit mahdollisesti synnyttävät aivoihin monipuolisemman hermoverkoston, mikä kompensoi iän ja sairauksien aiheuttamia aivomuutoksia (Pirttilä ja Erkinjuntti 2006). Tämän lisäksi fyysinen aktiivisuus ja ruokavalio vaikuttavat sairastumisriskiin. Välimerellisen ruokavalion noudattamisen, mikä sisältää paljon kalaa, kasviksia, tyydyttymättömiä rasvoja ja vähän punaista lihaa ja tyydyttyneitä rasvoja on tutkittu olevan yhteydessä vähentyneeseen riskiin sairastua AT:iin. (Scarmeas ym. 2009). Liikunnalla on monia suotuisia vaikutuksia aivojen terveydelle. Van Praagin ym. (1999) hiiritutkimuksen mukaan se parantaa oppimista sekä nuorilla että vanhemmilla eläimillä lisäten neurogeneesiä eli hermosolujen muodostumista ja solujen proliferaatiota eli lisääntymistä. 9 2.2 Kliiniset oireet ja neuropatologiset muutokset AT:lle tyypillisiä patologisia muutoksia ovat solunulkoiset amyloidiplakit ja solunsisäiset hyperfosforyloituneen tau-proteiinin (fosfo-tau) muodostamat neurofibrillivyyhdit, amyloidiangiopatia eli lukinkalvon ja aivokuoren pienten verisuonten amyloidikertymät ja hermosolujen kato. Nämä patologiset muutokset rajoittuvat lähes täysin keskushermostoon isoaivojen kuorikerrokseen. Erityisesti ohimolohkojen sisäosien limbiset alueet, missä tapahtuvat muistin ja oppimisen kannalta keskeiset prosessit, vaurioituvat (Tienari & Polvikoski 2006). Heiko ja Eva Braak (1991) jakoivat AT:n etenemisen kuuteen eri vaiheeseen neurofibrillimuutosten etenemisen perusteella. Braakin & Braakin mallin kuusi vaihetta ovat: I-II eli transentorinaalinen vaihe, III-IV eli limbinen vaihe ja V- VI eli neokortikaalinen vaihe. Kliiniset oireet etenevät myös vaiheittain ja niiden ilmaantuminen korreloi aivopatologisten muutosten etenemisen, kolinergisen vaurion sekä synapsien määrän kanssa. Sen sijaan amyloidimuutosten ja kliinisten oireiden välinen yhteys on epäselvä. Kliiniset vaiheet jaetaan oireettomaan eli prekliiniseen vaiheesen, varhaiseen AT:iin, lievään AT:n dementiaan, keskivaikeaan AT:n dementiaan ja vaikeaan AT:n dementiaan (Pirttilä & Erkinjuntti 2006). AT:n aivopatologisten muutosten kehittymisen on arvoitu alkavan jopa 10- 20 vuotta ennen ensimmäisten oireiden ilmaantumista (Kuva 3.) Patologiset muutokset eivät väistämättä johda dementiaan, ja patofysiologista prosessia missä ei vielä esiinny dementiaa tulisikin kutsua prekliiniseksi AT:ksi (McKhann ym. 2011). Prekliinisessä vaiheessa voi osalla potilaista esiintyä lievää kognitiivista eli oppimiseen ja muistiin liittyvää heikentymistä (MCI=Mild Cognitive Impairement), jolloin henkilöllä esiintyy sekä subjektiivisesti että objektiivisesti todettavissa oleva muistioire, mikä ei kuitenkaan haittaa arjesta suoriutumisessa. (Pirttilä 2008). MCI:tä voi seurata ensimmäinen varsinainen AT:n vaihe, lievä dementia, ja näin onkin arvoitu käyvän jopa 80 prosentille MCI- tapauksista (Hallikainen ym.2011). Braakin & Braakin mallissa prekliininen vaihe vastaa muutoksia, jotka rajoittuvat transentorinaalisen ja entorinaalisen kuorikerroksen alueelle. Varhaisessa AT:ssa oppimiseen ja muistiin liittyviä oireita alkaa ilmaantua, sillä patologiset muutokset ovat edenneet hippokampukseen ja sitä ympäröiville limbisille alueille, mitkä ovat oppimisen ja muistin kan- 10 nalta keskeisiä alueita. Neokortikaalisessa vaiheessa voidaan jo puhua dementiasta. Lievässä AT:n dementiassa oireet alkavat haitata päivittäistä elämää ja muistioireiden lisäksi esiintyy myös muita kognitiivisia häiriöitä, kuten vaikeuksia puheen tuotossa sekä psykologisia oireita kuten masennusta. Keskivaikeassa ja vaikeassa dementiassa muistioireet pahenevat edelleen ja niiden lisäksi tulevat käytösoireet. Potilaan toimintakyky alenee merkittävästi ja hän tarvitsee päivittäin valvontaa ja apua. Vaikeassa AT:n dementiassa ohimolohkojen sisäosat ovat lähes täysin tuhoutuneet ja neokorteksin eli isoaivokuoren patologiset muutokset lisääntyvät, jolloin myös perustoiminnot heikkenevät. Hyvin vaikeassa dementiassa potilaan toimintakyky on puolitoistavuotiaan lapsen tasolla. Aivopatologia etenee vastakkaisessa järjestyksessä kehittyvien aivojen myelinisaatiolle, eli suojaavien myeliinituppien muodostumiselle hermosolujen ympärille. Primaarinen sensomotorinen eli tunto- ja liikehermotuksesta vastaava ja oksipitaalinen eli takaraivon puoleinen kuorikerros myelinisoituvat ensimmäisenä aivojen kehittyessä, ja aivopatologia ilmaantuu viimeisenä näille alueille. Sen sijaan limbiset alueet, jotka myelinisoituvat viimeisenä ja heikoimmin, vaurioituvat ensimmäisinä AT:n patologisten muutosten johdosta. (Pirttilä & Erkinjuntti 2006). KUVA 3. AT:n neuropatologisten muutosten etenemistä kuvaavien biomarkkereiden ja oireiden etenemisen suhde. Lähde: Seppälä ym, 2010. Kuvasta nähdään miten patologiset prosessit etenevät vuosia ennen kliinisten oireiden ilmaantumista. Kun neuropatologia on edennyt tarpeeksi pitkälle tulevat ensimmäiset muistioireet ja lievä kognitiivinen heikentyminen. Myöhemmin myös yleinen toimintakyky heikkenee patologian edetessä aivoissa. 11 AT:lle on tunnusomaista pitkäkestoisen tapahtumamuistin eli episodisen muistin heikentyminen, ja se onkin taudin kliinisen diagnostiikan pääkriteeri. Episodista muistia voidaan testata potilaalle ja läheisille tehtävien muistikyselyiden avulla sekä CERAD (The Consortium to Establish a Registry for Alzheimer’s Disease) tehtäväsarjan avulla, joka testaa 10 sanan sanalistan oppimista, viivästettyä mieleen palauttamista ja tunnistamista. Näiden lisäksi diagnoosia tukevat biologiset markkerit, joita ovat magneettikuvantamisella todettava sisemmän ohimolohkon surkastuminen, selkäydinnesteestä mitattavat amyloidi β:n (Aβ) pitoisuuden muutokset, taun kokonaispitoisuuden (t-tau)- ja hyperfosforyloituneen taun (fosfo-tau) pitoisuuden muutokset, muutokset glukoosiaineenvaihdunnassa ja amyloidin kertymisessä, mitkä voidaan mitata positroniemissiotomografia (PET)- kuvantamisella, sekä kausaaliset mutaatiot amyloidiprekursioproteiini (APP)-, preseniliini-1(PSEN1) ja preseniliini-2-(PSEN2) geeneissä. On myös poissuljettava muut mahdolliset muistioreiden takana olevat tekijät kuten kallonsisäiset muutokset, puutostilat ja aineenvaihduntahäiriöt (Hallikainen ym. 2011). Koska AT:n aivopatologisten muutosten kehittyminen alkaa jo kauan ennen oireiden ilmaantumista, olisivat myös niiden aiheuttamat muutokset mitattavissa ennen oireiden ilmaantumista. Varhainen diagnoosi onkin edellytys hyvälle ja kokonaisvaltaiselle taudin hoidolle sekä tulevaisuudessa mahdollisille tautia estäville hoidoille ja niiden kehittämiselle. Koska toistaiseksi tautiin ei ole kyetty kehittämään parantavaa hoitoa, biomarkkereiden käyttö oireettomien potilaiden tunnistamiseksi ei ole sallittua. (Blennow ym. 2010) Sen sijaan tutkimuskäyttöön on kehitetty luokittelu prekliinisen AT:n tunnistamista varten, mutta sillä ei ainakaan vielä ole kliinistä käyttöä. (Sperling ym. 2011). AT:lle tyypillisten patologisten muutosten tarkkaa syntymekanismia ei vielä toistaiseksi tunneta. Amyloidihypoteesi, jonka mukaan Aβ:n kertyminen aivokudokseen käynnistää AT:iin johtavat patologiset prosessit, on johtava teoria. Vaikka amyloidihypoteesin puolesta on monia tutkimuksia, se ei ole täysin aukoton: esimerkiksi amyloidiplakkien määrän ja tajunnantason heikkenemisen välillä ei ole havaittu selvää korrelaatiota. Hypoteesia vastaan ei ole kuitenkaan pystytty esittämään sellaisia todisteita, että se olisi kannattanut hylätä (Hardy & Selkoe 2002). Aβ:aa muodostuu amyloidiprekursoriproteiinin, APP:n, pilkkoutumisen tuloksena. APP:ta voidaan pilkkoa solussa kahdella eri tavalla. α- sekretaasi pilkkoo proteiinin siten että pitkän Aβ:n muodostuminen ei ole mahdollista, vaan γ- sekretaasin toimesta muodostuu p3- fragmentti. β- sekretaasi sen sijaan pilkkoo ensin APP:n aivan Aβ:n ensimmäisen aminohapon vierestä. Tällöin γ- sekretaasin jatkaessa pilkkomista 12 muodostuu joko 40 (Aβ40) tai 42 aminohappoa pitkää Aβ:aa (Aβ42). Pidempi muoto eli Aβ42 on haitallisempi, sillä se sakkautuu muodostaen plakkeja solunulkoiseen tilaan (Tienari & Polvikoski 2006) (Kuva2). Aβ:n muodostuksen ohella myös sen hajotukseen ja poistumiseen liittyvät mekanismit ja niiden välinen tasapaino ovat tärkeä osa AT:n tautiprosessia (Hiltunen ym. 2013). Erityksen heikentymisen myötä amyloidin pitoisuus selkäydinnesteessä pienenee, mikä on yksi AT:n diagnoosia tukevista biomarkkereista (Blennov ym. 2010) KUVA 4 Amyloidiplakkeja. Lähde: Harvard University, 2011. Aβ (beta- amyloid) sakkautuu ja kertyy aivosolujen (brain cell) solunulkoiseen tilaan muodostaen amyloidiplakkeja, mitkä aiheuttavat hermosolujen aksoneiden (axon) ja dendriittien (dendrite) välisten yhteyksien heikkenemisen ja hermosolujen kuoleman. Tau- proteiini sitoutuu mikrotubuluksiin ja stabiloi niiden rakennetta sekä säätelee aksonikuljetusta. Sillä on siis tärkeitä fysiologisia tehtäviä elimistössä. AT:n toinen patologinen tunnusmerkki ovat hyperfosforyloituneesta tau- proteiinista muodostuneet neurofibrillivyyhdit eli hermosäiekimput. Normaaliolosuhteissa proteiini on liukoinen, mutta patologisissa olosuhteissa se hyperfosforyloituu, irtoaa mikrotubuluksista ja muodostaa liukenemattomia säikeitä. Taun reversiibeli eli käänteinen fosforylaatio on tärkeää neuronaalisten funktioiden säätelyssä, ja siitä vastaavat kinaasit ja fosfataasit. AT:ssa näiden molekyylien toiminta mahdollisesti häiriintyy johtaen fosforyloituneen muodon ylimäärään (Huang & Jiang 2009). Neurofibrillivyyhdit eivät ole AT:lle tyypillisiä muutoksia, vaan niitä esiintyy myös muissa neurodegeneratiivisissa eli hermosoluja rappeuttavissa sairauksissa (Spillandini ja Goedert 2013). 13 Ei ole täysin selvää ovatko amyloidi- ja tau- patologia toisiinsa kytkeytyneitä vai itsenäisiä prosesseja. Useat tutkimukset kuitenkin viittaavat että Aβ saisi aikaan neurofibrillivyyhtien muodostumisen ja neuronien kuoleman joko suoraan tai epäsuorasti. On esitetty kaksi mahdollista mekanismia joiden kautta Aβ:n ylimäärä saa aikaan taun hyperfosforylaation: oksidatiivien stressi ja neuronin solukalvon reseptorit (Huang & Jiang 2009). Neurofibrillivyyhtien lisäksi amyloidin kertyminen aiheuttaa oksidatiivista stressiä, tulehdusta, energia-aineenvaihdunnan muutoksia ja ohjelmoidun solukuoleman (Hiltunen ym. 2013). 2.3 Genetiikka 2.3.1 Kausaaliset mutaatiot Kliinisesti AT jaetaan varhaiseen ja myöhäiseen muotoon sairauden alkamisiän perusteella. Varhainen muoto alkaa alle 65-vuotiaana ja myöhäinen yli 65-vuotiaana. Sekä varhaiseen eli familiaaliseen että myöhäiseen AT:n muotoon liittyy geneettinen komponentti. (Bettens ym 2013). Familiaalisen muotoon kytkeytyviä kausaalisia, eli sairauteen johtavia mutaatioita, on löydetty kolmesta eri geenistä. Nämä mutaatiot selittävät kuitenkin vain 13 % varhaisista AT- tapauksista (Campion ym. 1999). Yleisemmän myöhäisen muodon geneettinen tausta on mutkikkaampi ja siihen vaikuttavat sekä geneettiset- että ympäristötekijät. Kaksoistutkimusten perusteella on kuitenkin todettu että perinnöllisillä tekijöillä on suuri merkitys myös taudin myöhäisemmässä muodossa ja että sen periytyvyys olisi jopa 80 prosenttia (Gatz ym. 2006). Kausaaliset mutaatiot APP-, PSEN1- ja PSEN2- geeneissä johtavat muutoksiin amyloidiaineenvaihdunnassa (Bettens ym. 2013). Ensimmäinen kausaalinen mutaatio, Val717Ile, löydettiin APP- geenistä (Goate ym 1991). Jo tätä aiemmin Glenner ja Wong (1984) löysivät kyseisen geenin Downin syndroomaa sairastavan henkilön genomista ja totesivat sen ja β- amyloidia koodaavan geenin olevan sama. He myös ehdottivat, että kyseinen geeni sijaitsee kromosomissa 21. Myöhemmin useampikin tutkimusryhmä vahvisti APP geenin todella sijaitsevan kyseisessä kromosomissa (Goldgaber ym.1987, Kang ym. 1987, Tanzi ym. 1987, 1988). Vuonna 1995 löydettiin useita mutaatiota kromosomissa 14 sijaitsevassa PSEN1-geenissä (Sherrington ym. 1995). Samana vuonna löydettiin mutaatio myös PSEN2-geenistä kromosomissa 1 (Levy-Lahad ym. 1995). Preseniliiniproteiinit ovat as- 14 partyyliproteaaseja ja toimivat osana γ- sekretaasia, mikä vastaa APP:n pilkkoutumisesta Aβ:si, APP:n tavoin ne vaikuttavat siis amyloidipatologian syntyyn (Wolfe ym. 1999). Toistaiseksi on löydetty 33 APP mutaatiota, 185 PSEN1 mutaatiota ja 13 PSEN2 mutaatiota (Alzheimer Disease and Frontotemporal Dementia Mutation Database; www.molgen.ua.ac.be/ADMutations, 2014). Lähes kaikki varhaiseen AT:iin johtavat mutaatiot periytyvät autosomaalisesti dominantisti eli vallitsevasti ja lähes kaikki johtavat AT:lle tyypilliseen Aβ42 /Aβ40 suhteen nousuun (Scheuner ym. 1996, Tanzi ja Bertram 2005, Tanzi 2012). Lisääntynyt Aβ42 johtaa puolestaan Aβ-peptidin sakkautumiseen oligomeereiksi ja lopulta amyloidisäikeiden muodostumiseen (Jarrett ym. 1993). On kuitenkin löydetty muutamia poikkeuksia. Ruotsalaisesta suvusta löydetty tuplamutaatio, LysMet670/671AspLeu, lisää molempien amyloidi muotojen määrää johtaen Aβ:n ylimäärään ja kerääntymiseen. (Mullan ym. 1992). AT:n hoitomuotojen kehittämisen kannalta mielenkiintoinen on APP-mutaatio, Ala673Thr, mikä johtaa vähentyneeseen amyloidogeenisten peptidien tuotantoon ja parempaan kognitiiviseen suorituskykyyn (Jonsson ym. 2012). On mahdollisesti olemassa muitakin kausaalisia mutaatiota APP- ja PSEN- geeneissä sijaitsevien lisäksi, mutta niitä on vielä etsittävä tarkemmin (Tanzi, 2012). 2.3.2 Riskigeenit AT:n myöhäisen muodon tärkein geneettinen riskitekijä on APOE (Apolipoproteiini Egeeni) ε4- alleeli, mikä sijaitsee kromosomissa 19q13 (Stritmatter ym. 1993). Esiintyessään yhtenä kappaleen ε4- alleeli lisää riskiä sairastua nelinkertaisesti ja jos henkilö perii alleelin kahtena kappaleena kasvaa riski kymmenkertaiseksi. Sen sijaan ε2- alleelilla on mahdollisesti taudilta suojaava vaikutus (Corder ym. 1994). APOE ε4 ei ole välttämätön, muttei myöskään riittämätön aiheuttamaan AT:n. (Bettens ym. 2013). Genin ym. (2011) esittävät että se on kohtalaisesti vallitseva geeni, joka periytyy semidominantisti eli osittain dominoivasti, joten kaikki ε4 kantajat eivät sairastu ja heterotsygooteilla on keskitason riski sairastua verrattuna homotsygootteihin kantajiin. Apolipoproteiini E (ApoE) on tärkein kolesterolin kuljettaja keskushermostossa. Kolesterolitasapainon ja AT:n välillä on geneettisten, epidemiologisten ja perustutkimusten mukaan patologinen yhteys. (Hardy ym. 2014). Geenin eri isomuotojen kyky kuljettaa kolesterolia vaihtelee, ε4- muodon kyky kuljettaa kolesterolia aivoissa on heikompi kuin ε3 muodon (Rapp ym. 2006). ε4-alleelin kantajilla myös aivoista ja selkäydinnesteestä mitatut ApoE kokonaispitoisuudet ovat pie- 15 nemmät, ja vähentynyt ApoE pitoisuus johtaa heikentyneeseen kolesterolin kuljetuskapasiteettiin (Riddell ym. 2008). Kolesterolimetabolia säätelee Aβ:n muodostumista ja Aβ voi mahdollisesti suoraan säädellä kolesterolimetaboliaa aivoissa (Riddell ym. 2001, Liu ym. 2007). ApoE säätelee myös Aβ:n kasautumista ja hajoamista: ε4 muoto on vähemmän tehokas Aβ:n hajottamisessa, ja se myös sitoutuu siihen heikommin vähentäen Aβ:n poistoa (Jiang ym. 2008, Deane ym. 2008). Vuoden 2009 jälkeen tietämys AT:n myöhäisemmän muodon genetiikasta on parantunut merkittävästi koko genomin kattavien assosiaatiotutkimusten (GWA= Genome Wide Association Studies) myötä. Näiden tutkimusten avulla on löydetty lukuisia uusia potentiaalisia riskigeenejä ja tautia mahdollisesti aiheuttavia mekanismeja liittyen rasva-aineenvaihduntaan, immuunisysteemiin ja synapsien toimintaan (Bettens ym. 2013). Nämä mekanismit mahdollisesti osallistuvat amyloidin kasautumiseen ja poistamiseen, mutta niiden merkitys Aβ:n tasapainoon on vielä epäselvä (Lambert ja Amouyel 2011, Bertram ym. 2010). Toisin kuin varhaiseen muotoon kytkeytyvät mutaatiot APP- ja PSEN- geeneissä, myöhäiseen muotoon liittyvien yleisten varianttien riskivaikutus on verrattain pieni (Kuva 3.) Pienen riskivaikutuksen omaavien yleisten varianttien lisäksi on todennäköistä että on olemassa myös harvinaisempia suuren vaikutuksen omaavia geenejä, joita ei ole voitu löytää GWA- tutkimusten avulla, sillä niiden esiintyminen tautipopulaatiossa on liian pieni. Uuden sukupolven sekvensointimenetelmä (NGS=Next Generation Sequencing) mahdollistaa tällaisten harvinaisten muutosten löytämisen ja siirtää tutkimuksen keskipisteen populaatiotasolta yksilöön (Hiltunen ym. 2013). Suuri osa AT:n genetiikasta on kuitenkin vielä selvittämättä. Esimerkiksi myöhäiseen muotoon liittyen on löydetty kaksi mahdollista harvinaista mutaatiota ADAM10 (ADAM metallopeptidase domain 10) geenistä, mikä haastaa ajatuksen siitä että myöhäisen muodon periytyminen koostuisi ainoastaan yleisistä varianteista (Tanzi 2012). 16 Sairastumisriski Korkea Keskitaso Matala Harvinainen Yleinen Yleisyys populaatiossa KUVA 5. AT:n tunnettuja riskilokuksia. Muokattu lähde: Hardy ym. 2014. Kuten kuvasta nähdään, ovat APP-, PSEN 1- JA PSEN2- geenien mutaatiot harvinaisia, mutta niiden riskivaikutus on sen sijaan suuri. APOE ε4 alleeli kahtena kappaleena (tummansininen) nostaa riskin korkeammaksi kuin yhtenä kappaleen perittynä (vaaleansininen). Vihreällä merkityt geenit omaavat pienen riskivaikutuksen, mutta ne ovat yleisiä. TREM2- mutaatiot ovat suhteellisen harvinaisia ja niiden riskivaikutus on heterotsygootin APOE ε4 alleelin luokkaa. Koska uusia kandidaattigeenejä löytyy jatkuvasti, ovat Lars Bertram ja hänen kollegansa perustaneet AlzGene.org- tietokannan kehityksen seurannan helpottamiseksi (Alzforum: AlzGene.org, 2011). Uusimmassa GWA- tutkimuksessa löydettiin kaksi uutta lokusta (TP53INP1 ja IGHV1- 67) sekä kolme uutta geeniä aiemmin löydettyjen SNP osumien läheisyydestä. Kyseisillä löydöksillä on yhteys energia- aineenvaihdunnan, proteiinien hajoamisen ja immuunisysteemin kanssa, jotka puolestaan ovat AT:n tautiprosessin kannalta keskeisiä toimintoja (Escott- Price ym. 2014). 2. 4 Uuden sukupolven sekvensointi menetelmät 17 2.4.1 Yleistä Vuonna 2003 Human Genome Project (1990- 2003) julkaisi ensimmäisen kokonaan sekvensoidun ihmisgenomin, sisältäen noin 3 miljoonaa emäsparia ja noin 25 000 ihmisen geeniä (International Human Genome Consortium 2004). Käytössä oli Sanger- sekvensointimenetelmä, ja projekti kesti useita vuosia maksaen lähes kolme miljardia Yhdysvaltain dollaria (Illumina 2013a). Sanger- sekvensointi kuuluu niin kutsuttuihin ensimmäisen polven sekvensointimenetelmiin ja se oli hallitseva menetelmä lähes kahden vuosikymmenen ajan. Vaikkakin sen osalta onnistuttiin tekemään joitain teknisiä parannuksia, tarve kehittää tehokkaampia menetelmiä säilyi edelleen. Tämä johti lopulta uuden sukupolven sekvensointimenetelmien kehittämiseen. (Mezker 2010). Sen jälkeen kun uuden sukupolven sekvensointimenetelmät kehitettiin vuonna 2007, kehitys on ollut nopeaa. Yhdellä sekvensointiajolla tuotettavan datan määrä on kasvanut eksponentiaalisesti. Sen lisäksi että tuotettavan datan määrä on paljon suurempi kuin mitä perinteisellä Sanger- sekvensoinnilla saadaan, on sekvensointi myös huomattavasti nopeampaa, kustannustehokkaampaa ja tarkempaa. Suurten datamäärien tuottaminen perustuu siihen että sekvensoidaan lukuisia pieniä DNA- fragmentteja eli kappaleita samanaikaisesti. Lisäksi näytteiden yhdistäminen samaan reaktioseokseen mahdollistaa eri potilaiden näytteiden samanaikaisen sekvensoinnin ja käsittelyn (Illumina 2013a). Uuden sukupolven menetelmien tehokkuuden ansiosta on mahdollista päästä käsiksi sellaisille lääketieteen osaalueille minne aiempien tekniikkojen suorituskyky ei riittänyt. Uuden tekniikan avulla aikaansaatu datamäärän kasvu on luonut myös painetta kehittää riittävän tehokkaita ohjelmia datan käsittelemiseksi. (Pavlopouluos ym. 2013). NGS (Next Generation Sequencing)- menetelmät voidaan jakaa vielä tarkemmin toisen ja kolmannen sukupolven laitteisiin. Toisen polven teknologiaa ovat kehittäneet useat yritykset kuten Illumina, Roche ja Bio systems/SOLiD (Palvopoulos 2013). Näistä käytetyimpiä ovat Illuminan sekvensaattorit huolimatta siitä, että niiden avulla voidaan sekvensoida yhtäaikaisesti vähiten näytteitä muihin menetelmiin verrattuna (Luo ym. 2012). Kolmannen polven menetelmiä ovat puolestaan kehittäneet Helico BioSciences-, Pacific Biosciences- , Oxford nanopore- ja Complete- yritykset ja niiden avulla ihmisgenomin sekvensoinnin uskotaan nopeutuvan edelleen, jolloin puhutaan tunneista päivien sijaan. Lisäksi kustannusten odotetaan laskevan vielä alhaisemmiksi (Pavlopoulos ym. 2013). Kaikki edellä mainitut tekniikat pitävät sisällään seuraavat vaiheet: näytteiden valmistelu, sekvensointi ja 18 kuvantaminen sekä datan analysointi. Eri teknologiat eroavat toistaan erityisten menettelytapojen osalta, joita käytetään edellä kuvattujen vaiheiden toteuttamiseksi (Metzker 2010). 2.4.2 Käyttömahdollisuudet NGS- teknologian avulla voidaan suorittaa monipuolisesti erilaisia geneettisiä tutkimuksia. Sen resoluutio eli erotuskyky ja kattavuus ovat säädettävissä, jolloin menetelmää voidaan soveltaa palvelemaan kulloisenkin tutkimuksen tarkoitusta parhaalla mahdollisella tavalla. Kattavuudella tarkoitetaan sitä kuinka monta kertaa kukin alkuperäisen DNA- näytteen nukleotidi sekvensoidaan eli kuinka monta ”luentaa” siitä tuotetaan. Kattavuuden avulla voidaan siis säädellä tutkimuksen resoluutiota. Esimerkiksi koko genomin kattavissa tutkimuksissa, missä tuotettavan datan määrä on suuri, voidaan resoluutio säätä pienemmäksi. Jos taas halutaan tutkia tarkemmin jotain aluetta genomissa pitää resoluutio säätää korkeammaksi, jotta voidaan havaita erittäin matalalla esiintymistaajuudella esiintyviä harvinaisia mutaatiota.(Illumina 2013a). NGS:n säädeltävyys on tuonut sille useita erilaisia käyttömahdollisuuksia. Sitä onkin hyödynnetty muun muassa evoluutiotutkimuksessa, populaatiogenetiikassa, mikrobiaalisessa kartoituksessa, GWA- tutkimuksissa, vertailevassa genomiikassa, variantti analyyseissa, geenien ilmenemisen tutkimisessa, epigenetiikassa ja monissa muissa (Pavlopoulos ym. 2013). Monipuoliset sovellusmahdollisuudet perustuvat pääasiassa siihen, miten geenikirjasto rakennetaan ja miten dataa käsitellään itse sekvensointi vaiheen pysyessä käytännössä samana. Geenikirjaston rakentamiseksi löytyy useita eri menettelytapoja, jotka mahdollistavat koko genomin, lähetti-RNA:n, kohdennettujen alueiden kuten koodaavien alueiden, proteiineja sitovien alueiden ja käyttäjän itse räätälöimien valikoitujen alueiden sekvensoinnin (Ilumina 2013a). Koko genomin sekvensointi NGS- menetelmän mahdollistamalla tehokkuudella on mahdollistanut laajat GWA- tutkimukset ja siten useiden uusien potentiaalisten yleisten pienen riskivaikutuksen omaavien geenien löytämisen. International Genomics of Alzheimer`s Project (IGAP) on koonnut dataa neljästä suuresta GWA- tutkimuksesta, analysoinut dataa useista eri näkökulmista, ja yleisten varianttien määrän odotetaan kasvavan edelleen näiden analyysien myötä. Aiemmin pienempiä genomeita, kuten viruksia tai bakteereja, sekvensoitaessa ongelmaksi on muodostunut referenssi eli viitegenomien puute. NGS:n avulla 19 sekvensointi voidaan suorittaa sekä referenssigenomin avulla että de novo eli ilman referenssigenomia. (Illumina 2013a). Kohdistetussa sekvensoinnissa valittu joukko geenejä tai määritellyt alueet sekvensoidaan suurella resoluutiolla. Kyseistä menetelmää käytetään yleensä kun halutaan tutkia geneettisiä variaatioita populaation sisällä, jolloin sekvensoidaan useita yksilöitä yhdellä kertaa. On olemassa kaksi eri tapaa rakentaa kirjasto kohdennettua sekvensointia varten: kohdennetun alueen rikastaminen tai amplikonien eli lyhyiden DNA- sekvenssien monistaminen ja sekvensointi. Molemmissa valikoidut alueet monistetaan geenikirjastoa rakennettaessa, tosin kohteen rikastamisessa suuremmat DNA- jaksot kuten kaikki koodaavat alueet eli koko eksomi ovat mahdollisia, jolloin sekvensoitavan DNA:n määrä näytettä kohden on oltava suurempi (Illumina 2013a). Koko eksomin sekvensointi on tehnyt mahdolliseksi sellaisten pienten familiaalista AT:ia sairastavien sukujen genetiikan tutkimisen, jotka ovat olleet liian pieniä aiemmilla menetelmillä tutkittaviksi. Toistaiseksi on tehty kaksi koko eksomin sekvensointitutkimusta AT- potilaille, joista löytyi mutaatioita NOTC- ja VCPsekä SORL1- geeneistä (Bettens ym. 2013). Kohteen rikastamista varten tutkijat voivat käyttää valmista menettelytapaa tai suunnitella itse omat alukkeet, jolloin on mahdollista sekvensoida vain tutkimuksen kannalta keskeiset alueet(Illumina 2013a). NGS mahdollistaa kaikkien neurodegeneratiivisiin sairauksiin vaikuttavien variaatioiden yhtäaikaisen tarkastelun ja tulevaisuudessa mahdollisesti myös yksilöllisen hoidon, joka kohdistuu molekulaarisiin mekanismeihin (Bettens ym. 2013). Tutkittaessa yhden geenin aiheuttamia mendeliaanisia periytymissääntöjä noudattavia sairauksia, käytetään usein koko eksomin sekvensointia, sillä se on huomattavan paljon halvempaa kuin koko genomin sekvensointi. Suurin osa AT:n kausaalisista mutaatiosta sijaitseekin eksomissa. On kuitenkin mahdollista että myös ei- koodaavat variantit nostavat neurodegeneratiivisten sairauksien riskiä. Lisäksi koko genomin sekvensointi kattaa paremmin koodaavat alueet kuin koko eksomin sekvensointi. Koko genomin sekvensoinnissa on kuitenkin omat haasteensa, sillä yhdessä genomissa useita miljoonia yhden nukleotidin polymorfioita (SNP= Single Nucleotide Polymorphism), jolloin huolellinen tutkimuksen suunnittelu ja potilaiden valinta on oleellista (Cirulli ym. 2011, Bettens ym. 2013). 20 3. AINEISTO JA MENETELMÄT 3.1 Tutkimustarkoitus Tässä tutkimuksessa käytettiin Rochen SeqCap- menetelmää näytekirjaston rakentamiseksi sekä Illuminan MiSeq- teknologiaa sekvensoinnissa. Tutkimuksessa oli mukana viisi potilasnäytettä, joilla tiedettiin olevan AT:ia aiheuttava kausaalinen mutaatio APP tai PSEN1 geenissä. Kustomoidun neuropaneelin avulla sekvensointiin joukko neurologisiin sairauksiin ja häiriöihin liittyviä geenejä, kyseessä oli siis kohdistettu sekvensointi. Tarkoituksena oli tutkia menetelmän toimivuutta eli löydetäänkö kyseiset mutaatiot käytössä olevan menetelmän avulla, kuinka hyvä lukusyvyys saavutetaan, ja paljonko eri variaatioita löydetään eri näytteillä. 3.2 Tutkimusmateriaali Tutkittavana olivat viisi eri näytettä (neljä miestä ja yksi nainen) suomalaisista AT- suvuista, joista kahdessa (APPa-b) oli aiemmin havaittu APP- duplikaatio ja kolmessa (PSEN1ac) Pro264Leu- mutaatio PSEN1- geenissä (taulukko 1). PSEN1- geenin mutaatiota kantavat henkilöt ovat samasta familiaarista AT:ia sairastavasta suvusta (Martikainen ym. 2009). Huolimatta samasta kausaalisesta mutaatiosta heidän fenotyyppinsä eli ilmiasunsa ovat erilaiset. APP- duplikaatio tapaukset puolestaan ovat sisaruksia, joilla molemmilla on todettu perinnöllinen AT ja cerebraalinen amyloidi angiopatia (CAA) eli aivojen verisuonten seinämien amyloidikertymä (Remes AM ym 2008). Kaikissa tapauksissa oireet ovat alkaneet alle 65 vuotiaana. Kahdella tapauksista on APOE-geenin ε4 alleeli heterotsygoottisena ja muilla ε3-alleeli homotsygoottisena. 21 TAULUKKO 1. Tutkimuksessa käytetyt näytteet. Näyte Muutos Ikä Sukupuoli PSEN1a Pro264Leu oireiden al- mies kamisikä:46v, kuollut 65 v. PSEN1b Pro264Leu oireiden al- mies kamisikä:58v, kuollut 75 v PSEN1c Pro264Leu mies Fenotyyppi/ status APOE Masennus 46 vuotiaana, kah- 3/4 dessa vuodessa MCI, vainoharhaisuus, kankeus ja hyperrefleksia. Oireet eivät täytä tyypillisiä AT:n kriteereitä, mahdollinen Lewyn kappale dementia. Vaikea dementia 10 vuoden 3/4 kuluessa oireiden alkamisesta, hyperrefleksia, ylemmän motoneuronin vaurioon viittaavat oireet. Oireet täyttävät AT:n kriteerit. 3/3 22 APPa APPkaatio dupli- 49 v. oireita 4- mies 5 v. aiemmin APPb APPkaatio dupli- 60 v., oireita 5 nainen v. aiemmin Lieviä oppimisen- ja muisti- 3/3 vaikeuksia: MMSE 22/30, oireet eivät etene tasaisesti: vaskulaarinen komponentti Oppimisen- ja muistivaikeuk- 3/3 sia, MMSE 17/30, jatkuvasti etenevä kognitiivinen heikentyminen. 3.3 Menetelmät 3.3.1 DNA- kirjaston rakentaminen Tässä tutkimuksessa DNA- kirjaston rakentamiseksi käytettiin Rochen Nimlegen SeqCap EZ library SR (version 4.2) kirjasto-työkaluja ja siihen kuuluvaa protokollaa (Roche NimbleGen 2013). Kyseinen menetelmä sopii kohdistettuun sekvensointiin, missä tarkastellaan tutkimuksen kannalta kiinnostavia alueita korkealla resoluutiolla. Kohdistetussa sekvensoinnissa voidaan sekvensoida joko tautiin liittyviä alueita, tautiprosessiin liittyviä geenejä tai koko eksomi eli kaikki koodaavat alueet eli eksonit (Roche Diagnostics GmbH 2013a). Lisäksi tässä tutkimuksessa käytettiin Rochen SeqCap EZ Neurology Panel Design- alukkeita spesifisten alueiden rikastamiseksi (Roche Diagnostics GmbH 2013b ). Kyseinen paneelin avulla voidaan sekvensoida 256 eri geeniä, jotka liittyvät 87:ään eri neurologiseen sairauteen tai häiriöön, lisäksi paneeliin lisättiin 22 omaa kustomoitua aluketta. DNA- kirjaston rakentaminen aloitetaan pilkkomalla genominen kaksijuosteinen DNA pienemmiksi kappaleiksi eli fragmenteiksi (kuva 6). Tämä voidaan tehdä vaihtoehtoisesti joko entsymaattisesti tai mekaanisesti. Tässä tapauksessa DNA pilkottiin mekaanisesti sonikaattorilla, missä hyödynnetään ääniaaltojen energiaa. Fragmenttien koon säätely perustuu siihen, miten pitkän aikaa niitä sonikoidaan. Tavoitteena on pilkkoa DNA 100- 500 emäsparia pitkiksi kappaleiksi. Sonikoinnin jälkeen fragmenttien kokojakauma tarkistetaan Bioanalyzer- menetelmällä (Agilent Technologies 2013). 23 KUVA 6. DNA:n pilkkominen. Lähde Illumina ® 2013b. Pilkkomisen jälkeen fragmenttien päät tasataan ja 5’-päät fosforyloidaan protokollan mukaan sekä suoritetaan fragmenttien pesu käyttäen magneettisia DNA:n sitomiseen tarvittavia helmiä (kuva 7). Helmien toiminta perustuu siihen, että DNA- fragmentit tarttuvat helmien pintaan, jotka puolestaan tarttuvat magneettiin muuttuessaan magneettisiksi magneettikentässä (kuva 8). Tällöin halutut fragmentit saadaan kerättyä talteen kun taas muut liuoksen komponentit voidaan huuhtoa turvallisesti pois. Lisäksi fragmenttien 3’-päihin kiinnitetään adeniini- emäshännät (poly-A-hännät), ja toistetaan pesu helmien avulla. Fosforylointi ja adeniini- emäksien liittäminen mahdollistavat niin kutsuttujen adaptereiden kiinnittämisen fragmenttien päihin. Lisäksi tässä vaiheessa poistetaan erittäin pitkät fragmentit SPRI (Solid Phase Reversible Immobilisation)- menetelmällä, jossa PEG (Polyetyleeni glykoli)/ NaCl (natriumkloridi)- liuoksen viskositeettiin ja tiheyteen sekä magneettisiin helmiin perustuvan menetelmän avulla voidaan napata talteen halutun kokoisia fragmentteja. 24 KUVA7. Fragmenttien päiden tasaus (sininen uloke), 5’-fosforylointi ja 3’-poly-A- häntien kiinnitys. Lähde Illumina ® 2013b. Helmien lisääminen Helminen kiinnittyminen Pesut ja fragmenttien Helmet sitoutuvat magneettiin ja muiden irrotus nesteeseen DNA- fragmentteihin komponenttien poisto KUVA 8. Pesu magneettisten helmien avulla. Lähde Albertoni ym. 2011. Edellä mainittujen vaiheiden jälkeen fragmentit ovat valmiit adaptereiden kiinnitystä varten (kuva 9). Adaptereiden päissä on tymiini- emäkset, jotka ovat komplementaarisia fragmentteihin kiinnitettyihin adeniini- emäksiin. Adapterit sisältävät myös niin kutsutut indeksit, jotka ovat 6 emäksen mittaisia spesifisiä tunnisteita, joiden avulla tutkimuksessa olevat eri näytteet voidaan erottaa toisistaan sekvensointivaiheessa. Lisäksi adapterit sisältävät alueet, joilla ne kiinnittyvät sekvensointivaiheessa käytettävän reaktiolevyn (flow cell) pinnalla oleviin oligopareihin tuhansien monistettujen DNA fragmenttien eli klustereiden muodostamisvaiheessa sekä sitomiskohdat sekvensointireaktion aloitusta varten. Adaptereiden liittämisen jälkeen sellaiset fragmentit, joiden molempiin päihin adapterit eivät ole sitoutuneet, poistetaan käyttäen helmiä ja PEG/ NaCl- liuosta. 25 KUVA 9. Adapterirakennelma. Lähde Illumina 2013b. Adapterit kiinnitetään fragmentteihin (DNA insertit). Adapterit sisältävät indeksit (index 1 ja index 2), lyhyet alueet sekvensointia varten (Rd1 SP ja Rd2 SP) sekä reaktiolevyn oligopareihin kiinnittyvät alueet (P5 ja P7). Adapterien lisäämisen jälkeen suoritetaan fragmenttien koon valinta PEG/ NaCl - liuoksen ja helmien avulla. Liian pitkät ja lyhyet fragmentit poistetaan kirjastosta ja tavoitteena on napata talteen 250- 450 emäsparia pitkät fragmentit, jotka ovat sopivia sekvensointiin. Ensin poistetaan 450 emäsparia tai sitä pidemmät fragmentit, jolloin liuokseen jää tätä lyhyemmät ja ehjät fragmentit. Seuraavaksi fragmentit siirretään uuteen putkeen helmien kanssa ja 250 emäsparia ja sitä lyhemmät fragmentit poistetaan, suoritetaan pesuvaiheet ja fragmentit irrotetaan helmistä. Vain noin 20 prosenttia alkuperäisen DNA-kirjaston fragmenteista on halutun kokoisia, joten jäljelle jääneiden fragmenttien määrää lisätään monistamalla PCR:llä seitsemän syklin verran käyttäen universaaleja alukkeita. PCR monistuksen jälkeen fragmentit pestään etanolilla ja SeqCap EZ- puhdistushelmillä. Helmien ja DNA- fragmenttien annetaan kuivaa pesun jälkeen ja pelletti liuotetaan veteen. Fragmenttien koko tarkastetaan lopuksi Bioanalyzerilla (Agilent Technologies 2013) (kuva10). 26 KUVA 10. Fragmenttien koon tarkastus Bioanalyzerilla. Lähde Illumina 2013b. Fragmenttien koon pitäisi olla 250- 450 emäsparia. Tähän asti eri henkilöiden näytteitä on käsitelty erikseen. Kun adapterit indekseineen on kiinnitetty eri näytteiden fragmentteihin, näytteet voidaan yhdistää samaan putkeen, mikä tehostaa työskentelyä. Rakennettu DNA kirjasto hybridisoidaan eli annetaan reagoida spesifisten geenialukkeiden kanssa. Ennen hybridisaatiota geenikirjastoon lisätään hybridisaatiota avustavia komponentteja, kuten universaaleja alukkeita ja indeksi-alueen alukkeita sekä COT- DNA. Alukkeet estävät adaptereiden tarttumisen toisiinsa ja COT- DNA puolestaan sitoutuu vaikeasti sekvensoitaviin DNA- jaksoihin. Tämän jälkeen DNA kirjasto kompleksi kuivataan vakuumikonsentraattorilla. Kuivauksen jälkeen kompleksiin lisätään hybridisaatiopuskuri ja denaturoidaan DNAfragmentit, minkä jälkeen lisätään spesifiset biotinyloidut alukkeet ja inkuboidaan 64- 72 tuntia. Spesifiset alukkeet on suunniteltu siten, että saadaan napattua tutkimuksen kannalta kiinnostavat alueet sekvensoitavaksi. Tässä tapauksessa käytössä olleen SeqCap EZ Neurology Panel Design- alukkeiden avulla napattiin sekvensoitavaksi neurologisiin sairauksiin liittyviä geenejä. Alukkeet tarttuvat niiden sekvenssiä vastaavaan kohtaan geenikirjastossa. Sellaiset fragmentit, joihin alukkeet ovat kiinnittyneet sisältävät niin kutsutun biotiinileiman. Biotiinileiman sisältävät alukkeet tarttuvat streptavidiini- helmiin, jotka puolestaan tarttuvat magneettiin. Useiden pesuvaiheiden jälkeen jäävät jäljelle vain sellaiset fragmentit, joihin spesifiset alukkeet ovat tarttuneet (kuva 11). Pesun jälkeen monistetaan napatut fragmentit PCR:llä, ja pestään käyttäen etanolia ja magneettisia helmiä. Saatu pelletti liuotetaan TE- puskuriin ja fragmenttien koko mitataan Bioanalyzerilla sekä konsentraatio tarkastetaan Nanodropilla. 27 Spesifinen aluke Biotiini-leima Streptavidiini- helmi . KUVA 11. Kohteen rikastaminen. Muokattu lähde: Illumina 2013a. Genomista voidaan valikoida alueita sekvensoitavaksi (violetilla merkitty fragmentti) alukkeiden avulla, jotka tarttuvat niiden emäsjärjestystä vastaaviin kohtiin DNA kirjastossa. Alukkeet ja niihin sitoutuneet DNA- fragmentit tarttuvat magneettisiin helmiin, jotka puolestaan tarttuvat magneettiin. Muu osa DNA- kirjastosta (harmaalla merkityt fragmentit) huuhtoutuu pois, jolloin saadaan napattua sekvensoitavaksi vain tutkimuksen kannalta kiinnostavat alueet. 3.3.2. Klustereiden muodostaminen MiSeq- sekvensointilaitteella Käytössä oli Illuminan MiSeq sekvensointilaite, joka sopii hyvin kohdennettuun sekvensointiin ja MiSeq- Reagent Kit v3- asetelma (reaktiolevy ja reagenssit), joka mahdollistaa 300 emäsparia pitkien DNA juosteiden lukemisen/sekvensoinnin (Illumina 2014). Sekvensointi alkaa klustereiden eli yksittäisten DNA-pylvässarjojen muodostumisella reaktiolevyn pinnalla oleviin alukkeisiin (kuva 12). Yksijuosteiset DNA-fragmentit kiinnittyvät adaptereissa olevien sekvenssien avulla reaktiolevyn pinnan alukkeisiin, missä DNA- polymeraasi ja leimaamattomat nukleotidit rakentavat niistä kopioita. Alkuperäiset juosteet huuhdotaan pois. Jäljelle jäänyt juoste, joka on kiinni reaktiolevyssä, kiinnittyy toisesta päästään reaktiolevyn alukkeeseen ja siitä rakennetaan kopio. Sekä mallina toimiva juoste että syntyvä kopio ovat toisesta päästään kiinni reaktiolevyn pinnassa, jolloin muodostuu kaksijuosteisia siltoja, ja vaihetta kutsutaankin silta monistumiseksi (bridge amplification). Kun juosteet denaturoidaan, tulee niistä jälleen yksijuosteisia, ja ne voivat puolestaan muodostaa rinnalleen uuden kopion. Tämä sama tapahtuma toistuu lukuisia kertoja muodostaen levyn pinnalle satoja miljoonia klustereita (Illumina 2008). 28 A C B . D KUVA 12. Klustereiden muodostuminen reaktiolevyn pintaan. Muokattu lähde: Illumina 2008. A. Yksijuosteiset DNA- fragmentit sitoutuvat reaktiolevyn kanavien sisäpintaan, missä sijaitsevat alukkeet (Dense Lawn Primers). B. Fragmentit tarttuvat toisesta päästään reaktiolevyn alukkeisiin ja polymeraasientsyymi muodostaa leimaamattomista nukleotideista vastaavan juosteen alkuperäisen rinnalle. Molempien fragmenttien juosteet ovat toisesta päästään kiinni reaktiolevyn pinnalla (attached terminus) ja toiset päät ovat vapaina (free terminus). C. Denaturaatiovaiheessa juosteet oikenevat suoraksi ja irtoavat toisistaan jääden edelleen kiinni reaktiolevyn pintaan (attached). D. Edellä mainitut vaiheet toistuvat lukuisia kertoja ja useassa kohdassa samanaikaisesti, jolloin muodostuu miljoonia klustereita (clusters) kuhunkin reaktiolevyn kanavaan. 29 3.3.3 Sekvensointi synteesin kautta Klustereiden muodostumista seuraa itse sekvensointi, joka tapahtuu synteesin kautta (SBS Sequencing by synthesis). NGS:n perusidea on sama kuin Sanger- sekvensoinnin: mallijuosteen perusteella uudelleen syntetisoituvat DNA-fragmentit lähettävät kustakin fluoresoivasta emäksestä tiedon, jonka perusteella niiden emäsjärjestys saadaan selville. NGS:ssa tämä tapahtuu reaktiolevyn kanavissa sijaitsevissa sadoissa miljoonissa klustereissa samanaikaisesti, mikä mahdollistaa nopean ja tehokkaan sekvensoinnin (Illumina 2008). Ensimmäiseksi klustereiden käänteiset juosteet huuhdotaan pois ja sekvensointi aloitetaan jäljelle jääneistä suorista juosteista. Sekvensointi alkaa sekvensointialukkeen tarttuessa mallijuosteeseen. Sitoutunut leimattu nukleotidi estää polymerisaation, ja kun emäs on luettu, se irtoaa kemiallisesti, jolloin seuraava sekvensointisykli eli kierros voi alkaa (kuva13). Sekvensointi sykli jatkuu kunnes kaikki juosteen emäksen on luettu. Seuraavaksi luetaan indeksit. Tämän jälkeen muodostetaan käänteiset juosteet polymerisaation kautta ja alkuperäiset huuhdotaan pois. Myös käänteiset juosteet sekvensoidaan samalla tavalla kuin alkuperäiset. Tällöin juosteet luetaan molemmista päistä, mikä vähentää aukkoja ja muita sekvensointivirheitä (Illumina 2014b). 30 KUVA 13. Sekvensointi synteesin kautta. Lähde Illumina, Schroth 2012. Sekvensoinnissa mallijuosteen perusteella syntetisoituvaan juosteeseen liittyvät nukleotidit lähettävät fluoresoivan signaalin laserin virittämänä, mikä perusteella mallijuosteen emäjärjestys tunnistetaan. Eri näytteet voidaan erotella adaptereihin liitettyjen indeksien avulla. Indeksien emäsjärjestys tunnetaan entuudestaan, jolloin eri potilaiden näytteet voidaan erotella sekvensointivaiheessa. Referenssi genomin pohjalta yksittäiset fragmentit järjestellään yhtenäiseksi kokonaisuudeksi (Illumina 2013a). 3.4 Analysointi vaihe MiSeq- sekvensaattorilla tuotettu datamäärä vaatii tehokkaita työkaluja sen käsittelemiseksi. Sekvensoidut lyhyet fragmentit järjestellään referenssi genomin perusteella yhdeksi kokonaisuudeksi siihen tarkoitetun työkalun avulla. Lisäksi käytetään varianttien etsintään internet pohjaisia työkaluja (variant caller), jotka tunnistavat variantit ja genotyypin. Näitä työkaluja on olemassa useita erilaisia ja varianttien havaitsemisen tarkkuuden parantamiseksi voidaan käyttää useita yhdessä. Näiden ohjelmien avulla saatua tietoa voidaan tarkastella visualisointi työkalun, kuten Integrative Genomics Viewer (IGV) avulla (Xiangtao ym. 2013) IGV on vapaasti ladattavissa oleva visualisointi työkalu, jolla on hyvä suorituskyky, ja jolla voidaan tutkia interaktiivisesti laajoja integroituja genomisia data-aineistoja. Se soveltuu monille erilaisille data tyypeille mukaan lukien NGS- aineistot. NGS:n tuottaman suuren datamäärän analysointi on rajoittava tekijä monissa tutkimuksissa. Vaikkakin suuri osa analyysista voidaan suorittaa automatisoidusti, ovat ihmisten tekemät analyysit ja arviot nopean visualisoinnin mahdollistamina tärkeitä monimutkaisten biologisten suhteiden havainnollistamiseksi. IGV mahdollistaa datan reaaliaikaisen tarkastelun emäsparien tasolta aina koko genomin tasolle (Thorvaldsdóttir ym. 2012). On olemassa myös muita työkaluja genomista tuotetun datan visualisoimiseksi kuten Tablet, BamView, Savant ja Artemis (Carver ym. 2010, Fiume ym. 2010, Rutherford ym. 2000). Tärkein IGV:n muista erottava tekijä on sen laajuus (breadth). Koska se on kehitetty useiden eri datatyyppien käsittelyä varten, voidaan eri datatyyppejä kuten NGS-dataa ja variantti analyyseja joustavasti yhdistää sekä keskenään että metadatan kuten kliinisen da- 31 tan kanssa. Toinen IGV:n erottava tekijä on, kyky näyttää useiden eri genomisten alueiden dataa samanaikaisesti erillisissä vierekkäisissä ruuduissa, esimerkiksi toisiinsa kytkeytyviä tapahtumia eri alueilta (Thorvaldsdóttir ym. 2012). 4. TULOKSET Sekvensoinnin tuloksena havaittiin noin 2000 variaatiota kustakin viidestä näytteestä. Dataa voidaan tarkastella useiden eri muuttujien avulla, joita on esitetty taulukossa 2, esimerkkinä näyte, jossa PSEN1- mutaatio. Muuttujien avulla suurta datamäärää voidaan lajitella eri tavoin, jolloin aineiston käsittely ja tutkiminen on helpompaa. Tieto variaatioiden luonteesta ja ominaisuuksista haetaan automaattisesti eri lähteistä käyttäen genomityökaluja, kuten GATK (the genome analysis toolkit), Atlas2, mpileup tai näiden yhdistelmiä, jolloin tieto kyseisestä variaatiosta on useamman variaatioita etsivän ja tunnistavan ohjelman tuottaman datan summa, josta käytetään termiä intersection. Jos muuttujalla on rs-numero, voidaan sen avulla hakea tietoa eri tietokannoista, ja vastaavasti HGMD (Human Gene Mutation Database)- koodin avulla voidaan etsiä tietoa etenkin variaatioista, joissa on mutaatio kyseisestä tietokannasta. Esimerkissä on kyse yhden nukleotidin vaihdoksesta (SNP= Single Nucleotide Polymorphism), missä sytosiini (C) on muuttunut tymiiniksi (T). Sytosiini on siis referenssiemäs ja tymiini muuttunut emäs. Kyseinen muutos on ei- synonyyminen eli se muuttaa aminohapposekvenssiä. Synonyyminen 32 variaatio puolestaan ei vaikuta aminohapposekvenssiin. Muita variaatiotyyppejä ovat esimerkiksi insertio ja deleetio. Emästen osuudet kertovat kuinka monta luentaa kustakin emäksestä on tehty. Esimerkissä sytosiini on luettu 167 kertaa ja tymiini 156 kertaa. HETarvo kertoo, onko jakauma heterotsygoottinen, ja kannattaako sitä siis tarkastella lähemmin. HET voi saada arvon 0 tai 1, tässä tapauksessa HET on yksi, jolloin kyse on heterotsygoottisesta muutoksesta. Havainnon merkittävyysastetta kuvataan termeillä Moderate, Modifier ja Low, joista Moderate on korkein. Variaatiot, joissa on tunnettu mutaatio tai jotkin 5’ säätelyalueen polymorfiat saavat Moderate merkinnän, tavalliset polymorfiat, deleetiot, insertiot saavat Modifier ja synonyymiset muutokset tai heikommin luetut Low merkinnän. PASS termi kertoo siitä, että muutoksen luenta on riittävän hyvänlaatuinen ja se on läpäissyt käyttäjän muokkaamat tai koneen oletus asetukset variaatioiden luennalle. TAULUKKO 2 Havainnollistavia muuttujia datan käsittelyyn. Muuttuja geeni rs- numero / ID referenssi nukleotidi muuttunut nukleotidi kromosomi paikka kromosomissa HGMD- tietokanta variaatiotyyppi emästen osuudet (A, C, G, T) variantin etsintä ohjelma/ variant caller variaation sijainti Laatu arvo= havainnon merkittävyys (MODERATE, MODIFIER, LOW) HET Filtteri Esimerkki PSEN1 rs63750301 C T chr14 73664760 CM951078 SNP 0, 167, 0, 156 (luennat) Intersection Non- synonymous MODERATE 1 PASS Kirjaston rakentamisen ja sekvensoinnin onnistumisen tuloksia voidaan tarkastella niin kutsuttujen hyvyysarvojen avulla, jota kertovat tuotetun datan laadusta ja määrästä. Sekvensoinnin hyvyysarvoja kullekin viidestä näytteestä on esitetty taulukossa 3. Keskimää- 33 räinen luentasyvyys voidaan lukea joko kaikista luetuista tai yksittäisistä kromosomien variaatiomuutoskohdista keskiarvolaskentana. Totaali luentojen määrä näytteiden välillä vaihtelee 4,42- 5,42*108. Keskimääräiset luennat emästä kohden kussakin näytteessämme ovat 232- 285 luentaa, kun se määritetään kaikista variaatiokohdista keskiarvolaskentana. Emästen osuus, jotka on luettu vähintään 15 kertaa, vaihtelee 98,8 prosentin ja 99 prosentin välillä. Havaittuja variantteja löydettiin 1996- 2040 kpl. Näistä 89,3- 91,2 prosenttia läpäisivät filtterin eli olivat laadultaan riittävän hyviä. Filtteröinti tulkitsee sellaiset variantit, joita ei ole luettu tarpeeksi monta kertaa joko matalaksi (low-coverage) tai huonolaatuiseksi (poor-quality). TAULUKKO 3 Sekvensoinnin hyvyysarvoja Näyte totaali ka. 15 % variantit filtteri PSEN1a 5,42*108 285 99 2040 89,3 PSEN1b 4,72*108 248 98,8 2014 89,6 PSEN1c 4,42*108 232 98,9 1996 90,4 APPa 4,66*108 245 98,9 2002 89,9 APPb 4,50*108 236 98,8 2001 91,2 Taulukon lyhenteiden selitykset: Totaali= totaali luentojen määrä näytettä kohden. Ka= keskimääräiset luennat emästä kohden kussakin näytteessä. 15 %= niiden emästen osuus prosentteina jotka luettu vähintään 15 kertaa. Variantit= havaittujen varianttien lukumäärä 34 kussakin näytteessä. Filtteri= sellaiset variantit, jotka on luettu tarpeeksi monta kertaa, ja joiden luennan laatu on riittävän hyvä ilmoitettuna prosentteina. 5. POHDINTA NGS- menetelmän avulla sekvensointi on aiempaa tehokkaampaa: tuotettavan datan määrä on kasvanut, kustannukset laskeneet ja työhön käytettävän ajan määrä vähentynyt. Näytteiden yhdistäminen eli multipleksaus mahdollistaa useiden näytteiden samanaikaisen valmistelun ja sekvensoinnin, mikä tehostaa työskentelyä (Luthra ym. 2014). Vaikkakin sekvensoinnin kustannukset ovat laskeneet, on koko genomin sekvensointi edelleen suhteellisen kallista. Siksipä joissain tapauksissa on järkevämpää sekvensoida vain koodaavat alueet tai valikoida spesifisten alukkeiden avulla vain tutkimuksen kannalta keskeisiä geenejä sekvensoitavaksi. (Chilamakuri ym. 2014). Tässä tutkimuksessa käytettiin Rochen neuropaneelia, jonka avulla sekvensoitiin hermostollisin sairauksiin ja häiriöihin liittyviä geenejä. Tällöin voitiin tarkastella AT:n genetiikan kannalta keskeisiä geenejä. Vaikkakin tietämys AT:n monimutkaisesta genetiikasta on lisääntynyt viime vuosina, liittyy sairauteen vielä mahdollisesti tuntemattomia geneettisiä komponentteja. NGS:n mahdollistamat koko genomin laajuiset assosiaatiotutkimukset ovat paljastaneet lukuisia uusia riskigeenejä. Nämä geenit ovat yleisiä ja niiden riskivaikutus on pieni. Harvinaisempien muutosten havaitseminen kuitenkin vaatii tarkempaa sekvensointia (Bettens ym. 2013). Kohdennetun sekvensoinnin avulla voidaan havaita sellaisia mutaatioita, joiden esiintymistaajuus väestössä on liian pieni havaittavaksi aikaisemmilla laitteilla ja menetelmillä. Sekvensoinnin resoluutio eli tarkkuus onkin säädettävissä sen mukaan, miten tarkkaan genomin eri alueita halutaan tarkastella. Kohdennetussa sekvensoinnissa kohdealueelta tuotetaan enemmän luentoja eli sekvensoinnin syvyys on suurempi ja tulosten luotettavuus parempi. (Illumina 2013a). NGS- laitteiden tehokkuus tuo mukanaan omat haasteensa. Tuotettavan datan määrä on suuri, jolloin tarvitaan tehokkaita ohjelmia datan käsittelemiseksi ja analysoimiseksi. Tulosten purkaminen on jossain määrin vaivalloista, sillä käytössä ei ole varsinaista avustetta sitä varten. Toisaalta dataa voidaan lajitella eri muuttujien avulla, mikä helpottaa datan käsittelyä ja analysointia. Datan analysointityökalujen kehittymisen myötä saadaan mahdollisesti vielä enemmän hyötyä NGS- laitteiden kapasiteetista. Vaikka itse sekvensointi on tehokasta ja suurelta osin automatisoitua, on geenikirjaston rakentaminen käyttämämme 35 asetelman osalta edelleen suhteellisen työlästä ja aikaa vievää. Lisäksi jotkin vaiheet kuten sonikointi vaativat suurta tarkkuutta ja huolellisuutta DNA fragmentoinnissa. MiSeq- sekvensaattorin kyky havaita variantteja on hyvä. Tämän ansoista sillä voidaan mahdollisesti löytää uusia mutaatioita jo aiemmin tautiin yhdistetyiltä alueilta. Meidän kolme potilasnäytettä sisälsi PSEN1 mutaation ja tämä mutaatio saatiin varmennettua tällä tekniikalla. Tosin APP- duplikaatioita ei voitu havaita, sillä käyttämällämme protokollalla voidaan tarkastella vain laadullisia eli kvalitatiivisia ominaisuuksia, jolloin kvantitatiivisia ominaisuuksia kuten koko geenin duplikaatioita ei voitu havaita. Yhteensä havaittiin noin 2000 eri varianttia yleisistä polymorfioista mutaatioihin eksoneissa ja geenien säätelyalueilla. NGS:n ominaisuudet: pienemmät kustannukset, näytteiden multipleksaus ja suuri kapasiteetti mahdollistavat useiden kiinnostuksen kohteena olevien geenien yhtäaikaisen ja tarkennetun sekvensoinnin. (Luthra ym. 2014). Esimerkiksi voidaan tarkastella lukuisia neurodegeneratiivisiin sairauksiin liittyviä geenejä, jolloin on mahdollista kehitellä yksiöllisiä hoitomenetelmiä, eteenkin kun taudin molekulaarisiin mekanismeihin perustuvat hoitomuodot tulevat mahdollisiksi. Lisäksi NGS- teknologiasta uskotaan olevan hyötyä potilaiden biomateriaalien lajittelussa ja geneettisessä diagnosoinnissa (Bettens ym. 2013). MiSeq:n sekvensointi tulosten toistettavuus on hyvä. Koska MiSeq vaatii suhteellisen vähän työaikaa ja on tarkka varianttien havaitsemisessa, on sillä potentiaalia toimia myös kliinisessä käytössä (Luthra ym. 2014). Tässä tutkimuksessa MiSeq- sekvensaattorilla saatujen keksimääräisten luentojen määrässä näytettä kohden ei ole suurta vaihtelua. Kaikissa näytteissä vähintään 15 kertaa luettujen emästen osuus on noin 99 prosenttia, eli luennan tarkkuus on erittäin hyvä, ja sekvensointituloksia voidaan pitää luotettavina. Havaittujen varianttien määrä eri näytteissä oli suhteellisen tasainen samoin kuin keskimääräiset luennat näytettä kohden. Chilamakuri ym. (2014) vertailivat tutkimuksessaan neljää eri koko eksomin kaappaus teknologiaa. Vertailussa olivat Illuminan TruSeq Exome Enrichment-, Rochen NibleGen SeqCap EZ Exome Library-, Agilentin SureSelect Human All Exon- ja Illuminan Nextera Exome Enrichment- asetelmat. Vaikka kyseessä olivat koko eksomin sekvensointiin tarkoitetut asetelmat, voidaan tutkimuksen tuloksia käyttää suuntaa antavina tarkasteltaessa oman sekvensoinnin tuloksia. Tutkimuksessa kaikki eksomin kaappaus teknologiat osoittautuivat hyvin toimiviksi, mutta niiden välillä on myös eroja. Agilent kattoi suurimman osuuden kohde alueistaan (99,8 %) ja Nextera puolestaan pienimmän osuuden (96,5 %). 36 Tämän uskotaan osittain selittyvän Agilentin pienemmillä kohde alueilla. Myös filtterin läpäisseiden luentojen määrä oli suurin Agilentilla (71,7 %) ja pienin Nexteralla (40,1 %). NibleGenilla vastaava osuus oli 66,0 %. NibleGen puolestaan kaappasi suurimman osuuden yhden nukleotidin varianteista (SNV= Single Nucleotide Variant), kun havaittujen varianttien määrä suhteutetaan teknologian kohdealueen kokoon. Kaikkien teknologioiden toistettavuus oli hyvä, eikä siinä havaittu suurta eroa. Tutkimustuloksia Rochen neuropaneelin käytöstä ei toistaiseksi ole saatavilla kirjallisuudessa. Valittaessa sopivaa teknologiaa kohdennettua sekvensointia varten on otettava huomioon kohdealueen DNA pitoisuus, lähtömateriaaliksi vaadittavan DNA:n määrä, kirjaston rakentamiseen vaadittu työmäärä ja reagenssien kustannukset halutun sekvensointi syvyyden saavuttamiseksi. VIITTEET Agilent Technologies (2013).Agilent 2100 Bioanalyzer System- Secure experimental success Luettu 11.8.2014. www.chem.agilent.com/library/Brochures/5991-3323EN.pdf Albertoni G, Arnoni C, Araujo P ym. Magnetic bead technology for viral RNA extraction from serum in blood bank screening. Braz J Infect Dis 2011; 15(6): 548- 52. Alzforum (2011): AlzGenewww.alzgene.org/TopResults.asp Top Results. (Päivitetty Alzheimer`s Association (2014). What Is Alzheimer's? www.alz.org/alzheimers_disease_what_is_alzheimers.asp Luettu 18.4.2011). 21.10.2014. Alzheimer Disease and Frontotemporal Dementia Mutation Database (2014). Luettu 5.8.2014. www.molgen.ua.ac.be/ADMutations. Bertram L, Lill CM, Tanzi RE. The genetics of Alzheimer disease: back to the future. Neuron 2010; 68: 270– 81 Bettens K, Sleegers K, Van Broeckhoven C. Genetic insights in Alzheimer’s disease. Lancet neurology 2013; 12:92–104 Blennow K, Hampel H, Weiner M, Zetterberg H. Cerebrospinal fluid and plasma biomarkers in Alzheimer disease. Nat Rev Neurol 2010 6:131–44 37 Braak, H, Braak, E. Neuropathological staging of Alzheimer-related changes. Acta Neuropathol 1991; 82: 239–259 Campion D, Dumanchin C, Hannequin D ym. Early-onset autosomal dominant Alzheimer disease: prevalence, genetic heterogeneity, and mutation spectrum. American Journal of Human Genetics1999; 65: 664–70. Carlson MC, Helms MJ, Steffens DC, Burke JR, Potter GG, Plassman BL. Midlife activity predicts risk of dementia in older male twin pairs. Alzheimer’s Dement 2008; 4(5):324–31. Carver T, Bohme U, Otto TD, ym. BamView: viewing mapped read alignment data in the context of the reference sequence. Bioinformatics 2010; 26:676-7. Chilamakuri C, Lorenz S, Madoui M-A ym. Performance comparison of four exome capture systems for deep sequencing. BMC Genomics 2014; 15: 449 Cirulli ET, Singh A, Shianna KV ym. Screening the human genome: comparison of whole genome and whole transcriptome sequencing. Genome Biol 2010; 11: R57 Corder EH, Saunders AM, Risch NJ ym. . Protective effect of apolipoprotein E type 2 allele for late onset Alzheimer disease. Nat Genet. 1994; 7: 180–4. Deane R, Sagare A, Hamm K ym.. apoE isoform-specific disruption of amyloid beta peptideclearance from mouse brain. J Clin Invest 2008; 118: 4002–13 Escott-Price V, Bellenguez C , Wang L. PLOS ONE (www.plosone.org) 2014; 6: e 94661 Evans DA, Funkenstein HH, Albert MS ym. Prevalence of Alzheimer’s disease in a community population of older persons. Higher than previously reported. JAMA. 1989; 262: 2551–2556 Ferri CP, Prince M, Brayne Cym. Global prevalence of dementia: a Delphi consensus study. Lancet 2005; 366(9503): 2112–7. Fiume M, Williams V, Brook A ym. Savant: genome browser for high-throughput sequencing data. Bioinformatics 2010; 26:1938-44. Fratiglioni L, Paillard-Borg S, Winblad B. An active and socially integrated lifestyle in late life might protect against dementia. Lancet Neurol 2004; 3(6): 343–53. Gatz M, Reynolds CA, Fratiglioni L. ym. Role of genes and environments for explaining Alzheimers disease. Arch Gen Psychiatry 2006; 63: 168 -74 Genin E, Hannequin D, Wallon D ym. APOE and Alzheimer`s disease: a major gene with semidominant inheritance. Mol Psychiatry 2011; 16: 903-07 Glenner GG, Wong CW. Alzheimer’s disease and Down’s syndrome: Sharing of a unique cerebrovascular amyloid fibril protein. Biochem Biophys Res Commun 1984; 122: 1131– 35. Goate A, Chartier- Harlin MC, Mullan M. ym. Segregation of a missense mutation in the amyloid precursor protein gene wiith familial Alzheimers disease. Nature 1991; 349; 70406 38 Goldgaber D, Lehrman M, McBride O ym. Characterization and chromosomal localization of a cDNA encoding brain amyloid of Alzheimer’s disease. Science 1987; 235: 877–80 Hardy J, Selkoe DJ. The Amyloid hypothesis of Alzheimer´s disease: Progress and Problems on the Road to Therapeutics. Science 2002; 297: 353–356. Hardy J, Bogdanovic N, Winblad B. Pathways to Alzheimer’s disease. J Intern Med 2014; 275: 296–303. Harvard University (2011). Diagnosing Alzheimer's disease. Luettu 20.6.2014. www.health.harvard.edu/newsletters/Harvard_Health_Letter/2011/July/diagnosingalzheimers-disease Hallikainen M, Suhonen J, Pirttilä T, Erkinjuntti T. Alzheimerin taudin kliinisen tutkimuksen uudistetut kriteerit. Suomen lääkärilehti 2011; 66:161- 165 Hiltunen M, Haapasalo A, Soininen H. Alzheimerin taudin uudet riskigeenit – tautia ennakoivat biomarkkerit? Duodecim 2013; 129: 583- 8 Huang H & Jiang Z. Accumulated Amyloid-β peptide and Hyperphosphorylated Tau Protein: Relationship and Links in Alzheimer’s disease. Journal of Alzheimer’s Disease 2009; 16: 15–27 Illumina (2008). Illumina Sequencing Technology. Luettu 5.6.2014. www.illumina.com/technology/sequencing_technology.ilmn Illumina, Schroth G (2012). The Impact of Massively Parallel DNA Sequencing on Genomic and Clinical Research. Illumina (2013a). An introduction to Next-Generation Sequencing Technology. Luettu 4.6.2014. www.illumina.com/technology/sequencing_technology.ilm. Illumina (2013b). TruSeq Nano DNA Sample Preparation Kit. Luettu 4.8.2014. http://res.illumina.com/documents/products/datasheets/dtasheet_truseq_nano_dna_sample prep_kit.p.df Illumina (2014a) Mi Seq® System- Focused power. Speed and simplicity for targeted and small genome sequenc Luettu 12.8.2014. http://res.illumina.com/documents/products/datasheets/datasheet_miseq.pdf Illumina (2014b). Sequencing by synthesis technology. Luettu 12.8.2014. http://technology.illumina.com/technology/next-generation-sequencing/sequencingtechnology.html International Human Genome Consortium. Finishing the euchromatic sequence of the human genome. Nature 2004; 431, 931–945. Jarrett JT, Berger EP, Lansbury PT Jr. The carboxy terminus of the b amyloid protein is critical for the seeding of amyloid formation: Implications for the pathogenesis of Alzheimer’s disease. Biochemistry 1993; 32: 4693–4697. 39 Jiang Q, Lee CY, Mandrekar S et al. ApoE promotes the proteolytic degradation of A beta. Neuron 2008; 58: 681–93. Jonsson T, Atwal JK, Steinberg S, ym. A mutation in APP protects against Alzheimer’s disease and age-related cognitive decline. Nature 2012; 488: 96–9. Kang J, Lemaire H, Unterbeck A ym. The precursor of Alzheimer’s disease amyloid A4 protein resembles a cell surface receptor. Nature 1987; 325: 733–736. Lambert J-C, Amouyel P. Genetics of Alzheimer’s disease: new evidences for an old hypothesis? Curr Opin Genet Dev 2011; 21: 295–301 Levy-Lahad E. Wasco W, Poorkaj P ym. Candidate gene for the chromosome 1 familial Alzheimers disease locus. Science 1995; 269: 973- 77. Leibson CL, Rocca WA, Hanson VA, Cha R, Kokmen E, O’Brien PC, et al. The risk of dementia among persons with diabetes mellitus: a population-based cohort study. Ann NY Acad Sci 1997; 826:422–7. Liu Q, Zerbinatti CV, Zhang J et al. Amyloid precursor protein regulates brain apolipoprotein E and cholesterol metabolism through lipoprotein receptor LRP1. Neuron 2007; 56: 66–78 Luchsinger JA, Tang MX, Stern Y, Shea S, Mayeux R. Diabetes mellitus and risk of Alzheimer’s disease and dementia with stroke in a multiethnic cohort. Am J Epidemiol 2001; 154(7):635–41.perspective. Eur J Pharmacol 2008; 585(1):119–29. Luo C, Tsemnetzi D, Kyrpides N. Direct comparisons of illumina vs. Roche 454 sequencing technologies on the same microbial community DNA sample. PLoS One 2012; 7: e30087 Luthra R, Patel K, Reddy N ym. Next generation sequencing- based mutligene mutational screening for acute myeloid leukeimia using MiSeq: applicabapiltiy for diagnosis and disease monitoring. haematologica 2014; 99(3): 465- 73. Mayeux R. Stern Y. Epidemiology of Alzheimer Disease.Cold Spring Harb Perspect Med. 2012; 2(8): a006239. McKhann GM, Knopman DS, Chertkow H, ym. The diagnosis of dementia due to Alzheimer’s disease: Recommendations from the National Institute on Aging- Alzheimer‘s Association workgroups on diagnostic guidelines for Alzheimer’s disease. Alzheimers Dement 2011; 7:208–44. Metzker M. Sequencing technologies- The next generation. Nature 2010; 11: 31–46. Mullan M, Crawford F, Axelman K ym. A pathogenic mutation for probable Alzheimer's disease in the APP gene at the N-terminus of beta-amyloid. Nat Genet. 1992; 1(5): 345-7. Pavlopoulos G, Oulas A, Iacucci E ym. Unraveling genomic variation from next generation sequencing data. BioData Mining 2013; 6: 13. 40 Pirttilä ja Erkinjuntti. Alzheimerin taudin kliininen kuva ja diagnoosi. Kirjassa Erkrinjuntti T, Kari A, Juha R, Soininen H. toim, Muistihäiriöt ja dementia. Helsinki Kustannus Oy Duodecim 2006, s.126–139 Pirttilä T. Lievä kognitiivinen heikentyminen – ennusteeltaan heterogeeninen oireyhtymä. Duodecim 2008; 124:159–66. Prince M, Guerchet M, Prina M. Policy Brief for Heads of Government: The Global Impact of Dementia Alzheimer’s Disease International (ADI), London. 2013: 2013–50. Rapp A, Gmeiner B, Hüttinger M. Implication of apoE isoforms in cholesterol metabolism by primary rat hippocampal neurons and astrocytes. Biochimie. 2006; 88:473–483. Riddell DR, Christie G, Hussain I, Dingwall C. Compartmentalization of beta-secretase (Asp2) into low-buoyant density, non caveolar lipid rafts. Curr Biol 2001; 11: 1288–93. Riddell DR, et al. Impact of apolipoprotein E (apoE) polymorphism on brain apoE levels. J Neurosci. 2008; 28:11445–11453 Roche Diagnostics GmbH (2013a). SeqCap EZ Library Discover more, sequence less. Luettu 20.6.2014. www.nimblegen.com/products/lit/05227887001_SeqCapBroch_May2013.pdf Roche Diagnostics GmbH (2013b). SeqCap EZ Designs - Neurology Panel Design Discover more, sequence less in your neurological research. Luettu 11.8.2014. www.nimblegen.com/products/lit/06870473001_NG_SeqCapEZ_Neurology_Flyr_Jan201 3.pdf Roche NimbleGen (2013). SeqCap EZ Library SR User’s Guide version 4.2. Luettu 7.8.2014. www.nimblegen.com/products/lit/06588786001_SeqCapEZLibrarySR_UGuide_v4p2.pdf Rutherford K, Parkhill J, Crook J ym. Artemis: sequence visualization and annotation. Bioinformatics 2000; 16:944-5. Scheuner, D, Eckman, C, Jensen M. ym. Secreted amyloid beta-protein similar to that in the senile plaques of Alzheimer’s disease is increased in vivo by the presenilin 1 and 2 and APP mutations linked to familial Alzheimer’s disease. Nat. Med. 1996; 2:864–870. Scarmeas N, Stern Y, Mayeux R, Luchsinger JA. Mediterranean diet, Alzheimer disease, and vascular mediation. Arch Neurol 2006b; 63: 1709–1717 Seppälä T. Herukka S-K. Remes A. Alzheimerin taudin varhaisdiagnostiikka. Duodecim 2013; 129:2003- 10 Sherrington R, Rogaev EI, Liang Y ym.Cloning of a gene bearing missense mutations in early-onset Familial Alzheimer’s disease. Nature 1995; 375: 754–760. Spillantini MG, Goedert M. Tau Pathology and neruodegeneration. Lancet Neurol 2013; 12: 609–22 StrittmatterWJ, Saunders AM, Schmechel D ym. Apolipoprotein E: High-avidity binding to b-amyloid and increased frequencyof type 4 allele in late-onset familial Alzheimer disease. Proc Natl Acad Sci 1993; 90: 1977–81. 41 Tanzi R, Gusella J, Watkins P ym. Amyloid β protein gene: cDNA, mRNA distribution, and genetic linkage near the Alzheimer locus. Science 1987; 235: 880– 884. Tanzi R, McClatchey A, Lamperti E ym. Protease inhibitor domain encoded by an amyloid protein precursor mRNA associated with Alzheimer’s Disease. Nature 1988; 331: 528–530. Tanzi RE, Bertram L. Twenty years of the Alzheimer’s disease amyloid hypothesis: A genetic perspective. Cell 2005; 120: 545–555. Tanzi R. The Genetics of Alzheimer Disease, Cold Spring Harbor Perspectives in Med. 2012; 2:a006296 Thorvaldsdóttir H, Robinson JT, Mesirov JP. Integrative Genomics Viewer (IGV): highperformance genomics data visualization and exploration Brief Bioinform 2013; 14 (2): 178–192 Tienari, Polvikoski. Alzheimerin taudin patogeneesi. Kirjassa: Erkinjuntti T, Kari A, Juha R, Soininen H, toim. Muistihäiriöt ja dementia. Helsinki: Kustannus Oy Duodecim 2006, s. 112–113, 115-116 van Praag H, Kempermann G, Gage FH . Running increases cell proliferation and neurogenesis in the adult mouse dentate gyrus. Nat Neurosci 1999; 2: 266–270 Wolfe MS, Xia W, Ostaszewski BL, Diehl TS, Kimberly WT, SelkoeDJ. Two transmembrane aspartates in presenilin-1 required for presenilin endoproteolysis and γ-secretase activity. Nature 1999; 398: 513–517. Xiangtao L, Shizhong H, Zuoheng W, Joel G, Bao-Zhu Y. Variant Callers for NextGeneration Sequencing Data: A Comparison Study. PLOS ONE | www.plosone.org 2013; 8(9): e75619 42
© Copyright 2025