Linkki julkaisuun - UEF Electronic Publications - Itä

KOHDENNETTU MISEQ- EKSONISEKVENSOINTI KÄYTTÄEN
SEQCAP-
GEENIKIRJASTOASETELMAA
JA
ALZHEIMERIN
TAUTITAPAUKSIA
Tiina Karkiainen
Opinnäytetyö
Lääketieteen koulutusohjelma
Itä-Suomen yliopisto
Terveystieteiden tiedekunta
Kliinisen lääketieteen yksikkö / Neurologia
Joulukuu 2014
ITÄ- SUOMEN YLIOPISTO, Terveystieteiden tiedekunta
Lääketieteen laitos
Lääketieteen koulutusohjelma
KARKIAINEN TIINA: Kohdennettu MiSeq- eksonisekvensointi käyttäen SeqCap- geenikirjastoasetelmaa ja Alzheimerin tautitapauksia
Opinnäytetutkielma: 41 sivua
Tutkielman ohjaajat: dosentti Seppo Helisalmi, professori Hilkka Soininen
Tutkielman tarkastaja: professori Mikko Hiltunen, professori Hilkka Soininen
Joulukuu 2014
Avainsanat: neurologia, Alzheimerin tauti, genetiikka, NGS
Alzheimerin tauti (AT) on vaiheittain etenevä hermostorappeumasairaus, jolle tyypillisiä
patologisia muutoksia ovat amyloidiplakit ja neurofibrillivyyhdit. AT:n harvinaisemman
familiaalisen muodon periytyminen noudattaa Mendeliaalista mallia ja taudin puhkeaminen johtuu kausaalisista mutaatiosta, joita on toistaiseksi löydetty kolmesta eri geenistä.
Nämä kausaaliset mutaatiot preseniliini-1 (PSEN1), preseniliini- 2 (PSEN2) ja amyloidiprekursoriproteiini (APP) geeneissä johtavat muutoksiin β-amyloidituotannossa, ja tämän
uskotaan olevan keskeinen osa taudin syntymekanismia. Lisäksi on löydetty lukuisia pienemmän riskivaikutuksen omaavia geenimuutoksia, jotka ovat yleisiä populaatiotasolla.
Nämä muutokset yhdessä ympäristötekijöiden kanssa saavat aikaan huomattavasti yleisemmän monitekijäisen AT:n tautimuodon. Vaikka tietämys AT:n genetiikasta on kasvanut
merkittävästi sitten koko genomin kattavien assosiaatiotutkimusten myötä, on osa taudin
periytymisestä vielä tuntematonta. Uuden sukupolven sekvensointi menetelmien (NGS =
Next Generation Sequencing) avulla voidaan tutkimuksen resoluutiota ja kattavuutta säätää
siten, että voidaan paitsi sekvensoida useita kokonaisia genomeja tehokkaasti, myös sekvensoida valikoituja alueita suurella resoluutiolla harvinaisempien muuttujien havaitsemiseksi.
Tässä tutkimuksessa testattiin menetelmää DNA kirjaston rakentamiseksi. Tutkittavana
olivat viisi eri näytettä suomalaisista AT- suvuista, joista kahdessa oli aiemmin toisella
tekniikalla havaittu APP- geenialueen duplikaatio ja kolmessa Pro264Leu- mutaatio
PSEN1- geenissä. Geenikirjaston rakentamiseksi käytettiin kohdennettua NGSsekvensointia, jossa oli valikoituna joukko neurologisiin sairauksiin liittyviä geenejä. Itse
sekvensointi suoritettiin Illumina MiSeq- sekvensointilaitteella. Sekvensointiajon tuloksia
tarkasteltiin erilaisten muuttujien avulla.
MiSeq- sekvensaattorin kyky havaita variantteja oli hyvä (neuropaneelilla n.2000 varianttia/näyte). Kolmessa näytteessä esiintyvä Pro264Leu PSEN-1 mutaatio voitiin havaita tällä
tekniikalla. Sen sijaan APP- geenialueen duplikaatiota ei pystytty havaitsemaan, viitaten
siihen, että käyttämällämme sekvensointimetodilla ei voida tutkia isoja kromosomaalisia
muutoksia, kuten isoja deleetioita tai insertioita. Vähintään 15 kertaa luettujen emästen
osuus on noin 99 prosenttia kussakin näytteessä, joten luennan tarkkuus oli erittäin hyvä, ja
sekvensointituloksia voidaan pitää luotettavina.
UNIVERSITY OF EASTERN FINLAND, Faculty of Health Sciences
School of Medicine
Medicine
KARKIAINEN TIINA: Targeted MiSeq exon sequencing by using SeqCap gene library
protocol and Alzheimer’s disease cases.
Thesis: 41 pages
Tutors: Docent Seppo Helisalmi, Professor Hilkka Soininen
Examiner: Professor Mikko Hiltunen, Professor Hilkka Soininen
December 2014
Keywords: neurology, Alzheimer’s disease, genetics, NGS
Alzheimer`s disease (AD) is a progressive neurodegenerative disease. Amyloid plaques
and neurofibrillary tangles are typical neuropathological changes in AD. The genetics of
the familial form of AD is characterized by Mendelian inheritance. Causative highly penetrant mutations in presenilin-1- (PSEN1), presenilin 2- (PSEN2) and amyloid precursor
protein- (APP) genes result in changes of β-amyloid production, which is considered to
play a central role in pathogenesis of the AD. In addition, there has been found several
common low- risk variants, which act together with environmental factors to cause more
common multifactorial from of the disease. Even though the knowledge on AD has increased since genome wide association studies, is the part of the genetics of AD still unknown. Next generation sequencing (NGS) - technology provides feasible resolution and
coverage enabling the sequencing of several entire genomes in a single run, or targeted
sequencing particular region of the genome with high resolution to identify rare variants.
In the present study, we tested a method for DNA library preparation. We examined five
samples from Finnish AD families. Two samples included APP- duplication and three
Pro264Leu mutation in PSEN1- gene previously identified by another techniques. To construct gene library, we used targeted approach to select genes linked to neurological diseases. Sequencing was performed with MiSeq- sequencing platform. The results of the sequencing were assessed alongside with different quality values.
The ability of MiSeq- sequencer to detect variants is good (in our neuropanel, about 2000
variants/sample were identified). Pro264Leu PSEN-1 mutation, which was presented in
three samples, was detected by this approach. Instead, APP-gene region duplication was
not detected, suggesting that large genomic alterations, such as deletions and insertions are
not detectable with this approach. In each sample, about 99 percent of the bases were read
at least 15 times, so the results of the NGS-sequencing can be considered reliable.
SISÄLTÖ
1.
JOHDANTO ................................................................................................................................. 5
2.
KIRJALLISUUSKATSAUS ............................................................................................................... 6
2.1 Epidemiologia ........................................................................................................................... 6
2.2 Kliiniset oireet ja neuropatologiset muutokset........................................................................ 9
2.3 Genetiikka .............................................................................................................................. 13
2.3.1 Kausaaliset mutaatiot...................................................................................................... 13
2.3.2 Riskigeenit ....................................................................................................................... 14
2. 4 Uuden sukupolven sekvensointi menetelmät ....................................................................... 16
2.4.1 Yleistä .............................................................................................................................. 17
2.4.2 Käyttömahdollisuudet ..................................................................................................... 18
3. AINEISTO JA MENETELMÄT .......................................................................................................... 20
3.1 Tutkimustarkoitus .................................................................................................................. 20
3.2 Tutkimusmateriaali ................................................................................................................ 20
3.3 Menetelmät............................................................................................................................ 22
3.3.1 DNA- kirjaston rakentaminen.......................................................................................... 22
3.3.2. Klustereiden muodostaminen MiSeq- sekvensointilaitteella ........................................ 27
3.3.3 Sekvensointi synteesin kautta ......................................................................................... 29
3.4 Analysointi vaihe .................................................................................................................... 30
4. TULOKSET ..................................................................................................................................... 31
5. POHDINTA .................................................................................................................................... 34
VIITTEET ............................................................................................................................................ 36
5
1. JOHDANTO
Alzheimerin tauti (AT) on yleisin dementian syy, ja se käsittää 60- 80 prosenttia dementiatapauksista. AT:n yleisin varhainen oire on lähimuistin heikkeneminen, sillä tautiin liittyvät patologiset aivomuutokset alkavat oppimisen ja muistin kannalta keskeisiltä alueilta
(Alzheimer`s Association, 2014). Taudille tyypillisiä patologisia muutoksia ovat hyperfosforyloituneesta tau- proteiinista muodostuneet solunsisäiset neurofibrillivyyhdit ja solunulkoiset β- amyloidista muodostuneet plakit (Bettens ym. 2013). AT:n patologiset muutokset
etenevät vaiheittain ja samaan tahtiin kliinisten oireiden kanssa (Braak H, Braak E 1991 ).
Vain pieni osa tautitapauksista johtuu kausaalisista mutaatioista amyloidiprekursoriproteiini (APP)-, preseniliini- 1 (PSEN1) ja preseniliini- 2(PSEN2) geeneissä. Sen sijaan suurimmalla osalla taudin puhkeamiseen vaikuttavat sekä geneettiset että ympäristötekijät.
Koko genomin kattavien assosiaatiotutkimusten (GWA= Genome Wide Association) avulla on löydetty suurella esiintymistaajuudella esiintyviä mutaatiota, jotka nostavat riskiä
sairastua vain vähän (Bettens ym. 2013). Uuden sukupolven sekvensointi menetelmät
(NGS= Next Generation Sequencing) mahdollistavat kokonaisten genomien sekvensoinnin
aiempaa nopeammin, tarkemmin ja edullisemmin. Lisäksi sekvensoinnin tarkkuutta voidaan säätää siten, että sekvensoidaan pienempiä alueita suurella tarkkuudella. Tällöin on
mahdollista löytää harvinaisempia mutaatioita (Illumina 2013a)
Tässä opinnäytetyössä tarkasteltiin NGS- menetelmän tehokkuutta ja luotettavuutta, sekä
pohdittiin sen hyötyjä ja haittoja. Tutkimuksessa sekvensoitiin viiden eri henkilön näytteet,
joilla kaikilla tiedettiin olevan kausaalinen AT- mutaatio, joko APP- tai PSEN1- geenissä.
Sekvensoinnissa käytettiin uuden sukupolven MiSeq- sekvensointilaitetta. Potilaiden näytteistä rakennettiin geenikirjasto, ja neuropaneelin avulla valikoitiin sekvensoitavaksi joukko neurologisiin sairauksiin tai häiriöihin liittyviä geenejä. Kyseiset valikoidut alueet sekvensoitiin suurella tarkkuudella, kyseessä on siis kohdennettu sekvensointi. Sekvensointiajon tuloksia tarkasteltiin erilaisten muuttujien ja hyvyysarvojen avulla.
6
2. KIRJALLISUUSKATSAUS
2.1 Epidemiologia
Dementian esiintyvyys maailmalaajuisesti vuonna 2013 oli arvioilta 44.4 miljoonaa. AT on
yleisin dementian syy. Väestön ikääntyessä dementiaa sairastavien määrän odotetaan kasvavan edelleen ja vuonna 2030 tapausten määrän ennustetaan olevan 75,6 miljoonaa ja
vuonna 2050 jopa 135,5 miljoonaa. Vuosittain uusia tapauksia on 7,7 miljoonaa. Kasvun
odotetaan olevan voimakasta etenkin kehittyvissä maissa (Prince ym. 2013). Vuonna 2005
tehdyn tutkimuksen mukaan eniten dementiaa sairastavia oli Pohjois-Amerikassa ja LänsiEuroopassa. Näiden jälkeen tulivat Latinalainen Amerikka, Kiina ja sen läntiset Välimeren
naapurit (Ferri ym. 2005). Edellisestä poiketen uudempien analyysien mukaan 62 % dementiaa sairastavista elää matala- tai keskituloisissa maissa ja osuuden on arvioitu kasva-
Miljoonaa dementiaa sairastavaa
van vuoteen 2050 mennessä 71 prosenttiin (Prince ym. 2013) (kuva 1).
Vuosi
KUVA 1. Dementian esiintyminen matala- ja keskituloissa( low and middle income countries) sekä korkeatuloisissa (high income countries) maissa. Muokattu lähde Prince ym.
2013. Dementiaa sairastavien määrän kasvun odotetaan olevan voimakasta seuraavien vuosikymmenien aikana eteenkin matala- ja keskituloisissa maissa.
Vuonna 2010 dementian aiheuttamat kustannukset maailmanlaajuisesti olivat noin 604
miljardia Yhdysvaltain dollaria. 70 prosenttia tästä summasta käytetään Länsi- Euroopassa
ja Pohjois- Amerikassa. Matala- ja keskituloisten maiden kustannukset ovat sitä vastoin
yhteensä vain noin 11 prosenttia kokonaissummasta. Näissä maissa kustannukset henkilöä
7
kohden ovat siis merkittävästi pienemmät kuin korkeamman tulotason maissa (Prince ym.
2013). Monet dementiaa sairastavista ovat vailla pätevää diagnoosia. Korkeamman elintason maissa 20- 50 prosenttia dementiatapauksista tunnistetaan ja dokumentoidaan. Matalamman elintason maissa tilanne on tätäkin huonompi. Asianmukaisen hoidon ja tuen saaminen edellyttää kunnollista diagnoosia (WHO).
AT:n esiintyvyys kasvaa merkittävästi iän myötä, eteenkin 65 ikävuoden jälkeen (Kuva 2).
Riski sairastua kasvaa 15 kertaiseksi 65 ja 80 ikävuoden välillä (Evans ym. 1989). AT:ia
sairastavista vain noin 1-5 prosenttia edustaa varhaista familiaalista muotoa, joka alkaa alle
65 vuotiaana, ja loput 95 prosenttia edustaa myöhäisempää yli 65 vuotiaana alkavaa monitekijäistä muotoa. Sekä varhaiseen että myöhäiseen muotoon liittyy periytyvä alttius sairastumiseen. Henkilöllä, jonka ensimmäisen asteen sukulaisella on myöhäinen AT, on kaksinkertainen riski sairastua verrattuna henkilöön, jonka ensimmäisen asteen sukulaisella ei
ole AT: ia (Reiz ja Mayeux 2014). Geneettisten tekijöiden lisäksi myös ympäristö ja elintavat vaikuttavat AT:n puhkeamiseen.
Vuosittainen ilmaantuminen (per 100 henkilöä/ vuosi)
KUVA 2. AT:n esiintyminen ikäluokittain. Lähde Mayeux ja Stern 2012. Vuosittain ilmaantuvien uusien AT- tapausten määrä kasvaa etenkin 65- ikävuoden jälkeen.
Sydän- ja verisuonisairaudet ja niihin liittyvät tekijät kuten tyypin kaksi diabetes, tupakointi, ylipaino, korkea verenpaine ja dyslipidemiat eli rasva-aineenvaihdunnan häiriöt ovat
eniten raportoidut AT:n riskitekijät (Mayeux ja Stern 2012). Tarkkaa mekanismia sydänja verisuonisairauksien ja AT:n välillä ei tunneta. On arveltu että muistioireet voivat johtua
joko aivomuutosten aiheuttamista suorista vaurioista muistin kannalta keskeisillä alueilla
8
tai kudosvaurioiden aiheuttamasta Aβ:n pitoisuuden noususta, mikä voi puolestaan johtaa
tulehdusreaktioon ja sitä kautta kognition heikkenemiseen. (Reiz ja Mayeux 2014). Kohonnut verenpaine keski-iässä (40- 60 vuotta) nostaa lievän kognitiivisen heikentymän
(MCI= Mild Cognitive Impairement), dementian ja AT:n riskiä myöhempinä ikävuosina.
Kohonneen verenpaineen uskotaan lisäävän aivo-veriesteen läpäisevyyttä, jolloin aivoihin
pääsee enemmän proteiineja. (Kalaria RN 2010) Proteiinien kerääntyminen puolestaan
johtaa soluvaurioihin, synapsien ja neuronien toiminnan häiriöihin ja Aβ:n kerääntymiseen
johtaen tajunnan heikkenemiseen (Deane ym 2004). Myöhemmällä iällä korkeammalla
verenpaineella on arvioitu olevan vastakkainen vaikutus, ja sen on katsottu jopa suojaavan
AT:lta. Tämä selittynee sillä, että verenpaine laskee sairauden kehossa aiheuttamien muutosten johdosta (Reiz & Mayeux 2014). Tyypin kaksi diabetes lähes kaksinkertaistaa riskin
sairastua (Leibson ym. 1997, Luchsinger 2001). Sekä aivoverenkiertoon liittyvät tekijät
että hyperinsulinemia eli insuliinin ylimäärä, mikä johtaa Aβ:n kasautumiseen, ovat mahdollisia mekanismeja (Luchsinger ym. 2008). Myös aivovammojen on katsottu nostavan
Aβ- tasoja. Lisäksi masennukseen liittyvien aivokemiallisten muutosten on arveltu nopeuttavan AT:n patologian kehittymistä (Pirttilä ja Erkinjuntti 2006). Sairastumisriskiä kasvattavien tekijöiden lisäksi on olemassa myös joitain mahdollisia AT:lta suojaavia tekijöitä.
Kognitiivisesti stimuloivat aktiviteetit, kuten lukeminen tai oppiminen, mahdollisesti vähentävät riskiä sairastua. Sekä nuoremmalla että vanhemmalla iällä älyllisellä ja sosiaalisella aktiivisuudella on todettu olevan suotuisia vaikutuksia myöhemmän iän kognitiiviseen suorituskykyyn (Carlson ym. 2008, Fratiglioni ym. 2004). Koulutus ja älylliset aktiviteetit mahdollisesti synnyttävät aivoihin monipuolisemman hermoverkoston, mikä kompensoi iän ja sairauksien aiheuttamia aivomuutoksia (Pirttilä ja Erkinjuntti 2006). Tämän
lisäksi fyysinen aktiivisuus ja ruokavalio vaikuttavat sairastumisriskiin. Välimerellisen
ruokavalion noudattamisen, mikä sisältää paljon kalaa, kasviksia, tyydyttymättömiä rasvoja ja vähän punaista lihaa ja tyydyttyneitä rasvoja on tutkittu olevan yhteydessä vähentyneeseen riskiin sairastua AT:iin. (Scarmeas ym. 2009). Liikunnalla on monia suotuisia vaikutuksia aivojen terveydelle. Van Praagin ym. (1999) hiiritutkimuksen mukaan se parantaa
oppimista sekä nuorilla että vanhemmilla eläimillä lisäten neurogeneesiä eli hermosolujen
muodostumista ja solujen proliferaatiota eli lisääntymistä.
9
2.2 Kliiniset oireet ja neuropatologiset muutokset
AT:lle tyypillisiä patologisia muutoksia ovat solunulkoiset amyloidiplakit ja solunsisäiset
hyperfosforyloituneen tau-proteiinin (fosfo-tau) muodostamat neurofibrillivyyhdit, amyloidiangiopatia eli lukinkalvon ja aivokuoren pienten verisuonten amyloidikertymät ja
hermosolujen kato. Nämä patologiset muutokset rajoittuvat lähes täysin keskushermostoon
isoaivojen kuorikerrokseen. Erityisesti ohimolohkojen sisäosien limbiset alueet, missä tapahtuvat muistin ja oppimisen kannalta keskeiset prosessit, vaurioituvat (Tienari & Polvikoski 2006). Heiko ja Eva Braak (1991) jakoivat AT:n etenemisen kuuteen eri vaiheeseen
neurofibrillimuutosten etenemisen perusteella. Braakin & Braakin mallin kuusi vaihetta
ovat: I-II eli transentorinaalinen vaihe, III-IV eli limbinen vaihe ja V- VI eli neokortikaalinen vaihe. Kliiniset oireet etenevät myös vaiheittain ja niiden ilmaantuminen korreloi aivopatologisten muutosten etenemisen, kolinergisen vaurion sekä synapsien määrän kanssa.
Sen sijaan amyloidimuutosten ja kliinisten oireiden välinen yhteys on epäselvä. Kliiniset
vaiheet jaetaan oireettomaan eli prekliiniseen vaiheesen, varhaiseen AT:iin, lievään AT:n
dementiaan, keskivaikeaan AT:n dementiaan ja vaikeaan AT:n dementiaan (Pirttilä & Erkinjuntti 2006).
AT:n aivopatologisten muutosten kehittymisen on arvoitu alkavan jopa 10- 20 vuotta ennen ensimmäisten oireiden ilmaantumista (Kuva 3.) Patologiset muutokset eivät väistämättä johda dementiaan, ja patofysiologista prosessia missä ei vielä esiinny dementiaa tulisikin kutsua prekliiniseksi AT:ksi (McKhann ym. 2011). Prekliinisessä vaiheessa voi
osalla potilaista esiintyä lievää kognitiivista eli oppimiseen ja muistiin liittyvää heikentymistä (MCI=Mild Cognitive Impairement), jolloin henkilöllä esiintyy sekä subjektiivisesti
että objektiivisesti todettavissa oleva muistioire, mikä ei kuitenkaan haittaa arjesta suoriutumisessa. (Pirttilä 2008). MCI:tä voi seurata ensimmäinen varsinainen AT:n vaihe, lievä
dementia, ja näin onkin arvoitu käyvän jopa 80 prosentille MCI- tapauksista (Hallikainen
ym.2011).
Braakin & Braakin mallissa prekliininen vaihe vastaa muutoksia, jotka rajoittuvat transentorinaalisen ja entorinaalisen kuorikerroksen alueelle. Varhaisessa AT:ssa oppimiseen ja
muistiin liittyviä oireita alkaa ilmaantua, sillä patologiset muutokset ovat edenneet hippokampukseen ja sitä ympäröiville limbisille alueille, mitkä ovat oppimisen ja muistin kan-
10
nalta keskeisiä alueita. Neokortikaalisessa vaiheessa voidaan jo puhua dementiasta. Lievässä AT:n dementiassa oireet alkavat haitata päivittäistä elämää ja muistioireiden lisäksi
esiintyy myös muita kognitiivisia häiriöitä, kuten vaikeuksia puheen tuotossa sekä psykologisia oireita kuten masennusta. Keskivaikeassa ja vaikeassa dementiassa muistioireet
pahenevat edelleen ja niiden lisäksi tulevat käytösoireet. Potilaan toimintakyky alenee
merkittävästi ja hän tarvitsee päivittäin valvontaa ja apua. Vaikeassa AT:n dementiassa
ohimolohkojen sisäosat ovat lähes täysin tuhoutuneet ja neokorteksin eli isoaivokuoren
patologiset muutokset lisääntyvät, jolloin myös perustoiminnot heikkenevät. Hyvin vaikeassa dementiassa potilaan toimintakyky on puolitoistavuotiaan lapsen tasolla. Aivopatologia etenee vastakkaisessa järjestyksessä kehittyvien aivojen myelinisaatiolle, eli suojaavien
myeliinituppien muodostumiselle hermosolujen ympärille. Primaarinen sensomotorinen eli
tunto- ja liikehermotuksesta vastaava ja oksipitaalinen eli takaraivon puoleinen kuorikerros
myelinisoituvat ensimmäisenä aivojen kehittyessä, ja aivopatologia ilmaantuu viimeisenä
näille alueille. Sen sijaan limbiset alueet, jotka myelinisoituvat viimeisenä ja heikoimmin,
vaurioituvat ensimmäisinä AT:n patologisten muutosten johdosta. (Pirttilä & Erkinjuntti
2006).
KUVA 3. AT:n neuropatologisten muutosten etenemistä kuvaavien biomarkkereiden ja
oireiden etenemisen suhde. Lähde: Seppälä ym, 2010. Kuvasta nähdään miten patologiset
prosessit etenevät vuosia ennen kliinisten oireiden ilmaantumista. Kun neuropatologia on
edennyt tarpeeksi pitkälle tulevat ensimmäiset muistioireet ja lievä kognitiivinen heikentyminen. Myöhemmin myös yleinen toimintakyky heikkenee patologian edetessä aivoissa.
11
AT:lle on tunnusomaista pitkäkestoisen tapahtumamuistin eli episodisen muistin heikentyminen, ja se onkin taudin kliinisen diagnostiikan pääkriteeri. Episodista muistia voidaan
testata potilaalle ja läheisille tehtävien muistikyselyiden avulla sekä CERAD (The Consortium to Establish a Registry for Alzheimer’s Disease) tehtäväsarjan avulla, joka testaa 10
sanan sanalistan oppimista, viivästettyä mieleen palauttamista ja tunnistamista. Näiden
lisäksi diagnoosia tukevat biologiset markkerit, joita ovat magneettikuvantamisella todettava sisemmän ohimolohkon surkastuminen, selkäydinnesteestä mitattavat amyloidi β:n
(Aβ) pitoisuuden muutokset, taun kokonaispitoisuuden (t-tau)- ja hyperfosforyloituneen
taun (fosfo-tau) pitoisuuden muutokset, muutokset glukoosiaineenvaihdunnassa ja amyloidin kertymisessä, mitkä voidaan mitata positroniemissiotomografia (PET)- kuvantamisella, sekä kausaaliset mutaatiot amyloidiprekursioproteiini (APP)-, preseniliini-1(PSEN1) ja preseniliini-2-(PSEN2) geeneissä. On myös poissuljettava muut mahdolliset
muistioreiden takana olevat tekijät kuten kallonsisäiset muutokset, puutostilat ja aineenvaihduntahäiriöt (Hallikainen ym. 2011). Koska AT:n aivopatologisten muutosten kehittyminen alkaa jo kauan ennen oireiden ilmaantumista, olisivat myös niiden aiheuttamat
muutokset mitattavissa ennen oireiden ilmaantumista. Varhainen diagnoosi onkin edellytys
hyvälle ja kokonaisvaltaiselle taudin hoidolle sekä tulevaisuudessa mahdollisille tautia
estäville hoidoille ja niiden kehittämiselle. Koska toistaiseksi tautiin ei ole kyetty kehittämään parantavaa hoitoa, biomarkkereiden käyttö oireettomien potilaiden tunnistamiseksi ei
ole sallittua. (Blennow ym. 2010) Sen sijaan tutkimuskäyttöön on kehitetty luokittelu prekliinisen AT:n tunnistamista varten, mutta sillä ei ainakaan vielä ole kliinistä käyttöä.
(Sperling ym. 2011).
AT:lle tyypillisten patologisten muutosten tarkkaa syntymekanismia ei vielä toistaiseksi
tunneta. Amyloidihypoteesi, jonka mukaan Aβ:n kertyminen aivokudokseen käynnistää
AT:iin johtavat patologiset prosessit, on johtava teoria. Vaikka amyloidihypoteesin puolesta on monia tutkimuksia, se ei ole täysin aukoton: esimerkiksi amyloidiplakkien määrän ja
tajunnantason heikkenemisen välillä ei ole havaittu selvää korrelaatiota. Hypoteesia vastaan ei ole kuitenkaan pystytty esittämään sellaisia todisteita, että se olisi kannattanut hylätä (Hardy & Selkoe 2002). Aβ:aa muodostuu amyloidiprekursoriproteiinin, APP:n, pilkkoutumisen tuloksena. APP:ta voidaan pilkkoa solussa kahdella eri tavalla. α- sekretaasi
pilkkoo proteiinin siten että pitkän Aβ:n muodostuminen ei ole mahdollista, vaan γ- sekretaasin toimesta muodostuu p3- fragmentti. β- sekretaasi sen sijaan pilkkoo ensin APP:n
aivan Aβ:n ensimmäisen aminohapon vierestä. Tällöin γ- sekretaasin jatkaessa pilkkomista
12
muodostuu joko 40 (Aβ40) tai 42 aminohappoa pitkää Aβ:aa (Aβ42). Pidempi muoto eli
Aβ42 on haitallisempi, sillä se sakkautuu muodostaen plakkeja solunulkoiseen tilaan (Tienari & Polvikoski 2006) (Kuva2). Aβ:n muodostuksen ohella myös sen hajotukseen ja
poistumiseen liittyvät mekanismit ja niiden välinen tasapaino ovat tärkeä osa AT:n tautiprosessia (Hiltunen ym. 2013). Erityksen heikentymisen myötä amyloidin pitoisuus selkäydinnesteessä pienenee, mikä on yksi AT:n diagnoosia tukevista biomarkkereista (Blennov ym. 2010)
KUVA 4 Amyloidiplakkeja. Lähde: Harvard University, 2011. Aβ (beta- amyloid) sakkautuu ja kertyy aivosolujen (brain cell) solunulkoiseen tilaan muodostaen amyloidiplakkeja,
mitkä aiheuttavat hermosolujen aksoneiden (axon) ja dendriittien (dendrite) välisten yhteyksien heikkenemisen ja hermosolujen kuoleman.
Tau- proteiini sitoutuu mikrotubuluksiin ja stabiloi niiden rakennetta sekä säätelee aksonikuljetusta. Sillä on siis tärkeitä fysiologisia tehtäviä elimistössä. AT:n toinen patologinen tunnusmerkki ovat hyperfosforyloituneesta tau- proteiinista muodostuneet neurofibrillivyyhdit eli hermosäiekimput. Normaaliolosuhteissa proteiini on liukoinen, mutta patologisissa olosuhteissa se hyperfosforyloituu, irtoaa mikrotubuluksista ja muodostaa liukenemattomia säikeitä. Taun reversiibeli eli käänteinen fosforylaatio on tärkeää neuronaalisten
funktioiden säätelyssä, ja siitä vastaavat kinaasit ja fosfataasit. AT:ssa näiden molekyylien
toiminta mahdollisesti häiriintyy johtaen fosforyloituneen muodon ylimäärään (Huang &
Jiang 2009). Neurofibrillivyyhdit eivät ole AT:lle tyypillisiä muutoksia, vaan niitä esiintyy
myös muissa neurodegeneratiivisissa eli hermosoluja rappeuttavissa sairauksissa (Spillandini ja Goedert 2013).
13
Ei ole täysin selvää ovatko amyloidi- ja tau- patologia toisiinsa kytkeytyneitä vai itsenäisiä
prosesseja. Useat tutkimukset kuitenkin viittaavat että Aβ saisi aikaan neurofibrillivyyhtien
muodostumisen ja neuronien kuoleman joko suoraan tai epäsuorasti. On esitetty kaksi
mahdollista mekanismia joiden kautta Aβ:n ylimäärä saa aikaan taun hyperfosforylaation:
oksidatiivien stressi ja neuronin solukalvon reseptorit (Huang & Jiang 2009). Neurofibrillivyyhtien lisäksi amyloidin kertyminen aiheuttaa oksidatiivista stressiä, tulehdusta, energia-aineenvaihdunnan muutoksia ja ohjelmoidun solukuoleman (Hiltunen ym. 2013).
2.3 Genetiikka
2.3.1 Kausaaliset mutaatiot
Kliinisesti AT jaetaan varhaiseen ja myöhäiseen muotoon sairauden alkamisiän perusteella.
Varhainen muoto alkaa alle 65-vuotiaana ja myöhäinen yli 65-vuotiaana. Sekä varhaiseen
eli familiaaliseen että myöhäiseen AT:n muotoon liittyy geneettinen komponentti. (Bettens
ym 2013). Familiaalisen muotoon kytkeytyviä kausaalisia, eli sairauteen johtavia mutaatioita, on löydetty kolmesta eri geenistä. Nämä mutaatiot selittävät kuitenkin vain 13 % varhaisista AT- tapauksista (Campion ym. 1999). Yleisemmän myöhäisen muodon geneettinen tausta on mutkikkaampi ja siihen vaikuttavat sekä geneettiset- että ympäristötekijät.
Kaksoistutkimusten perusteella on kuitenkin todettu että perinnöllisillä tekijöillä on suuri
merkitys myös taudin myöhäisemmässä muodossa ja että sen periytyvyys olisi jopa 80
prosenttia (Gatz ym. 2006).
Kausaaliset mutaatiot APP-, PSEN1- ja PSEN2- geeneissä johtavat muutoksiin amyloidiaineenvaihdunnassa (Bettens ym. 2013). Ensimmäinen kausaalinen mutaatio, Val717Ile,
löydettiin APP- geenistä (Goate ym 1991). Jo tätä aiemmin Glenner ja Wong (1984) löysivät kyseisen geenin Downin syndroomaa sairastavan henkilön genomista ja totesivat sen ja
β- amyloidia koodaavan geenin olevan sama. He myös ehdottivat, että kyseinen geeni sijaitsee kromosomissa 21. Myöhemmin useampikin tutkimusryhmä vahvisti APP geenin
todella sijaitsevan kyseisessä kromosomissa (Goldgaber ym.1987, Kang ym. 1987, Tanzi
ym. 1987, 1988). Vuonna 1995 löydettiin useita mutaatiota kromosomissa 14 sijaitsevassa
PSEN1-geenissä (Sherrington ym. 1995). Samana vuonna löydettiin mutaatio myös
PSEN2-geenistä kromosomissa 1 (Levy-Lahad ym. 1995). Preseniliiniproteiinit ovat as-
14
partyyliproteaaseja ja toimivat osana γ- sekretaasia, mikä vastaa APP:n pilkkoutumisesta
Aβ:si, APP:n tavoin ne vaikuttavat siis amyloidipatologian syntyyn (Wolfe ym. 1999).
Toistaiseksi on löydetty 33 APP mutaatiota, 185 PSEN1 mutaatiota ja 13 PSEN2 mutaatiota
(Alzheimer
Disease
and
Frontotemporal
Dementia
Mutation
Database;
www.molgen.ua.ac.be/ADMutations, 2014). Lähes kaikki varhaiseen AT:iin johtavat mutaatiot periytyvät autosomaalisesti dominantisti eli vallitsevasti ja lähes kaikki johtavat
AT:lle tyypilliseen Aβ42 /Aβ40 suhteen nousuun (Scheuner ym. 1996, Tanzi ja Bertram
2005, Tanzi 2012). Lisääntynyt Aβ42 johtaa puolestaan Aβ-peptidin sakkautumiseen oligomeereiksi ja lopulta amyloidisäikeiden muodostumiseen (Jarrett ym. 1993). On kuitenkin löydetty muutamia poikkeuksia. Ruotsalaisesta suvusta löydetty tuplamutaatio, LysMet670/671AspLeu, lisää molempien amyloidi muotojen määrää johtaen Aβ:n ylimäärään
ja kerääntymiseen. (Mullan ym. 1992). AT:n hoitomuotojen kehittämisen kannalta mielenkiintoinen on APP-mutaatio, Ala673Thr, mikä johtaa vähentyneeseen amyloidogeenisten peptidien tuotantoon ja parempaan kognitiiviseen suorituskykyyn (Jonsson ym. 2012).
On mahdollisesti olemassa muitakin kausaalisia mutaatiota APP- ja PSEN- geeneissä sijaitsevien lisäksi, mutta niitä on vielä etsittävä tarkemmin (Tanzi, 2012).
2.3.2 Riskigeenit
AT:n myöhäisen muodon tärkein geneettinen riskitekijä on APOE (Apolipoproteiini Egeeni) ε4- alleeli, mikä sijaitsee kromosomissa 19q13 (Stritmatter ym. 1993). Esiintyessään
yhtenä kappaleen ε4- alleeli lisää riskiä sairastua nelinkertaisesti ja jos henkilö perii alleelin kahtena kappaleena kasvaa riski kymmenkertaiseksi. Sen sijaan ε2- alleelilla on mahdollisesti taudilta suojaava vaikutus (Corder ym. 1994). APOE ε4 ei ole välttämätön, muttei myöskään riittämätön aiheuttamaan AT:n. (Bettens ym. 2013). Genin ym. (2011) esittävät että se on kohtalaisesti vallitseva geeni, joka periytyy semidominantisti eli osittain dominoivasti, joten kaikki ε4 kantajat eivät sairastu ja heterotsygooteilla on keskitason riski
sairastua verrattuna homotsygootteihin kantajiin. Apolipoproteiini E (ApoE) on tärkein
kolesterolin kuljettaja keskushermostossa. Kolesterolitasapainon ja AT:n välillä on geneettisten, epidemiologisten ja perustutkimusten mukaan patologinen yhteys. (Hardy ym.
2014). Geenin eri isomuotojen kyky kuljettaa kolesterolia vaihtelee, ε4- muodon kyky kuljettaa kolesterolia aivoissa on heikompi kuin ε3 muodon (Rapp ym. 2006). ε4-alleelin kantajilla myös aivoista ja selkäydinnesteestä mitatut ApoE kokonaispitoisuudet ovat pie-
15
nemmät, ja vähentynyt ApoE pitoisuus johtaa heikentyneeseen kolesterolin kuljetuskapasiteettiin (Riddell ym. 2008). Kolesterolimetabolia säätelee Aβ:n muodostumista ja Aβ voi
mahdollisesti suoraan säädellä kolesterolimetaboliaa aivoissa (Riddell ym. 2001, Liu ym.
2007). ApoE säätelee myös Aβ:n kasautumista ja hajoamista: ε4 muoto on vähemmän tehokas Aβ:n hajottamisessa, ja se myös sitoutuu siihen heikommin vähentäen Aβ:n poistoa
(Jiang ym. 2008, Deane ym. 2008). Vuoden 2009 jälkeen tietämys AT:n myöhäisemmän
muodon genetiikasta on parantunut merkittävästi koko genomin kattavien assosiaatiotutkimusten (GWA= Genome Wide Association Studies) myötä. Näiden tutkimusten avulla
on löydetty lukuisia uusia potentiaalisia riskigeenejä ja tautia mahdollisesti aiheuttavia
mekanismeja liittyen rasva-aineenvaihduntaan, immuunisysteemiin ja synapsien toimintaan (Bettens ym. 2013). Nämä mekanismit mahdollisesti osallistuvat amyloidin kasautumiseen ja poistamiseen, mutta niiden merkitys Aβ:n tasapainoon on vielä epäselvä (Lambert ja Amouyel 2011, Bertram ym. 2010). Toisin kuin varhaiseen muotoon kytkeytyvät
mutaatiot APP- ja PSEN- geeneissä, myöhäiseen muotoon liittyvien yleisten varianttien
riskivaikutus on verrattain pieni (Kuva 3.) Pienen riskivaikutuksen omaavien yleisten varianttien lisäksi on todennäköistä että on olemassa myös harvinaisempia suuren vaikutuksen omaavia geenejä, joita ei ole voitu löytää GWA- tutkimusten avulla, sillä niiden esiintyminen tautipopulaatiossa on liian pieni. Uuden sukupolven sekvensointimenetelmä
(NGS=Next Generation Sequencing) mahdollistaa tällaisten harvinaisten muutosten löytämisen ja siirtää tutkimuksen keskipisteen populaatiotasolta yksilöön (Hiltunen ym. 2013).
Suuri osa AT:n genetiikasta on kuitenkin vielä selvittämättä. Esimerkiksi myöhäiseen
muotoon liittyen on löydetty kaksi mahdollista harvinaista mutaatiota ADAM10 (ADAM
metallopeptidase domain 10) geenistä, mikä haastaa ajatuksen siitä että myöhäisen muodon
periytyminen koostuisi ainoastaan yleisistä varianteista (Tanzi 2012).
16
Sairastumisriski
Korkea
Keskitaso
Matala
Harvinainen
Yleinen
Yleisyys populaatiossa
KUVA 5. AT:n tunnettuja riskilokuksia. Muokattu lähde: Hardy ym. 2014. Kuten kuvasta
nähdään, ovat APP-, PSEN 1- JA PSEN2- geenien mutaatiot harvinaisia, mutta niiden riskivaikutus on sen sijaan suuri. APOE ε4 alleeli kahtena kappaleena (tummansininen) nostaa riskin korkeammaksi kuin yhtenä kappaleen perittynä (vaaleansininen). Vihreällä merkityt geenit omaavat pienen riskivaikutuksen, mutta ne ovat yleisiä. TREM2- mutaatiot
ovat suhteellisen harvinaisia ja niiden riskivaikutus on heterotsygootin APOE ε4 alleelin
luokkaa.
Koska uusia kandidaattigeenejä löytyy jatkuvasti, ovat Lars Bertram ja hänen kollegansa
perustaneet AlzGene.org- tietokannan kehityksen seurannan helpottamiseksi (Alzforum:
AlzGene.org, 2011). Uusimmassa GWA- tutkimuksessa löydettiin kaksi uutta lokusta
(TP53INP1 ja IGHV1- 67) sekä kolme uutta geeniä aiemmin löydettyjen SNP osumien
läheisyydestä. Kyseisillä löydöksillä on yhteys energia- aineenvaihdunnan, proteiinien hajoamisen ja immuunisysteemin kanssa, jotka puolestaan ovat AT:n tautiprosessin kannalta
keskeisiä toimintoja (Escott- Price ym. 2014).
2. 4 Uuden sukupolven sekvensointi menetelmät
17
2.4.1 Yleistä
Vuonna 2003 Human Genome Project (1990- 2003) julkaisi ensimmäisen kokonaan sekvensoidun ihmisgenomin, sisältäen noin 3 miljoonaa emäsparia ja noin 25 000 ihmisen
geeniä (International Human Genome Consortium 2004). Käytössä oli Sanger- sekvensointimenetelmä, ja projekti kesti useita vuosia maksaen lähes kolme miljardia Yhdysvaltain
dollaria (Illumina 2013a). Sanger- sekvensointi kuuluu niin kutsuttuihin ensimmäisen polven sekvensointimenetelmiin ja se oli hallitseva menetelmä lähes kahden vuosikymmenen
ajan. Vaikkakin sen osalta onnistuttiin tekemään joitain teknisiä parannuksia, tarve kehittää
tehokkaampia menetelmiä säilyi edelleen. Tämä johti lopulta uuden sukupolven sekvensointimenetelmien kehittämiseen. (Mezker 2010).
Sen jälkeen kun uuden sukupolven sekvensointimenetelmät kehitettiin vuonna 2007, kehitys on ollut nopeaa. Yhdellä sekvensointiajolla tuotettavan datan määrä on kasvanut eksponentiaalisesti. Sen lisäksi että tuotettavan datan määrä on paljon suurempi kuin mitä perinteisellä Sanger- sekvensoinnilla saadaan, on sekvensointi myös huomattavasti nopeampaa, kustannustehokkaampaa ja tarkempaa. Suurten datamäärien tuottaminen perustuu siihen että sekvensoidaan lukuisia pieniä DNA- fragmentteja eli kappaleita samanaikaisesti.
Lisäksi näytteiden yhdistäminen samaan reaktioseokseen mahdollistaa eri potilaiden näytteiden samanaikaisen sekvensoinnin ja käsittelyn (Illumina 2013a). Uuden sukupolven menetelmien tehokkuuden ansiosta on mahdollista päästä käsiksi sellaisille lääketieteen osaalueille minne aiempien tekniikkojen suorituskyky ei riittänyt. Uuden tekniikan avulla aikaansaatu datamäärän kasvu on luonut myös painetta kehittää riittävän tehokkaita ohjelmia
datan käsittelemiseksi. (Pavlopouluos ym. 2013).
NGS (Next Generation Sequencing)- menetelmät voidaan jakaa vielä tarkemmin toisen ja
kolmannen sukupolven laitteisiin. Toisen polven teknologiaa ovat kehittäneet useat yritykset kuten Illumina, Roche ja Bio systems/SOLiD (Palvopoulos 2013). Näistä käytetyimpiä
ovat Illuminan sekvensaattorit huolimatta siitä, että niiden avulla voidaan sekvensoida yhtäaikaisesti vähiten näytteitä muihin menetelmiin verrattuna (Luo ym. 2012). Kolmannen
polven menetelmiä ovat puolestaan kehittäneet Helico BioSciences-, Pacific Biosciences- ,
Oxford nanopore- ja Complete- yritykset ja niiden avulla ihmisgenomin sekvensoinnin
uskotaan nopeutuvan edelleen, jolloin puhutaan tunneista päivien sijaan. Lisäksi kustannusten odotetaan laskevan vielä alhaisemmiksi (Pavlopoulos ym. 2013). Kaikki edellä
mainitut tekniikat pitävät sisällään seuraavat vaiheet: näytteiden valmistelu, sekvensointi ja
18
kuvantaminen sekä datan analysointi. Eri teknologiat eroavat toistaan erityisten menettelytapojen osalta, joita käytetään edellä kuvattujen vaiheiden toteuttamiseksi (Metzker 2010).
2.4.2 Käyttömahdollisuudet
NGS- teknologian avulla voidaan suorittaa monipuolisesti erilaisia geneettisiä tutkimuksia.
Sen resoluutio eli erotuskyky ja kattavuus ovat säädettävissä, jolloin menetelmää voidaan
soveltaa palvelemaan kulloisenkin tutkimuksen tarkoitusta parhaalla mahdollisella tavalla.
Kattavuudella tarkoitetaan sitä kuinka monta kertaa kukin alkuperäisen DNA- näytteen
nukleotidi sekvensoidaan eli kuinka monta ”luentaa” siitä tuotetaan. Kattavuuden avulla
voidaan siis säädellä tutkimuksen resoluutiota. Esimerkiksi koko genomin kattavissa tutkimuksissa, missä tuotettavan datan määrä on suuri, voidaan resoluutio säätä pienemmäksi.
Jos taas halutaan tutkia tarkemmin jotain aluetta genomissa pitää resoluutio säätää korkeammaksi, jotta voidaan havaita erittäin matalalla esiintymistaajuudella esiintyviä harvinaisia mutaatiota.(Illumina 2013a).
NGS:n säädeltävyys on tuonut sille useita erilaisia käyttömahdollisuuksia. Sitä onkin hyödynnetty muun muassa evoluutiotutkimuksessa, populaatiogenetiikassa, mikrobiaalisessa
kartoituksessa, GWA- tutkimuksissa, vertailevassa genomiikassa, variantti analyyseissa,
geenien ilmenemisen tutkimisessa, epigenetiikassa ja monissa muissa (Pavlopoulos ym.
2013). Monipuoliset sovellusmahdollisuudet perustuvat pääasiassa siihen, miten geenikirjasto rakennetaan ja miten dataa käsitellään itse sekvensointi vaiheen pysyessä käytännössä
samana. Geenikirjaston rakentamiseksi löytyy useita eri menettelytapoja, jotka mahdollistavat koko genomin, lähetti-RNA:n, kohdennettujen alueiden kuten koodaavien alueiden,
proteiineja sitovien alueiden ja käyttäjän itse räätälöimien valikoitujen alueiden sekvensoinnin (Ilumina 2013a).
Koko genomin sekvensointi NGS- menetelmän mahdollistamalla tehokkuudella on mahdollistanut laajat GWA- tutkimukset ja siten useiden uusien potentiaalisten yleisten pienen
riskivaikutuksen omaavien geenien löytämisen. International Genomics of Alzheimer`s
Project (IGAP) on koonnut dataa neljästä suuresta GWA- tutkimuksesta, analysoinut dataa
useista eri näkökulmista, ja yleisten varianttien määrän odotetaan kasvavan edelleen näiden
analyysien myötä. Aiemmin pienempiä genomeita, kuten viruksia tai bakteereja, sekvensoitaessa ongelmaksi on muodostunut referenssi eli viitegenomien puute. NGS:n avulla
19
sekvensointi voidaan suorittaa sekä referenssigenomin avulla että de novo eli ilman referenssigenomia. (Illumina 2013a).
Kohdistetussa sekvensoinnissa valittu joukko geenejä tai määritellyt alueet sekvensoidaan
suurella resoluutiolla. Kyseistä menetelmää käytetään yleensä kun halutaan tutkia geneettisiä variaatioita populaation sisällä, jolloin sekvensoidaan useita yksilöitä yhdellä kertaa.
On olemassa kaksi eri tapaa rakentaa kirjasto kohdennettua sekvensointia varten: kohdennetun alueen rikastaminen tai amplikonien eli lyhyiden DNA- sekvenssien monistaminen
ja sekvensointi. Molemmissa valikoidut alueet monistetaan geenikirjastoa rakennettaessa,
tosin kohteen rikastamisessa suuremmat DNA- jaksot kuten kaikki koodaavat alueet eli
koko eksomi ovat mahdollisia, jolloin sekvensoitavan DNA:n määrä näytettä kohden on
oltava suurempi (Illumina 2013a). Koko eksomin sekvensointi on tehnyt mahdolliseksi
sellaisten pienten familiaalista AT:ia sairastavien sukujen genetiikan tutkimisen, jotka ovat
olleet liian pieniä aiemmilla menetelmillä tutkittaviksi. Toistaiseksi on tehty kaksi koko
eksomin sekvensointitutkimusta AT- potilaille, joista löytyi mutaatioita NOTC- ja VCPsekä SORL1- geeneistä (Bettens ym. 2013). Kohteen rikastamista varten tutkijat voivat
käyttää valmista menettelytapaa tai suunnitella itse omat alukkeet, jolloin on mahdollista
sekvensoida vain tutkimuksen kannalta keskeiset alueet(Illumina 2013a). NGS mahdollistaa kaikkien neurodegeneratiivisiin sairauksiin vaikuttavien variaatioiden yhtäaikaisen tarkastelun ja tulevaisuudessa mahdollisesti myös yksilöllisen hoidon, joka kohdistuu molekulaarisiin mekanismeihin (Bettens ym. 2013).
Tutkittaessa yhden geenin aiheuttamia mendeliaanisia periytymissääntöjä noudattavia sairauksia, käytetään usein koko eksomin sekvensointia, sillä se on huomattavan paljon halvempaa kuin koko genomin sekvensointi. Suurin osa AT:n kausaalisista mutaatiosta sijaitseekin eksomissa. On kuitenkin mahdollista että myös ei- koodaavat variantit nostavat neurodegeneratiivisten sairauksien riskiä. Lisäksi koko genomin sekvensointi kattaa paremmin
koodaavat alueet kuin koko eksomin sekvensointi. Koko genomin sekvensoinnissa on kuitenkin omat haasteensa, sillä yhdessä genomissa useita miljoonia yhden nukleotidin polymorfioita (SNP= Single Nucleotide Polymorphism), jolloin huolellinen tutkimuksen suunnittelu ja potilaiden valinta on oleellista (Cirulli ym. 2011, Bettens ym. 2013).
20
3. AINEISTO JA MENETELMÄT
3.1 Tutkimustarkoitus
Tässä tutkimuksessa käytettiin Rochen SeqCap- menetelmää näytekirjaston rakentamiseksi
sekä Illuminan MiSeq- teknologiaa sekvensoinnissa. Tutkimuksessa oli mukana viisi potilasnäytettä, joilla tiedettiin olevan AT:ia aiheuttava kausaalinen mutaatio APP tai PSEN1
geenissä. Kustomoidun neuropaneelin avulla sekvensointiin joukko neurologisiin sairauksiin ja häiriöihin liittyviä geenejä, kyseessä oli siis kohdistettu sekvensointi. Tarkoituksena
oli tutkia menetelmän toimivuutta eli löydetäänkö kyseiset mutaatiot käytössä olevan menetelmän avulla, kuinka hyvä lukusyvyys saavutetaan, ja paljonko eri variaatioita löydetään eri näytteillä.
3.2 Tutkimusmateriaali
Tutkittavana olivat viisi eri näytettä (neljä miestä ja yksi nainen) suomalaisista AT- suvuista, joista kahdessa (APPa-b) oli aiemmin havaittu APP- duplikaatio ja kolmessa (PSEN1ac) Pro264Leu- mutaatio PSEN1- geenissä (taulukko 1). PSEN1- geenin mutaatiota kantavat henkilöt ovat samasta familiaarista AT:ia sairastavasta suvusta (Martikainen ym. 2009).
Huolimatta samasta kausaalisesta mutaatiosta heidän fenotyyppinsä eli ilmiasunsa ovat
erilaiset. APP- duplikaatio tapaukset puolestaan ovat sisaruksia, joilla molemmilla on todettu perinnöllinen AT ja cerebraalinen amyloidi angiopatia (CAA) eli aivojen verisuonten
seinämien amyloidikertymä (Remes AM ym 2008). Kaikissa tapauksissa oireet ovat alkaneet alle 65 vuotiaana. Kahdella tapauksista on APOE-geenin ε4 alleeli heterotsygoottisena
ja muilla ε3-alleeli homotsygoottisena.
21
TAULUKKO 1. Tutkimuksessa käytetyt näytteet.
Näyte
Muutos
Ikä
Sukupuoli
PSEN1a
Pro264Leu
oireiden
al- mies
kamisikä:46v,
kuollut 65 v.
PSEN1b
Pro264Leu
oireiden
al- mies
kamisikä:58v,
kuollut 75 v
PSEN1c
Pro264Leu
mies
Fenotyyppi/ status
APOE
Masennus 46 vuotiaana, kah- 3/4
dessa vuodessa MCI, vainoharhaisuus, kankeus ja hyperrefleksia. Oireet eivät täytä
tyypillisiä AT:n kriteereitä,
mahdollinen Lewyn kappale
dementia.
Vaikea dementia 10 vuoden 3/4
kuluessa oireiden alkamisesta, hyperrefleksia, ylemmän
motoneuronin vaurioon viittaavat oireet. Oireet täyttävät
AT:n kriteerit.
3/3
22
APPa
APPkaatio
dupli- 49 v. oireita 4- mies
5 v. aiemmin
APPb
APPkaatio
dupli- 60 v., oireita 5 nainen
v. aiemmin
Lieviä oppimisen- ja muisti- 3/3
vaikeuksia: MMSE 22/30,
oireet eivät etene tasaisesti:
vaskulaarinen komponentti
Oppimisen- ja muistivaikeuk- 3/3
sia, MMSE 17/30, jatkuvasti
etenevä kognitiivinen heikentyminen.
3.3 Menetelmät
3.3.1 DNA- kirjaston rakentaminen
Tässä tutkimuksessa DNA- kirjaston rakentamiseksi käytettiin Rochen Nimlegen SeqCap
EZ library SR (version 4.2) kirjasto-työkaluja ja siihen kuuluvaa protokollaa (Roche NimbleGen 2013). Kyseinen menetelmä sopii kohdistettuun sekvensointiin, missä tarkastellaan tutkimuksen kannalta kiinnostavia alueita korkealla resoluutiolla. Kohdistetussa sekvensoinnissa voidaan sekvensoida joko tautiin liittyviä alueita, tautiprosessiin liittyviä geenejä tai koko eksomi eli kaikki koodaavat alueet eli eksonit (Roche Diagnostics GmbH
2013a). Lisäksi tässä tutkimuksessa käytettiin Rochen SeqCap EZ Neurology Panel Design- alukkeita spesifisten alueiden rikastamiseksi (Roche Diagnostics GmbH 2013b ).
Kyseinen paneelin avulla voidaan sekvensoida 256 eri geeniä, jotka liittyvät 87:ään eri
neurologiseen sairauteen tai häiriöön, lisäksi paneeliin lisättiin 22 omaa kustomoitua aluketta.
DNA- kirjaston rakentaminen aloitetaan pilkkomalla genominen kaksijuosteinen DNA
pienemmiksi kappaleiksi eli fragmenteiksi (kuva 6). Tämä voidaan tehdä vaihtoehtoisesti
joko entsymaattisesti tai mekaanisesti. Tässä tapauksessa DNA pilkottiin mekaanisesti sonikaattorilla, missä hyödynnetään ääniaaltojen energiaa. Fragmenttien koon säätely perustuu siihen, miten pitkän aikaa niitä sonikoidaan. Tavoitteena on pilkkoa DNA 100- 500
emäsparia pitkiksi kappaleiksi. Sonikoinnin jälkeen fragmenttien kokojakauma tarkistetaan
Bioanalyzer- menetelmällä (Agilent Technologies 2013).
23
KUVA 6. DNA:n pilkkominen. Lähde Illumina ® 2013b.
Pilkkomisen jälkeen fragmenttien päät tasataan ja 5’-päät fosforyloidaan protokollan mukaan sekä suoritetaan fragmenttien pesu käyttäen magneettisia DNA:n sitomiseen tarvittavia helmiä (kuva 7). Helmien toiminta perustuu siihen, että DNA- fragmentit tarttuvat helmien pintaan, jotka puolestaan tarttuvat magneettiin muuttuessaan magneettisiksi magneettikentässä (kuva 8). Tällöin halutut fragmentit saadaan kerättyä talteen kun taas muut liuoksen komponentit voidaan huuhtoa turvallisesti pois. Lisäksi fragmenttien 3’-päihin kiinnitetään adeniini- emäshännät (poly-A-hännät), ja toistetaan pesu helmien avulla. Fosforylointi ja adeniini- emäksien liittäminen mahdollistavat niin kutsuttujen adaptereiden kiinnittämisen fragmenttien päihin. Lisäksi tässä vaiheessa poistetaan erittäin pitkät fragmentit
SPRI (Solid Phase Reversible Immobilisation)- menetelmällä, jossa PEG (Polyetyleeni
glykoli)/ NaCl (natriumkloridi)- liuoksen viskositeettiin ja tiheyteen sekä magneettisiin
helmiin perustuvan menetelmän avulla voidaan napata talteen halutun kokoisia fragmentteja.
24
KUVA7. Fragmenttien päiden tasaus (sininen uloke), 5’-fosforylointi ja 3’-poly-A- häntien
kiinnitys. Lähde Illumina ® 2013b.
Helmien lisääminen
Helminen kiinnittyminen Pesut ja fragmenttien
Helmet sitoutuvat
magneettiin ja muiden
irrotus nesteeseen
DNA- fragmentteihin
komponenttien poisto
KUVA 8. Pesu magneettisten helmien avulla. Lähde Albertoni ym. 2011.
Edellä mainittujen vaiheiden jälkeen fragmentit ovat valmiit adaptereiden kiinnitystä varten (kuva 9). Adaptereiden päissä on tymiini- emäkset, jotka ovat komplementaarisia
fragmentteihin kiinnitettyihin adeniini- emäksiin. Adapterit sisältävät myös niin kutsutut
indeksit, jotka ovat 6 emäksen mittaisia spesifisiä tunnisteita, joiden avulla tutkimuksessa
olevat eri näytteet voidaan erottaa toisistaan sekvensointivaiheessa. Lisäksi adapterit sisältävät alueet, joilla ne kiinnittyvät sekvensointivaiheessa käytettävän reaktiolevyn (flow
cell) pinnalla oleviin oligopareihin tuhansien monistettujen DNA fragmenttien eli klustereiden muodostamisvaiheessa sekä sitomiskohdat sekvensointireaktion aloitusta varten.
Adaptereiden liittämisen jälkeen sellaiset fragmentit, joiden molempiin päihin adapterit
eivät ole sitoutuneet, poistetaan käyttäen helmiä ja PEG/ NaCl- liuosta.
25
KUVA 9. Adapterirakennelma. Lähde Illumina 2013b. Adapterit kiinnitetään fragmentteihin (DNA insertit). Adapterit sisältävät indeksit (index 1 ja index 2), lyhyet alueet sekvensointia varten (Rd1 SP ja Rd2 SP) sekä reaktiolevyn oligopareihin kiinnittyvät alueet (P5 ja
P7).
Adapterien lisäämisen jälkeen suoritetaan fragmenttien koon valinta PEG/ NaCl - liuoksen
ja helmien avulla. Liian pitkät ja lyhyet fragmentit poistetaan kirjastosta ja tavoitteena on
napata talteen 250- 450 emäsparia pitkät fragmentit, jotka ovat sopivia sekvensointiin. Ensin poistetaan 450 emäsparia tai sitä pidemmät fragmentit, jolloin liuokseen jää tätä lyhyemmät ja ehjät fragmentit. Seuraavaksi fragmentit siirretään uuteen putkeen helmien kanssa ja 250 emäsparia ja sitä lyhemmät fragmentit poistetaan, suoritetaan pesuvaiheet ja
fragmentit irrotetaan helmistä. Vain noin 20 prosenttia alkuperäisen DNA-kirjaston fragmenteista on halutun kokoisia, joten jäljelle jääneiden fragmenttien määrää lisätään monistamalla PCR:llä seitsemän syklin verran käyttäen universaaleja alukkeita. PCR monistuksen jälkeen fragmentit pestään etanolilla ja SeqCap EZ- puhdistushelmillä. Helmien ja
DNA- fragmenttien annetaan kuivaa pesun jälkeen ja pelletti liuotetaan veteen. Fragmenttien koko tarkastetaan lopuksi Bioanalyzerilla (Agilent Technologies 2013) (kuva10).
26
KUVA 10. Fragmenttien koon tarkastus Bioanalyzerilla. Lähde Illumina 2013b. Fragmenttien koon pitäisi olla 250- 450 emäsparia.
Tähän asti eri henkilöiden näytteitä on käsitelty erikseen. Kun adapterit indekseineen on
kiinnitetty eri näytteiden fragmentteihin, näytteet voidaan yhdistää samaan putkeen, mikä
tehostaa työskentelyä. Rakennettu DNA kirjasto hybridisoidaan eli annetaan reagoida spesifisten geenialukkeiden kanssa. Ennen hybridisaatiota geenikirjastoon lisätään hybridisaatiota avustavia komponentteja, kuten universaaleja alukkeita ja indeksi-alueen alukkeita
sekä COT- DNA. Alukkeet estävät adaptereiden tarttumisen toisiinsa ja COT- DNA puolestaan sitoutuu vaikeasti sekvensoitaviin DNA- jaksoihin. Tämän jälkeen DNA kirjasto
kompleksi kuivataan vakuumikonsentraattorilla.
Kuivauksen jälkeen kompleksiin lisätään hybridisaatiopuskuri ja denaturoidaan DNAfragmentit, minkä jälkeen lisätään spesifiset biotinyloidut alukkeet ja inkuboidaan 64- 72
tuntia. Spesifiset alukkeet on suunniteltu siten, että saadaan napattua tutkimuksen kannalta
kiinnostavat alueet sekvensoitavaksi. Tässä tapauksessa käytössä olleen SeqCap EZ Neurology Panel Design- alukkeiden avulla napattiin sekvensoitavaksi neurologisiin sairauksiin
liittyviä geenejä. Alukkeet tarttuvat niiden sekvenssiä vastaavaan kohtaan geenikirjastossa.
Sellaiset fragmentit, joihin alukkeet ovat kiinnittyneet sisältävät niin kutsutun biotiinileiman. Biotiinileiman sisältävät alukkeet tarttuvat streptavidiini- helmiin, jotka puolestaan tarttuvat magneettiin. Useiden pesuvaiheiden jälkeen jäävät jäljelle vain sellaiset
fragmentit, joihin spesifiset alukkeet ovat tarttuneet (kuva 11). Pesun jälkeen monistetaan
napatut fragmentit PCR:llä, ja pestään käyttäen etanolia ja magneettisia helmiä. Saatu pelletti liuotetaan TE- puskuriin ja fragmenttien koko mitataan Bioanalyzerilla sekä konsentraatio tarkastetaan Nanodropilla.
27
Spesifinen aluke
Biotiini-leima
Streptavidiini- helmi
.
KUVA 11. Kohteen rikastaminen. Muokattu lähde: Illumina 2013a. Genomista voidaan
valikoida alueita sekvensoitavaksi (violetilla merkitty fragmentti) alukkeiden avulla, jotka
tarttuvat niiden emäsjärjestystä vastaaviin kohtiin DNA kirjastossa. Alukkeet ja niihin sitoutuneet DNA- fragmentit tarttuvat magneettisiin helmiin, jotka puolestaan tarttuvat magneettiin. Muu osa DNA- kirjastosta (harmaalla merkityt fragmentit) huuhtoutuu pois, jolloin saadaan napattua sekvensoitavaksi vain tutkimuksen kannalta kiinnostavat alueet.
3.3.2. Klustereiden muodostaminen MiSeq- sekvensointilaitteella
Käytössä oli Illuminan MiSeq sekvensointilaite, joka sopii hyvin kohdennettuun sekvensointiin ja MiSeq- Reagent Kit v3- asetelma (reaktiolevy ja reagenssit), joka mahdollistaa
300 emäsparia pitkien DNA juosteiden lukemisen/sekvensoinnin (Illumina 2014). Sekvensointi alkaa klustereiden eli yksittäisten DNA-pylvässarjojen muodostumisella reaktiolevyn pinnalla oleviin alukkeisiin (kuva 12). Yksijuosteiset DNA-fragmentit kiinnittyvät
adaptereissa olevien sekvenssien avulla reaktiolevyn pinnan alukkeisiin, missä DNA- polymeraasi ja leimaamattomat nukleotidit rakentavat niistä kopioita. Alkuperäiset juosteet
huuhdotaan pois. Jäljelle jäänyt juoste, joka on kiinni reaktiolevyssä, kiinnittyy toisesta
päästään reaktiolevyn alukkeeseen ja siitä rakennetaan kopio. Sekä mallina toimiva juoste
että syntyvä kopio ovat toisesta päästään kiinni reaktiolevyn pinnassa, jolloin muodostuu
kaksijuosteisia siltoja, ja vaihetta kutsutaankin silta monistumiseksi (bridge amplification).
Kun juosteet denaturoidaan, tulee niistä jälleen yksijuosteisia, ja ne voivat puolestaan
muodostaa rinnalleen uuden kopion. Tämä sama tapahtuma toistuu lukuisia kertoja muodostaen levyn pinnalle satoja miljoonia klustereita (Illumina 2008).
28
A
C
B
.
D
KUVA 12. Klustereiden muodostuminen reaktiolevyn pintaan. Muokattu lähde: Illumina
2008.
A. Yksijuosteiset DNA- fragmentit sitoutuvat reaktiolevyn kanavien sisäpintaan, missä
sijaitsevat alukkeet (Dense Lawn Primers).
B. Fragmentit tarttuvat toisesta päästään reaktiolevyn alukkeisiin ja polymeraasientsyymi
muodostaa leimaamattomista nukleotideista vastaavan juosteen alkuperäisen rinnalle. Molempien fragmenttien juosteet ovat toisesta päästään kiinni reaktiolevyn pinnalla (attached
terminus) ja toiset päät ovat vapaina (free terminus).
C. Denaturaatiovaiheessa juosteet oikenevat suoraksi ja irtoavat toisistaan jääden edelleen
kiinni reaktiolevyn pintaan (attached).
D. Edellä mainitut vaiheet toistuvat lukuisia kertoja ja useassa kohdassa samanaikaisesti,
jolloin muodostuu miljoonia klustereita (clusters) kuhunkin reaktiolevyn kanavaan.
29
3.3.3 Sekvensointi synteesin kautta
Klustereiden muodostumista seuraa itse sekvensointi, joka tapahtuu synteesin kautta (SBS
Sequencing by synthesis). NGS:n perusidea on sama kuin Sanger- sekvensoinnin: mallijuosteen perusteella uudelleen syntetisoituvat DNA-fragmentit lähettävät kustakin fluoresoivasta emäksestä tiedon, jonka perusteella niiden emäsjärjestys saadaan selville. NGS:ssa
tämä tapahtuu reaktiolevyn kanavissa sijaitsevissa sadoissa miljoonissa klustereissa samanaikaisesti, mikä mahdollistaa nopean ja tehokkaan sekvensoinnin (Illumina 2008). Ensimmäiseksi klustereiden käänteiset juosteet huuhdotaan pois ja sekvensointi aloitetaan
jäljelle jääneistä suorista juosteista. Sekvensointi alkaa sekvensointialukkeen tarttuessa
mallijuosteeseen. Sitoutunut leimattu nukleotidi estää polymerisaation, ja kun emäs on
luettu, se irtoaa kemiallisesti, jolloin seuraava sekvensointisykli eli kierros voi alkaa (kuva13). Sekvensointi sykli jatkuu kunnes kaikki juosteen emäksen on luettu. Seuraavaksi
luetaan indeksit. Tämän jälkeen muodostetaan käänteiset juosteet polymerisaation kautta ja
alkuperäiset huuhdotaan pois. Myös käänteiset juosteet sekvensoidaan samalla tavalla kuin
alkuperäiset. Tällöin juosteet luetaan molemmista päistä, mikä vähentää aukkoja ja muita
sekvensointivirheitä (Illumina 2014b).
30
KUVA 13. Sekvensointi synteesin kautta. Lähde Illumina, Schroth 2012. Sekvensoinnissa
mallijuosteen perusteella syntetisoituvaan juosteeseen liittyvät nukleotidit lähettävät fluoresoivan signaalin laserin virittämänä, mikä perusteella mallijuosteen emäjärjestys tunnistetaan.
Eri näytteet voidaan erotella adaptereihin liitettyjen indeksien avulla. Indeksien emäsjärjestys tunnetaan entuudestaan, jolloin eri potilaiden näytteet voidaan erotella sekvensointivaiheessa. Referenssi genomin pohjalta yksittäiset fragmentit järjestellään yhtenäiseksi kokonaisuudeksi (Illumina 2013a).
3.4 Analysointi vaihe
MiSeq- sekvensaattorilla tuotettu datamäärä vaatii tehokkaita työkaluja sen käsittelemiseksi. Sekvensoidut lyhyet fragmentit järjestellään referenssi genomin perusteella yhdeksi
kokonaisuudeksi siihen tarkoitetun työkalun avulla. Lisäksi käytetään varianttien etsintään
internet pohjaisia työkaluja (variant caller), jotka tunnistavat variantit ja genotyypin. Näitä
työkaluja on olemassa useita erilaisia ja varianttien havaitsemisen tarkkuuden parantamiseksi voidaan käyttää useita yhdessä. Näiden ohjelmien avulla saatua tietoa voidaan tarkastella visualisointi työkalun, kuten Integrative Genomics Viewer (IGV) avulla (Xiangtao
ym. 2013)
IGV on vapaasti ladattavissa oleva visualisointi työkalu, jolla on hyvä suorituskyky, ja
jolla voidaan tutkia interaktiivisesti laajoja integroituja genomisia data-aineistoja. Se soveltuu monille erilaisille data tyypeille mukaan lukien NGS- aineistot. NGS:n tuottaman suuren datamäärän analysointi on rajoittava tekijä monissa tutkimuksissa. Vaikkakin suuri osa
analyysista voidaan suorittaa automatisoidusti, ovat ihmisten tekemät analyysit ja arviot
nopean visualisoinnin mahdollistamina tärkeitä monimutkaisten biologisten suhteiden havainnollistamiseksi. IGV mahdollistaa datan reaaliaikaisen tarkastelun emäsparien tasolta
aina koko genomin tasolle (Thorvaldsdóttir ym. 2012).
On olemassa myös muita työkaluja genomista tuotetun datan visualisoimiseksi kuten Tablet, BamView, Savant ja Artemis (Carver ym. 2010, Fiume ym. 2010, Rutherford ym.
2000). Tärkein IGV:n muista erottava tekijä on sen laajuus (breadth). Koska se on kehitetty
useiden eri datatyyppien käsittelyä varten, voidaan eri datatyyppejä kuten NGS-dataa ja
variantti analyyseja joustavasti yhdistää sekä keskenään että metadatan kuten kliinisen da-
31
tan kanssa. Toinen IGV:n erottava tekijä on, kyky näyttää useiden eri genomisten alueiden
dataa samanaikaisesti erillisissä vierekkäisissä ruuduissa, esimerkiksi toisiinsa kytkeytyviä
tapahtumia eri alueilta (Thorvaldsdóttir ym. 2012).
4. TULOKSET
Sekvensoinnin tuloksena havaittiin noin 2000 variaatiota kustakin viidestä näytteestä. Dataa voidaan tarkastella useiden eri muuttujien avulla, joita on esitetty taulukossa 2, esimerkkinä näyte, jossa PSEN1- mutaatio. Muuttujien avulla suurta datamäärää voidaan lajitella eri tavoin, jolloin aineiston käsittely ja tutkiminen on helpompaa. Tieto variaatioiden
luonteesta ja ominaisuuksista haetaan automaattisesti eri lähteistä käyttäen genomityökaluja, kuten GATK (the genome analysis toolkit), Atlas2, mpileup tai näiden yhdistelmiä, jolloin tieto kyseisestä variaatiosta on useamman variaatioita etsivän ja tunnistavan ohjelman
tuottaman datan summa, josta käytetään termiä intersection.
Jos muuttujalla on rs-numero, voidaan sen avulla hakea tietoa eri tietokannoista, ja vastaavasti HGMD (Human Gene Mutation Database)- koodin avulla voidaan etsiä tietoa etenkin
variaatioista, joissa on mutaatio kyseisestä tietokannasta. Esimerkissä on kyse yhden nukleotidin vaihdoksesta (SNP= Single Nucleotide Polymorphism), missä sytosiini (C) on
muuttunut tymiiniksi (T). Sytosiini on siis referenssiemäs ja tymiini muuttunut emäs. Kyseinen muutos on ei- synonyyminen eli se muuttaa aminohapposekvenssiä. Synonyyminen
32
variaatio puolestaan ei vaikuta aminohapposekvenssiin. Muita variaatiotyyppejä ovat esimerkiksi insertio ja deleetio. Emästen osuudet kertovat kuinka monta luentaa kustakin
emäksestä on tehty. Esimerkissä sytosiini on luettu 167 kertaa ja tymiini 156 kertaa. HETarvo kertoo, onko jakauma heterotsygoottinen, ja kannattaako sitä siis tarkastella lähemmin. HET voi saada arvon 0 tai 1, tässä tapauksessa HET on yksi, jolloin kyse on heterotsygoottisesta muutoksesta. Havainnon merkittävyysastetta kuvataan termeillä Moderate,
Modifier ja Low, joista Moderate on korkein. Variaatiot, joissa on tunnettu mutaatio tai
jotkin 5’ säätelyalueen polymorfiat saavat Moderate merkinnän, tavalliset polymorfiat,
deleetiot, insertiot saavat Modifier ja synonyymiset muutokset tai heikommin luetut Low
merkinnän. PASS termi kertoo siitä, että muutoksen luenta on riittävän hyvänlaatuinen ja
se on läpäissyt käyttäjän muokkaamat tai koneen oletus asetukset variaatioiden luennalle.
TAULUKKO 2 Havainnollistavia muuttujia datan käsittelyyn.
Muuttuja
geeni
rs- numero / ID
referenssi nukleotidi
muuttunut nukleotidi
kromosomi
paikka kromosomissa
HGMD- tietokanta
variaatiotyyppi
emästen osuudet (A, C, G, T)
variantin etsintä ohjelma/ variant caller
variaation sijainti
Laatu arvo= havainnon merkittävyys (MODERATE, MODIFIER, LOW)
HET
Filtteri
Esimerkki
PSEN1
rs63750301
C
T
chr14
73664760
CM951078
SNP
0, 167, 0, 156 (luennat)
Intersection
Non- synonymous
MODERATE
1
PASS
Kirjaston rakentamisen ja sekvensoinnin onnistumisen tuloksia voidaan tarkastella niin
kutsuttujen hyvyysarvojen avulla, jota kertovat tuotetun datan laadusta ja määrästä. Sekvensoinnin hyvyysarvoja kullekin viidestä näytteestä on esitetty taulukossa 3. Keskimää-
33
räinen luentasyvyys voidaan lukea joko kaikista luetuista tai yksittäisistä kromosomien
variaatiomuutoskohdista keskiarvolaskentana. Totaali luentojen määrä näytteiden välillä
vaihtelee 4,42- 5,42*108. Keskimääräiset luennat emästä kohden kussakin näytteessämme
ovat 232- 285 luentaa, kun se määritetään kaikista variaatiokohdista keskiarvolaskentana.
Emästen osuus, jotka on luettu vähintään 15 kertaa, vaihtelee 98,8 prosentin ja 99 prosentin
välillä. Havaittuja variantteja löydettiin 1996- 2040 kpl. Näistä 89,3- 91,2 prosenttia läpäisivät filtterin eli olivat laadultaan riittävän hyviä. Filtteröinti tulkitsee sellaiset variantit,
joita ei ole luettu tarpeeksi monta kertaa joko matalaksi (low-coverage) tai huonolaatuiseksi (poor-quality).
TAULUKKO 3 Sekvensoinnin hyvyysarvoja
Näyte
totaali
ka.
15 %
variantit
filtteri
PSEN1a
5,42*108
285
99
2040
89,3
PSEN1b
4,72*108
248
98,8
2014
89,6
PSEN1c
4,42*108
232
98,9
1996
90,4
APPa
4,66*108
245
98,9
2002
89,9
APPb
4,50*108
236
98,8
2001
91,2
Taulukon lyhenteiden selitykset: Totaali= totaali luentojen määrä näytettä kohden. Ka=
keskimääräiset luennat emästä kohden kussakin näytteessä. 15 %= niiden emästen osuus
prosentteina jotka luettu vähintään 15 kertaa. Variantit= havaittujen varianttien lukumäärä
34
kussakin näytteessä. Filtteri= sellaiset variantit, jotka on luettu tarpeeksi monta kertaa, ja
joiden luennan laatu on riittävän hyvä ilmoitettuna prosentteina.
5. POHDINTA
NGS- menetelmän avulla sekvensointi on aiempaa tehokkaampaa: tuotettavan datan määrä
on kasvanut, kustannukset laskeneet ja työhön käytettävän ajan määrä vähentynyt. Näytteiden yhdistäminen eli multipleksaus mahdollistaa useiden näytteiden samanaikaisen valmistelun ja sekvensoinnin, mikä tehostaa työskentelyä (Luthra ym. 2014). Vaikkakin sekvensoinnin kustannukset ovat laskeneet, on koko genomin sekvensointi edelleen suhteellisen
kallista. Siksipä joissain tapauksissa on järkevämpää sekvensoida vain koodaavat alueet tai
valikoida spesifisten alukkeiden avulla vain tutkimuksen kannalta keskeisiä geenejä sekvensoitavaksi. (Chilamakuri ym. 2014). Tässä tutkimuksessa käytettiin Rochen neuropaneelia, jonka avulla sekvensoitiin hermostollisin sairauksiin ja häiriöihin liittyviä geenejä. Tällöin voitiin tarkastella AT:n genetiikan kannalta keskeisiä geenejä.
Vaikkakin tietämys AT:n monimutkaisesta genetiikasta on lisääntynyt viime vuosina, liittyy sairauteen vielä mahdollisesti tuntemattomia geneettisiä komponentteja. NGS:n mahdollistamat koko genomin laajuiset assosiaatiotutkimukset ovat paljastaneet lukuisia uusia
riskigeenejä. Nämä geenit ovat yleisiä ja niiden riskivaikutus on pieni. Harvinaisempien
muutosten havaitseminen kuitenkin vaatii tarkempaa sekvensointia (Bettens ym. 2013).
Kohdennetun sekvensoinnin avulla voidaan havaita sellaisia mutaatioita, joiden esiintymistaajuus väestössä on liian pieni havaittavaksi aikaisemmilla laitteilla ja menetelmillä. Sekvensoinnin resoluutio eli tarkkuus onkin säädettävissä sen mukaan, miten tarkkaan genomin eri alueita halutaan tarkastella. Kohdennetussa sekvensoinnissa kohdealueelta tuotetaan enemmän luentoja eli sekvensoinnin syvyys on suurempi ja tulosten luotettavuus parempi. (Illumina 2013a).
NGS- laitteiden tehokkuus tuo mukanaan omat haasteensa. Tuotettavan datan määrä on
suuri, jolloin tarvitaan tehokkaita ohjelmia datan käsittelemiseksi ja analysoimiseksi. Tulosten purkaminen on jossain määrin vaivalloista, sillä käytössä ei ole varsinaista avustetta
sitä varten. Toisaalta dataa voidaan lajitella eri muuttujien avulla, mikä helpottaa datan
käsittelyä ja analysointia. Datan analysointityökalujen kehittymisen myötä saadaan mahdollisesti vielä enemmän hyötyä NGS- laitteiden kapasiteetista. Vaikka itse sekvensointi
on tehokasta ja suurelta osin automatisoitua, on geenikirjaston rakentaminen käyttämämme
35
asetelman osalta edelleen suhteellisen työlästä ja aikaa vievää. Lisäksi jotkin vaiheet kuten
sonikointi vaativat suurta tarkkuutta ja huolellisuutta DNA fragmentoinnissa.
MiSeq- sekvensaattorin kyky havaita variantteja on hyvä. Tämän ansoista sillä voidaan
mahdollisesti löytää uusia mutaatioita jo aiemmin tautiin yhdistetyiltä alueilta. Meidän
kolme potilasnäytettä sisälsi PSEN1 mutaation ja tämä mutaatio saatiin varmennettua tällä
tekniikalla. Tosin APP- duplikaatioita ei voitu havaita, sillä käyttämällämme protokollalla
voidaan tarkastella vain laadullisia eli kvalitatiivisia ominaisuuksia, jolloin kvantitatiivisia
ominaisuuksia kuten koko geenin duplikaatioita ei voitu havaita. Yhteensä havaittiin noin
2000 eri varianttia yleisistä polymorfioista mutaatioihin eksoneissa ja geenien säätelyalueilla. NGS:n ominaisuudet: pienemmät kustannukset, näytteiden multipleksaus ja suuri
kapasiteetti mahdollistavat useiden kiinnostuksen kohteena olevien geenien yhtäaikaisen ja
tarkennetun sekvensoinnin. (Luthra ym. 2014). Esimerkiksi voidaan tarkastella lukuisia
neurodegeneratiivisiin sairauksiin liittyviä geenejä, jolloin on mahdollista kehitellä yksiöllisiä hoitomenetelmiä, eteenkin kun taudin molekulaarisiin mekanismeihin perustuvat hoitomuodot tulevat mahdollisiksi. Lisäksi NGS- teknologiasta uskotaan olevan hyötyä potilaiden biomateriaalien lajittelussa ja geneettisessä diagnosoinnissa (Bettens ym. 2013).
MiSeq:n sekvensointi tulosten toistettavuus on hyvä. Koska MiSeq vaatii suhteellisen vähän työaikaa ja on tarkka varianttien havaitsemisessa, on sillä potentiaalia toimia myös
kliinisessä käytössä (Luthra ym. 2014).
Tässä tutkimuksessa MiSeq- sekvensaattorilla saatujen keksimääräisten luentojen määrässä
näytettä kohden ei ole suurta vaihtelua. Kaikissa näytteissä vähintään 15 kertaa luettujen
emästen osuus on noin 99 prosenttia, eli luennan tarkkuus on erittäin hyvä, ja sekvensointituloksia voidaan pitää luotettavina. Havaittujen varianttien määrä eri näytteissä oli suhteellisen tasainen samoin kuin keskimääräiset luennat näytettä kohden.
Chilamakuri ym. (2014) vertailivat tutkimuksessaan neljää eri koko eksomin kaappaus
teknologiaa. Vertailussa olivat Illuminan TruSeq Exome Enrichment-, Rochen NibleGen
SeqCap EZ Exome Library-, Agilentin SureSelect Human All Exon- ja Illuminan Nextera
Exome Enrichment- asetelmat. Vaikka kyseessä olivat koko eksomin sekvensointiin tarkoitetut asetelmat, voidaan tutkimuksen tuloksia käyttää suuntaa antavina tarkasteltaessa
oman sekvensoinnin tuloksia. Tutkimuksessa kaikki eksomin kaappaus teknologiat osoittautuivat hyvin toimiviksi, mutta niiden välillä on myös eroja. Agilent kattoi suurimman
osuuden kohde alueistaan (99,8 %) ja Nextera puolestaan pienimmän osuuden (96,5 %).
36
Tämän uskotaan osittain selittyvän Agilentin pienemmillä kohde alueilla. Myös filtterin
läpäisseiden luentojen määrä oli suurin Agilentilla (71,7 %) ja pienin Nexteralla (40,1 %).
NibleGenilla vastaava osuus oli 66,0 %. NibleGen puolestaan kaappasi suurimman osuuden yhden nukleotidin varianteista (SNV= Single Nucleotide Variant), kun havaittujen
varianttien määrä suhteutetaan teknologian kohdealueen kokoon. Kaikkien teknologioiden
toistettavuus oli hyvä, eikä siinä havaittu suurta eroa. Tutkimustuloksia Rochen neuropaneelin käytöstä ei toistaiseksi ole saatavilla kirjallisuudessa. Valittaessa sopivaa teknologiaa kohdennettua sekvensointia varten on otettava huomioon kohdealueen DNA pitoisuus,
lähtömateriaaliksi vaadittavan DNA:n määrä, kirjaston rakentamiseen vaadittu työmäärä ja
reagenssien kustannukset halutun sekvensointi syvyyden saavuttamiseksi.
VIITTEET
Agilent Technologies (2013).Agilent 2100 Bioanalyzer System- Secure experimental success Luettu 11.8.2014. www.chem.agilent.com/library/Brochures/5991-3323EN.pdf
Albertoni G, Arnoni C, Araujo P ym. Magnetic bead technology for viral RNA extraction
from serum in blood bank screening. Braz J Infect Dis 2011; 15(6): 548- 52.
Alzforum
(2011):
AlzGenewww.alzgene.org/TopResults.asp
Top
Results.
(Päivitetty
Alzheimer`s Association (2014). What Is Alzheimer's?
www.alz.org/alzheimers_disease_what_is_alzheimers.asp
Luettu
18.4.2011).
21.10.2014.
Alzheimer Disease and Frontotemporal Dementia Mutation Database (2014). Luettu
5.8.2014. www.molgen.ua.ac.be/ADMutations.
Bertram L, Lill CM, Tanzi RE. The genetics of Alzheimer disease: back to the future. Neuron 2010; 68: 270– 81
Bettens K, Sleegers K, Van Broeckhoven C. Genetic insights in Alzheimer’s disease. Lancet neurology 2013; 12:92–104
Blennow K, Hampel H, Weiner M, Zetterberg H. Cerebrospinal fluid and plasma biomarkers in Alzheimer disease. Nat Rev Neurol 2010 6:131–44
37
Braak, H, Braak, E. Neuropathological staging of Alzheimer-related changes. Acta Neuropathol 1991; 82: 239–259
Campion D, Dumanchin C, Hannequin D ym. Early-onset autosomal dominant Alzheimer
disease: prevalence, genetic heterogeneity, and mutation spectrum. American Journal of
Human Genetics1999; 65: 664–70.
Carlson MC, Helms MJ, Steffens DC, Burke JR, Potter GG, Plassman BL. Midlife activity
predicts risk of dementia in older male twin pairs. Alzheimer’s Dement 2008; 4(5):324–31.
Carver T, Bohme U, Otto TD, ym. BamView: viewing mapped read alignment data in the
context of the reference sequence. Bioinformatics 2010; 26:676-7.
Chilamakuri C, Lorenz S, Madoui M-A ym. Performance comparison of four exome capture systems for deep sequencing. BMC Genomics 2014; 15: 449
Cirulli ET, Singh A, Shianna KV ym. Screening the human genome: comparison of whole
genome and whole transcriptome sequencing. Genome Biol 2010; 11: R57
Corder EH, Saunders AM, Risch NJ ym. . Protective effect of apolipoprotein E type 2 allele for late onset Alzheimer disease. Nat Genet. 1994; 7: 180–4.
Deane R, Sagare A, Hamm K ym.. apoE isoform-specific disruption of amyloid beta peptideclearance from mouse brain. J Clin Invest 2008; 118: 4002–13
Escott-Price V, Bellenguez C , Wang L. PLOS ONE (www.plosone.org) 2014; 6: e 94661
Evans DA, Funkenstein HH, Albert MS ym. Prevalence of Alzheimer’s disease in a community population of older persons. Higher than previously reported. JAMA. 1989; 262:
2551–2556
Ferri CP, Prince M, Brayne Cym. Global prevalence of dementia: a Delphi consensus
study. Lancet 2005; 366(9503): 2112–7.
Fiume M, Williams V, Brook A ym. Savant: genome browser for high-throughput sequencing data. Bioinformatics 2010; 26:1938-44.
Fratiglioni L, Paillard-Borg S, Winblad B. An active and socially integrated lifestyle in late
life might protect against dementia. Lancet Neurol 2004; 3(6): 343–53.
Gatz M, Reynolds CA, Fratiglioni L. ym. Role of genes and environments for explaining
Alzheimers disease. Arch Gen Psychiatry 2006; 63: 168 -74
Genin E, Hannequin D, Wallon D ym. APOE and Alzheimer`s disease: a major gene with
semidominant inheritance. Mol Psychiatry 2011; 16: 903-07
Glenner GG, Wong CW. Alzheimer’s disease and Down’s syndrome: Sharing of a unique
cerebrovascular amyloid fibril protein. Biochem Biophys Res Commun 1984; 122: 1131–
35.
Goate A, Chartier- Harlin MC, Mullan M. ym. Segregation of a missense mutation in the
amyloid precursor protein gene wiith familial Alzheimers disease. Nature 1991; 349; 70406
38
Goldgaber D, Lehrman M, McBride O ym. Characterization and chromosomal localization
of a cDNA encoding brain amyloid of Alzheimer’s disease. Science 1987; 235: 877–80
Hardy J, Selkoe DJ. The Amyloid hypothesis of Alzheimer´s disease: Progress and Problems on the Road to Therapeutics. Science 2002; 297: 353–356.
Hardy J, Bogdanovic N, Winblad B. Pathways to Alzheimer’s disease. J Intern Med 2014;
275: 296–303.
Harvard University (2011). Diagnosing Alzheimer's disease. Luettu 20.6.2014.
www.health.harvard.edu/newsletters/Harvard_Health_Letter/2011/July/diagnosingalzheimers-disease
Hallikainen M, Suhonen J, Pirttilä T, Erkinjuntti T. Alzheimerin taudin kliinisen tutkimuksen uudistetut kriteerit. Suomen lääkärilehti 2011; 66:161- 165
Hiltunen M, Haapasalo A, Soininen H. Alzheimerin taudin uudet riskigeenit – tautia ennakoivat biomarkkerit? Duodecim 2013; 129: 583- 8
Huang H & Jiang Z. Accumulated Amyloid-β peptide and Hyperphosphorylated Tau Protein: Relationship and Links in Alzheimer’s disease. Journal of Alzheimer’s Disease 2009;
16: 15–27
Illumina (2008). Illumina Sequencing Technology. Luettu 5.6.2014.
www.illumina.com/technology/sequencing_technology.ilmn
Illumina, Schroth G (2012). The Impact of Massively Parallel DNA Sequencing on Genomic and Clinical Research.
Illumina (2013a). An introduction to Next-Generation Sequencing Technology. Luettu
4.6.2014. www.illumina.com/technology/sequencing_technology.ilm.
Illumina (2013b). TruSeq Nano DNA Sample Preparation Kit. Luettu 4.8.2014.
http://res.illumina.com/documents/products/datasheets/dtasheet_truseq_nano_dna_sample
prep_kit.p.df
Illumina (2014a) Mi Seq® System- Focused power. Speed and simplicity for targeted and
small
genome
sequenc
Luettu
12.8.2014.
http://res.illumina.com/documents/products/datasheets/datasheet_miseq.pdf
Illumina (2014b). Sequencing by synthesis technology. Luettu 12.8.2014.
http://technology.illumina.com/technology/next-generation-sequencing/sequencingtechnology.html
International Human Genome Consortium. Finishing the euchromatic sequence of the human genome. Nature 2004; 431, 931–945.
Jarrett JT, Berger EP, Lansbury PT Jr. The carboxy terminus of the b amyloid protein is
critical for the seeding of amyloid formation: Implications for the pathogenesis of Alzheimer’s disease. Biochemistry 1993; 32: 4693–4697.
39
Jiang Q, Lee CY, Mandrekar S et al. ApoE promotes the proteolytic degradation of A beta.
Neuron 2008; 58: 681–93.
Jonsson T, Atwal JK, Steinberg S, ym. A mutation in APP protects against Alzheimer’s
disease and age-related cognitive decline. Nature 2012; 488: 96–9.
Kang J, Lemaire H, Unterbeck A ym. The precursor of Alzheimer’s disease amyloid A4
protein resembles a cell surface receptor. Nature 1987; 325: 733–736.
Lambert J-C, Amouyel P. Genetics of Alzheimer’s disease: new evidences for an old hypothesis? Curr Opin Genet Dev 2011; 21: 295–301
Levy-Lahad E. Wasco W, Poorkaj P ym. Candidate gene for the chromosome 1 familial
Alzheimers disease locus. Science 1995; 269: 973- 77.
Leibson CL, Rocca WA, Hanson VA, Cha R, Kokmen E, O’Brien PC, et al. The risk of
dementia among persons with diabetes mellitus: a population-based cohort study. Ann NY
Acad Sci 1997; 826:422–7.
Liu Q, Zerbinatti CV, Zhang J et al. Amyloid precursor protein regulates brain apolipoprotein E and cholesterol metabolism through lipoprotein receptor LRP1. Neuron 2007; 56:
66–78
Luchsinger JA, Tang MX, Stern Y, Shea S, Mayeux R. Diabetes mellitus and risk of Alzheimer’s disease and dementia with stroke in a multiethnic cohort. Am J Epidemiol 2001;
154(7):635–41.perspective. Eur J Pharmacol 2008; 585(1):119–29.
Luo C, Tsemnetzi D, Kyrpides N. Direct comparisons of illumina vs. Roche 454 sequencing technologies on the same microbial community DNA sample. PLoS One 2012; 7:
e30087
Luthra R, Patel K, Reddy N ym. Next generation sequencing- based mutligene mutational
screening for acute myeloid leukeimia using MiSeq: applicabapiltiy for diagnosis and disease monitoring. haematologica 2014; 99(3): 465- 73.
Mayeux R. Stern Y. Epidemiology of Alzheimer Disease.Cold Spring Harb Perspect Med.
2012; 2(8): a006239.
McKhann GM, Knopman DS, Chertkow H, ym. The diagnosis of dementia due to Alzheimer’s disease: Recommendations from the National Institute on Aging- Alzheimer‘s
Association workgroups on diagnostic guidelines for Alzheimer’s disease. Alzheimers
Dement 2011; 7:208–44.
Metzker M. Sequencing technologies- The next generation. Nature 2010; 11: 31–46.
Mullan M, Crawford F, Axelman K ym. A pathogenic mutation for probable Alzheimer's
disease in the APP gene at the N-terminus of beta-amyloid. Nat Genet. 1992; 1(5): 345-7.
Pavlopoulos G, Oulas A, Iacucci E ym. Unraveling genomic variation from next generation sequencing data. BioData Mining 2013; 6: 13.
40
Pirttilä ja Erkinjuntti. Alzheimerin taudin kliininen kuva ja diagnoosi. Kirjassa Erkrinjuntti
T, Kari A, Juha R, Soininen H. toim, Muistihäiriöt ja dementia. Helsinki Kustannus Oy
Duodecim 2006, s.126–139
Pirttilä T. Lievä kognitiivinen heikentyminen – ennusteeltaan heterogeeninen oireyhtymä.
Duodecim 2008; 124:159–66.
Prince M, Guerchet M, Prina M. Policy Brief for Heads of Government: The Global Impact of Dementia Alzheimer’s Disease International (ADI), London. 2013: 2013–50.
Rapp A, Gmeiner B, Hüttinger M. Implication of apoE isoforms in cholesterol metabolism
by primary rat hippocampal neurons and astrocytes. Biochimie. 2006; 88:473–483.
Riddell DR, Christie G, Hussain I, Dingwall C. Compartmentalization of beta-secretase
(Asp2) into low-buoyant density, non caveolar lipid rafts. Curr Biol 2001; 11: 1288–93.
Riddell DR, et al. Impact of apolipoprotein E (apoE) polymorphism on brain apoE levels. J
Neurosci. 2008; 28:11445–11453
Roche Diagnostics GmbH (2013a). SeqCap EZ Library Discover more, sequence less. Luettu 20.6.2014.
www.nimblegen.com/products/lit/05227887001_SeqCapBroch_May2013.pdf
Roche Diagnostics GmbH (2013b). SeqCap EZ Designs - Neurology Panel Design Discover more, sequence less in your neurological research. Luettu 11.8.2014.
www.nimblegen.com/products/lit/06870473001_NG_SeqCapEZ_Neurology_Flyr_Jan201
3.pdf
Roche NimbleGen (2013). SeqCap EZ Library SR User’s Guide version 4.2. Luettu
7.8.2014.
www.nimblegen.com/products/lit/06588786001_SeqCapEZLibrarySR_UGuide_v4p2.pdf
Rutherford K, Parkhill J, Crook J ym. Artemis: sequence visualization and annotation. Bioinformatics 2000; 16:944-5.
Scheuner, D, Eckman, C, Jensen M. ym. Secreted amyloid beta-protein similar to that in
the senile plaques of Alzheimer’s disease is increased in vivo by the presenilin 1 and 2 and
APP mutations linked to familial Alzheimer’s disease. Nat. Med. 1996; 2:864–870.
Scarmeas N, Stern Y, Mayeux R, Luchsinger JA. Mediterranean diet, Alzheimer disease,
and vascular mediation. Arch Neurol 2006b; 63: 1709–1717
Seppälä T. Herukka S-K. Remes A. Alzheimerin taudin varhaisdiagnostiikka. Duodecim
2013; 129:2003- 10
Sherrington R, Rogaev EI, Liang Y ym.Cloning of a gene bearing missense mutations in
early-onset Familial Alzheimer’s disease. Nature 1995; 375: 754–760.
Spillantini MG, Goedert M. Tau Pathology and neruodegeneration. Lancet Neurol 2013;
12: 609–22
StrittmatterWJ, Saunders AM, Schmechel D ym. Apolipoprotein E: High-avidity binding
to b-amyloid and increased frequencyof type 4 allele in late-onset familial Alzheimer disease. Proc Natl Acad Sci 1993; 90: 1977–81.
41
Tanzi R, Gusella J, Watkins P ym. Amyloid β protein gene: cDNA, mRNA
distribution, and genetic linkage near the Alzheimer locus. Science 1987; 235: 880–
884.
Tanzi R, McClatchey A, Lamperti E ym. Protease inhibitor domain encoded by an amyloid
protein precursor mRNA associated with Alzheimer’s
Disease. Nature 1988; 331: 528–530.
Tanzi RE, Bertram L. Twenty years of the Alzheimer’s disease amyloid hypothesis: A genetic perspective. Cell 2005; 120: 545–555.
Tanzi R. The Genetics of Alzheimer Disease, Cold Spring Harbor Perspectives in Med.
2012; 2:a006296
Thorvaldsdóttir H, Robinson JT, Mesirov JP. Integrative Genomics Viewer (IGV): highperformance genomics data visualization and exploration Brief Bioinform 2013; 14 (2):
178–192
Tienari, Polvikoski. Alzheimerin taudin patogeneesi. Kirjassa: Erkinjuntti T,
Kari A, Juha R, Soininen H, toim. Muistihäiriöt ja dementia. Helsinki: Kustannus Oy
Duodecim 2006, s. 112–113, 115-116
van Praag H, Kempermann G, Gage FH . Running increases cell proliferation and neurogenesis in the adult mouse dentate gyrus. Nat Neurosci 1999; 2: 266–270
Wolfe MS, Xia W, Ostaszewski BL, Diehl TS, Kimberly WT, SelkoeDJ. Two transmembrane aspartates in presenilin-1 required for presenilin endoproteolysis and γ-secretase activity. Nature 1999; 398: 513–517.
Xiangtao L, Shizhong H, Zuoheng W, Joel G, Bao-Zhu Y. Variant Callers for NextGeneration Sequencing Data: A Comparison Study. PLOS ONE | www.plosone.org 2013;
8(9): e75619
42