NGS-baserad diagnostik av lungcancer vid Centrum

NGS-baserad diagnostik av lungcancer vid
Centrum för Molekylär Diagnostik
2015-02-11
Centrum för molekylär diagnostik (CMD) inrättades i oktober 2014 i syfte att stärka
klinisk diagnostik baserat på den s.k. nya generationens sekvenseringsteknik (NGS)
inom Region Skåne. CMD tillhör organisatoriskt Medicinsk service-förvaltningen. Vid
CMD samverkar verksamhetsområden inom Medicinsk service/Labmedicin, Skånes
Universitetssjukhus (SUS) och forskargrupper vid Lunds Universitet (LU).
Inom CMD utarbetas korta översikter för NGS-baserad diagnostik vid olika
sjukdomstillstånd. Dessa översikter författas av arbetsgrupper för olika diagnoser med
en representant från CMD som sammankallande och dokumentansvarig.
Aktuell översikt berör NGS-baserad diagnostik av lungcancer. Arbetsgruppen består av
följande personer:
•
•
•
•
•
•
•
•
•
•
Johan Staaf, Docent, Avd. för Onkologi och Patologi, LU (sammankallande och
dokumentansvarig)
Per Leveén, processledare molekylärpatologi, Klinisk Patologi, Labmedicin
Kajsa Ericson-Lindquist, medicinsk ansvarig molekylärpatologi, Klinisk Patologi,
Labmedicin
Hans Brunnström, processledare lungpatologi, Klinisk Patologi, Labmedicin
Göran Jönsson, Docent, Avd. för Onkologi och Patologi, LU
Per Jönsson, överläkare, Thoraxkirurgi, SUS
Håkan Griph, överläkare, Lungmedicin, SUS
Ronny Öhman, överläkare, Lungmedicin, SUS
Lars Ek, överläkare, Lungmedicin, SUS
Maria Planck, specialist, Onkologiska kliniken, SUS
Bakgrund
Lungcancer är den femte vanligaste cancerformen i Sverige, med cirka 3500 nya fall
per år. Dödligheten är hög, med en total 5-års-överlevnad på ca 14% för män och 19%
för kvinnor. Lungcancer utgör därför den vanligaste cancerrelaterade dödsorsaken
(www.socialstyrelsen.se). Den främsta orsaken till den dåliga prognosen är att
sjukdomen oftast (i ca 75% av fallen) diagnostiseras i icke-operabelt stadium.
På molekylär nivå är lungcancer en mycket heterogen sjukdom med flera
histologiska undergrupper. Traditionellt görs en första uppdelning i småcellig cancer
(SCLC) och icke-småcellig lungcancer (NSCLC, ca 80-85% av alla patienter). Den senare
gruppen består i sin tur av flera undergrupper, varav de största är adenocarcinom,
skivepitelcancer och storcellig lungcancer. De olika undergrupperna uppvisar stora
skillnader avseende prognos, association med rökning, morfologi, proteinuttryck,
genuttryck och DNA-förändringar. Kartläggning av somatiska DNA-förändringar i
lungcancergenom har identifierat EGFR och KRAS som de två mest muterade
onkogenerna i NSCLC. Mutationer i EGFR och KRAS återfinns främst i adenocarcinom,
vilken idag representerar den största undergruppen av NSCLC. EGFR och KRAS kodar
för protein som är viktiga element i signalvägar i cellen som ofta är aktiverade i cancer.
Specifika mutationer i dessa gener skapar ett aktiverat protein vilket i sin tur aktiverar
specifika signalvägar och stimulerar tumörtillväxt. Patienter med aktiverande KRASmutationer behandlas idag ej rutinmässigt med målstyrd terapi, medan det för
patienter vars tumör uppvisar EGFR-mutation, finns flera olika EGFR-hämmande
läkemedel i kliniskt bruk. Aktiverande mutationer i EGFR finns främst i exon 18-21 i
EGFR genen och observeras i ca 10-30% av patienter med NSCLC (1). Ett stort antal
kliniska studier har idag bevisat att patienter med avancerad sjukdom och aktiverande
EGFR-mutation uppvisar signifikant ökad sjukdomsfri överlevnad om de behandlas
med en EGFR-inhibitor i jämförelse med standardvalet av cytostatika (2). Trots att
patienter med EGFR-muterade tumörer i de flesta fall svarar mycket väl på behandling
uppkommer obligatoriskt en behandlingsresistens, och ofta ses detta redan efter kort
tid (3). Bakgrunden till behandlingsresistensen är mångfacetterad och innefattar dels
sekundära förändringar i EGFR (ex uppkomst av resistensmutationen T790M), men
även mutationer eller DNA kopietalsförändringar i andra onkgener/tumörsuppressor
gener har visats ge upphov till resistens mot EGFR-inhibitorer (3).
Förutom EGFR existerar andra behandlingsrelevanta genförändringar i
lungcancer, ex mutationer i BRAF, HER2, PIK3CA, AKT1, MAP2K1 och MET, samt ALK
och ROS1 genfusioner (1). Det gemensamma för dessa förändringar är att de, i en
oselekterad patientpopulation, förekommer i låg frekvens. Därmed föreligger det ett
reellt kliniskt behov av att prediktivt testa lungcancertumörer för mutationer både
primärt i EGFR och, i förlängningen, andra, ovanligare, mutationer/förändringar i andra
gener. Detta är av vikt både för val av framtida målstyrda terapier och för hantering av
behandlingsresistens. Generellt testas idag lungcancerpatienter kliniskt för mutationer
i EGFR med metoder som ger information för en gen i taget. Med ett växande antal
mutationer och gener som kan ha betydelse för dels behandlingssvar med befintliga
riktade terapier men även för nya terapier under pågående prövning i kliniska studier
börjar denna strategi bli tids- och kostnadsmässigt ohållbar. Därför behövs ett nytt
synsätt med nya känsliga metoder, där många cancerrelevanta gener analyseras
samtidigt för varje patient. Dylika metoder möjliggör identifiering av inte bara de mest
vanligt förekommande förändringarna, utan också av förändringar som är lågfrekventa
i den allmänna patientpopulationen och av lågfrekventa förändringar av hittills okänd
betydelse som kan förekomma i tillägg till redan kända förändringar i en och samma
tumör (multiklonalitet).
Inom Region Skåne utfördes ca 350 EGFR mutationsanalyser för lungcancer under
2014. De patienter som hittills varit aktuella för mutationsanalys och som erbjuds
behandling utifrån analysresultatet är patienter med avancerad icke-skivepitel NSCLC,
samt recidiv från kirurgiskt behandlade sådana patienter. Fr.o.m. januari 2015 införs
dock successivt, med start på Skånes Universitetssjukhus, SUS, reflextestning av alla
NSCLC, oavsett stadium och undergrupp.
Provtagningsrutiner och provhantering för NGS-baserad diagnostik
Utgångspunkten för den NGS-baserade diagnostiken är paraffininbäddad
formalinfixerad vävnad (s.k. FFPE vävnad). Molekylärpatolog ansvarar för materialets
lämplighet för analys, genom att granska tumörvävnad från de histologiska och/eller
cytologiska preparat som finns arkiverade. Ett representativt tumörområde väljs ut
med hög andel maligna cellkärnor. Ofta kan detta utgöra en liten del av den vävnadsbit
som finns i en FFPE klots. Ett antal tunna snitt av urvald tumörvävnad tas, typiskt 4st
5um snitt, samt nya HTX-snitt för att verifiera att representativt material analyserats.
(utförs av VO Klinisk Patologi). Vid tillfälle kan provpreparatet även bestå av
cytologimaterial i form av cytologiutstryk, där ett cellysat förbereds varifrån DNA
extraheras, eller paraffininbäddat centrifugerat cytologimaterial som snittas (s.k.
cellblock). Provet, tillsammans med mutationsremiss, transporteras därefter till
Avdelningen för Onkologi och Patologi. Provtransport sker två gånger i veckan på
bestämda dagar (se Figur 1).
Vid ankomst av prov och remiss till avdelningen registreras provet och remissen
arkiveras i ett dedikerat remissrum (se Figur 1). Vid registrering erhåller varje prov ett
avkodat löpnummer specifikt för laboratoriet. Detta löpnummer används därefter i
den laborativa såväl som dataanalysdelen av mutationsanalysen. Kopplingen mellan
löpnummer och persondata är endast tillgänglig för dedikerad personal från
Avdelningen för Onkologi och Patologi och VO Klinisk Patologi via Region Skånes ITstruktur, inom vilken även färdigställande av mutationsrapport sker.
Figur 1. Översikt av NGS-baserad diagnostik vid Avdelningen för Onkologi och Patologi. Varje vecka
utförs två stycken parallella analyser med olika startdagar. En analys tar 5 arbetsdagar i anspråk från det
att DNA/RNA extraktion påbörjats till dess att mutationssvar rapporteras tillbaka.
Nukleinsyra extraktion och DNA kvalitetskontroll
Från provet (FFPE snitt) extraheras DNA och RNA. Först avparaffiniseras provet med
hjälp av lösningsmedel (xylen), varefter den rena tumörvävnaden bryts ner
enzymatiskt så att DNA och RNA frisläpps i lösning. DNA/RNA isolering sker därefter
automatiserat med ett kommersiellt extraktionskit (Qiagen FFPE AllPrepp). DNA/RNA
extraktion utförs två gånger i veckan (se Figur 1).
Formalinfixering av tumörvävnad leder till degradering av nukleinsyror. Det är
därför av stor betydelse att uppskatta hur utbredd DNA degraderingen är innan
molekylärgenetisk analys genomförs. Extraherat DNA används i en kvantitativ PCR
reaktion för att bestämma hur stor mängd av det totala DNAt som motsvarar en viss
storlek. Detta är ett viktigt steg för att kunna förutspå vilka prover som kommer att ge
ett tillförlitligt mutationssvar. Den kvantitativa PCR analysen resulterar i ett
kvalitetsvärde som indikerar provets lämplighet för NGS-baserad diagnostik. Om
kvalitetsvärdet faller utanför empiriskt definierade ramar återrapporteras detta till
Klinisk Patologi där ett beslut tas om preparatet trots allt ska gå vidare till
mutationsanalys eller om nytt material ska begäras. Detta förfarande förkortar
avsevärt svarstiden för prov som sannolikt inte skulle ge informativa svar i NGSanalysen.
NGS-baserad diagnostik för identifiering av somatiska mutationer
Prov vars DNA passerat kvalitetskontrollen går vidare till den NGS-baserade
mutationsanalysen. Metoden som används vid Avdelningen för Onkologi och Patologi
är baserad på Illuminas (www.illumina.com) ”next generation sequencing” (NGS)
teknik i kombination med en riktad genpanel (Illumina TruSight Tumor genpanel). Den
riktade genpanelen innefattar 26 stycken utvalda cancerrelaterade gener (Figur 2 och
Tabell 1).
Figur 2. Gruppering av TruSight Tumor 26-gen NGS panel enligt tumörsjukdom (www.illumina.com).
GIST: Gastrointestinal stromacellstumör.
För dessa gener analyseras olika antal hela kodande exon. Val av exon är baserat på
förekomst av rapporterade somatiska tumörförändringar via exempelvis COSMIC
(http://cancer.sanger.ac.uk), CAP (www.cap.org) och NCCN (www.nccn.org) riktlinjer,
samt kliniska prövningar (www.clinicaltrials.gov). Den experimentella delen av NGS
metoden kan delas upp i två steg, i) preparering av ett s.k. DNA provbibliotek för varje
prov och ii) själva sekvenseringen. Ett DNA provbibliotek betyder här en vätskelösning
av ett stort antal olika DNA fragment för vilka DNA sekvensen ska bestämmas. I
prepareringen av ett provbibliotek för ett specifikt prov anrikas först DNA från de
specifika genregioner som ska analyseras via en hybridiseringsprocess. Denna
anrikning utförs separat för de två olika DNA strängarna via olika oligonukleotidpooler.
Detta innebär att för varje prov skapas i slutändan två individuella provbibliotek vilka
är att betrakta som tekniska replikat. Därefter amplifieras de utvalda genregioner i en
PCR reaktion, och specifika oligonukleotidadaptorer kopplas på varje fragment för att
möjliggöra sekvensering. Innan sekvensering poolas de två biblioteken för varje prov.
På grund av NGS teknikens massiva kapacitet kan många prov prepareras parallellt,
poolas, och sekvenseras samtidigt, vilket medger ett högt provflöde. Sekvenseringen
sker därefter på ett Illumina MiSeq instrumentet. Den experimentella
mutationsanalysen (bibliotekspreparation och sekvensering) utförs två gånger per
vecka (se Figur 1).
Tabell 1. Gener och hela exon ingåendes i Illumina TruSight Tumor genpanelen.
Gen
Typ av gen
Analyserade hela exon
AKT1
Onkogen
2
ALK
Onkogen
23
APC
Tumörsuppressor gen
15
BRAF
Onkogen
11, 15
CDH1
Tumörsuppressor gen
8, 9, 12
CTNNB1
Onkogen
2
EGFR
Onkogen
18, 19, 20, 21
ERBB2
Onkogen
20
FBXW7
Tumörsuppressor gen
7, 8, 9, 10, 11
FGFR2
Onkogen
6
FOXL2
Onkogen
1
GNAQ
Onkogen
4, 5, 6
GNAS
Onkogen
6, 8
KIT
Onkogen
9, 11, 13, 17, 18
KRAS
Onkogen
1, 2, 3, 4
MAP2K1
Onkogen
2
MET
Onkogen
1, 4, 13, 15, 16, 17, 18, 20
MSH6
Tumörsuppressor gen
5
NRAS
Onkogen
1, 2, 3, 4
PDGFRA
Onkogen
11, 13, 17
PIK3CA
Onkogen
1, 2, 7, 9, 20
PTEN
Tumörsuppressor gen
1, 2, 3, 4, 5, 6, 7, 9
SMAD4
Tumörsuppressor gen
8, 11
SRC
Onkogen
10
STK11
Tumörsuppressor gen
1, 4, 6, 8
TP53
Tumörsuppressor gen
2, 3, 4, 5, 6, 7, 8, 9, 10, 11
Analys av somatiska varianter från NGS data
NGS tekniken genererar en massiv sekvensmängd för varje prov. För att kunna
identifiera somatiska mutationer (varianter) i denna stora datamängd för de 26
generna sker ett antal dataanalyssteg i samband med sekvensering (Figur 1). Först
måste sekvensdatan från MiSeq instrumentet matchas mot ett humant referensgenom
för att definiera vilka sekvenser som hör till en viss undersökt genregion, ex exon 19 i
EGFR. För Illumina TruSight Tumor panelen sker detta via en BWA baserad alignment
algoritm (4). Därefter identifieras basparspositioner där den undersökta sekvensen
inte matchar referensgenomet, s.k. varianter (potentiella mutationer). Denna analys
sker via en implementering av en GATK baserad algoritm (5). Genom att räkna antalet
sekvenser med en viss variant jämfört med totala antalet sekvenser för området kan
en variantfrekvens beräknas (Figur 3).
Figur 3. Illustration över begreppet variantfrekvens. A) NGS-analys har identifierat en deletion av 15
baser i exon 19 i EGFR genen i ett lungcancer adenocarcinom. X-axeln visar basparspositioner i genomet
för exon 19 i EGFR genen. Y-axeln visar antalet gånger respektive bas har sekvenserats, s.k.
täckningsgrad. Deletionen visar sig som en tydlig nedgång i täckningsgrad eftersom de 15 baserna är
deleterade i många tumörcellers genom. B) NGS-analys har identifierat en punktmutation i exon 6 i
tumörsuppressorgenen TP53 i ett lungcancer adenocarcinom. X-axeln visar ett begränsat antal baser (en
cirkel motsvarar en bas) i exon 6 i TP53 genen. Y-axeln visar täckningsgrad enligt A. Röd linje visar
antalet gånger en bas med avvikande sekvens mot referensgenomet (grön linje) har identifierats.
Punktmutationen ses som en höjning av den röda linjen över noll för en specifik bas i exon 6,
motsvarande 25% av alla sekvenser för denna bas.
Variantfrekvensen ger en indirekt uppfattning av hur frekvent mutationen är i
tumören. En variant (mutation) som detekteras endast i ett fåtal sekvenser kan
reflektera att endast en subklon av tumören bär på mutationen, alternativt att det
analyserade preparatets tumörhalt är låg. I denna analys utnyttjas det faktum att varje
prov representeras av två olika provbibliotek. Endast varianter som korrekt återfinns i
båda provbiblioteken används för vidare analys. Detta tillvägagångssätt har fördelen av
att kunna identifiera och filtrera bort basparsvariationer som tillkommit genom
exempelvis formalinfixeringen av vävnaden (DNA skada). Alla dessa steg är inbyggda i
ett strömlinjeformat analysflöde som utförs automatiskt på MiSeq instrumentet under
och efter att den faktiska sekvenseringen är klar. Resultatet av analysen består av en
textfil med alla identifierade varianter för respektive prov. För annotering och
klassificering av varianter för den slutliga mutationsrapporten används ett specifikt
annoteringsprogram, VariantStudio, (Illumina). Detta program möjliggör på enkelt sätt
annotering av identifierade varianter mot ett stort antal olika databaser, inklusive
COSMIC (http://cancer.sanger.ac.uk), ClinVar (www.ncbi.nlm.nih.gov/clinvar), och
databaser över naturligt förekommande varianter i det humana genomet (SNP
databaser). Kopplat till variantannoteringen sker även klassning och filtrering av
identifierade varianter. I detta steg identifieras dels kända behandlingsprediktiva
mutationer som exempelvis BRAF V600E, EGFR L858R, och KRAS G12C, men även
somatiska varianter som kan vara drivande i tumörutvecklingen men för vilka ingen
behandling existerar i nuläget.
Återrapportering av mutationsresultat till VO Klinisk Patologi
Efter att identifierade varianter från sekvenseringen har annoterats, filtrerats, och
klassats sammanställs en rapport över samtliga kvarvarande varianter (mutationer).
Först i denna rapport sker återkopplingen mellan patient och mutationssvar.
Mutationsrapporten färdigställs inom Region Skånes IT-struktur, varefter rapport samt
grunddata över identifierade varianter överförs till VO Klinisk Patologi för vidare
sammanställning/formatering och slutgiltig återrapportering till remitterande kliniker.
Svarstider NGS-baserad diagnostik
Arbetsschemat för NGS-baserad diagnostik inom Avdelningen för Onkologi och
Patologi (Figur 1) innebär att två analyser utförs per vecka på bestämda dagar, där
varje labanalys tar 5 arbetsdagar i anspråk efter att FFPE tumörvävnad ankommit till
avdelningen. Svarstid till VO Klinisk Patologi blir därigenom 5-7 arbetsdagar beroende
på när FFPE tumörvävnad är redo för transport från Klinisk Patologi efter snitting.
Referenser
1.
Pao W, Girard N. New driver mutations in non-small-cell lung cancer. Lancet
Oncol 2011;12: 175-80.
2.
Ohashi K, Maruvka YE, Michor F, Pao W. Epidermal growth factor receptor
tyrosine kinase inhibitor-resistant disease. J Clin Oncol 2013;31: 1070-80.
3.
Pao W, Chmielecki J. Rational, biologically based treatment of EGFR-mutant
non-small-cell lung cancer. Nat Rev Cancer 2010;10: 760-74.
4.
Li H, Durbin R. Fast and accurate short read alignment with BurrowsWheeler transform. Bioinformatics 2009;25: 1754-60.
5.
DePristo MA, Banks E, Poplin R, Garimella KV, Maguire JR, Hartl C, et al. A
framework for variation discovery and genotyping using next-generation DNA
sequencing data. Nat Genet 2011;43: 491-8.