Primer og probe design

Primer og probe design
Kurs TH-28973
Molekylærgenetiske metoder i medisinsk mikrobiologi
16.-20.mars 2015
Kåre Bergh
Overlege St.Olavs Hospital / professor NTNU
Tema
• Valg av målsete («target sequence»)
• Primer design
• Probe design
• ( evt PCR optimalisering)
Litteratur søk
• Hva vites om aktuelle agens?
• Søk litteratur, f.eks Pubmed:
http://www.ncbi.nlm.nih.gov/pubmed
• Finnes et gen som er unik for dette agens?
• Single-gen eller multi-kopi gen?
• Publiserte PCR metoder
– Hvis ja, hvilke gener er benyttet?
– Hvis ja, hvor gammel publikasjon? Benyttet av andre
senere?
• Hva er gjort på feltet senere år?
– Publisert nye alleler?
Genbank søk
• Søk i Genbank for gen-sekvenser
– http://www.ncbi.nlm.nih.gov/sites/gquery
– Hvor konservert er aktuelle sekvens?
– Hvor mange ulike alleler er kjent?
• “Alignment” av alle kjente alleler, f.eks v hj a ClustalW
– http://www.ebi.ac.uk/Tools/msa/clustalo/
– Konserverte regioner
– Polymorfismer
• Passende områder for primere/ probe i konserverte del
av genet?
• Designe primere/ probe(r)
OBS! Fallgruve ved alignment - retningsavhengig
CLUSTAL 2.1 multiple sequence alignment
1 CTTCTTCTTCTT 12
2 AAGAAGAAGAAG 12
. :
. :
. :
. :
Hjelpemiddel for å omforme sekvenser: F.eks
http://www.bioinformatics.org/sms/rev_comp.html
Reverse Complement converts a DNA sequence into its reverse,
complement, or reverse-complement counterpart. You may want to
work with the reverse-complement of a sequence if it contains an ORF
on the reverse strand.
Paste the raw or FASTA sequence into the text area below.
>Sample sequence
cttcttcttctt
*******
The Sequence Manipulation Suite: Reverse Complement
Results for 12 residue sequence "Sample sequence" starting
"cttcttcttc".
aagaagaagaag
OBS! Fallgruve ved alignment - retningsavhengig
CLUSTAL 2.1 multiple sequence alignment
1 cttcttcttctt 12
2 aagaagaagaag 12
. :
. :
. :
. :
CLUSTAL multiple sequence alignment etter sekvens 2  reverse complement
1 cttcttcttctt
2 cttcttcttctt
************
Primerparets rolle
• Startpunkt for initiering av
DNA syntese
– DNA polymeraser trenger en
primer for start av DNA syntese
• Definerer PCR produktstørrelsen
• Komplementært til templat
DNA
• Essentielt for spesifisitet til
PCR reaksjonen
Ulike termer for primere
Primer – oligonukleotid
◦ Sense- Antisense
◦ Forward - Reverse
◦ Primer 1 -Primer 2
Primer egenskaper
• Hydrogen bindinger:
– GC basepar 3 stk
– AT basepar 2 stk
• GC mer stabil enn AT
Primer design
 Ingen eksakt vitenskap . Mye empiri
 Optimal primer lengde: 18-22 (16-30) nt
 Primer smeltetemperatur (Tm)
◦ Avhengig av lengde og GC-innhold
◦ Flere måter på beregne / ulike formler for kalkulering
◦ Vanlig, enkel (ofte greit fungerende) metode: Tm = 2(A+T) +
4(G+C)
◦ Nearest neighbor method anses ofte best
◦ Eksempel web-basert Tm calculator:
 http://www.sigma-genosys.com/calc/DNACalc.asp
• Anbefalt primer Tm: 50-60 °C
– Tm differanse mellom primere: < 5 °C
– Tm diff primer vs PCR produkt: < 22 °C
Primer design
• Repeats Ex: ATATATAT
– Kan medføre “slipping” av primer
– Max 4 dinukleotid repeats
• Runs Ex: AGCGGGGGATGGGG
– Kan forårsake mispriming
– Opp til 4 kan være akseptabelt
Primer design
• 3’-ende stabilitet
– Beregnes på basis av 5 siste baser i 3’- ende
– Mispriming mindre hvis 3’-ende ikke er for stabil
• GC clamp
– Fare for mispriming til GC-rike områder
– Maximum 3 G/C i 3’-ende
• GC-innhold (anbefalt 40-60 %)
• Fortrinnsvis jevn/balansert fordeling av nt
Primer design

Fri energi (kcal/mol)
– Mål for stabilitet til primer binding
– Beregnes ofte som Gibbs fri energi (ΔG),
men flere metoder benyttes
• Avhengig av nukleotid sammensetning,
elektrolytt konsentrasjon og temperatur
• Høy stabilitet ved lav ΔG (høy negativ verdi)
Primer design
 Sekundær-strukturer
–”hårnål” / hairpin
– Bør unngås i 3’-ende
– Bør ikke være for mange (men usikkert å kalkulere
effekten), vurder energi og arbeidstemperatur
 Primer-dimerer
– Selv-dimer og kryss-dimer
• 3’-ende: ingen komplementaritet
• Intern (< 8nt)
Primer design
Vanlig størrelse PCR-produkt:
◦ Konvensjonell PCR: 200-1000 bp
◦ Real-time PCR:
◦ SybrGreen:
◦ TaqMan probe:
◦ Hyb probe:
80-250(300) bp
50-150 bp
80-800 bp
Primer design
• Templat sekundær strukturer bør unngås
– Single strand DNA hybridiserer til seg selv
• Avhengig av ΔG og templat Tm
– Noen primer design-software kan beregne dette
• Viktigst ved design av kvantitativ PCR
Primer design
• Spesifisitet
– Perfekt match mellom primer og templat i 3’ ende
• DNA-syntese pga DNA polymerase starter kun når 3’
ende av primer festes til templatet
– Viktig for sikre spesifisitet for annealing til den korrekt
målsekvens
– 5’ ende mindre viktig mht spesifisitet
• Kan endre sekvense ved å legge inn restriksjon sete
eller gjøre andre modifikasjoner
– Så primer BLAST for å sjekke spesifisitet
• http://blast.ncbi.nlm.nih.gov/
Primer design
• Resultat fra BLAST
– S – Score
• Indikerer likhet mellom “query” sekvens og treffene i
sekvuens databasee
• Score for en match: +2 , og -1 for en mismatch
– E verdi – expectation value
• Antall ulike alignments med score lik S som kan
forventes å opptre tilfeldig
• Jo lavere E-verdi, jo mer signifikant er Score.
Primer design
 God primer ? (mht sensitivitet og spesifisitet
basert på BLAST resultater)
◦ 100 % komplementaritet til referanse sekvensen
 Høy Score og lav E-verdi
◦ Ulikhet til andre sekvenser som bør ha lavere Score og
høyere E-verdi
 Dårlig primer? (mht spesifisitet basert på BLAST
resultater)
◦ Komplementaritet med andre “targets”
 Lik Score og E-verdi som for referanse sekvensen
GenBank number
Hits in GenBank
Score
GenBank number
Lenght of hit
Desciption of hit
Query coverage
Which strand
Query – searching sequence
Sbject – sequence of hit in the database
the percent of
the query
length that is
included in the
aligned
segments
E-value
Software for primer design
◦ Kommersiell software
◦ OLIGO primer analysis software (Oligo.net )
◦ AlleleID (Premier Biosoft)
◦ + andre
◦ Gratis programmer (eksempler)
◦ Primer-BLAST http://www.ncbi.nlm.nih.gov/tools/primer-blast/index.cgi?LINK_LOC=BlastHome
◦ Primer3 http://primer3.wi.mit.edu/
◦ GeneFisher http://bibiserv.techfak.uni-bielefeld.de/genefisher2/
Primer design
• Degenererte primere
– Mix av primere
• 6 bases → 26 = 64 forskjellige primere
AGCTGACTGCTGATGCTAG
AGGGGCTTGCTGGTGCTTG
AGSKGMYTGCTGRTGCTWG
Probe design
 Generelle prinsipper (både TaqMan og
Hybridiseringsprober
◦ Tm for probe(r) må være 5-10 °C høyere enn for primerne
 For å sikre hybridisering av probe før primer annealing
◦ Unngå repetitive enheter og strekk av identiske nucleotider
 (slipping av probe; ? Mispriming?)
◦ Unngå sekvenser med selv-komplementaritet
 (evt sekundær strukturer, redusert tilgjengelighet
◦ Unngå sekvenser som kan hybridisere til 3’ ende av primere
 Kan danne primer-probe dimerer
◦ Blokker 3’ ende av probe for å unngå elongering under PCR
Probe design
 TaqMan probe
◦ GC innhold: 30-80 %
◦ Ikke G’ i 5’ end
 Risiko for quenching
◦ Konstruerte probe bør ha flere C enn G (evt velge
komplementær tråden)
 FRET probes
◦ Begge prober på samme tråd, 1-5 nucleotider fra
hverandre, unngå C i gap
 Energy transfer mellom prober er avhengig av distanse
◦ Donor probe merkes med fluorescein i 3’ end
◦ Akseptor probe merkes med fluorophore i 5’ end
Probe design
– Unngå clustre av G og C i noen ende
• Proben kan bindes for sterkt til target
– Unngå ekstremt purin (A/G) -rike sekvenser
• Kan gi dårlig hybridisering
– Spesielle momenter for deteksjon av mutasjoner
• Sensor probe dekke predikert sete for mutasjonen
• Anchor probe producer fluorescens signalet
• Tm sensor < Tm anchor
– Sikre at proben som dekker mutasjonssetet vil kontrollere
dannelsen av fluorescens signalet
Etablering av en nyPCR
• Optimalisering av parametre som affiserer PCR
reaksjonen
–
–
–
–
–
–
–
–
Denaturering: temperatur og tid
Annealing : temperatur og tid
Ekstensjon : temperatur og tid
MgCl2 konsentrasjon
Sensitivitet og spesifisitet
Effektivitet
Hvordan detektere / måle PCR produkt?
Hvordan forbedre en dårlig PCR?
• Checkboard analysis (primer kons.c vs MgCl kons.)
Eksempler på noen modifikasjoner:
- PNA
- LNA
- DPO
PNA (Peptide Nucleic Acid) prober
• Polyamid N-(2-aminethyl)-glycin
skjelett istedet for sukker-fosfat i
DNA / RNA
• Nt kovalent bundet til den uladete
polyamid
• hydrofob
• ikke fosfat - mindre elektrostatisk
repulsjon - sterkere binding kortere prober - meget sensitiv for
mismatcher
PNA prober
Andre egenskaper:
• høy affinitet
• rask hybridiseringskinetikk
• bedre penetrasjon gj den hydrofobe bakterieveggen?
• økt resistens mot nukleaser/proteaser
• stabil over vidt pH område
Betydelig økte kostnader
LNA: Locked Nucleic Acid
• Modifisert RNA nt
• Bro mellom 2’O og 4’C  «locks
in 3’endo-pos»
• Øker hybridiseringsegenskaper (+
antatt andre gunstige egenskaper
som økt sensitivitet og
spesifisitet)
Mest brukt i DNA microarray og
FISH, også som real-time PCRprimere og -prober
DPO: dual priming oligonucleotide: Hensikt hindre mismatch priming og uspesifikk
priming
Teoretisk fordel med DPO:
Første priming; stabilizer lokalisere primerbindings område , den andre
«determiner» gir mulighet for kritisk spesifisitet.
Sies å ha en «større komfortsone» (mindre optimalisering, mindre kritisk mht
sekundærstrukturer, hairpins, kryss- og selv-komplementaritet)