Tirsdagsoevelser_dan..

Introduktion til de praktiske øvelser
Vi vil i dag fokusere på tre forskellige online so4ware 6l SNP analyser •  snpTree •  NDtree •  CSIphylogony Introduktion til SNP analyser
h@p://cge.cbs.dtu.dk/services/all.php npTree DRAG’n Drop (eller brug Browse) 6l at uploade filer …eller vælg din egen reference (index case? – dra4 genome)!! Vælg en reference (samme bakterielle species) Vælg data format (her: Assembled genomes) Vælg minimal distance der skal være imellem SNPs. Prune?
Hvad er SNPs…og hvad bruger vi dem 6l? Hvad er forudsætningen for at vi kan bruge dem? Lidt om.....filnavne….
Kirsten Siggaard Kirsten_Siggaard ngen MELLEMRUM (eller sære tegn!) i filnavne!!
npTree Vælg minimal distance der skal være imellem SNPs. Submit……..og vent……eller start et nyt job.. Vælg alt ”CTRL + A” teksten i vinduet og kopier ”CTRL + C ” Åben here4er MS Excel og sæt teksten ind ”CTRL + V” Vælg alt ”CTRL + A” teksten i vinduet og kopier ”CTRL + C ” Åben here4er TreeViewer og sæt teksten ind ”CTRL + V” h"p://cge.cbs.dtu.dk/services/TreeViewer-­‐1.0/treeviewer.php h@p://cge.cbs.dtu.dk/services/TreeViewer-­‐1.0/treeviewer.php h@p://cge.cbs.dtu.dk/services/TreeViewer-­‐1.0/treeviewer.php Copy/Paste tekst fra NEWICK filen her! I prøve anden Træ-­‐viewer, så kan man hente FigTree her: h@p://tree.bio.ed.ac.uk/so4ware/figt
-ng archives: h@p://7-­‐zip.org/ r: h@p://www.rarlab.com/download.htm Bemærk: .vcf filer i Windows er kontakt-­‐filer 6l Outlook!! For at åbne en bioinforma6sk .vcf fil* skal man højre-­‐klikke på filen og vælge ”Åben med” og vælge ”Notesblok” som standardprogram 6l denne filtype! * En bioinforma6sk .vcf fil indeholder informa6on om alle SNPs i forhold 6l referencen for hver af de sekvenser, man har uploadet. Vælg alt ”CTRL + A” teksten i vinduet Vælg alt ”CTRL + A” teksten i vinduet og kopier ”CTRL + C ” Åben here4er MS Excel og sæt teksten ind ”CTRL + V” tree DRAG’n Drop (eller brug Browse) 6l at uploade file
Vælg ”Fast mode” i dag… Vælg din egen foretrukne reference…eller lad serveren iden6ficere det bedste match fra en meget lang liste af fuldt sekventerede genomer fra NCBI... Find filen i ”Download” eller ”Overførsler” mappen i Windows s6finder Bemærk: .mat filer i Windows er MS Access filer!! For at åbne en bioinforma6sk .mat distancefil skal man højreklikke på filen og væ
”Åben med” og vælge ”Notesblok” som standardprogram 6l denne filtype! Here4er kopieres indholdet ”CTRL + A”, ”CTRL + C ” og sæ@es ind i Excel ”CTRL + V
P.S. Output kan være ret svært at læse (det arbejdes der på) Vælg alt med ”CTRL + A” og kopier ”CTRL + C ” Åben here4er ThreeViewer og sæt teksten ind ”CTRL + V” h"p://cge.cbs.dtu.dk/services/TreeViewer-­‐1.0/treeviewer.php Phylogeny Vælg din egen reference (index case/Typestamme?)!! DRAG’n Drop (eller brug Browse) 6l at uploade file
Vælg minimal distance der skal være imellem SNPs. Submit dit job Vælg alt med ”CTRL + A” og kopier ”CTRL + C ” Åben here4er TreeViewer og sæt teksten ind ”CTRL + V” h"p://cge.cbs.dtu.dk/services/TreeViewer-­‐1.0/treeviewer.php Here4er kopieres indholdet i Notepad med ”CTRL + A”, ”CTRL + C ” og sæ@es ind i Excel ”CTRL + V” Here4er kopieres indholdet i Notepad med ”CTRL + A”, ”CTRL + C ” og sæ@es ind i Excel ”CTRL + V” SNP øvelsen
•  Øvelsessæ@et består af 7 Klebsiella pneumoniae stammer relateret 6l et udbrud af CTX-­‐M-­‐15/SHV-­‐28 producerende K. pneumoniae med udgangspunkt i Hospitalet i Hillerød. •  Herudover vil I få udleveret den nærmest beslægtede (fuldt sekventerede) NCBI reference stammer. •  Og et ESBL producerende E. coli stamme 6l at teste med. Test data
Navn År Dato Sted Pa-ent Species Kpn_1 2006 K. pneumoniae 2008 A B 1 Kpn_2 04.01 22.01 2 K. pneumoniae Kpn_3 2008 14.07 B 3 K. pneumoniae Kpn_4 2008 02.12 A 4 K. pneumoniae Kpn_5 2008 14.03 C 5 K. pneumoniae Kpn_6 2009 03.04 A 4 K. pneumoniae Kpn_7 2009 06.08 C 6 K. pneumoniae Ref_1084 ? ? NCBI Reference K. pneumoniae Ec 2008 E. coli Leg og lær….
•  Tanken er, at I kan prøve én eller flere af de forskellige SNP web-­‐
servere af med de@e testsæt. •  Det er muligt at sæ@e mere end ét job over ad gangen…. •  …..men husk på, at vi er 25, der gør det sam6dig, hvilket godt kan have en effekt på has6gheden af serveren. •  Skulle det gå helt galt, kan vi blive nødt 6l at genstarte serveren…!! I kan få tilsendt en e-mail med resultatet
•  Resultatet vil kun være 6lgængeligt i 48 6mer på serveren….here4er sle@es linket. Så vil I gerne gemme resultaterne af jeres frem6dige søgninger, er I nødt 6l at gemme filerne! •  Kører I flere jobs, så anbefales det varmt, at I skriver en lille note ned angående jobbet (Hvilken reference, hvilken prune, hvilke stammer osv.)
Forslag til Jobs, der kan sættes i gang
Start med at lave en folder på computerens skrivebord, som I navngiver med jeres ini6aler. 1.  Prøv at køre enten snpTree, Ndtree eller CSI Phylogony med de 7 teststammer. Brug introduk6onen fra før 6l at sikre jer, at I starter det, med de korrekte parametre. Note snpTree: Vælg en af de 5 Klebsiella’er i NCBI listen og husk at vælge ”Assembled genomes” som input! Note NDtree: Prøv at lade NDtree selv finde referencen ved at lade feltet ”Template file” stå tomt. Note CSI Phylogeny: Vælg filen ”Ref_1084” som reference. Kan I iden6ficere udbrudsstammerne imellem de 7 isolater. Prøv jer frem….
I kan prøve at tjekke nogle af outpuwilerne ud. •  Kan I finde, hvor mange SNPs der er 6l forskel imellem de forskellige udbrudsstammer? •  Kan I få hentet NEWICK filen og få den over i TreeViewer? Prøv at ændre på træet i ThreeViewer. Prøv jer frem….
Prøv at gentage jobbet med ændrede parametre (højere prune, ændre reference, samme sæt med en af de to andre web-­‐servere..). •  Får I samme resultater? •  Hvordan reagerer de forskellige SNP-­‐servere på at der kommer en forkert species (her E. coli) med i analysen? Prøv jer frem….
Prøv at gentage jobbet med ændrede parametre: •  højere prune •  ændre reference 6l index case (kpn_1) •  samme sæt data med en af de to andre web-­‐servere. •  Får I samme resultater med de ændrede parametre? •  Hvordan reagerer de forskellige SNP-­‐servere på at der kommer en forkert species (her E. coli) med i analysen? Resultater…..
1. 
2. 
3. 
4. 
5. 
6. 
7. 
8. 
9. 
10. 
11. 
12. 
13. 
snpTree, alle 7 stammer, reference (MGH….), 10 prune snpTree, alle 7 stammer, reference (kpn_7), 10 prune NDtree, alle 7 stammer, ingen valgt reference CSI Phylogeny, alle 7 stammer, Ref (1084), 10 prune snpTree, 6 sidste stammer, Ref (kpn_1), 10 prune NDtree, 6 sidste stammer, Ref (kpn_1) CSI Phylogeny, 6 sidste stammer, Ref (kpn_1), 10 prune CSI Phylogeny, 7 + EC, Ref (1084), 10 prune snpTree, 7 + EC, Ref (1084), 10 prune NDtree, 7 + EC, Ref (1084) snpTree, 6 udbrudsstammer, Ref (kpn_1), prune 10 NDtree, 6 udbrudsstammer, Ref (kpn_1) CSI Phylogeny, 6 udbrudsstammer, Ref (kpn_1), prune 10 1.  snpTree, alle 7 stammer, reference (MGH….), 10 prune 2.  snpTree, alle 7 stammer, reference (kpn_7), 10 prune 3.  NDtree, alle 7 stammer, ingen valgt reference 4.  CSI Phylogeny, alle 7 stammer, Ref (1084), 10 prune 5.  snpTree, 6 sidste stammer, Ref (kpn_1), 10 prune 6.  NDtree, 6 sidste stammer, Ref (kpn_1) 7.  CSI Phylogeny, 6 sidste stammer, Ref (kpn_1), 10 prune 8.  CSI Phylogeny, 7 + EC, Ref (1084), 10 prune 9.  snpTree, 7 + EC, Ref (1084), 10 prune 10. NDtree, 7 + EC, Ref (1084) 11. snpTree, 6 udbrudsstammer, Ref (kpn_1), prune 10 12. NDTree, 6 udbrudsstammer, Ref (kpn_1), 13. CSI Phylogeny, 6 udbrudsstammer, Ref (kpn_1), prune 10