PředmětyPředměty(verze: 877)
Předmět, akademický rok 2020/2021
  
Genomika: algoritmy a analýza - M143003
Anglický název: Genomics: algorithms and analysis
Zajišťuje: Ústav informatiky a chemie (143)
Platnost: od 2019
Semestr: zimní
Body: zimní s.:4
E-Kredity: zimní s.:4
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:2/1 Z+Zk [hodiny/týden]
Počet míst: neomezen / neomezen (neurčen)
Minimální obsazenost: neomezen
Jazyk výuky: čeština
Způsob výuky: prezenční
Úroveň:  
Pro druh: navazující magisterské
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Pačes Jan Mgr. Ph.D.
Záměnnost : N143046
Anotace -
Poslední úprava: Hladíková Jana (04.01.2018)
Cílem předmětu je srozumitelnou formou poskytnout studentům základní přehled současných "high-throughput" sekvenačních technik, jejich principy a instrumentace. Zvláštní důraz bude kladen na popis jednotlivých aplikací jako je: ChIP-Seq, RNA-Seq, resekvenace, metagenomika, de-novo sekvenace a další. Přednášky budou následně zaměřeny na představení scénáře kompletní analýzy dat pro jednotlivé aplikace. Tyto scénáře budou dále demonstrována na praktických příkladech během cvičeních. Studenti by se během předmětu měli seznámit se základními znalostmi jako je kvalita čtení ("base calling") a její kontrola, používané datové formáty a standardy, pokročilé programové nástroje a vhodnost jejich aplikace pro řešení konkrétních problémů, mapování sekvenčních dat, skládání krátkých a dlouhých sekvenčních dat, identifikace SNP a funkční anotace.
Výstupy studia předmětu -
Poslední úprava: Hladíková Jana (04.01.2018)

Studenti budou umět:

  • Znát základní principy nových sekvenačních technik a jejich aplikace.
  • Seznámí se a osvojí si základní oborovou terminologii.
  • Provádět základní analýzu genomických dat, která zahrnuje většinu běžně prováděných experimentů ve vědeckých laboratořích.
  • Porozumí problematice datových formátů, skladování genomických dat, skládání krátkých a dlouhých sekvencí, mapování sekvencí na známé genomy.
  • Zvládnout provést výběr vhodné aplikace pro řešení konkrétního problému. Získají přehled o současných programových nástrojích, jejich omezeních a vhodnosti pro řešení konkrétních problémů.
Literatura -
Poslední úprava: Svozil Daniel doc. Mgr. Ph.D. (04.11.2018)

Z: Martínková N., Analýza genomických a proteomických dat, Institut biostatistiky a analýz MU Brno, 2018, http://portal.matematickabiologie.cz/index.php?pg=analyza-genomickych-a-proteomickych-dat

Z: Nosek J. a kol., Genomika (slovenská edice), CreateSpace Independent Publishing Platform, 2013, ISBN: 1494230623

Z: Brown S. M. (Ed.), Next-Generation DNA Sequencing Informatics, Cold Spring Harbor Laboratory Press 2015, ISBN: 978-1621821236

D: Snustad, D. P., Simmons, M. J. Genetika. Nakladatelství Masarykovy univerzity, Brno, 2009, ISBN: 978-80-210-4852-2

D: Bergman N. H. (Ed.), Comparative Genomics (Volume 1 and Volume 2), Humana Press Inc. 2011, ISBN: 978-1617377228, 978-1617379338

D: Rodriguez-Ezpeleta N., Hackenberg M., Aransay A. M. (Eds.), Bioinformatics for High Throughput Sequencing, Springer Science 2012, ISBN: 978-1-4614-0781-2

D: Janitz M. (Ed.), Next-Generation Genome Sequencing: Towards Personalized Medicine, Wiley-VCH 2008, 978-3-527-32090-5

Studijní opory -
Poslední úprava: Hladíková Jana (04.01.2018)

žádné

Požadavky ke kontrole studia
Poslední úprava: Hladíková Jana (04.01.2018)

Zápočet: praktický projekt

Zkouška: písemný test

Sylabus -
Poslední úprava: Hladíková Jana (04.01.2018)

1. Úvod do genomiky a sekvenování: Historický přehled. Základní pojmy.

2. Sekvenační techniky: Sanger metoda. NGS - Illumina, SOLID, 454 a další. Popis základních aplikací. Porovnání jednotlivých technik.

3. Sekvenační data: Vizualizace - EnsEMBL, UCSC Browser, Artemis, ACT, Mummer, Circos. Base-calling a kontrola kvality sekvencí. Datové formáty.

4. Skládání DNA sekvencí (I): Mapování sekvencí na referenční genom. De novo skládání dlouhých sekvencí - newbler, mira. De novo skládání krátkých sekvencí (De Bruijn) - WGS, velvet, soap2, AbySS.

5. Skládání DNA sekvencí (II): Sekvenační projekty, sekvenace plnodélkové cDNA, tvorba scaffoldu. Software - Staden, AMOS, Consed.

6. Anotace genomu: Predikce genových modelů. Identifikace nekodující RNA. Identifikace proteinových domén. Funkční anotace. Databázové zdroje. Anotační systémy.

7. Detekce sekvenčních variant: identifikace SNP, indel, translokace, inverze, CNV.

8. Analýza interakce protein - nukleová kyselina: ChIP-seq - interakce protein s DNA. CLIP-seq - interakce protein s RNA.

9. Diferenční exprese (I): RNA-seq. Mapování sekvencí. Měření genové exprese. Normalizace, sumarizace a diferenční exprese. Identifikace transkripčních variant - alternativní sestřih. Experimentální design.

10. Diferenční exprese (II): Expresní profilování mikro RNA. Identifikace nových mikro RNA.

11. Epigenomika: Analýza celogenomových methylačních map.

12. Metagenomika: anotace genů a rekonstrukce metabolismu - MG-RAST. Amplikonové sekvenování (16S rDNA) a analýza taxonomických jednotek.

13. Komparativní genomika: Mezidruhové porovnání genomů.

14. Genomické projekty a WWW software: ENCODE. Paleogenomika. Sekvenační projekty. WWW nástroje - Galaxy, GMOD, Gbrowser, BioCycle, RAST, EnsEMBL API. Personalizovaná medicína.

Studijní prerekvizity -
Poslední úprava: Hladíková Jana (04.01.2018)

Biochemie, Molekulární genetika

Podmínky zakončení předmětu -
Poslední úprava: Svozil Daniel doc. Mgr. Ph.D. (29.01.2018)

Zápočet bude udělen na základě řešení úloh ze cvičení a vypracování seminární práce. Zkouška sestává z ústní a písemné části.

Zátěž studenta
Činnost Kredity Hodiny
Obhajoba individuálního projektu 0,5 14
Účast na přednáškách 1 28
Příprava na přednášky, semináře, laboratoře, exkurzi nebo praxi 1 28
Práce na individuálním projektu 0,5 14
Příprava na zkoušku a její absolvování 1 28
4 / 4 112 / 112
 
VŠCHT Praha