Within this course contemporary high-throughput sequencing techniques are introduced. The main focus of the course is on individual applications such as, e.g., ChIP-Seq, RNA-Seq, resequencing, metagenomics or de-novo sequencing. A procedures of the complete analyses for individual applications will be described, and will be demonstrated during practical exercises. Explained knowledge includes sequence quality reading ("base calling") and its control, data formats and standards, advanced software tools and evaluation of their suitability, mapping of sequence data, short and long sequence assembly, identification of SNPs, and functional annotation.
Last update: Cibulková Jana (13.09.2024)
Cílem předmětu je srozumitelnou formou poskytnout studentům základní přehled současných "high-throughput" sekvenačních technik, jejich principy a instrumentace. Zvláštní důraz bude kladen na popis jednotlivých aplikací jako je: ChIP-Seq, RNA-Seq, resekvenace, metagenomika, de-novo sekvenace a další. Přednášky budou následně zaměřeny na představení scénáře kompletní analýzy dat pro jednotlivé aplikace. Tyto scénáře budou dále demonstrována na praktických příkladech během cvičeních. Studenti by se během předmětu měli seznámit se základními znalostmi jako je kvalita čtení ("base calling") a její kontrola, používané datové formáty a standardy, pokročilé programové nástroje a vhodnost jejich aplikace pro řešení konkrétních problémů, mapování sekvenčních dat, skládání krátkých a dlouhých sekvenčních dat, identifikace SNP a funkční anotace.
Last update: Cibulková Jana (13.09.2024)
Aim of the course -
Students will be able to:
Know basic principles of contemporary sequencing techniques and their applications.
Will be acquainted with a branch terminology.
Will be able to analyse genomic data produced by experimental departments.
Will understand data formats, genomic data storage, assembly of short and long sequencies, sequence mapping onto known genomes.
Will be able to choose a suitable application to solve a given problem. Will gain general knowledge of existing software tools, their limitations and their strengths.
Last update: Cibulková Jana (13.09.2024)
Studenti budou umět:
Znát základní principy nových sekvenačních technik a jejich aplikace.
Seznámí se a osvojí si základní oborovou terminologii.
Provádět základní analýzu genomických dat, která zahrnuje většinu běžně prováděných experimentů ve vědeckých laboratořích.
Porozumí problematice datových formátů, skladování genomických dat, skládání krátkých a dlouhých sekvencí, mapování sekvencí na známé genomy.
Zvládnout provést výběr vhodné aplikace pro řešení konkrétního problému. Získají přehled o současných programových nástrojích, jejich omezeních a vhodnosti pro řešení konkrétních problémů.
Last update: Cibulková Jana (13.09.2024)
Course completion requirements -
A credit will be given based on assigmments during exercises and a seminar work. An exam consists of both oral and written parts.
Last update: Cibulková Jana (13.09.2024)
Zápočet bude udělen na základě řešení úloh ze cvičení a vypracování seminární práce. Zkouška sestává z ústní a písemné části.
Last update: Cibulková Jana (13.09.2024)
Literature -
R: Martínková N., Analýza genomických a proteomických dat, Institut biostatistiky a analýz MU Brno, 2018, http://portal.matematickabiologie.cz/index.php?pg=analyza-genomickych-a-proteomickych-dat
R: Nosek J. a kol., Genomika (slovenská edice), CreateSpace Independent Publishing Platform, 2013, ISBN: 1494230623
R: Brown S. M. (Ed.), Next-Generation DNA Sequencing Informatics, Cold Spring Harbor Laboratory Press 2015, ISBN: 978-1621821236
A: Snustad, D. P., Simmons, M. J. Genetika. Nakladatelství Masarykovy univerzity, Brno, 2009, ISBN: 978-80-210-4852-2
A: Bergman N. H. (Ed.), Comparative Genomics (Volume 1 and Volume 2), Humana Press Inc. 2011, ISBN: 978-1617377228, 978-1617379338
A: Rodriguez-Ezpeleta N., Hackenberg M., Aransay A. M. (Eds.), Bioinformatics for High Throughput Sequencing, Springer Science 2012, ISBN: 978-1-4614-0781-2
A: Janitz M. (Ed.), Next-Generation Genome Sequencing: Towards Personalized Medicine, Wiley-VCH 2008, 978-3-527-32090-5
Last update: Cibulková Jana (13.09.2024)
Z: Martínková N., Analýza genomických a proteomických dat, Institut biostatistiky a analýz MU Brno, 2018, http://portal.matematickabiologie.cz/index.php?pg=analyza-genomickych-a-proteomickych-dat
Z: Nosek J. a kol., Genomika (slovenská edice), CreateSpace Independent Publishing Platform, 2013, ISBN: 1494230623
Z: Brown S. M. (Ed.), Next-Generation DNA Sequencing Informatics, Cold Spring Harbor Laboratory Press 2015, ISBN: 978-1621821236
D: Snustad, D. P., Simmons, M. J. Genetika. Nakladatelství Masarykovy univerzity, Brno, 2009, ISBN: 978-80-210-4852-2
D: Bergman N. H. (Ed.), Comparative Genomics (Volume 1 and Volume 2), Humana Press Inc. 2011, ISBN: 978-1617377228, 978-1617379338
D: Rodriguez-Ezpeleta N., Hackenberg M., Aransay A. M. (Eds.), Bioinformatics for High Throughput Sequencing, Springer Science 2012, ISBN: 978-1-4614-0781-2
D: Janitz M. (Ed.), Next-Generation Genome Sequencing: Towards Personalized Medicine, Wiley-VCH 2008, 978-3-527-32090-5
Last update: Cibulková Jana (13.09.2024)
Requirements to the exam - Czech
Zápočet: praktický projekt
Zkouška: písemný test
Last update: Cibulková Jana (13.09.2024)
Syllabus -
1. Itroduction to genomics and sequencing: historical overview, basic concepts.
2. Sequencing techniques: Sanger method, NGS (new generation sequencing): Illumina, SOLID, 454, etc. Comparison of sequencing techniques.
3. Sequencing data: Visualization - EnsEMBL, UCSC Browser, Artemis, ACT, Mummer, Circos. Base-calling and sequence quality control. Data formats.
4. DNA sequence assembly I: Sequence mapping onto reference genome. De novo assembly of long sequencies - newbler, mira. De novo assembly of short sequencies - WGS, velvet, soap2, AbySS.
6. Genome annotation: Prediction of gene models. Identification of non-coding RNA. Identification of protein domains. Functional annotation. Database sources and annotation systems.
7. Detection of sequence variations: Identification of single-nucleotide polymorphisms (SNPs), insertions and deletions, translocations, inversions, and copy-number variations (CNVs).
1. Úvod do genomiky a sekvenování: Historický přehled. Základní pojmy.
2. Sekvenační techniky: Sanger metoda. NGS - Illumina, SOLID, 454 a další. Popis základních aplikací. Porovnání jednotlivých technik.
3. Sekvenační data: Vizualizace - EnsEMBL, UCSC Browser, Artemis, ACT, Mummer, Circos. Base-calling a kontrola kvality sekvencí. Datové formáty.
4. Skládání DNA sekvencí (I): Mapování sekvencí na referenční genom. De novo skládání dlouhých sekvencí - newbler, mira. De novo skládání krátkých sekvencí (De Bruijn) - WGS, velvet, soap2, AbySS.
5. Skládání DNA sekvencí (II): Sekvenační projekty, sekvenace plnodélkové cDNA, tvorba scaffoldu. Software - Staden, AMOS, Consed.