In this course, students will be introduced to the basic types of functional genomic data. These data primarily include data obtained by quantification of specific nucleic acids using polymerase chain reaction (RT-qPCR), data from DNA microarray profiling, and data obtained through high-throughput sequencing. Students will also be introduced to data preprocessing procedures, including the removal of technological artifacts and transformation into standardized form. They will become familiar with specific methods of exploratory data analysis and with statistical methods used in the analysis of multidimensional genomic data. Biological interpretation of the results will be demonstrated using gene ontologies. Students will also learn methods for data visualization and data archiving. Practical sessions will be conducted in the R scripting language, and acquired knowledge will be deepened using real datasets and commonly used analytical tools and database resources.
Last update: Kolář Michal (11.02.2026)
Studenti budou v rámci této přednášky seznámeni se základními typy funkčně genetických dat. Mezi tato data patří především data získaná kvantifikací specifických nukleových kyselin pomocí polymerázové řetězové reakce (RT-qPCR), data z profilování na DNA čipech a data získaná prostřednictvím vysoce výkonného sekvenování. Dále budou studenti seznámeni s postupy předzpracování dat, zahrnujícími jejich očištění od technologických artefaktů a převedení do standardizovaného tvaru. Studenti budou obeznámeni se specifickými metodami explorativní analýzy dat a se statistickými metodami používanými při zpracování mnohorozměrných genomických dat. S využitím genových ontologií bude demonstrována biologická interpretace získaných výsledků. Studenti budou rovněž seznámeni se způsoby vizualizace a archivace dat. Cvičení budou realizována ve skriptovacím jazyce R a získané znalosti budou prohlubovány na reálných datech s využitím běžně používaných analytických nástrojů a databázových zdrojů.
Last update: Kolář Michal (11.02.2026)
Course completion requirements -
During the semester, students complete and submit assigned tasks. At the end of the semester, students present a semester project and take a written examination, which may be followed by an oral examination if necessary.
Last update: Kolář Michal (11.02.2026)
V průběhu semestru studenti průběžně vypracovávají a odevzdávají zadané úkoly. Na konci semestru studenti prezentují semestrální projekt a skládají písemnou zkoušku s případným ústním dozkoušením.
Last update: Kolář Michal (11.02.2026)
Literature -
Recommended:
Z: Pfeiferová L, Kolář M, Svatoňová P, Novotný J, Dohnalová H, Pačes J (2022) Bioinformatika – Základy, University of Chemistry and Technology, Prague.
D: Irizarry RA, Love MI (2021) Data Analysis for the Life Sciences, Leanpub. Online: http://leanpub.com/dataanalysisforthelifesciences
D: Real-time PCR Handbook (2016) Thermo Fisher Scientific Inc.
D: Wickham H, Grolemund G (2017) R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O'Reilly Media. Online: https://r4ds.hadley.nz
D: Love MI, Huber W, Anders S (2014) Moderated Estimation of Fold Change and Dispersion for RNA-seq Data with DESeq2. Genome Biology, 15, 550.
1. Introduction: Types of functional genomic data. Objectives of analyses.
2. Preprocessing of RT-qPCR data: Standard curve. Amplification curve. Threshold cycle. Background correction. Data normalization.
3. Preprocessing of transcriptional microarray data: Background noise removal. Data normalization. Relative and absolute quantification. Variance stabilization. Data summarization.
4. Preprocessing of high-throughput sequencing data: Sequencing reads. Read mapping. Read counts. Data quality control.
5. Single-cell transcriptomics and spatially resolved analyses: Analysis of cell populations. Trajectories. Spatial heterogeneity.
6. Exploratory data analysis: Dimensionality reduction. Clustering. Quality control.
7. Statistical data analysis: Linear models. Statistical tests. Multiple testing problem.
9. Annotation and archiving of results: Genome browsers. Functional genomics databases.
10. Biological interpretation of results: Gene set enrichment analysis (GSEA). Signaling pathway databases. Gene ontologies.
11. Additional applications of discussed methodologies: Analysis of single nucleotide polymorphisms and chromosomal aberrations (SNP, CNV, LOH). DNA methylation analysis. Identification of transcription factor binding sites.
Last update: Kolář Michal (12.02.2026)
1. Úvod: Typy funkčně genetických dat. Cíle analýz.
3. Předzpracování dat z transkripčních čipů: Odstranění šumu na pozadí. Normalizace dat. Relativní a absolutní kvantifikace. Stabilizace rozptylu. Sumarizace dat.
4. Předzpracování dat z vysoce výkonného sekvenování: Sekvenační čtení. Mapování čtení. Četnosti čtení. Kontrola kvality dat.
5. Transkripční analýzy jednotlivých buněk a analýzy s prostorovým rozlišením: Analýza buněčných populací. Trajektorie. Prostorová heterogenita.