The course aims to introduce students to the fundamentals of processing small to medium-scale experimental data using automated tools. Emphasis is placed on cleaning raw data, transforming it, visualizing it, and exporting the results. Students will primarily work in the R language, with extensive use of the Tidyverse ecosystem. They will also learn the basics of using the shell (bash) and GitHub for version control and code sharing.
Last update: Strejček Michal (28.05.2025)
Cílem předmětu je seznámit studenty se základy strojového zpracování experimentálních dat menšího až středního rozsahu. Důraz je kladen na zpracování hrubých dat, jejich transformace a export nebo jejich vizualizace.
Cílem předmětu je seznámit studenty se základy zpracování experimentálních dat menšího až středního rozsahu. Důraz je kladen na zpracování hrubých dat, jejich transformaci a export nebo jejich vizualizaci. Studenti budou pracovat převážně v jazyce R, přičemž využijí především ekosystém Tidyverse. Seznámí se také se základy práce v shellu (bash) a se službou GitHub pro správu verzí a sdílení kódu.
Last update: Strejček Michal (28.05.2025)
Course completion requirements -
Attendance at lectures is recommended but not required.
Last update: Strejček Michal (28.05.2025)
Účast na přednáškách je doporučená, není však kontrolována.
Last update: Strejček Michal (28.05.2025)
Literature -
Recommended:
Wickham, Hadley, Çetinkaya-Rundel, Mine, Grolemund, Garrett. R for data science, import, tidy, transform, visualize, and model data. : , , xxiii, 548 stran s. ISBN 978-1-4920-9740-2.
Wickham, Hadley. Advanced R. : , , s. ISBN 978-1-4665-8696-3.
Last update: Strejček Michal (28.05.2025)
Doporučená:
Wickham, Hadley, Çetinkaya-Rundel, Mine, Grolemund, Garrett. R for data science, import, tidy, transform, visualize, and model data. : , , xxiii, 548 stran s. ISBN 978-1-4920-9740-2.
Wickham, Hadley. Advanced R. : , , s. ISBN 978-1-4665-8696-3.
Last update: Strejček Michal (28.05.2025)
Requirements to the exam -
The course is completed by submitting an individual project.
Last update: Strejček Michal (28.05.2025)
Předmět je zakončen vypracováním samostatného projektu
Last update: Lipovová Petra (09.08.2023)
Syllabus -
1. Introduction to working with data
2–3. RStudio IDE, basics of R
4–6. Tidyverse – data transformation
7–9. Tidyverse – data visualization
10. Working with strings (Stringr, regular expressions)
11–12. Basics of Linux system administration
13. Remote access and installation of software tools (Anaconda, Pip, GitHub)
14. Project consultation
Last update: Strejček Michal (28.05.2025)
1. Problematika práce s daty
2.-3. Rstudio IDE, základy jazyka R
4.-6. Tidyverse – transformace dat
7.-9. Tidyverse – vizualizace data
10. Práce s textovými řetězci (Stringr, regulární výrazy)
11.-12. Základy administrace systému Linux
13. Vzdálený přístup a instalace softwarových nástrojů (Anaconda, Pip, GitHub)
14. Konzultace projektu
Last update: Lipovová Petra (13.07.2023)
Learning outcomes -
Students will acquire foundational skills in working within a Linux environment and in data processing and visualization in R, with emphasis on the concept of “tidy data” and the Tidyverse ecosystem.
Last update: Strejček Michal (28.05.2025)
Studenti si osvojí základy práce v linuxovém prostředí a základy zpracování a vizualizace dat v prostředí R s důrazem na koncept „tidy data“ a systém Tidyverse.