Cílem předmětu je seznámit studenty se základy strojového zpracování experimentálních dat menšího až středního rozsahu. Důraz je kladen na zpracování hrubých dat, jejich transformace a export nebo jejich vizualizace.
Cílem předmětu je seznámit studenty se základy zpracování experimentálních dat menšího až středního rozsahu. Důraz je kladen na zpracování hrubých dat, jejich transformaci a export nebo jejich vizualizaci. Studenti budou pracovat převážně v jazyce R, přičemž využijí především ekosystém Tidyverse. Seznámí se také se základy práce v shellu (bash) a se službou GitHub pro správu verzí a sdílení kódu.
Poslední úprava: Strejček Michal (28.05.2025)
The course aims to introduce students to the fundamentals of processing small to medium-scale experimental data using automated tools. Emphasis is placed on cleaning raw data, transforming it, visualizing it, and exporting the results. Students will primarily work in the R language, with extensive use of the Tidyverse ecosystem. They will also learn the basics of using the shell (bash) and GitHub for version control and code sharing.
Poslední úprava: Strejček Michal (28.05.2025)
Podmínky zakončení předmětu (Další požadavky na studenta) -
Účast na přednáškách je doporučená, není však kontrolována.
Poslední úprava: Strejček Michal (28.05.2025)
Attendance at lectures is recommended but not required.
Poslední úprava: Strejček Michal (28.05.2025)
Literatura -
Doporučená:
Wickham, Hadley, Çetinkaya-Rundel, Mine, Grolemund, Garrett. R for data science, import, tidy, transform, visualize, and model data. : , , xxiii, 548 stran s. ISBN 978-1-4920-9740-2.
Wickham, Hadley. Advanced R. : , , s. ISBN 978-1-4665-8696-3.
Poslední úprava: Strejček Michal (28.05.2025)
Recommended:
Wickham, Hadley, Çetinkaya-Rundel, Mine, Grolemund, Garrett. R for data science, import, tidy, transform, visualize, and model data. : , , xxiii, 548 stran s. ISBN 978-1-4920-9740-2.
Wickham, Hadley. Advanced R. : , , s. ISBN 978-1-4665-8696-3.
Poslední úprava: Strejček Michal (28.05.2025)
Požadavky ke zkoušce (Forma způsobu ověření studijních výsledků) -
Předmět je zakončen vypracováním samostatného projektu
Poslední úprava: Lipovová Petra (09.08.2023)
The course is completed by submitting an individual project.
Poslední úprava: Strejček Michal (28.05.2025)
Sylabus -
1. Problematika práce s daty
2.-3. Rstudio IDE, základy jazyka R
4.-6. Tidyverse – transformace dat
7.-9. Tidyverse – vizualizace data
10. Práce s textovými řetězci (Stringr, regulární výrazy)
11.-12. Základy administrace systému Linux
13. Vzdálený přístup a instalace softwarových nástrojů (Anaconda, Pip, GitHub)
14. Konzultace projektu
Poslední úprava: Lipovová Petra (13.07.2023)
1. Introduction to working with data
2–3. RStudio IDE, basics of R
4–6. Tidyverse – data transformation
7–9. Tidyverse – data visualization
10. Working with strings (Stringr, regular expressions)
11–12. Basics of Linux system administration
13. Remote access and installation of software tools (Anaconda, Pip, GitHub)
14. Project consultation
Poslední úprava: Strejček Michal (28.05.2025)
Výsledky učení -
Studenti si osvojí základy práce v linuxovém prostředí a základy zpracování a vizualizace dat v prostředí R s důrazem na koncept „tidy data“ a systém Tidyverse.
Poslední úprava: Strejček Michal (21.06.2023)
Students will acquire foundational skills in working within a Linux environment and in data processing and visualization in R, with emphasis on the concept of “tidy data” and the Tidyverse ecosystem.