Bioinformatické zpracování dat - M320079
Anglický název: Bioinformatic Data Processing
Zajišťuje: Ústav biochemie a mikrobiologie (320)
Fakulta: Fakulta potravinářské a biochemické technologie
Platnost: od 2023 do 2024
Semestr: zimní
Body: zimní s.:4
E-Kredity: zimní s.:4
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:1/2, Z+Zk [HT]
Počet míst: neomezen / neomezen (neurčen)
Minimální obsazenost: neomezen
Kompetence:  
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Úroveň:  
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Strejček Michal Ing. Ph.D.
Termíny zkoušek   
Anotace
Cílem předmětu je seznámit studenty se základy strojového zpracování experimentálních dat menšího až středního rozsahu. Důraz je kladen na zpracování hrubých dat, jejich transformace a export nebo jejich vizualizace. Cílem předmětu je seznámit studenty se základy zpracování experimentálních dat menšího až středního rozsahu. Důraz je kladen na zpracování hrubých dat, jejich transformaci a export nebo jejich vizualizaci. Studenti budou pracovat převážně v jazyce R, přičemž využijí především ekosystém Tidyverse. Seznámí se také se základy práce v shellu (bash) a se službou GitHub pro správu verzí a sdílení kódu.
Poslední úprava: Strejček Michal (28.05.2025)
Podmínky zakončení předmětu (Další požadavky na studenta)

Účast na přednáškách je doporučená, není však kontrolována.

Poslední úprava: Strejček Michal (28.05.2025)
Literatura

Z: R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. Hadley Wickham, Mine Çetinkaya-Rundel, Garrett Grolemund. 2023, 2nd Edition, O'Reilly Media. ISBN 1492097403.

Z: Advanced R. Hadley Wickham. 2019, 2nd Edition, O'Reilly Media. ISBN 0815384572.

Poslední úprava: Strejček Michal (28.05.2025)
Požadavky ke zkoušce (Forma způsobu ověření studijních výsledků)

Předmět je zakončen vypracováním samostatného projektu

Poslední úprava: Lipovová Petra (09.08.2023)
Sylabus

1. Problematika práce s daty

2.-3. Rstudio IDE, základy jazyka R

4.-6. Tidyverse – transformace dat

7.-9. Tidyverse – vizualizace data

10. Práce s textovými řetězci (Stringr, regulární výrazy)

11.-12. Základy administrace systému Linux

13. Vzdálený přístup a instalace softwarových nástrojů (Anaconda, Pip, GitHub)

14. Konzultace projektu

Poslední úprava: Lipovová Petra (13.07.2023)
Výsledky učení

Studenti si osvojí základy práce v linuxovém prostředí a základy zpracování a vizualizace dat v prostředí R s důrazem na koncept „tidy data“ a systém Tidyverse.

Poslední úprava: Strejček Michal (21.06.2023)