PředmětyPředměty(verze: 976)
Předmět, akademický rok 2024/2025
  
Bioinformatické zpracování dat - M320079
Anglický název: Bioinformatic Data Processing
Zajišťuje: Ústav biochemie a mikrobiologie (320)
Fakulta: Fakulta potravinářské a biochemické technologie
Platnost: od 2023 do 2024
Semestr: zimní
Body: zimní s.:4
E-Kredity: zimní s.:4
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:1/2, Z+Zk [HT]
Počet míst: neomezen / neomezen (neurčen)
Minimální obsazenost: neomezen
Kompetence:  
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Úroveň:  
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Strejček Michal Ing. Ph.D.
Anotace
Cílem předmětu je seznámit studenty se základy strojového zpracování experimentálních dat menšího až středního rozsahu. Důraz je kladen na zpracování hrubých dat, jejich transformace a export nebo jejich vizualizace. Cílem předmětu je seznámit studenty se základy zpracování experimentálních dat menšího až středního rozsahu. Důraz je kladen na zpracování hrubých dat, jejich transformaci a export nebo jejich vizualizaci. Studenti budou pracovat převážně v jazyce R, přičemž využijí především ekosystém Tidyverse. Seznámí se také se základy práce v shellu (bash) a se službou GitHub pro správu verzí a sdílení kódu.
Poslední úprava: Strejček Michal (28.05.2025)
Podmínky zakončení předmětu (Další požadavky na studenta)

Účast na přednáškách je doporučená, není však kontrolována.

Poslední úprava: Strejček Michal (28.05.2025)
Literatura

Z: R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. Hadley Wickham, Mine Çetinkaya-Rundel, Garrett Grolemund. 2023, 2nd Edition, O'Reilly Media. ISBN 1492097403.

Z: Advanced R. Hadley Wickham. 2019, 2nd Edition, O'Reilly Media. ISBN 0815384572.

Poslední úprava: Strejček Michal (28.05.2025)
Požadavky ke zkoušce (Forma způsobu ověření studijních výsledků)

Předmět je zakončen vypracováním samostatného projektu

Poslední úprava: Lipovová Petra (09.08.2023)
Sylabus

1. Problematika práce s daty

2.-3. Rstudio IDE, základy jazyka R

4.-6. Tidyverse – transformace dat

7.-9. Tidyverse – vizualizace data

10. Práce s textovými řetězci (Stringr, regulární výrazy)

11.-12. Základy administrace systému Linux

13. Vzdálený přístup a instalace softwarových nástrojů (Anaconda, Pip, GitHub)

14. Konzultace projektu

Poslední úprava: Lipovová Petra (13.07.2023)
Výsledky učení

Studenti si osvojí základy práce v linuxovém prostředí a základy zpracování a vizualizace dat v prostředí R s důrazem na koncept „tidy data“ a systém Tidyverse.

Poslední úprava: Strejček Michal (21.06.2023)
 
VŠCHT Praha