Vytěžování znalostí z dat - B500007
Anglický název: Data Mining
Zajišťuje: Ústav informatiky a chemie (143)
Fakulta: Fakulta chemické technologie
Platnost: od 2021
Semestr: oba
Body: 4
E-Kredity: 4
Způsob provedení zkoušky:
Rozsah, examinace: 2/2, Z+Zk [HT]
Počet míst: zimní:neomezen / neomezen (neurčen)
letní:neurčen / neurčen (neurčen)
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Úroveň:  
Poznámka: předmět lze zapsat v ZS i LS
Garant: Kordík Pavel doc. Ing. Ph.D.
Záměnnost : N500011
Je záměnnost pro: B500010, B500011
Termíny zkoušek   
Anotace -
Studenti se seznámí se základními postupy při vytěžování znalostí z dat. Konkrétně se naučí základní techniky předzpracování dat, vizualizace vícerozměrných dat, statistické techniky transformace dat, základní principy metod pro vytěžování znalostí. Studenti získají povědomí o vztahu mezi zaujetím a variancí modelů a o vyhodnocení kvality modelů. V předmětu se extenzivně využívá vytěžovací software. Studenti budou schopni kvalifikovaně použít základní nástroje data miningu na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).
Poslední úprava: Kubová Petra (02.01.2018)
Výstupy studia předmětu -

Studenti budou umět:

základní postupy při vytěžování znalostí z dat, konkrétně se naučí základní techniky předzpracování dat, vizualizace vícerozměrných dat, statistické

techniky transformace dat, základní principy metod pro vytěžování znalostí.

budou mít povědomí o vztahu mezi zaujetím a variancí modelů a o vyhodnocení kvality modelů.

používat vytěžovací software.

kvalifikovaně použít základní nástroje data miningu na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).

Poslední úprava: Kubová Petra (02.01.2018)
Podmínky zakončení předmětu (Další požadavky na studenta)

Pro zı́skánı́ zápočtu je potřeba dostatek bodů ze programovacích úloh a testu. Zkouška se skládá z povinné pı́semné části.

Poslední úprava: Svozil Daniel (07.02.2018)
Literatura -

Z: Berka, P. Dobývání znalostí z databází. Praha: Academia, 2003

D: L. Pierson: Data Science for Dummies (2nd edition), 2017

Poslední úprava: Svozil Daniel (26.03.2019)
Sylabus -

1. Úvod do data miningu, příprava dat, vizualizace dat.

2. Statistická analýza dat.

3. Model dat, metoda nejbližšího souseda

4. Učení, validace, testování, hodnocení kvality modelu

5. Umělé neuronové sítě v data miningu.

6. Neuronové sítě bez učitele - kompetiční učení

7. Pravděpodobnost a Bayesovská klasifikace

8. Rozhodovací stromy a pravidla.

9. Neuronové sítě s učitelem.

10. Shluková analýza.

11. Kombinování neuronových sítí a modelů obecně.

12. Data mining v prostředí Clementine.

13. Text mining, Web mining, vybrané aplikace a nové trendy.

Poslední úprava: Kubová Petra (02.01.2018)
Studijní opory -

https://edux.fit.cvut.cz/courses/BI-VZD/

(nutné přihlášení)

Poslední úprava: Kubová Petra (02.01.2018)
Studijní prerekvizity -

žádné

Poslední úprava: Kubová Petra (02.01.2018)
Zátěž studenta
Činnost Kredity Hodiny
Účast na přednáškách 1 28
Příprava na přednášky, semináře, laboratoře, exkurzi nebo praxi 1 28
Příprava na zkoušku a její absolvování 1 28
Účast na seminářích 1 28
4 / 4 112 / 112