PředmětyPředměty(verze: 861)
Předmět, akademický rok 2019/2020
  
Vytěžování znalostí z dat - B500007
Anglický název: Data Mining
Zajišťuje: ČVUT v Praze, Fakulta informačních technologií (500)
Platnost: od 2019
Semestr: zimní
Body: zimní s.:4
E-Kredity: zimní s.:4
Způsob provedení zkoušky: zimní s.:
Rozsah, examinace: zimní s.:2/2 Z+Zk [hodiny/týden]
Počet míst: neurčen / neurčen (neurčen)
Minimální obsazenost: neomezen
Jazyk výuky: čeština
Způsob výuky: prezenční
Úroveň:  
Pro druh: bakalářské
Garant: Kordík Pavel doc.Ing. Ph.D.
Záměnnost : N500011
Anotace -
Poslední úprava: Kubová Petra Ing. (02.01.2018)
Studenti se seznámí se základními postupy při vytěžování znalostí z dat. Konkrétně se naučí základní techniky předzpracování dat, vizualizace vícerozměrných dat, statistické techniky transformace dat, základní principy metod pro vytěžování znalostí. Studenti získají povědomí o vztahu mezi zaujetím a variancí modelů a o vyhodnocení kvality modelů. V předmětu se extenzivně využívá vytěžovací software. Studenti budou schopni kvalifikovaně použít základní nástroje data miningu na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).
Výstupy studia předmětu -
Poslední úprava: Kubová Petra Ing. (02.01.2018)

Studenti budou umět:

základní postupy při vytěžování znalostí z dat, konkrétně se naučí základní techniky předzpracování dat, vizualizace vícerozměrných dat, statistické

techniky transformace dat, základní principy metod pro vytěžování znalostí.

budou mít povědomí o vztahu mezi zaujetím a variancí modelů a o vyhodnocení kvality modelů.

používat vytěžovací software.

kvalifikovaně použít základní nástroje data miningu na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).

Literatura -
Poslední úprava: Svozil Daniel doc. Mgr. Ph.D. (26.03.2019)

Z: Berka, P. Dobývání znalostí z databází. Praha: Academia, 2003

D: L. Pierson: Data Science for Dummies (2nd edition), 2017

Studijní opory -
Poslední úprava: Kubová Petra Ing. (02.01.2018)

https://edux.fit.cvut.cz/courses/BI-VZD/

(nutné přihlášení)

Sylabus -
Poslední úprava: Kubová Petra Ing. (02.01.2018)

1. Úvod do data miningu, příprava dat, vizualizace dat.

2. Statistická analýza dat.

3. Model dat, metoda nejbližšího souseda

4. Učení, validace, testování, hodnocení kvality modelu

5. Umělé neuronové sítě v data miningu.

6. Neuronové sítě bez učitele - kompetiční učení

7. Pravděpodobnost a Bayesovská klasifikace

8. Rozhodovací stromy a pravidla.

9. Neuronové sítě s učitelem.

10. Shluková analýza.

11. Kombinování neuronových sítí a modelů obecně.

12. Data mining v prostředí Clementine.

13. Text mining, Web mining, vybrané aplikace a nové trendy.

Studijní prerekvizity -
Poslední úprava: Kubová Petra Ing. (02.01.2018)

žádné

Podmínky zakončení předmětu
Poslední úprava: Svozil Daniel doc. Mgr. Ph.D. (07.02.2018)

Pro zı́skánı́ zápočtu je potřeba dostatek bodů ze programovacích úloh a testu. Zkouška se skládá z povinné pı́semné části.

Zátěž studenta
Činnost Kredity Hodiny
Účast na přednáškách 1 28
Příprava na přednášky, semináře, laboratoře, exkurzi nebo praxi 1 28
Příprava na zkoušku a její absolvování 1 28
Účast na seminářích 1 28
4 / 4 112 / 112
Hodnocení studenta
Forma Váha
Zkouškový test 60
Průběžné a zápočtové testy 40

 
VŠCHT Praha