PředmětyPředměty(verze: 963)
Předmět, akademický rok 2013/2014
  
Vytěžování znalostí z dat - N500011
Anglický název: Data Mining
Zajišťuje: ČVUT v Praze, Fakulta informačních technologií (500)
Fakulta: Vysoká škola chemicko-technologická v Praze
Platnost: od 2013 do 2020
Semestr: letní
Body: letní s.:4
E-Kredity: letní s.:4
Způsob provedení zkoušky: letní s.:
Rozsah, examinace: letní s.:2/2, Z+Zk [HT]
Počet míst: neurčen / neurčen (neurčen)
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Úroveň:  
Garant: Kordík Pavel doc. Ing. Ph.D.
Termíny zkoušek   Rozvrh   
Anotace -
Studenti se seznámí se základními postupy při vytěžování znalostí z dat. Konkrétně se naučí základní techniky předzpracování dat, vizualizace vícerozměrných dat, statistické techniky transformace dat, základní principy metod pro vytěžování znalostí. Studenti získají povědomí o vztahu mezi zaujetím a variancí modelů a o vyhodnocení kvality modelů. V předmětu se extenzivně využívá vytěžovací software. Studenti budou schopni kvalifikovaně použít základní nástroje data miningu na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).
Poslední úprava: Jirát Jiří (10.01.2014)
Výstupy studia předmětu -

Studenti budou umět:

základní postupy při vytěžování znalostí z dat, konkrétně se naučí základní techniky předzpracování dat, vizualizace vícerozměrných dat, statistické

techniky transformace dat, základní principy metod pro vytěžování znalostí.

budou mít povědomí o vztahu mezi zaujetím a variancí modelů a o vyhodnocení kvality modelů.

používat vytěžovací software.

kvalifikovaně použít základní nástroje data miningu na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).

Poslední úprava: Jirát Jiří (13.01.2014)
Literatura -

Z:Berka, P. Dobývání znalostí z databází. Praha: Academia, 2003. ISBN 80-200-1062-9.

Poslední úprava: Jirát Jiří (10.01.2014)
Sylabus -

1. Úvod do data miningu, příprava dat, vizualizace dat.

2. Statistická analýza dat.

3. Model dat, metoda nejbližšího souseda

4. Učení, validace, testování, hodnocení kvality modelu

5. Umělé neuronové sítě v data miningu.

6. Neuronové sítě bez učitele - kompetiční učení

7. Pravděpodobnost a Bayesovská klasifikace

8. Rozhodovací stromy a pravidla.

9. Neuronové sítě s učitelem.

10. Shluková analýza.

11. Kombinování neuronových sítí a modelů obecně.

12. Data mining v prostředí Clementine.

13. Text mining, Web mining, vybrané aplikace a nové trendy.

Poslední úprava: Jirát Jiří (10.01.2014)
Studijní opory -

https://edux.fit.cvut.cz/courses/BI-VZD/

(nutné přihlášení)

Poslední úprava: Jirát Jiří (10.01.2014)
Studijní prerekvizity -

žádné

Poslední úprava: Jirát Jiří (31.01.2014)
Zátěž studenta
Činnost Kredity Hodiny
Účast na přednáškách 1 28
Práce na individuálním projektu 0.5 14
Příprava na zkoušku a její absolvování 1.1 30
Účast na seminářích 1 28
4 / 4 100 / 112
 
VŠCHT Praha