Poslední úprava: Jirát Jiří Ing. Ph.D. (10.01.2014)
Studenti se seznámí se základními postupy při vytěžování znalostí z dat. Konkrétně se naučí základní techniky předzpracování dat, vizualizace vícerozměrných dat, statistické techniky transformace dat, základní principy metod pro vytěžování znalostí. Studenti získají povědomí o vztahu mezi zaujetím a variancí modelů a o vyhodnocení kvality modelů. V předmětu se extenzivně využívá vytěžovací software. Studenti budou schopni kvalifikovaně použít základní nástroje data miningu na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).
Poslední úprava: Jirát Jiří Ing. Ph.D. (10.01.2014)
Students are introduced to the basic methods of discovering knowledge in data. In particular, they learn the basic techniques of data preprocessing, multidimensional data visualization, statistical techniques of data transformation, and fundamental principles of knowledge discovery methods. Students will be aware of the relationships between model bias and variance, and know the fundamentals of assessing model quality. Data mining software is extensively used in the module. Students will be able to apply basic data mining tools to common problems (classification, regression, clustering).
Výstupy studia předmětu -
Poslední úprava: Jirát Jiří Ing. Ph.D. (13.01.2014)
Studenti budou umět:
základní postupy při vytěžování znalostí z dat, konkrétně se naučí základní techniky předzpracování dat, vizualizace vícerozměrných dat, statistické
techniky transformace dat, základní principy metod pro vytěžování znalostí.
budou mít povědomí o vztahu mezi zaujetím a variancí modelů a o vyhodnocení kvality modelů.
používat vytěžovací software.
kvalifikovaně použít základní nástroje data miningu na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).
Poslední úprava: Jirát Jiří Ing. Ph.D. (31.01.2014)
Students will be able to:
Understand knowledge discovery in data.
Literatura -
Poslední úprava: Jirát Jiří Ing. Ph.D. (10.01.2014)
Z:Berka, P. Dobývání znalostí z databází. Praha: Academia, 2003. ISBN 80-200-1062-9.
Poslední úprava: Jirát Jiří Ing. Ph.D. (10.01.2014)
R:Larose, D. T. Discovering Knowledge in Data: An Introduction to Data Mining. Wiley-Interscience, 2004. ISBN 0471666572.
Studijní opory -
Poslední úprava: Jirát Jiří Ing. Ph.D. (10.01.2014)
https://edux.fit.cvut.cz/courses/BI-VZD/
(nutné přihlášení)
Poslední úprava: Jirát Jiří Ing. Ph.D. (10.01.2014)
https://edux.fit.cvut.cz/courses/BI-VZD/
(login necessary)
Sylabus -
Poslední úprava: Jirát Jiří Ing. Ph.D. (10.01.2014)
1. Úvod do data miningu, příprava dat, vizualizace dat.
2. Statistická analýza dat.
3. Model dat, metoda nejbližšího souseda
4. Učení, validace, testování, hodnocení kvality modelu
5. Umělé neuronové sítě v data miningu.
6. Neuronové sítě bez učitele - kompetiční učení
7. Pravděpodobnost a Bayesovská klasifikace
8. Rozhodovací stromy a pravidla.
9. Neuronové sítě s učitelem.
10. Shluková analýza.
11. Kombinování neuronových sítí a modelů obecně.
12. Data mining v prostředí Clementine.
13. Text mining, Web mining, vybrané aplikace a nové trendy.
Poslední úprava: Jirát Jiří Ing. Ph.D. (10.01.2014)
1. Introduction to data mining, data preparation, data visualization.
2. Statistical analysis of data.
3. Data model, nearest neighbour classifier.
4. Training, validation and testing, model's quality evaluation.