Vytěžování znalostí z dat - N143034
Anglický název: Data Mining
Zajišťuje: Ústav informatiky a chemie (143)
Fakulta: Fakulta chemické technologie
Platnost: od 2022
Semestr: letní
Body: letní s.:5
E-Kredity: letní s.:5
Způsob provedení zkoušky: letní s.:
Rozsah, examinace: letní s.:2/2, Z+Zk [HT]
Počet míst: neurčen / neurčen (neurčen)
Minimální obsazenost: neomezen
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Úroveň:  
Pro druh:  
Další informace: http://ich.vscht.cz/~svozil/teaching.html
Garant: Svozil Daniel prof. Mgr. Ph.D.
Termíny zkoušek   Rozvrh   
Anotace -
Tento předmět představuje široký úvod do problematiky strojového učení a vytěžování znalostí z dat. Témeta zahrnují: (i) učení s učitelem (rozhodovací stromy, support vector mašinky, neuronové sítě) (ii) učení bez učitele (shluková analýza, redukce dimenze) (iii) jak nejlépe aplikovat metody strojovéhi učení (dekompozice bias/variance, předzpracování dat, vyhodnocení kvality a výběr modelu). Na cvičeních pak studenti aplikují nabyté vědomosti na případová studie využívající datové soubory z reálných aplikací. V předmětu se extenzivně využívá open source software Rapidminer.
Poslední úprava: ROZ143 (15.11.2012)
Výstupy studia předmětu -

Studenti budou umět:

Kvalifikovaně použít základní nástroje vytěžování znalostí z dat na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).

Vybrat algoritmus vhodný pro řešení daného problému a vyhodnotit jeho přesnost.

Naučí se, jak fungují metody vytěžování znalostí z dat a strojového učení.

Poslední úprava: SMIDOVAL (10.06.2013)
Literatura -

Z:Berka P., Dobývání znalostí z databází, Academia, 2003, ISBN 80-200-1062-9

D:Mařík V. a kol., Umělá inteligence 1, Academia, 2000, ISBN 80-200-0496-3

D:Šnorek M. a kol., Neuronové sítě a neuropočítače, skripta ČVUT, Praha 1997

D:Larose D. T., Discovering Knowledge in Data: An Introduction to Data Mining, Wiley-Interscience, 2004, ISBN 0471666572

D:Ch. M. Bishop, Pattern Recognition and Machine Learning, Springer, 2007, ISBN 0387310738

D:I. H. Witten, Data Mining: Practical Machine Learning Tools, Morgan Kaufmann, 2011, ISBN 0123748569

Poslední úprava: ROZ143 (15.11.2012)
Studijní opory -

Online materiály k přednášce na http://ich.vscht.cz/~svozil/teaching.html

Přednáška (video i slidy) "Learning from data" z Caltechu: http://work.caltech.edu/telecourse.html

Přednáška (video i slidy) "Machine learning" ze Stanfordu: http://see.stanford.edu/see/courseinfo.aspx?coll=348ca38a-3a6d-4052-937d-cb017338d7b1 a http://cs229.stanford.edu/materials.html

Kurs "Machine learning" na Courseře: https://www.coursera.org/course/machlearning

Poslední úprava: ROZ143 (15.11.2012)
Požadavky ke zkoušce (Forma způsobu ověření studijních výsledků)

Zápočet bude získán na základě vypracovaného projektu, jehož součástí je závěrečné zpráva a prezentace výsledků. Na konci semestru studenti skládají písemnou zkoušku.

Poslední úprava: Svozil Daniel (28.02.2011)
Sylabus -

1) Úvod do vytěžování znalostí z dat. CRISP-DM. Datový sklad. OLAP.

2) Rozpoznávání vzorů - základní koncepty. učení s učitelem a bez učitele. Klasifikace a regrese. Generalizace. Přefitování. Zaujetí a rozptyl (bias a variance).

3) Metoda testovací množiny a metoda křížové validace. Metoda k-nejbližších sousedů.

4) Shluková analýza.

5) Teorie informace. Rozhodovací stromy.

6) Neuronové sítě I. Prahový neuron. ADALINE. Lineární perceptron.

7) Neuronové sítě II. Vícevrstvý perceptron.

8) Neuronové sítě III. Sítě typu Radial Basis Function (RBF).

9) Neuronové sítě I. Samoorganizující se mapa.

10) Support Vector Machines.

11) Genetické algoritmy.

12) Výběr a extrakce příznaků.

13) Kombinování modelů.

14) Shrnutí.

Poslední úprava: ROZ143 (15.11.2012)
Studijní prerekvizity -

Základy statistiky

Poslední úprava: ROZ143 (15.11.2012)
Zátěž studenta
Činnost Kredity Hodiny
Příprava na přednášky, semináře, laboratoře, exkurzi nebo praxi 1 28
Práce na individuálním projektu 1 28
Příprava na zkoušku a její absolvování 1 28
3 / 5 84 / 140
Hodnocení studenta
Forma Váha
Obhajoba individuálního projektu 30
Zkouškový test 70