PředmětyPředměty(verze: 811)
Předmět, akademický rok 2017/2018
  
Vytěžování znalostí z dat - N143034
Anglický název: Data Mining
Zajišťuje: Laboratoř informatiky a chemie (143)
Platnost: od 2016
Semestr: letní
Body: letní s.:5
E-Kredity: letní s.:5
Způsob provedení zkoušky: letní s.:
Rozsah, examinace: letní s.:2/2 Z+Zk [hodiny/týden]
Počet míst: neurčen / neurčen (neurčen)Rozvrh není zveřejněn, proto je tento údaj pouze informativní a může se ještě měnit.
Minimální obsazenost: neomezen
Jazyk výuky: čeština
Způsob výuky: prezenční
Úroveň:  
Pro druh:  
Další informace: http://ich.vscht.cz/~svozil/teaching.html
Garant: Svozil Daniel doc. Mgr. Ph.D.
Anotace -
Poslední úprava: ROZ143 (15.11.2012)

Tento předmět představuje široký úvod do problematiky strojového učení a vytěžování znalostí z dat. Témeta zahrnují: (i) učení s učitelem (rozhodovací stromy, support vector mašinky, neuronové sítě) (ii) učení bez učitele (shluková analýza, redukce dimenze) (iii) jak nejlépe aplikovat metody strojovéhi učení (dekompozice bias/variance, předzpracování dat, vyhodnocení kvality a výběr modelu). Na cvičeních pak studenti aplikují nabyté vědomosti na případová studie využívající datové soubory z reálných aplikací. V předmětu se extenzivně využívá open source software Rapidminer.
Výstupy studia předmětu -
Poslední úprava: Šmídová Ludmila (10.06.2013)

Studenti budou umět:

Kvalifikovaně použít základní nástroje vytěžování znalostí z dat na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).

Vybrat algoritmus vhodný pro řešení daného problému a vyhodnotit jeho přesnost.

Naučí se, jak fungují metody vytěžování znalostí z dat a strojového učení.

Literatura -
Poslední úprava: ROZ143 (15.11.2012)

Z:Berka P., Dobývání znalostí z databází, Academia, 2003, ISBN 80-200-1062-9

D:Mařík V. a kol., Umělá inteligence 1, Academia, 2000, ISBN 80-200-0496-3

D:Šnorek M. a kol., Neuronové sítě a neuropočítače, skripta ČVUT, Praha 1997

D:Larose D. T., Discovering Knowledge in Data: An Introduction to Data Mining, Wiley-Interscience, 2004, ISBN 0471666572

D:Ch. M. Bishop, Pattern Recognition and Machine Learning, Springer, 2007, ISBN 0387310738

D:I. H. Witten, Data Mining: Practical Machine Learning Tools, Morgan Kaufmann, 2011, ISBN 0123748569

Studijní opory -
Poslední úprava: ROZ143 (15.11.2012)

Online materiály k přednášce na http://ich.vscht.cz/~svozil/teaching.html

Přednáška (video i slidy) "Learning from data" z Caltechu: http://work.caltech.edu/telecourse.html

Přednáška (video i slidy) "Machine learning" ze Stanfordu: http://see.stanford.edu/see/courseinfo.aspx?coll=348ca38a-3a6d-4052-937d-cb017338d7b1 a http://cs229.stanford.edu/materials.html

Kurs "Machine learning" na Courseře: https://www.coursera.org/course/machlearning

Požadavky ke kontrole studia
Poslední úprava: Svozil Daniel doc. Mgr. Ph.D. (28.02.2011)

Zápočet bude získán na základě vypracovaného projektu, jehož součástí je závěrečné zpráva a prezentace výsledků. Na konci semestru studenti skládají písemnou zkoušku.

Sylabus -
Poslední úprava: ROZ143 (15.11.2012)

1) Úvod do vytěžování znalostí z dat. CRISP-DM. Datový sklad. OLAP.

2) Rozpoznávání vzorů - základní koncepty. učení s učitelem a bez učitele. Klasifikace a regrese. Generalizace. Přefitování. Zaujetí a rozptyl (bias a variance).

3) Metoda testovací množiny a metoda křížové validace. Metoda k-nejbližších sousedů.

4) Shluková analýza.

5) Teorie informace. Rozhodovací stromy.

6) Neuronové sítě I. Prahový neuron. ADALINE. Lineární perceptron.

7) Neuronové sítě II. Vícevrstvý perceptron.

8) Neuronové sítě III. Sítě typu Radial Basis Function (RBF).

9) Neuronové sítě I. Samoorganizující se mapa.

10) Support Vector Machines.

11) Genetické algoritmy.

12) Výběr a extrakce příznaků.

13) Kombinování modelů.

14) Shrnutí.

Studijní prerekvizity -
Poslední úprava: ROZ143 (15.11.2012)

Základy statistiky

Zátěž studenta
Činnost Kredity Hodiny
Příprava na přednášky, semináře, laboratoře, exkurzi nebo praxi 1 28
Práce na individuálním projektu 1 28
Příprava na zkoušku a její absolvování 1 28
3 / 5 84 / 140
Hodnocení studenta
Forma Váha
Obhajoba individuálního projektu 30
Zkouškový test 70

 
VŠCHT Praha