Předměty
Předměty(verze: 633)
Login :  Heslo :     
Předmět, akademický rok 2012/2013
 
Vytěžování znalostí z dat - N143034
Anglický název: Data ming
Zajišťuje: Laboratoř informatiky a chemie (143)
Platnost: od 2010 do 2012
Semestr: letní
Rozsah, examinace: letní s.:2/2 Z+Zk [hodiny/týden]
Body: letní s.:5
E-Kredity: letní s.:5
Způsob provedení zkoušky: letní s.:
Rozsah za akademický rok:  
Počet míst: 25 / 25 (neurčen)
Minimální obsazenost: neomezen
Jazyk výuky: čeština
Způsob výuky: prezenční
Úroveň:  
Další informace: http://ich.vscht.cz/~svozil/teaching.html
Garant: Svozil Daniel doc. Mgr. Ph.D.
Anotace -
Poslední úprava: ROZ143 (15.11.2012)

Tento předmět představuje široký úvod do problematiky strojového učení a vytěžování znalostí z dat. Témeta zahrnují: (i) učení s učitelem (rozhodovací stromy, support vector mašinky, neuronové sítě) (ii) učení bez učitele (shluková analýza, redukce dimenze) (iii) jak nejlépe aplikovat metody strojovéhi učení (dekompozice bias/variance, předzpracování dat, vyhodnocení kvality a výběr modelu). Na cvičeních pak studenti aplikují nabyté vědomosti na případová studie využívající datové soubory z reálných aplikací. V předmětu se extenzivně využívá open source software Rapidminer.
Výstupy studia předmětu -
Poslední úprava: ROZ143 (15.11.2012)

Studenti budou umět:

Kvalifikovaně použít základní nástroje vytěžování znalostí z dat na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).

Vybrat algoritmus vhodný pro řešení daného problému a vyhodnotit jeho přesnost.

Naučí se, jak fungují metody vytěžování znalostí z dat a strojového učení.

Literatura -
Poslední úprava: ROZ143 (15.11.2012)

Z:Berka P., Dobývání znalostí z databází, Academia, 2003, ISBN 80-200-1062-9

D:Mařík V. a kol., Umělá inteligence 1, Academia, 2000, ISBN 80-200-0496-3

D:Šnorek M. a kol., Neuronové sítě a neuropočítače, skripta ČVUT, Praha 1997

D:Larose D. T., Discovering Knowledge in Data: An Introduction to Data Mining, Wiley-Interscience, 2004, ISBN 0471666572

D:Ch. M. Bishop, Pattern Recognition and Machine Learning, Springer, 2007, ISBN 0387310738

D:I. H. Witten, Data Mining: Practical Machine Learning Tools, Morgan Kaufmann, 2011, ISBN 0123748569

Studijní opory -
Poslední úprava: ROZ143 (15.11.2012)

Online materiály k přednášce na http://ich.vscht.cz/~svozil/teaching.html

Přednáška (video i slidy) "Learning from data" z Caltechu: http://work.caltech.edu/telecourse.html

Přednáška (video i slidy) "Machine learning" ze Stanfordu: http://see.stanford.edu/see/courseinfo.aspx?coll=348ca38a-3a6d-4052-937d-cb017338d7b1 a http://cs229.stanford.edu/materials.html

Kurs "Machine learning" na Courseře: https://www.coursera.org/course/machlearning

Požadavky ke kontrole studia
Poslední úprava: Svozil Daniel doc. Mgr. Ph.D. (28.02.2011)

Zápočet bude získán na základě vypracovaného projektu, jehož součástí je závěrečné zpráva a prezentace výsledků. Na konci semestru studenti skládají písemnou zkoušku.

Sylabus -
Poslední úprava: ROZ143 (15.11.2012)

1) Úvod do vytěžování znalostí z dat. CRISP-DM. Datový sklad. OLAP.

2) Rozpoznávání vzorů - základní koncepty. učení s učitelem a bez učitele. Klasifikace a regrese. Generalizace. Přefitování. Zaujetí a rozptyl (bias a variance).

3) Metoda testovací množiny a metoda křížové validace. Metoda k-nejbližších sousedů.

4) Shluková analýza.

5) Teorie informace. Rozhodovací stromy.

6) Neuronové sítě I. Prahový neuron. ADALINE. Lineární perceptron.

7) Neuronové sítě II. Vícevrstvý perceptron.

8) Neuronové sítě III. Sítě typu Radial Basis Function (RBF).

9) Neuronové sítě I. Samoorganizující se mapa.

10) Support Vector Machines.

11) Genetické algoritmy.

12) Výběr a extrakce příznaků.

13) Kombinování modelů.

14) Shrnutí.

Studijní prerekvizity -
Poslední úprava: ROZ143 (15.11.2012)

Základy statistiky

Potřebujete-li další nápovědu, přečtěte si ještě Otázky a odpovědi systému Student?
 
VŠCHT Praha