|
|
|
||
Tento předmět představuje široký úvod do problematiky strojového učení a vytěžování znalostí z dat. Témeta zahrnují: (i) učení s učitelem (rozhodovací stromy, support vector mašinky, neuronové sítě) (ii) učení bez učitele (shluková analýza, redukce dimenze) (iii) jak nejlépe aplikovat metody strojovéhi učení (dekompozice bias/variance, předzpracování dat, vyhodnocení kvality a výběr modelu). Na cvičeních pak studenti aplikují nabyté vědomosti na případová studie využívající datové soubory z reálných aplikací. V předmětu se extenzivně využívá open source software Rapidminer.
Poslední úprava: ROZ143 (15.11.2012)
|
|
||
Studenti budou umět: Kvalifikovaně použít základní nástroje vytěžování znalostí z dat na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování). Vybrat algoritmus vhodný pro řešení daného problému a vyhodnotit jeho přesnost. Naučí se, jak fungují metody vytěžování znalostí z dat a strojového učení. Poslední úprava: SMIDOVAL (10.06.2013)
|
|
||
Z:Berka P., Dobývání znalostí z databází, Academia, 2003, ISBN 80-200-1062-9 D:Mařík V. a kol., Umělá inteligence 1, Academia, 2000, ISBN 80-200-0496-3 D:Šnorek M. a kol., Neuronové sítě a neuropočítače, skripta ČVUT, Praha 1997 D:Larose D. T., Discovering Knowledge in Data: An Introduction to Data Mining, Wiley-Interscience, 2004, ISBN 0471666572 D:Ch. M. Bishop, Pattern Recognition and Machine Learning, Springer, 2007, ISBN 0387310738 D:I. H. Witten, Data Mining: Practical Machine Learning Tools, Morgan Kaufmann, 2011, ISBN 0123748569 Poslední úprava: ROZ143 (15.11.2012)
|
|
||
Zápočet bude získán na základě vypracovaného projektu, jehož součástí je závěrečné zpráva a prezentace výsledků. Na konci semestru studenti skládají písemnou zkoušku. Poslední úprava: Svozil Daniel (28.02.2011)
|
|
||
1) Úvod do vytěžování znalostí z dat. CRISP-DM. Datový sklad. OLAP. 2) Rozpoznávání vzorů - základní koncepty. učení s učitelem a bez učitele. Klasifikace a regrese. Generalizace. Přefitování. Zaujetí a rozptyl (bias a variance). 3) Metoda testovací množiny a metoda křížové validace. Metoda k-nejbližších sousedů. 4) Shluková analýza. 5) Teorie informace. Rozhodovací stromy. 6) Neuronové sítě I. Prahový neuron. ADALINE. Lineární perceptron. 7) Neuronové sítě II. Vícevrstvý perceptron. 8) Neuronové sítě III. Sítě typu Radial Basis Function (RBF). 9) Neuronové sítě I. Samoorganizující se mapa. 10) Support Vector Machines. 11) Genetické algoritmy. 12) Výběr a extrakce příznaků. 13) Kombinování modelů. 14) Shrnutí. Poslední úprava: ROZ143 (15.11.2012)
|
|
||
Online materiály k přednášce na http://ich.vscht.cz/~svozil/teaching.html Přednáška (video i slidy) "Learning from data" z Caltechu: http://work.caltech.edu/telecourse.html Přednáška (video i slidy) "Machine learning" ze Stanfordu: http://see.stanford.edu/see/courseinfo.aspx?coll=348ca38a-3a6d-4052-937d-cb017338d7b1 a http://cs229.stanford.edu/materials.html Kurs "Machine learning" na Courseře: https://www.coursera.org/course/machlearning Poslední úprava: ROZ143 (15.11.2012)
|
|
||
Základy statistiky Poslední úprava: ROZ143 (15.11.2012)
|
Zátěž studenta | ||||
Činnost | Kredity | Hodiny | ||
Účast na přednáškách | 1 | 28 | ||
Příprava na přednášky, semináře, laboratoře, exkurzi nebo praxi | 1 | 28 | ||
Práce na individuálním projektu | 1 | 28 | ||
Příprava na zkoušku a její absolvování | 1 | 28 | ||
Účast na seminářích | 1 | 28 | ||
5 / 5 | 140 / 140 |
Hodnocení studenta | |
Forma | Váha |
Obhajoba individuálního projektu | 30 |
Zkouškový test | 70 |