PředmětyPředměty(verze: 965)
Předmět, akademický rok 2019/2020
  
Algoritmy data miningu - M500002
Anglický název: Data Mining Algorithms
Zajišťuje: Ústav informatiky a chemie (143)
Fakulta: Fakulta chemické technologie
Platnost: od 2019 do 2021
Semestr: letní
Body: letní s.:4
E-Kredity: letní s.:4
Způsob provedení zkoušky: letní s.:
Rozsah, examinace: letní s.:2/1, Z+Zk [HT]
Počet míst: neomezen / neomezen (neurčen)
Minimální obsazenost: neomezen
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Úroveň:  
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Holeňa Martin doc. Ing. RNDr.
Záměnnost : N500012
Termíny zkoušek   Rozvrh   
Anotace -
Předmět je vhodný pro ty z vás, kteří se chtějí seznámit s náramně zajímavou a užitečnou disciplínou "vytěžováním znalostí z dat" (data miningem). Budeme se vám snažit nenásilnou formou přiblížit ty nejužitečnější algoritmy, které pak snadno využijete v kterékoli oblasti informatiky.
Poslední úprava: Hladíková Jana (05.01.2018)
Podmínky zakončení předmětu (Další požadavky na studenta)

Pro zı́skánı́ zápočtu je potřeba dostatek bodů ze semestrálnı́ práce. Zkouška se skládá z pı́semné přı́pravy a povinné ústnı́ části.

Poslední úprava: Svozil Daniel (07.02.2018)
Literatura -

Z:Berka P. Dobývání znalostí z databází. Praha: Academia, 2003. ISBN 80-200-1062-9

Z:Hastie T.,Tibshirani R.,Friedman J., The Elements of Statistical Learning, Data Mining, Inference and Prediction, Springer, 2016, ISBN: 978-0387848570

Poslední úprava: Svozil Daniel (04.11.2018)
Sylabus -

1) Úvod a základní úlohy data miningu, klasifikace, predikce, algoritmus nejbližších sousedů a jeho varianty

2) Model, hodnocení modelu, plasticita, regularizace

3) Úvod do klasifikace a regrese

4) Rozhodovací stromy (algoritmy C4.5, CART, MARS)

5) Klasifikace pomocí perceptronů a její zobecnění

6) Lineární, polynomiální a logistická regrese, algoritmy LMS, MLE

7) Nelineární SVM-klasifikátory a SV-regrese

8) Induktivní modelování - algoritmy GMDH MIA, COMBI

9) Nelineární regrese pomocí vícevrstvých perceptronů

10) Kombinování modelů (algoritmus Adaboost)

11) Statistický přístup k umělým neuronovým sítím

12) Shluková analýza (algoritmy K-středů, hierarchické shlukování, neuronový plyn, SOM)

13) Využití statistického přístupu při volbě počtu skrytých neuronů

Poslední úprava: Hladíková Jana (05.01.2018)
Studijní opory -

https://edux.fit.cvut.cz/courses/MI-ADM

(nutné přihlášení)

Poslední úprava: Hladíková Jana (05.01.2018)
Výsledky učení -

Studenti budou umět:

orientovat se v algoritmech používaných v oblasti data-miningu

využít tyto algoritmy v různých oblastech informatiky

Poslední úprava: Hladíková Jana (05.01.2018)
Studijní prerekvizity -

Statistická analýza dat, Vytěžování znalostí z dat, Programování a algoritmizace

Poslední úprava: Svozil Daniel (08.02.2018)
Zátěž studenta
Činnost Kredity Hodiny
Účast na přednáškách 1 28
Práce na individuálním projektu 2 56
Účast na seminářích 0.5 14
4 / 4 98 / 112
Hodnocení studenta
Forma Váha
Protokoly z individuálních projektů 40
Ústní zkouška 60

 
VŠCHT Praha