PředmětyPředměty(verze: 855)
Předmět, akademický rok 2019/2020
  
Algoritmy data miningu - M500002
Anglický název: Data Mining Algorithms
Zajišťuje: ČVUT v Praze, Fakulta informačních technologií (500)
Platnost: od 2019
Semestr: letní
Body: letní s.:4
E-Kredity: letní s.:4
Způsob provedení zkoušky: letní s.:
Rozsah, examinace: letní s.:2/1 Z+Zk [hodiny/týden]
Počet míst: neomezen / neomezen (neurčen)
Minimální obsazenost: neomezen
Jazyk výuky: čeština
Způsob výuky: prezenční
Úroveň:  
Pro druh:  
Poznámka: předmět je možno zapsat mimo plán
povolen pro zápis po webu
Garant: Holeňa Martin doc. Ing. RNDr.
Záměnnost : N500012
Termíny zkoušek   Rozvrh   
Anotace -
Poslední úprava: Hladíková Jana (05.01.2018)
Předmět je vhodný pro ty z vás, kteří se chtějí seznámit s náramně zajímavou a užitečnou disciplínou "vytěžováním znalostí z dat" (data miningem). Budeme se vám snažit nenásilnou formou přiblížit ty nejužitečnější algoritmy, které pak snadno využijete v kterékoli oblasti informatiky.
Výstupy studia předmětu -
Poslední úprava: Hladíková Jana (05.01.2018)

Studenti budou umět:

orientovat se v algoritmech používaných v oblasti data-miningu

využít tyto algoritmy v různých oblastech informatiky

Literatura -
Poslední úprava: Svozil Daniel doc. Mgr. Ph.D. (04.11.2018)

Z:Berka P. Dobývání znalostí z databází. Praha: Academia, 2003. ISBN 80-200-1062-9

Z:Hastie T.,Tibshirani R.,Friedman J., The Elements of Statistical Learning, Data Mining, Inference and Prediction, Springer, 2016, ISBN: 978-0387848570

Studijní opory -
Poslední úprava: Hladíková Jana (05.01.2018)

https://edux.fit.cvut.cz/courses/MI-ADM

(nutné přihlášení)

Sylabus -
Poslední úprava: Hladíková Jana (05.01.2018)

1) Úvod a základní úlohy data miningu, klasifikace, predikce, algoritmus nejbližších sousedů a jeho varianty

2) Model, hodnocení modelu, plasticita, regularizace

3) Úvod do klasifikace a regrese

4) Rozhodovací stromy (algoritmy C4.5, CART, MARS)

5) Klasifikace pomocí perceptronů a její zobecnění

6) Lineární, polynomiální a logistická regrese, algoritmy LMS, MLE

7) Nelineární SVM-klasifikátory a SV-regrese

8) Induktivní modelování - algoritmy GMDH MIA, COMBI

9) Nelineární regrese pomocí vícevrstvých perceptronů

10) Kombinování modelů (algoritmus Adaboost)

11) Statistický přístup k umělým neuronovým sítím

12) Shluková analýza (algoritmy K-středů, hierarchické shlukování, neuronový plyn, SOM)

13) Využití statistického přístupu při volbě počtu skrytých neuronů

Studijní prerekvizity -
Poslední úprava: Svozil Daniel doc. Mgr. Ph.D. (08.02.2018)

Statistická analýza dat, Vytěžování znalostí z dat, Programování a algoritmizace

Podmínky zakončení předmětu
Poslední úprava: Svozil Daniel doc. Mgr. Ph.D. (07.02.2018)

Pro zı́skánı́ zápočtu je potřeba dostatek bodů ze semestrálnı́ práce. Zkouška se skládá z pı́semné přı́pravy a povinné ústnı́ části.

Zátěž studenta
Činnost Kredity Hodiny
Účast na přednáškách 1 28
Práce na individuálním projektu 2 56
Účast na seminářích 0,5 14
4 / 4 98 / 112
Hodnocení studenta
Forma Váha
Protokoly z individuálních projektů 40
Ústní zkouška 60

 
VŠCHT Praha