Předměty

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

Metodika analýzy dat: Od základů po aplikace metod strojového učení - CZV4460002

Anglický název:	Data Analysis Methodology: From Basics to Machine Learning Methods Application
Podoba výuky:	cvičení
Zajišťuje:	Ústav matematiky, informatiky a kybernetiky (446)
Fakulta:	Fakulta chemicko-inženýrská
Platnost:	od 2024
Kolik má semestrů:	1
Semestr:	oba
Body:	0
E-Kredity:	0
Způsob provedení zkoušky:
Rozsah, examinace:	0/32, Jiné [HS]
Počet míst:	zimní:neurčen / neurčen (10) letní:neurčen / neurčen (10)
Maximální kapacita předmětu:	10
Minimální obsazenost:	5
Stav předmětu:	vyučován
Jazyk výuky:	čeština
Forma uskutečňování:	prezenční
Úroveň:
Možnost opakovaného zápisu:	- / - / - / 9
Poznámka:	předmět lze zapsat v ZS i LS

Garant:	Vrba Jan Ing. Ph.D. Steinbach Jakub Ing.
Třída:	Kurz CŽV

Termíny zkoušek

Anotace

Kurz poskytuje účastníkům komplexní vhled do širokého spektra metod analýzy dat. Začíná základní metodikou analýzy dat, která zahrnuje popis jednorozměrných a dvourozměrných dat, vzorkování signálů a základní statistické metody zpracování signálů. Účastníci se seznámí s nelineární regresní analýzou, analýza hlavních komponent a postupně se dostane k sofistikovanějším metodám jako je support vector machine (SVM). Tyto metody jsou důležité pro porozumění složitějším vzorům a vztahům v datech a umožňují přesnější modelování a predikce. V průběhu kurzu se účastníci také naučí používat rozhodovací stromy, které jsou užitečné pro klasifikaci i predikci, a gradientní metody, které jsou důležité pro optimalizaci modelů. Tyto techniky rozšiřují účastníkům schopnost analyzovat a interpretovat data a umožňují jim efektivnější práci s rozsáhlejšími a komplexnějšími datovými soubory. Kurz dále zdůrazňuje důležitost validace a vyhodnocování přesnosti klasifikace, což jsou klíčové kroky při práci s daty a modely. Účastníci se naučí správně hodnotit výsledky svých modelů. Celkově kurz poskytuje účastníkům široký přehled základních a pokročilých metod analýzy dat a umožňuje jim aplikovat tyto techniky na reálná data v různých oblastech, od akademického výzkumu po průmyslové aplikace. Tím účastníkům poskytuje potřebné dovednosti a znalosti pro úspěšnou a efektivní práci v oblasti analýzy dat.

Poslední úprava: Krátká Jana (25.09.2024)

Sylabus

Úvod do programování a jazyk Python 1

Seznámení se s jazykem Python, představení možných IDEs, základní práce s proměnnými, cykly, podmínky

Úvod do programování a jazyk Python 2

Funkce, knihovny, moduly, instalace a načítání knihoven a modulů

Práce s daty ve formě tabulky, jednoduchá zobrazení dat

Knihovna pandas - DataFrame, statistické přehledy, indexace dat v DataFrame, filtrování, agregace, odstranění dat, korelační matice, načítání různých typů dat (read_csv, read_sql)

Knihovna seaborn - Relační grafy, sloupcové grafy, histogram, heatmap

Statistické vyhodnocení dat

Testy normality dat a použití knihovny SciPy

Testování hypotéz nezávislosti dat - Fischerův exaktní test, Boschlooův test, chí-kvadrát test

Lineární regrese, úvod do nelineární regrese, validace regresních modelů, regularizace

Práce s knihovnami SciPy a NumPy

Transformace dat - normalizace, standardizace, kódování, PCA, LDA

Úvod do knihovny Scikit-learn

Klasifikační modely #1: Logistická regrese; Vyhodnocování kvality klasifikačních modelů

Problematika vyhodnocení a porovnání klasifikačních modelů, tvorba modelů založených na logistické regresi

Klasifikační modely #2: Support Vector Machine, Rozhodovací stromy, náhodné lesy; rozdíly mezi binární klasifikací a klasifikací do více tříd

Pokročilé klasifikační modely a problém klasifikace do více tříd

Poslední úprava: Krátká Jana (25.09.2024)