PředmětyPředměty(verze: 962)
Předmět, akademický rok 2024/2025
  
Metodika analýzy dat: Od základů po aplikace metod strojového učení - CZV4460002
Anglický název: Data Analysis Methodology: From Basics to Machine Learning Methods Application
Zajišťuje: Ústav matematiky, informatiky a kybernetiky (446)
Fakulta: Fakulta chemicko-inženýrská
Platnost: od 2024
Semestr: oba
Body: 0
E-Kredity: 0
Způsob provedení zkoušky:
Rozsah, examinace: 0/32, Jiné [HS]
Počet míst: zimní:neurčen / neurčen (10)
letní:neurčen / neurčen (10)
Minimální obsazenost: 5
Stav předmětu: vyučován
Jazyk výuky: čeština
Způsob výuky: prezenční
Způsob výuky: prezenční
Úroveň:  
Poznámka: předmět lze zapsat v ZS i LS
Garant: Vrba Jan Ing. Ph.D.
Steinbach Jakub Ing.
Třída: Kurz CŽV
Anotace
Kurz poskytuje účastníkům komplexní vhled do širokého spektra metod analýzy dat. Začíná základní metodikou analýzy dat, která zahrnuje popis jednorozměrných a dvourozměrných dat, vzorkování signálů a základní statistické metody zpracování signálů. Účastníci se seznámí s nelineární regresní analýzou, analýza hlavních komponent a postupně se dostane k sofistikovanějším metodám jako je support vector machine (SVM). Tyto metody jsou důležité pro porozumění složitějším vzorům a vztahům v datech a umožňují přesnější modelování a predikce. V průběhu kurzu se účastníci také naučí používat rozhodovací stromy, které jsou užitečné pro klasifikaci i predikci, a gradientní metody, které jsou důležité pro optimalizaci modelů. Tyto techniky rozšiřují účastníkům schopnost analyzovat a interpretovat data a umožňují jim efektivnější práci s rozsáhlejšími a komplexnějšími datovými soubory. Kurz dále zdůrazňuje důležitost validace a vyhodnocování přesnosti klasifikace, což jsou klíčové kroky při práci s daty a modely. Účastníci se naučí správně hodnotit výsledky svých modelů. Celkově kurz poskytuje účastníkům široký přehled základních a pokročilých metod analýzy dat a umožňuje jim aplikovat tyto techniky na reálná data v různých oblastech, od akademického výzkumu po průmyslové aplikace. Tím účastníkům poskytuje potřebné dovednosti a znalosti pro úspěšnou a efektivní práci v oblasti analýzy dat.
Poslední úprava: Krátká Jana (25.09.2024)
Sylabus

Úvod do programování a jazyk Python 1

Seznámení se s jazykem Python, představení možných IDEs, základní práce s proměnnými, cykly, podmínky

Úvod do programování a jazyk Python 2

Funkce, knihovny, moduly, instalace a načítání knihoven a modulů

Práce s daty ve formě tabulky, jednoduchá zobrazení dat

Knihovna pandas - DataFrame, statistické přehledy, indexace dat v DataFrame, filtrování, agregace, odstranění dat, korelační matice, načítání různých typů dat (read_csv, read_sql)

Knihovna seaborn - Relační grafy, sloupcové grafy, histogram, heatmap

Statistické vyhodnocení dat

Testy normality dat a použití knihovny SciPy

Testování hypotéz nezávislosti dat - Fischerův exaktní test, Boschlooův test, chí-kvadrát test

Lineární regrese, úvod do nelineární regrese, validace regresních modelů, regularizace

Práce s knihovnami SciPy a NumPy

Transformace dat - normalizace, standardizace, kódování, PCA, LDA

Úvod do knihovny Scikit-learn

Klasifikační modely #1: Logistická regrese; Vyhodnocování kvality klasifikačních modelů

Problematika vyhodnocení a porovnání klasifikačních modelů, tvorba modelů založených na logistické regresi

Klasifikační modely #2: Support Vector Machine, Rozhodovací stromy, náhodné lesy; rozdíly mezi binární klasifikací a klasifikací do více tříd

Pokročilé klasifikační modely a problém klasifikace do více tříd

Poslední úprava: Krátká Jana (25.09.2024)
 
VŠCHT Praha