SubjectsSubjects(version: 962)
Course, academic year 2024/2025
  
Data Analysis Methodology: From Basics to Machine Learning Methods Application - CZV4460002
Title: Metodika analýzy dat: Od základů po aplikace metod strojového učení
Guaranteed by: Department of Mathematics, Informatics and Cybernetics (446)
Faculty: Faculty of Chemical Engineering
Actual: from 2024
Semester: both
Points: 0
E-Credits: 0
Examination process:
Hours per week, examination: 0/32, other [HS]
Capacity: winter:unknown / unknown (10)
summer:unknown / unknown (10)
Min. number of students: 5
State of the course: taught
Language: Czech
Teaching methods: full-time
Teaching methods: full-time
Level:  
Note: you can enroll for the course in winter and in summer semester
Guarantor: Vrba Jan Ing. Ph.D.
Steinbach Jakub Ing.
Class: Kurz CŽV
Annotation - Czech
Kurz poskytuje účastníkům komplexní vhled do širokého spektra metod analýzy dat. Začíná základní metodikou analýzy dat, která zahrnuje popis jednorozměrných a dvourozměrných dat, vzorkování signálů a základní statistické metody zpracování signálů. Účastníci se seznámí s nelineární regresní analýzou, analýza hlavních komponent a postupně se dostane k sofistikovanějším metodám jako je support vector machine (SVM). Tyto metody jsou důležité pro porozumění složitějším vzorům a vztahům v datech a umožňují přesnější modelování a predikce. V průběhu kurzu se účastníci také naučí používat rozhodovací stromy, které jsou užitečné pro klasifikaci i predikci, a gradientní metody, které jsou důležité pro optimalizaci modelů. Tyto techniky rozšiřují účastníkům schopnost analyzovat a interpretovat data a umožňují jim efektivnější práci s rozsáhlejšími a komplexnějšími datovými soubory. Kurz dále zdůrazňuje důležitost validace a vyhodnocování přesnosti klasifikace, což jsou klíčové kroky při práci s daty a modely. Účastníci se naučí správně hodnotit výsledky svých modelů. Celkově kurz poskytuje účastníkům široký přehled základních a pokročilých metod analýzy dat a umožňuje jim aplikovat tyto techniky na reálná data v různých oblastech, od akademického výzkumu po průmyslové aplikace. Tím účastníkům poskytuje potřebné dovednosti a znalosti pro úspěšnou a efektivní práci v oblasti analýzy dat.
Last update: Krátká Jana (25.09.2024)
Syllabus - Czech

Úvod do programování a jazyk Python 1

Seznámení se s jazykem Python, představení možných IDEs, základní práce s proměnnými, cykly, podmínky

Úvod do programování a jazyk Python 2

Funkce, knihovny, moduly, instalace a načítání knihoven a modulů

Práce s daty ve formě tabulky, jednoduchá zobrazení dat

Knihovna pandas - DataFrame, statistické přehledy, indexace dat v DataFrame, filtrování, agregace, odstranění dat, korelační matice, načítání různých typů dat (read_csv, read_sql)

Knihovna seaborn - Relační grafy, sloupcové grafy, histogram, heatmap

Statistické vyhodnocení dat

Testy normality dat a použití knihovny SciPy

Testování hypotéz nezávislosti dat - Fischerův exaktní test, Boschlooův test, chí-kvadrát test

Lineární regrese, úvod do nelineární regrese, validace regresních modelů, regularizace

Práce s knihovnami SciPy a NumPy

Transformace dat - normalizace, standardizace, kódování, PCA, LDA

Úvod do knihovny Scikit-learn

Klasifikační modely #1: Logistická regrese; Vyhodnocování kvality klasifikačních modelů

Problematika vyhodnocení a porovnání klasifikačních modelů, tvorba modelů založených na logistické regresi

Klasifikační modely #2: Support Vector Machine, Rozhodovací stromy, náhodné lesy; rozdíly mezi binární klasifikací a klasifikací do více tříd

Pokročilé klasifikační modely a problém klasifikace do více tříd

Last update: Krátká Jana (25.09.2024)
 
VŠCHT Praha