Cílem předmětu je nastínit základní principy různých statistický metod pro analýzu mnohorozměrných dat. Důraz
bude kladen na ověřování předpokladů jednotlivých metod a interpretaci jejich výsledků. Studenti si vyzkouší
řešení konkrétních úloh pomocí programu R.
Poslední úprava: Kubová Petra (22.01.2018)
Basic principles of selected statistical methods for analysing multidimensional data will be outlined with focus on reconciliation of the assumptions of the methods and interpretation of their results. Students will learn how to perform corresponding calculations in statistical software R.
Poslední úprava: Zikmundová Markéta (18.12.2023)
Výstupy studia předmětu -
Studenti budou umět:
1. Porozumět základním principům statistických metod pro mnohorozměrnou analýzu dat.
2. Posoudit, kdy lze jednotlivé metody použít.
3. Interpretovat výsledky statistických metod.
4. Provést příslušné výpočty na konkrétních datech pomocí softwaru (R).
Poslední úprava: Kubová Petra (22.01.2018)
Students will know:
1. Understand basic principles of selected statistical methods for multivariate data analysis
2. Reconcile assumptions of particular methods.
3. Understand the results of the methods.
4. Perform essential calculations with specific data in specialized software (R).
Poslední úprava: Kubová Petra (22.01.2018)
Podmínky zakončení předmětu (Další požadavky na studenta) -
Zápočet na základě vypracování semestrálního projektu. Ústní zkouška.
Poslední úprava: Kříž Pavel (09.02.2018)
Credit for seminar project. Oral exam.
Poslední úprava: Kříž Pavel (09.02.2018)
Literatura -
Z: Härdle W. K., Simar L.: Applied Multivariate Statistical Analysis, Springer 2015, ISBN: 978-3-662-45171-7.
Z: Rencher A. C., Christensen W. F.: Methods of Multivariate Analysis, John Wiley & Sons 2012, ISBN: 978-0-470-17896-6.
D: Meloun M., Militký J., Hill M.: Počítačová analýza vícerozměrných dat v příkladech, Academia, Praha 2012, ISBN: 978-80-200-2071-0.
1. Datový vektor, datová matice a maticová algebra (násobení, inverze matice, vlastní čísla a vektory), kovarianční matice.
2. Vizualizace vícerozměrných dat.
3. Průzkumová analýza dat.
4. Shluková analýza.
5. Analýza hlavních komponent.
6. Multidimensional scaling.
7. Vícerozměrné odhady a testy hypotéz, bayesovská statistika.
8. Vícerozměrná analýza rozptylu (MANOVA).
9. Regresní metody 1 - vícenásobná lineární regrese.
10. Regresní metody 2 - principal component regression (PCR), zobecněné lineární modely (GLM).
11. Diskriminační analýza.
12. Kanonická korelační analýza.
13. Faktorová analýza.
Poslední úprava: Kříž Pavel (30.05.2019)
1. Data vector, data matrix and matrix algebra (multiplication, inverse matrix, eigenvalues and eigenvectors), covariance matrix.
2. Vizualisation of multidimensional data.
3. Exploratory data analysis (EDA).
4. Cluster analysis.
5. Principal component analysis (PCA).
6. Multidimensional scaling.
7. Multidimensional parameter estimation and hypothesis testing. Bayesian statistics.
8. Multivariate analysis of variance (MANOVA).
9. Regression methods 1 - multiple linear regression.
10. Regression methods 2 - principal component regression (PCR), generalized linear models (GLM).
11. Discriminant analysis.
12. Canonical correlation analysis.
13. Factor analysis (FA).
Poslední úprava: Kříž Pavel (30.05.2019)
Studijní opory -
Materiály k přednášce na e-learningu
Statistická analysa dat v R (skripta Doc. Spiwoka, VSCHT) http://web.vscht.cz/~spiwokv/statistika/skripta.pdf
Poslední úprava: Kubová Petra (22.01.2018)
Lecture notes on e-learning
Statistická analysa dat v R (lecture notes by Doc. Spiwok, VSCHT, in Czech) http://web.vscht.cz/~spiwokv/statistika/skripta.pdf
Poslední úprava: Kříž Pavel (30.05.2019)
Vstupní požadavky -
Základní znalosti teorie pravděpodobnosti a statistiky v rozsahu předmětu Aplikovaná statistika nebo Statistická analýza dat vyučovaných na VŠCHT.
Poslední úprava: Borská Lucie (07.05.2019)
Students are expected to have either completed at least one of the prerequisite courses Applied Statistics or Statistical Data Analysis or possess the equivalent knowledge on probability theory and statistics prior to enrolling in the course.
For successful completion of the course, basic knowledge of probability and mathematical statistics is required at a level corresponding to the syllabus of the Applied Statistics course:
1. Random events, probability and its properties, independence of random events, conditional probability
2. Random variables, their probability distribution and characteristics
3. Fundamental types of probability distributions (especially normal distribution)
4. Random vectors and their distributions, correlation and independence of random variables
5. Sum of large number of random variables — Central Limit Theorem, Law of Large Numbers
6. Random sample, point estimate of expectation and variance, Maximum Likelihood and Bayesian estimators
7. Confidence intervals — calculation and interpretation
8. Testing of statistical hypotheses — basic principle, type I and II errors, interpretation of results (p-value), basic parametric and nonparametric tests
9. ANOVA
10. Test of independence of quantitative random variables (correlation test)
11. Goodness-of-fit testing, test of independence in contingency tables
12. Fundaments of regression analysis — linear, multiple, nonlinear Futher, knowledge of at least basic R software and eigenvalues and eigenvectors of matrices is recommended.
Poslední úprava: Řehák Karel (08.03.2023)
Studijní prerekvizity -
Žádné.
Poslední úprava: Borská Lucie (06.05.2019)
No requirements.
Poslední úprava: Borská Lucie (06.05.2019)
Zátěž studenta
Činnost
Kredity
Hodiny
Účast na přednáškách
1
28
Příprava na přednášky, semináře, laboratoře, exkurzi nebo praxi