|
|
|
||
Poslední úprava: Svozil Daniel prof. Mgr. Ph.D. (23.05.2018)
|
|
||
Poslední úprava: Svozil Daniel prof. Mgr. Ph.D. (23.05.2018)
Studenti budou umět:
|
|
||
Poslední úprava: Svozil Daniel prof. Mgr. Ph.D. (23.05.2018)
Z: Baeza-Yates, R., Ribeiro-Neto, B.: Modern Information Retrieval. Second edition, Addison-Wesley, 2011. Z: Weiss, S.M. et all: Text Mining? Predictive Methods for Analyzing Unstructured Information. Springer, 2005. |
|
||
Poslední úprava: Svozil Daniel prof. Mgr. Ph.D. (23.05.2018)
Materiály přednášejícího |
|
||
Poslední úprava: Svozil Daniel prof. Mgr. Ph.D. (23.05.2018)
Úvod do problematiky information retrieval, neurčitost, relevance, přístup fuzzy, normalizace textových dokumentů, Zipfův zákon Indexování, dotazování a hledání v textových dokumentech - metriky, vektorový model - redukce dimenzí, latentní semantické indexování Shlukování dokumentů a shlukování klíčových slov (clustering), vzdálenost, metriky podobnosti, centroid, metody shlukování Klasifikace dokumentů. Bayesovská klasifikace, metoda k-NN, metoda rozhodovacích stromů, metoda support vector machine Cíle a možnosti text miningu, metody linguistiky v text miningu, lexikon, tokenization, part-of-speech tagging, named entity recognition, parsing, koreference Aplikace metod text mining pro information retrieval: automatická extrakce obsahu dokumentu, automatické shrnutí obsahu dokumentu, automatické odpovědi na dotazy |
|
||
Poslední úprava: Svozil Daniel prof. Mgr. Ph.D. (23.05.2018)
Ústní zkouška |