FI:IA161 NLP in Practice - Informace o předmětu
IA161 Natural Language Processing in Practice
Fakulta informatikypodzim 2025
- Rozsah
- 1/1/0. 2 kr. (plus ukončení). Ukončení: k.
Vyučováno kontaktně - Vyučující
- doc. RNDr. Aleš Horák, Ph.D. (přednášející)
doc. Mgr. Pavel Rychlý, Ph.D. (pomocník)
RNDr. Miloš Jakubíček, Ph.D. (pomocník)
RNDr. Marek Medveď, Ph.D. (pomocník)
Mgr. Radoslav Sabol (pomocník)
RNDr. Vít Suchomel, Ph.D. (pomocník) - Garance
- doc. RNDr. Aleš Horák, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Předpoklady
- Všichni studenti by měli mít praktické znalosti programování v jazyce Python. Předpokládají se přehledové znalosti o oblasti zpracování přirozeného jazyka na úrovni úvodových kurzů jako např. IB030 Úvod do počítačového zpracování přirozeného jazyka nebo PA153 Natural Language Processing. Seminář je veden v angličtině. Řešení úloh mohou být v angličtině, češtině nebo slovenštině.
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 52 mateřských oborů, zobrazit
- Cíle předmětu
- Studenti předmětu budou mít příležitost poznat, vyzkoušet a experimentovat s pokročilými technikami zpracování přirozeného jazyka a pochopit možnosti a omezení aktuálních nejlepších řešení. Cílem předmětu je představení současných nejlepších přístupů k řešení problémů jazykového inženýrství a praktické seznámení se s programovacími technikami využívanými v aplikacích jazykových technologií.
- Výstupy z učení
- Student bude po absolvování předmětu schopen:
- vysvětlit vybraný problém z oblasti NLP a vyjmenovat jeho hlavní aspekty;
- vytvořit základní či mírně pokročilou aplikaci pro obtížnější úkoly zpracování jazyka, typicky pro český, slovenský nebo anglický jazyk;
- vytvořit datové podklady (model, testovací sadu) pro vybraný problém z oblasti NLP a vyhodnotit jejich přínos;
- porovnat vybrané dostupné nástroje na řešení pokročilých úloh zpracování přirozeného jazyka a aplikovat je na zvolené datové sady, případně je upravit pro konkrétní úlohu. - Osnova
- Prezentované úkoly zpracování přirozeného jazyka se soustředí na praktické problémy spojené se zpracování textových dat vytvořených lidmi. Konkrétní témata zahrnují:
- Dolování názorů, analýza sentimentu (Opinion mining, sentiment analysis)
- Strojový překlad (Machine translation)
- Syntaktická analýza češtiny: Pravidla i statistika (Parsing of Czech: Between Rules and Statistics)
- Rozpoznávání jmenných entit (Named Entity Recognition)
- Tvorba jazykových zdrojů z webu (effective crawling, boilerplate removal, tokenisation, near duplicates identification)
- Jazykové modelování (Language modelling)
- Identifikace tématu, modelování tématu (Topic identification, topic modelling)
- Extrakce strukturovaných informací z textu
- Generativní jazykové modely
- Rozpoznávání anaforických výrazů (Anaphora resolution)
- Stylometrie
- Automatické jazykové korekce
- Literatura
- Dan Jurafsky and James H. Martin. Speech and Language Processing (2025, 3rd ed. draft). https://web.stanford.edu/~jurafsky/slp3/
- J. Eisenstein, Introduction to Natural Language Processing (2019), MIT Press.
- https://www.aclweb.org/anthology/
- Výukové metody
- Každá přednáška se skládá z hodinového představení teorie a řešení vybraného problému zpracování přirozeného jazyka a hodinové praktické práce u počítače zaměřené na implementaci, úpravy a vyhodnocení prezentovaných technik na běžných datech.
- Metody hodnocení
- Řešení úkolů v praktické části přednášky případně domácí úkoly.
- Vyučovací jazyk
- Angličtina
- Informace učitele
- http://nlp.fi.muni.cz/NlpInPracticeCourse
- Další komentáře
- Předmět je vyučován každoročně.
Výuka probíhá každý týden.
- Statistika zápisu (nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/podzim2025/IA161