| Meno: | Natália |
|---|---|
| Priezvisko: | Kňažeková |
| Názov: | Inferencia prirodzeného jazyka v slovenčine |
| Vedúci: | Mgr. Marek Šuppa |
| Rok: | 2026 |
| Kľúčové slová: | inferencia prirodzeného jazyka, slovenský jazyk, dátové množiny, dolaďovanie predtrénovaných jazykových modelov |
| Abstrakt: | Úloha inferencie prirodzeného jazyka (NLI) patrí k úlohám spracovania prirodzeného jazyka. Slovenský jazyk patrí k jazykom s obmedzenými zdrojmi. Jedným z cieľov práce bolo zanalyzovať stav úlohy NLI pre slovenčinu. Vytvorili sme päť datasetov tromi spôsobmi. Prvý spôsob je preloženie existujúceho anglického datasetu do slovenčiny pomocou troch rôznych modelov a vyhodnotenie kvality prekladu pre každý jeden z nich. Druhý spôsob je vytvorenie anotovaného datasetu. Tretí spôsob je vygenerovanie syntetického datasetu modelom GPT. Následne boli doladené jazykové modely SlovakBERT a XLM-R na dvoch preložených datasetoch, spolu 4 doladené modely. |
Súbory diplomovej práce:
Autor nedal súhlas so zverejnením svojej diplomovej práce.
Súbory prezentácie na obhajobe: