Meno:Natália
Priezvisko:Kňažeková
Názov:Inferencia prirodzeného jazyka v slovenčine
Vedúci:Mgr. Marek Šuppa
Rok:2026
Kľúčové slová:inferencia prirodzeného jazyka, slovenský jazyk, dátové množiny, dolaďovanie predtrénovaných jazykových modelov
Abstrakt:Úloha inferencie prirodzeného jazyka (NLI) patrí k úlohám spracovania prirodzeného jazyka. Slovenský jazyk patrí k jazykom s obmedzenými zdrojmi. Jedným z cieľov práce bolo zanalyzovať stav úlohy NLI pre slovenčinu. Vytvorili sme päť datasetov tromi spôsobmi. Prvý spôsob je preloženie existujúceho anglického datasetu do slovenčiny pomocou troch rôznych modelov a vyhodnotenie kvality prekladu pre každý jeden z nich. Druhý spôsob je vytvorenie anotovaného datasetu. Tretí spôsob je vygenerovanie syntetického datasetu modelom GPT. Následne boli doladené jazykové modely SlovakBERT a XLM-R na dvoch preložených datasetoch, spolu 4 doladené modely.

Súbory diplomovej práce:
Autor nedal súhlas so zverejnením svojej diplomovej práce.

Súbory prezentácie na obhajobe:

Upraviť