Meno:Tatiana
Priezvisko:Tóthová
Názov:Sila a zložitosť moderných regulárnych výrazov
Vedúci:RNDr. Michal Forišek PhD.
Rok:2015
Blok:INF
Kľúčové slová:regex, spätné referencie, pozitívny a negatívny lookaround, lookahead, lookbehind, priestorová zložitosť
Abstrakt:Skúmali sme moderné regulárne výrazy špecifikované v jazyku Python z hľadiska teórie formálnych jazykov. Nové konštrukcie rozširujúce klasické regulárne výrazy sú spätné referencie, pozitívny a negatívny lookaround. Práca naväzuje na výsledky o spätných referenciách a pozitívnom lookarounde a doplňuje výsledky do hierarchie tried regexov nad rôznymi množinami operácií, ako napríklad neporovnateľnosť s bezkontextovými jazykmi. Ďalej ukazujeme, že uzavretosť triedy s pozitívnym lookaroundom na zreťazenie nie je triviálne a dokázali sme vlastnosti negatívneho lookaroundu podobné ako pri pozitívnej verzii. V oblasti priestorovej zložitosti sme zistili, že regexy s~pozitívnym lookaroundom potrebujú priestor NSPACE(log n) a s pridaným negatívnym lookaroundom dosiahneme DSPACE((log n)^2). Pokiaľ na vstup dostávame zároveň regex aj slovo, zložitosť pre triedu s pozitívnym lookaroundom je NSPACE(n*log n) a výsledok DSPACE(n*(log n)^2) platí iba ak je zaručená konštantná hĺbka vnorenia lookaroundov. K dôkazom sme zaviedli nový formálny model s konfiguráciami a krokom výpočtu inšpirovaný Turingovým strojom.

Súbory diplomovej práce:

tothova-dip.pdf