Meno:Peter
Priezvisko:Komoráš
Názov:Popis štruktúry metagenómov pomocou k-mer counting
Vedúci:Marta Lukačišinová, PhD.
Rok:2025
Kľúčové slová:algebra, bioinformatika, embedding, metagenomika
Abstrakt:V tejto práci sa zaoberáme problémom efektívneho reprezentovania a analýzy vysokorozmerných biologických dát, konkrétne metagenomických vzoriek. Tradičné prístupy založené na taxonomickom priradení sú závislé od referenčných databáz a výpočtovo náročné. Budeme preto skúmať metódu založenú na k-mer vektoroch, ktoré zachytávajú štruktúru sekvencií bez nutnosti predchádzajúcej znalosti druhového zloženia. Pomocou týchto reprezentácií skúmame možnosť odhalenia biologicky relevantných zoskupení v dátach črevného metagenómu. Okrem jednoduchého embeddingu s k-mermi testujeme aj embedding založený na metóde word2vec. Okrem toho analyzujeme vplyv parametra k na výslednú štruktúru dát v zníženej dimenzionalite a pozeráme sa na teoretické aj praktické aspekty tejto metódy z pohľadu informatiky.

Súbory bakalárskej práce:

praca final.pdf

Súbory prezentácie na obhajobe:

Obhajoba (2).pdf

Upraviť