| Meno: | Peter
|
|---|
| Priezvisko: | Komoráš
|
|---|
| Názov: | Popis štruktúry metagenómov pomocou k-mer counting
|
|---|
| Vedúci: | Marta Lukačišinová, PhD.
|
|---|
| Rok: | 2025
|
|---|
| Kľúčové slová: | algebra, bioinformatika, embedding, metagenomika
|
|---|
| Abstrakt: | V tejto práci sa zaoberáme problémom efektívneho reprezentovania a analýzy vysokorozmerných biologických dát, konkrétne metagenomických vzoriek. Tradičné prístupy založené na taxonomickom priradení sú závislé od referenčných databáz a výpočtovo náročné. Budeme preto skúmať metódu založenú na k-mer vektoroch, ktoré zachytávajú štruktúru sekvencií bez nutnosti predchádzajúcej znalosti druhového zloženia. Pomocou týchto reprezentácií skúmame možnosť odhalenia biologicky relevantných zoskupení v dátach črevného metagenómu. Okrem jednoduchého embeddingu s k-mermi testujeme aj embedding založený na metóde word2vec. Okrem toho analyzujeme vplyv parametra k na výslednú štruktúru dát v zníženej dimenzionalite a pozeráme sa na teoretické aj praktické aspekty tejto metódy z pohľadu informatiky.
|
|---|