Meno: | Peter
|
---|
Priezvisko: | Komoráš
|
---|
Názov: | Popis štruktúry metagenómov pomocou k-mer counting
|
---|
Vedúci: | Marta Lukačišinová, PhD.
|
---|
Rok: | 2025
|
---|
Kľúčové slová: | algebra, bioinformatika, embedding, metagenomika
|
---|
Abstrakt: | V tejto práci sa zaoberáme problémom efektívneho reprezentovania a analýzy vysokorozmerných biologických dát, konkrétne metagenomických vzoriek. Tradičné prístupy založené na taxonomickom priradení sú závislé od referenčných databáz a výpočtovo náročné. Budeme preto skúmať metódu založenú na k-mer vektoroch, ktoré zachytávajú štruktúru sekvencií bez nutnosti predchádzajúcej znalosti druhového zloženia. Pomocou týchto reprezentácií skúmame možnosť odhalenia biologicky relevantných zoskupení v dátach črevného metagenómu. Okrem jednoduchého embeddingu s k-mermi testujeme aj embedding založený na metóde word2vec. Okrem toho analyzujeme vplyv parametra k na výslednú štruktúru dát v zníženej dimenzionalite a pozeráme sa na teoretické aj praktické aspekty tejto metódy z pohľadu informatiky.
|
---|