Meno:Ondrej
Priezvisko:Škorňák
Názov:Analýza genomickej kompozície pre diagnostiku rakovinových ochorení
Vedúci:Mgr. Jaroslav Budiš, PhD.
Rok:2025
Kľúčové slová:genomická kompozícia, diagnostika rakoviny, tekutá biopsia, stro jové učenie, štatistické modely
Abstrakt:Rakovina predstavuje celosvetovo jednu z najzávažnejších zdravotných výziev, pričom včasná diagnostika je kľúčová pre úspešnú liečbu. Táto bakalárska práca sa venuje analýze genómickej kompozície s cieľom identifikovať rozdiely medzi zdravými a nádorovými vzorkami DNA získanými z tekutej biopsie - minimálne invazívna alternatíva k tradičnej biopsii. Práca skúma potenciál metódy Frequency Chaos Game Representation (FCGR) a analýzy k-merov pre odhalenie charakteristických sekvenčných vzorov v dátach z tekutej biopsie. Na dátach z klinických štúdií Prevelynch (kolorektálny karcinóm) a Genoscan (rakovina prostaty) sme analyzovali frekvencie k-merov a dinukleotidov. Zistili sme štatisticky významné rozdiely v zastúpení 8-merov, najmä v štúdii Prevelynch, kde sa frekvencia takmer 79\% 8-merov štatisticky významne líšila medzi nádorovými a kontrolnými vzorkami. Pozorovali sme tiež výrazné zmeny vo frekvenciách dinukleotidov CG, GC (znížené) a GA (zvýšené) v nádorových vzorkách kolorektálneho karcinómu. Následne sme vyvinuli a testovali modely strojového učenia (Support Vector Machine, Random Forest a XGBoost). Pre kolorektálny karcinóm dosiahol SVM model pri optimálnej dĺžke k-meru k=6 takmer perfektnú klasifikačnú schopnosť (AUC 0,996). Výsledky naznačujú, že analýza genómickej kompozície, špecificky k-merových profilov, je sľubným prístupom pre neinvazívnu diagnostiku rakoviny a môže byť špecifická pre daný typ nádoru, čím otvára cestu k vývoju nových biomarkerov.

Súbory bakalárskej práce:

BC_Práca_AnaGenKomp_OŠ.pdf

Súbory prezentácie na obhajobe:

Obhajoba_Ana_Gen_Komp_OŠ.pdf

Upraviť