Meno:Michal
Priezvisko:Kubica
Názov:Detekcia anomálií
Vedúci:Mgr. Lukáš Polesňák
Rok:2016
Kľúčové slová:anomália, Hadoop, Cloudera, k-means, Apache Spark
Abstrakt:Cieľom práce je popísať pojem anomália, ako aj problémy spojené s ich detegovaním. Zamerali sme sa hlavne na problémy detekcie anomálií pomocou klastrovacej metódy k-means a neustále zväčšujúcim sa množstvom dát, ktoré je nutné analyzovať. Pre tieto účely sme využili distribuované prostredie na prácu s dátami veľkých rozmerov Apache Spark. V závere sme implementovali modifikovanú metódu na detegovanie anomálií, ktorá dosahovala lepšie výsledky v porovnaní s klasickým detektorom založenom na metóde k-means a jednoduchej hranici. The objective of the thesis is to describe the term anomaly and the problems connected with their detection. The main focus lies on the problems connected to the anomaly detection by clustering method k-means and the ever increasing amount of data needed to be analysed. To fulfil stated objectives, Apache Spark, the big data processing framework, was used. In the final part of the thesis, we implemented a modified method for anomaly detection. The use of the modified method achieved better results than the use of the detector, which is based on the k-means method and simple threshold, did.

Súbory bakalárskej práce:

michal_kubica_bak_Dodatok_A.zip
kubica_michal_anomaly_detection.pdf