Meno:Tomáš
Priezvisko:Barančok
Názov:Analyzing Fast Scene Description For Industrial Waste Sorting
Vedúci:doc. RNDr. Andrej Ferko, PhD.
Rok:2025
Kľúčové slová:Triedenie odpadu, MPEG-7, Detekcia odpadu, triedenie recyklovateľného odpadu, analýza dát, strojové učenie
Abstrakt:Množstvo odpadu každoročne narastá a recyklácia čo najväčšieho množstva odpadu má zásadný význam pre zmiernenie znečistenia životného prostredia. V súčasnosti sa triedenie odpadu stále vo veľkej miere spolieha na ľudskú prácu, a to aj napriek rôznym pokusom o zavedenie automatizácie pomocou počítačovej technológie. Hoci prístupy založené na neurónových sieťach vykazujú na súboroch údajov skvelé výsledky, niektoré súbory údajov skresľujú realitu tým, že vylučujú pozadie, čím sa stávajú menej použiteľnými na trénovanie modelov v reálnych scenároch. Existujú modely a súbory údajov, ktoré sa snažia tieto problémy riešiť a dosiahli dobré výsledky. V našej práci je cieľom preskúmať, ako efektívne sú prístupy bez neurónových sietí pri riešení tohto problému, konkrétne pomocou deskriptorov MPEG-7. Presnejšie, chceme zistiť, či vizuálne deskriptory MPEG-7 môžu slúžiť ako životaschopná alternatíva na klasifikáciu obrázkov odpadu a optimalizáciu procesu triedenia odpadu automatizovaným spôsobom. MPEG-7 je štandard pre opis multimediálneho obsahu, ktorý zahŕňa obrázky, 3D-priestor, video a zvuk. Jeho deskriptory sa dajú spoľahlivo použiť na kategorizáciu obrázkov a rýchle porovnávanie obrázkov, napríklad pri online vyhľadávaní obrázkov. Z dôvodu efektívnosti sme použili existujúci súbor údajov o obrázkoch odpadu a k nim pripojenú kategorizáciu materiálov. Pre každý obrázok sme vypočítali vizuálne deskriptory MPEG-7, aby sme neskôr mohli posúdiť ich účinnosť pri triedení nových obrázkov do týchto kategórií. Štandardné implementácie výpočtu deskriptorov MPEG7 sú zložité a nie veľmi rýchle. Namiesto prepisovania efektívnejšej implementácie sme skúmali rôzne spôsoby, ako tieto výpočty urýchliť. Jedným z prístupov bolo zníženie rozlíšenia obrazu, keďže obrazy s vysokým rozlíšením nie sú potrebné na presnú klasifikáciu založenú na deskriptoroch. Okrem toho, keďže vstupné obrázky často obsahovali skôr celky záberov z dopravných pásov než jednotlivé položky odpadu, riešili sme tento problém segmentáciou obrázkov. Nakoniec, tieto testy generujú veľké množstvo metadát a spoliehajú sa na ne, preto sme skúmali možnosť skrátenia niektorých výstupov deskriptorov a zároveň analyzovali, aká presnosť sa zachová. Cieľom tejto práce je nakoniec vyhodnotiť, či deskriptory MPEG-7 ponúkajú praktickú a výpočtovo efektívnu alternatívu k neurónovým sieťam na automatizované triedenie odpadu alebo, či sú vhodné pre použitie v strojovom učení.

Súbory bakalárskej práce:

barancok_bk_d.pdf

Súbory prezentácie na obhajobe:

barancok.pdf

Upraviť