Abstrakt: | Množstvo odpadu každoročne narastá a recyklácia čo najväčšieho množstva odpadu
má zásadný význam pre zmiernenie znečistenia životného prostredia. V súčasnosti sa
triedenie odpadu stále vo veľkej miere spolieha na ľudskú prácu, a to aj napriek rôznym
pokusom o zavedenie automatizácie pomocou počítačovej technológie. Hoci prístupy
založené na neurónových sieťach vykazujú na súboroch údajov skvelé výsledky, niektoré súbory údajov skresľujú realitu tým, že vylučujú pozadie, čím sa stávajú menej
použiteľnými na trénovanie modelov v reálnych scenároch. Existujú modely a súbory
údajov, ktoré sa snažia tieto problémy riešiť a dosiahli dobré výsledky. V našej práci
je cieľom preskúmať, ako efektívne sú prístupy bez neurónových sietí pri riešení tohto problému, konkrétne pomocou deskriptorov MPEG-7. Presnejšie, chceme zistiť, či
vizuálne deskriptory MPEG-7 môžu slúžiť ako životaschopná alternatíva na klasifikáciu obrázkov odpadu a optimalizáciu procesu triedenia odpadu automatizovaným spôsobom. MPEG-7 je štandard pre opis multimediálneho obsahu, ktorý zahŕňa obrázky,
3D-priestor, video a zvuk. Jeho deskriptory sa dajú spoľahlivo použiť na kategorizáciu
obrázkov a rýchle porovnávanie obrázkov, napríklad pri online vyhľadávaní obrázkov.
Z dôvodu efektívnosti sme použili existujúci súbor údajov o obrázkoch odpadu a k
nim pripojenú kategorizáciu materiálov. Pre každý obrázok sme vypočítali vizuálne
deskriptory MPEG-7, aby sme neskôr mohli posúdiť ich účinnosť pri triedení nových
obrázkov do týchto kategórií. Štandardné implementácie výpočtu deskriptorov MPEG7 sú zložité a nie veľmi rýchle. Namiesto prepisovania efektívnejšej implementácie sme
skúmali rôzne spôsoby, ako tieto výpočty urýchliť. Jedným z prístupov bolo zníženie rozlíšenia obrazu, keďže obrazy s vysokým rozlíšením nie sú potrebné na presnú
klasifikáciu založenú na deskriptoroch. Okrem toho, keďže vstupné obrázky často obsahovali skôr celky záberov z dopravných pásov než jednotlivé položky odpadu, riešili sme
tento problém segmentáciou obrázkov. Nakoniec, tieto testy generujú veľké množstvo
metadát a spoliehajú sa na ne, preto sme skúmali možnosť skrátenia niektorých výstupov deskriptorov a zároveň analyzovali, aká presnosť sa zachová. Cieľom tejto práce
je nakoniec vyhodnotiť, či deskriptory MPEG-7 ponúkajú praktickú a výpočtovo efektívnu alternatívu k neurónovým sieťam na automatizované triedenie odpadu alebo, či
sú vhodné pre použitie v strojovom učení.
|
---|