Rezumat și 1. Introducere
Lucrări Conexe
MaGGIe
3.1. Matting Eficient de Instanțe Ghidat de Mască
3.2. Consistența Temporală Caracteristică-Matte
Seturi de Date pentru Matting de Instanțe
4.1. Matting de Instanțe de Imagine și 4.2. Matting de Instanțe Video
Experimente
5.1. Pre-antrenare pe date de imagine
5.2. Antrenare pe date video
Discuții și Referințe
\ Material Suplimentar
Detalii de arhitectură
Matting de imagine
8.1. Generarea și pregătirea setului de date
8.2. Detalii de antrenare
8.3. Detalii cantitative
8.4. Mai multe rezultate calitative pe imagini naturale
Matting video
9.1. Generarea setului de date
9.2. Detalii de antrenare
9.3. Detalii cantitative
9.4. Mai multe rezultate calitative
Această secțiune detaliază procesul de matting de imagine, oferind perspective suplimentare asupra generării setului de date și comparații cuprinzătoare cu metodele existente. Intrăm în detaliile creării seturilor de date I-HIM50K și M-HIM2K, oferim analize cantitative detaliate și prezentăm rezultate calitative suplimentare pentru a sublinia eficacitatea abordării noastre.
Setul de date I-HIM50K a fost sintetizat din setul de date HHM50K [50], cunoscut pentru colecția sa extinsă de matte-uri de imagini umane. Am folosit un model MaskRCNN [14] Resnet-50 FPN 3x, antrenat pe setul de date COCO, pentru a filtra imaginile cu o singură persoană, rezultând un subset de 35 053 de imagini. Urmând metodologia InstMatt [49], aceste imagini au fost compuse pe fundaluri diverse din setul de date BG20K [29], creând scenarii cu instanțe multiple cu 2-5 subiecți pe imagine. Subiecții au fost redimensionați și poziționați pentru a menține o scară realistă și pentru a evita suprapunerea excesivă, așa cum indică IoU-urile instanțelor care nu depășesc 30%. Acest proces a generat 49 737 de imagini, cu o medie de 2,28 instanțe pe imagine. În timpul antrenării, măștile de ghidare au fost generate prin binarizarea matte-urilor alfa și aplicarea operațiilor aleatorii de dropout, dilatare și eroziune. Imagini demonstrative din I-HIM50K sunt afișate în Fig. 10.
\ Setul de date M-HIM2K a fost conceput pentru a testa robustețea modelului față de calități variate ale măștilor. Acesta cuprinde zece măști pe instanță, generate folosind diverse modele MaskRCNN. Mai multe informații despre modelele utilizate pentru acest proces de generare sunt prezentate în Tabelul 8. Măștile au fost potrivite cu instanțele pe baza celui mai mare IoU cu matte-urile alfa de referință, asigurând un prag minim IoU de 70%. Măștile care nu au îndeplinit acest prag au fost generate artificial din referința reală. Acest proces a rezultat într-un set cuprinzător de 134 240 de măști, cu 117 660 pentru imagini compozite și 16 600 pentru imagini naturale, oferind un benchmark solid pentru evaluarea matting-ului de instanțe ghidat de mască. Setul complet de date I-HIM50K și M-HIM2K va fi lansat după acceptarea acestei lucrări.
\ 
\ 
\
:::info Autori:
(1) Chuong Huynh, University of Maryland, College Park (chuonghm@cs.umd.edu);
(2) Seoung Wug Oh, Adobe Research (seoh,jolee@adobe.com);
(3) Abhinav Shrivastava, University of Maryland, College Park (abhinav@cs.umd.edu);
(4) Joon-Young Lee, Adobe Research (jolee@adobe.com).
:::
:::info Această lucrare este disponibilă pe arxiv sub licența CC by 4.0 Deed (Attribution 4.0 International).
:::
\
