數據增強方式在方法上可以分為仿射變換、色彩變化、混合增強。仿射變換是指對圖像進行縮放、旋轉、平移和鏡像等;色彩變化是指調節圖像的明度、亮度和飽和度等(此外還可以使用各種濾波器對圖像進行模糊、增強等操作);混合增強是指多圖融合的增強手段,如mixup、cutmix等(此外還有cutup(又稱random erasing))。
這些增強方式也可以分為同類增強和混合增強,同類增強是通過對一張圖像進行變化,從而達到增強的目的;而混合增強是指對多張圖像進行融合,其返回的標簽獨熱碼也按照相應的比例進行了相應的融合。本博文,主要介紹mixup和cutmix兩種混合方式的實現,以兩種方式實現,分別支持靜態圖與動態圖,與ai框架無關,pytorch、tensorflow、paddle、keras都可以使用。
本博客只實現mixup與cutmix兩種數據混合增強方式,Cutout方式的實現請參考python工具方法 21 應用於語義分割、圖像分類、自動編碼機的圖像隨機mask方法(Cutout方法、Random Erasing方法)_萬裡鵬程轉瞬至的博客-CSDN博客
如:貓、狗、兔、鼠、牛五分類數據中,有以下兩個數據:
Im1:貓,label1:[1,0,0,0,0]
Im2:鼠,label2:[0,0,0,1,0]
Im1和Im2