前段日子有朋友咨詢了下分析圖像主顏色的算法,我對這一塊也沒有什麼深入的研究,參考了一些小代碼,然後自己寫了一個很簡單的小工具,現共享給大家。
界面截圖如下:
算法的原理很簡單,就是統計出圖像中各種顏色的分布情況,然後取前N個顏色作為主成分。
當然,實際上如果直接對圖像的各通道256個色階進行統計,得到的結果可能是沒有意義的,所以一般都需要先把256個色階線性的隱射到更少的色階范圍。
主要的代碼如下:
static unsafe class Statistics { //'***************************************************************************************** //'** 開發日期 : 2013-6-21 //'** 作 者 : laviewpbt //'** 聯系方式: 33184777 //'** 修改日期 : 2013-6-21 //'** 版 本 : Version 1.1.1 //'** 轉載請不要刪除以上信息 //'**************************************************************************************** [StructLayout(LayoutKind.Sequential)] public struct MajorColor : IComparable<MajorColor> { internal int Color; internal int Amount; public MajorColor(int Color, int Amount) { this.Color = Color; this.Amount = Amount; } public int CompareTo(MajorColor obj) { return this.Amount.CompareTo(obj.Amount); } } // http://www.coolphptools.com/color_extract // http://www.wookmark.com/image/268753/30-inspiring-examples-of-levitation-photography-inspirationfeed-com public static List<MajorColor> PrincipalColorAnalysis(Bitmap Bmp, int PCAAmount, int Delta = 24) { List<MajorColor> MC = new List<MajorColor>(); int X, Y, Width, Height, Stride, Index, TotalColorAmount = 0; int HalfDelta; byte* Pointer, Scan0; BitmapData BmpData = Bmp.LockBits(new Rectangle(0, 0, Bmp.Width, Bmp.Height), ImageLockMode.ReadWrite, PixelFormat.Format24bppRgb); Height = Bmp.Height; Width = Bmp.Width; Stride = BmpData.Stride; Scan0 = (byte*)BmpData.Scan0; int[] Table = new int[256 * 256 * 256]; int[] NonZero = new int[Width * Height]; int[] Map = new int[256]; if (Delta > 2) HalfDelta = Delta / 2 - 1; else HalfDelta = 0; for (Y = 0; Y < 256; Y++) { Map[Y] = ((Y + HalfDelta) / Delta) * Delta; if (Map[Y] > 255) Map[Y] = 255; } for (Y = 0; Y < Height; Y++) { Pointer = Scan0 + Stride * Y; for (X = 0; X < Width; X++) { Index = (Map[*Pointer] << 16) + (Map[*(Pointer + 1)] << 8) + Map[*(Pointer + 2)]; if (Table[Index] == 0) // 還沒有出現過該顏色 { NonZero[TotalColorAmount] = Index; // 記錄下有顏色的位置,同時也記錄下了該顏色 TotalColorAmount++; // 顏色總數+1 } Table[Index]++; // 對應的顏色數加1 Pointer += 3; // 移動到下一個像素 } } MajorColor[] Result = new MajorColor[TotalColorAmount]; for (Y = 0; Y < TotalColorAmount; Y++) { Result[Y].Amount = Table[NonZero[Y]]; Result[Y].Color = NonZero[Y]; } Array.Sort(Result); // 系統自帶的這個排序算法比一般自己寫的都要快 Array.Reverse(Result); for (Y = 0; Y < PCAAmount; Y++) MC.Add(new MajorColor(Result[Y].Color, Result[Y].Amount)); Bmp.UnlockBits(BmpData); GC.Collect(); // 立即釋放掉分配的64MB的內存 return MC; } }
統計顏色這一塊,其實我一直在尋找一種即不用占很大內存,速度又快的算法,但是一直沒有想到好辦法。 上面的代碼中是分配了64MB的內存來索引計數的,雖然對於很小的圖像也需要這麼大的內存占用量,但是我經過對比發現,比用Dictionary之類的基於字典的統計方法還是要快很多的。
關於排序,我一直認為自己能寫出比系統更快的算法,但是最終我還是選擇了如上代碼中的簡便方式。在對Amount進行排序的同時,Color的值也跟著隨動了。
在這種占用比較大內存的代碼中,我認為應該立即調用GC.Collect()釋放掉內存。
關於Delta的取值,似乎不太好確定,這個只能說試驗確定吧,一般取16-32之間比較合理。
兩個參考鏈接處也有一些比較好的算法的,不過裡面的代碼是PHP的,改寫成C#的應該說還是有一定的難度的,有興趣的朋友可以自己參考著學習下吧。
從個人的理解來看,我覺得這種顏色主成分分析 還可以利用 類似於彩色轉索引時 找最佳索引表時用的八叉樹算法;也可以用FCM或者KMEANS之類的聚類算法來實現。待時間充足時我回去實際驗證下。