以經典 iris 數據為例,經典數據集 iris 內包含 3 類共 150 條記錄,每類各 50 個數據,每條記錄都有 4 項特征:花萼長度、花萼寬度、花瓣長度、花瓣寬度,可以通過這 4 個特征預測鸢尾花卉屬於(iris-setosa, iris-versicolour, iris-virginica) 中的哪一品種。
初始條件設置:
考慮到已知真實分類為 3 類,初始設置超參數:簇類數量 K=3;
DBSCAN 密度聚類半徑設為 0.5,高密度阈值設為 2。
以下為 python 代碼:
參考文獻
[1] 密度峰值聚類算法總結及其python實現_Clustering聚類算法總結+python實踐 2020.12