Penerapan Triangular Kernel Nearest Neighbor Sebagai Metode Clustering Dasar Pada Metode Bagging
Abstract
Salah satu permasalahan utama dalam data mining adalah untuk menemukan metode clustering yang powerful. Terdapat suatu pendekatan baru dengan menggabungkan lebih dari satu metode clustering dikenal juga sebagai multi-clustering. Salah satu metode yang telah diperkenalkan adalah bagging (bootstrap aggregating). Metode tersebut terdiri dari metode clustering dasar dan metode clustering hierarki untuk mengkombinasikan partisi yang dihasilkan oleh metode clustering dasar. Triangular kernel nearest neighbor (TKNN) merupakan salah satu metode clustering berbasis densitas yang memiliki kemampuan untuk menghasilkan jumlah cluster secara otomatis. Penelitian ini menggunakan TKNN sebagai metode clustering dasar dalam metode bagging. Analisis komparatif menggunakan nilai F-Measures untuk empat metode single clustering (TKNN, ILGC, DBSCAN dan DENCLUE) dengan 9 dataset untuk menganalisa kinerja dari metode yang diusulkan. Berdasarkan hasil percobaan, menunjukkan beberapa hasil cluster yang lebih baik.
Downloads
References
J. A.K., M. M.N., and F. P.J., “Data Clustering : A Review,” ACM Comput. Surv., vol. 31, no. 3, pp. 264–323, 1999.
J. Han, M. Kamber, and J. Pei, Data Mining: Concepts and Techniques. 2012.
F. Leisch, “Bagged clustering,” Adapt. Inf. Syst. Model. Econ. Manag. Sci., vol. 51, no. 51, p. 11, 1999.
T. N. Tran, R. Wehrens, and L. M. C. Buydens, “KNN-kernel density-based clustering for high-dimensional multivariate data,” Comput. Stat. Data Anal., vol. 51, no. 2, pp. 513–525, 2006.
D. Frossyniotis, M. Pertselakis, and A. Stafylopatis, “A Multi-clustering Fusion Algorithm,” 2007, pp. 225–236.
A. Amini, H. Saboohi, and T. Y. Wah, “A multi density-based clustering algorithm for data stream with noise,” in Proceedings - IEEE 13th International Conference on Data Mining Workshops, ICDMW 2013, 2013, pp. 1105–1112.
A. Musdholifah and S. Z. Siti, “Triangular kernel nearest neighbor based clustering for pattern extraction in spatio-temporal database,” in Proceedings of the 2010 10th International Conference on Intelligent Systems Design and Applications, ISDA’10, 2010, pp. 67–73.
A. Musdholifah, S. Zaiton, and M. Hashim, “Cluster Analysis on High-Dimensional Data : A Comparison of Density-based Clustering Algorithms,” vol. 7, no. 2, pp. 380–389, 2013.
J. H. Ward, “Hierarchical Grouping to Optimize an Objective Function,” J. Am. Stat. Assoc., vol. 58, no. 301, pp. 236–244, 1963.
“Iris Data Set.” [Online]. Available: https://archive.ics.uci.edu/ml/datasets/iris.
B. Leo, “Bagging predictors,” Mach. Learn., vol. 24, no. 2, pp. 123–140, 1996.
K. Hsu, “Weight-Adjusted Baggin gof classification Algorithms Sensitive to missing Values,” Int. J. Inf. Educ. Technol. ( IJIET ), vol. 3, no. 5, pp. 560–566, 2013.
A. Musdholifah, S. Z. M. Hashim, and R. Ngah, “Robust Local Triangular Kernel density-based clustering for high-dimensional data,” in 2013 5th International Conference on Computer Science and Information Technology, CSIT 2013 - Proceedings, 2013, pp. 24–32.