Clustering merupakan fungsionalitas pada data mining. “Tujuan dari proses clustering ini yaitu untuk mengelompokkan data ke dalam suatu klaster, sehingga objek pada suatu klaster memiliki kemiripan yang sangat besar dengan objek lain pada klaster yang sama, tetapi sangat tidak mirip dengan objek pada klaster yang lain”. Clustering tidak memiliki pendefinisian target kelas sehingga disebut juga unsupervised learning. Unsupervised learning (clustering) adalah suatu teknik untuk mengelompokkan data ke dalam suatu klaster-klaster (kelas-kelas) tertentu berdasarkan kemiripan pada data atau pengelompokan kelas(cluster)nya dilakukan berdasarkan similarity dan dissimilarity dari data yang ada. Dalam data mining, usaha difokuskan pada metode-metode penemuan untuk cluster pada basis data berukuran besar secara efektif dan efisien. Beberapa kebutuhan clustering dalam data mining meliputi skalabilitas, kemampuan untuk menangani tipe atribut yang berbeda, mampu menangani dimensionalitas yang tinggi, menangani data yang mempunyai noise, dan dapat diterjemahkan dengan mudah.

Secara garis besar, terdapat beberapa metode clustering data. Pemilihan metode clustering bergantung pada tipe data dan tujuan clustering itu sendiri. Metode-metode beserta algoritma yang termasuk didalamnya meliputi :
1.    Partitioning Methods
Metode ini mengelompokkan data kedalam klaster-klaster dimana tiap klaster harus berisi paling sedikit satu objek dan tiap objek hanya merupakan anggota dari satu klaster. Contoh : k-Means, Fuzzy C-Means (FCM), k-Medoids, CLARA, CLARANS, PAM
2.    Hierarchical Methods
Metode ini mengelompokkan data kedalam pohon klaster. Contoh : BIRCH, AGNES, DIANA
3.    Density Based Methods
Metode ini hanya dapat menemukan klaster berbentuk bola dan akan mengalami kesulitan dalam menemukan klaster dalam bentuk yang berubah-ubah. Contoh : DBSCAN, OPTICS, DENCLUE, CLIQUE
4.    Grid Based Methods
Metode ini membagi ruang objek kedalam sejumlah sel yang membentuk struktur grid. Algoritma yang termasuk dalam metode ini yaitu STING, WaveCluster
5.    Model Based Clustering Methods
Metode ini melakukan hipotesa mengenai sebuah model untuk tiap klaster dan mencari data yang sesuai untuk model tersebut. Contoh : SOM dan COBWEB.