Data mining merupakan sebuah proses penemuan pola-pola yang menarik dari sekumpulan data berukuran besar. Data mining dapat diterapkan pada berbagai area, seperti kesehatan, asuransi, pemasaran, maupun ilmu pengetahuan yang lain. Data mining merupakan salah satu langkah dalam menghasilkan KDD (Knowledge Discovery in Database). KDD merupakan sekumpulan proses untuk mengubah data menjadi pengetahuan yang berguna. Kumpulan proses tersebut meliputi : pembersihan data (data cleaning), integrasi data (data integration), pemilihan data (data selection), transformasi data (data transformation), penambangan data (data mining), evaluasi pola (pattern evaluation), dan presentasi pengetahuan (knowledge presentation). Data Mining melibatkan berbagai teknik dari berbagai multidisiplin, seperti teknologi basisdata, statistika, machine learning, pengenalan pola, information retrieval, dan sebagainya. Data mining mendukung task-task atau fungsionalitas yang meliputi :
a.    Klasifikasi dan Prediksi
Klasifikasi adalah proses pencarian sekumpulan model atau fungsi yang menggambarkan dan membedakan kelas data dengan tujuan agar model tersebut dapat digunakan untuk memprediksi kelas dari suatu objek yang belum diketahui kelasnya.
b.    Analisis Asosiasi
Analisis asosiasi adalah penentuan kaidah asosiasi (association rule) yang menunjukkan kondisi nilai atribut yang sering terjadi secara bersamaan dalam sekumpulan data. Analisis asosiasi ini sering digunakan untuk analisis data transaksi dan market basket.
c.    Analisis Cluster
Clustering merupakan proses pengelompokan sekumpulan fisik atau abstrak dari suatu objek kedalam kelas – kelas objek yang sama. Cluster merupakan kumpulan objek data yang mirip satu sama lain dalam satu cluster dan tidak mirip dengan objek di cluster lain.  Analisis cluster telah digunakan dalam aplikasi analisis data, patern recognition, image processing dan market research.
d.    Anomaly Detection
Anomaly Detection merupakan metode pendeteksian suatu data dimana tujuannya adalah menemukan objek yang berbeda dari sebagian besar objek lain. Anomaly dapat dideteksi dengan menggunakan uji statistik yang menerapkan model distribusi atau probabilitas untuk data.
e.    Regression (Predictive Task)
Regression akan memprediksi suatu nilai yang berisi variabel continous berdasarkan nilai dari variabel lain, misalkan suatu linear atau non linear model. Regression biasanya digunakan pada bidang marketing, earth science.