Data Mining vs OLAP
Baik penambangan data dan OLAP adalah dua teknologi Business Intelligence (BI) yang umum. Intelijen bisnis mengacu pada metode berbasis komputer untuk mengidentifikasi dan mengekstraksi informasi yang berguna dari data bisnis. Data mining adalah bidang ilmu komputer yang berhubungan dengan penggalian pola yang menarik dari kumpulan data yang besar. Ini menggabungkan banyak metode dari kecerdasan buatan, statistik, dan manajemen basis data. OLAP (online analytic processing) sesuai dengan namanya merupakan kompilasi dari cara query database multidimensi.
Data mining juga dikenal sebagai Knowledge Discovery in data (KDD). Seperti disebutkan di atas, ini adalah bidang ilmu komputer, yang berkaitan dengan ekstraksi informasi yang sebelumnya tidak diketahui dan menarik dari data mentah. Karena pertumbuhan data yang eksponensial, terutama di bidang-bidang seperti bisnis, penambangan data telah menjadi alat yang sangat penting untuk mengubah kekayaan data yang besar ini menjadi intelijen bisnis, karena ekstraksi pola secara manual tampaknya tidak mungkin dilakukan dalam beberapa dekade terakhir. Misalnya, saat ini telah digunakan untuk berbagai aplikasi seperti analisis jejaring sosial, deteksi penipuan, dan pemasaran. Data mining biasanya berhubungan dengan empat tugas berikut: pengelompokan, klasifikasi, regresi, dan asosiasi. Clustering adalah mengidentifikasi kelompok serupa dari data yang tidak terstruktur. Klasifikasi adalah aturan pembelajaran yang dapat diterapkan pada data baru dan biasanya akan mencakup langkah-langkah berikut: pra-pemrosesan data, merancang pemodelan, pembelajaran/pemilihan fitur, dan evaluasi/validasi. Regresi adalah menemukan fungsi dengan kesalahan minimal untuk memodelkan data. Dan asosiasi adalah mencari hubungan antar variabel. Data mining biasanya digunakan untuk menjawab pertanyaan seperti apa produk utama yang dapat membantu untuk memperoleh keuntungan yang tinggi tahun depan di Wal-Mart.
OLAP adalah kelas sistem, yang memberikan jawaban atas kueri multidimensi. Biasanya OLAP digunakan untuk pemasaran, penganggaran, peramalan, dan aplikasi serupa. Tak perlu dikatakan bahwa database yang digunakan untuk OLAP dikonfigurasikan untuk kueri kompleks dan ad-hoc dengan kinerja cepat. Biasanya matriks digunakan untuk menampilkan output dari OLAP. Baris dan kolom dibentuk oleh dimensi kueri. Mereka sering menggunakan metode agregasi pada beberapa tabel untuk mendapatkan ringkasan. Misalnya, dapat digunakan untuk mengetahui penjualan tahun ini di Wal-Mart dibandingkan tahun lalu? Bagaimana prediksi penjualan di kuartal berikutnya? Apa yang bisa dikatakan tentang tren dengan melihat persentase perubahan?
Meskipun jelas bahwa Data mining dan OLAP serupa karena mereka beroperasi pada data untuk mendapatkan kecerdasan, perbedaan utama berasal dari cara mereka beroperasi pada data. Alat OLAP menyediakan analisis data multidimensi dan menyediakan ringkasan data tetapi sebaliknya, penambangan data berfokus pada rasio, pola, dan pengaruh dalam kumpulan data. Itu adalah kesepakatan OLAP dengan agregasi, yang bermuara pada pengoperasian data melalui "penambahan" tetapi penambangan data sesuai dengan "pembagian". Perbedaan penting lainnya adalah bahwa ketika alat data mining memodelkan data dan mengembalikan aturan yang dapat ditindaklanjuti, OLAP akan melakukan teknik perbandingan dan kontras sepanjang dimensi bisnis secara real time.