Data mining vs Data Warehousing
Data Mining dan Data Warehousing adalah teknik yang sangat kuat dan populer untuk menganalisis data. Pengguna yang cenderung ke statistik menggunakan Data Mining. Mereka menggunakan model statistik untuk mencari pola tersembunyi dalam data. Penambang data tertarik untuk menemukan hubungan yang berguna antara elemen data yang berbeda, yang pada akhirnya menguntungkan bagi bisnis. Namun di sisi lain, pakar data yang dapat menganalisis dimensi bisnis secara langsung cenderung menggunakan Data warehouse.
Data mining juga dikenal sebagai Knowledge Discovery in data (KDD). Seperti disebutkan di atas, ini adalah bidang ilmu komputer, yang berkaitan dengan ekstraksi informasi yang sebelumnya tidak diketahui dan menarik dari data mentah. Karena pertumbuhan data yang eksponensial, terutama di bidang-bidang seperti bisnis, penambangan data telah menjadi alat yang sangat penting untuk mengubah kekayaan data yang besar ini menjadi intelijen bisnis, karena ekstraksi pola secara manual tampaknya tidak mungkin dilakukan dalam beberapa dekade terakhir. Misalnya, saat ini telah digunakan untuk berbagai aplikasi seperti analisis jejaring sosial, deteksi penipuan, dan pemasaran. Data mining biasanya berhubungan dengan empat tugas berikut: pengelompokan, klasifikasi, regresi, dan asosiasi. Clustering adalah mengidentifikasi kelompok serupa dari data yang tidak terstruktur. Klasifikasi adalah aturan pembelajaran yang dapat diterapkan pada data baru dan biasanya akan mencakup langkah-langkah berikut: pra-pemrosesan data, merancang pemodelan, pembelajaran/pemilihan fitur, dan Evaluasi/validasi. Regresi adalah menemukan fungsi dengan kesalahan minimal untuk memodelkan data. Dan asosiasi adalah mencari hubungan antar variabel. Data mining biasanya digunakan untuk menjawab pertanyaan seperti apa produk utama yang dapat membantu untuk memperoleh keuntungan yang tinggi tahun depan di Wal-Mart?
Seperti disebutkan di atas, Data warehousing juga digunakan untuk menganalisis data, tetapi oleh kelompok pengguna yang berbeda dan tujuan yang sedikit berbeda dalam pikiran. Misalnya, ketika datang ke sektor ritel, pengguna Data warehousing lebih memperhatikan jenis pembelian apa yang populer di kalangan pelanggan, sehingga hasil analisis dapat membantu pelanggan dengan meningkatkan pengalaman pelanggan. Tetapi penambang data pertama-tama menduga hipotesis seperti pelanggan mana yang membeli jenis produk tertentu dan menganalisis data untuk menguji hipotesis. Data warehousing dapat dilakukan oleh peritel besar yang awalnya menimbun tokonya dengan ukuran produk yang sama untuk kemudian mengetahui bahwa toko New York menjual persediaan ukuran yang lebih kecil jauh lebih cepat daripada di toko Chicago. Jadi, dengan melihat hasil ini pengecer dapat menimbun toko New York dengan ukuran yang lebih kecil dibandingkan dengan toko Chicago.
Jadi, seperti yang dapat Anda lihat dengan jelas, kedua jenis analisis ini tampaknya memiliki sifat yang sama dengan mata telanjang. Keduanya sama-sama peduli tentang peningkatan keuntungan berdasarkan data historis. Tapi tentu saja, ada perbedaan utama. Secara sederhana, Data Mining dan Data Warehousing didedikasikan untuk menyediakan berbagai jenis analitik, tetapi pasti untuk berbagai jenis pengguna. Dengan kata lain, Data Mining mencari korelasi, pola untuk mendukung hipotesis statistik. Namun, Data Warehousing menjawab pertanyaan yang relatif lebih luas dan mengiris dan memotong data dari sana dan seterusnya untuk mengenali cara perbaikan di masa depan.