Pengertian Data Mining
Data Mining merupakan Serangkaian proses untuk menggali nilai tambah
berupa informasi yang selama ini tidak diketahui secara manual dari
suatu basis data atau bisa disebut dengan KDD ( Knowledge Discovery in Database).
Informasi yang dihasilkan diperoleh dengan cara mengekstraksi dan
mengenali pola yang penting atau menarik dari data yang terdapat dalam
basis data.
Pengertian dan Manfaat KDD
KDD (Knowledge Discovery in Database) adalah keseluruhan proses
non-trivial untuk mencari dan mengidentifikasi pola (pattern) dalam
data, dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat
dan dapat dimengerti. Serangkaian proses tersebut yang memiliki tahap.
Pembersihan data dan integrasi data (cleaning and integration). Proses
ini digunakan untuk membuang data yang tidak konsisten dan bersifat
noise dari data yang terdapat di berbagai basisdata yang mungkin berbeda
format maupun platform yang kemudian diintegrasikan dalam satu database
datawarehouse.
Latar Belakang Terbentuknya Data Mining
- Melimpahnya data (overload data) yang dialami oleh berbagai institusi, perusahaan atau organisasi.
- Merlimpahnya data ini merupakan akumulasi data transaksi yang terekam bertahun-tahun..
- Data–data tersebut merupakan data transaksi yang umumnya diproses menggunakan aplikasi komputer yang biasa disebut dengan OLTP (On Line Transaction Processing).
Fungsi - Fungsi Umum Data Mining
- Assosiation, adalah proses untuk menemukan aturan assosiatif antara suatu kombinasi item dalam suatu waktu
- Sequence, proses untuk menemukan aturan assosiatif antara suatu kombinasi item dalam suatu waktu dan diterapkan lebih dari satu periode
- Clustering, adalah proses pengelompokan seumlah data/obyek ke dalam kelompok data sehingga setiap kelompok berisi data yang mirip
- Classification, proses penemuan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui.
- Regretion, adalah proses pemetaan data dalam suatu nilai prediksi
- Forecasting, adalah proses pengestimasian nilai prediksi berdasarkan pola-pola di dalam sekumpulan data.
- Solution, adalah proses penemuan akar masalah dan problem solving dari persoalan bisnis yang dihadapkai atau paling tidak sebagai informasi dalam pengambilan keputusan.
Proses Data Mining1. Pembersihan data dan integritas data (Cleaning & Integration)
Proses ini digunakan untuk membuang data yang tidak konsisten dan bersifat noise dari data yang terdapat di berbagai basisdata yang mungkin berbeda format maupun platform yang kemudian dinintegrasikan dalam satu database datawarehouse
2. Seleksi dan transformasi data (selection and transformation)
Data yang ada dalam database datawarehouse kemudian direduksi untuk mendapatkan hasil yang akurat. Beberapa cara seleksi, antara lain :
Metode seleksi pada data Mining
- Sampling, adalah seleksi subset representatif dari populasi data yang besar.
- Denoising, adalah proses menghilangkan noise dari data yang akan ditransformasikan
- Feature extraction, adalah proses membuka spesifikasi data yang signifikan dalam konteks tertentu.
- Centering, mengurangi setiap data dengan rata-rata dari setiap atribut yang ada.
- Normalisation, membagi setiap data yang dicentering dengan standar deviasi dari atribut bersangkutan.
- Scaling, mengubah data sehingga berada dalam skala tertentu.
Data yang telah ditransformasi, kemudian ditambang dengan berbagai teknik. Proses data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunkan fungsi-fungsi tertentu. Fungsi atau algoritma dalam data mining sangat bervariasi, dimana pemilihannya bergantung pada tujuan dan proses pencarian pengetahuan secara menyeluruh.
4. Evaluasi pola dan presentasi pengetahuan
Tahap ini merupakan bagian dari proses pencarian pengetahuan yang mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya. Langkah terakhir KDD adalah mempresentasikan pengetahuan dalam bentuk yang mudah dipahami pengguna.
Manfaat Data MiningDari sudut pandang komersial
Pemanfaatan data mining dapat digunakan dalam menangani meledaknya
volume data. Bagaimana mana menyimpannya, mengestraknya serta
memanfaaatkannya. Berbagai teknik komputasi dapat digunakan menghasilkan
informasi yang dibutuhkan. Informasi yang dihasilkan menjadi asset
untuk meningkatkan daya saing suatu institusi. Data mining tidak hanya
digunakan untuk menangani persoalan menumpuknya data/informasi dan
bagaimana menggudangkannya tanpa kehilangan informasi yang penting
(warehousing). Data mining juga diperlukan untuk menyelesaikan
permasalahan atau menjawab kebutuhan bisnis itu sendiri, misalnya :
- Bagaimana mengetahui hilangnya pelanggan karena pesaing
- Bagaimana mengetahui item produk atau konsumen yang memiliki kesamaan karakteristik
- Bagaimana mengidentifikasi produk-produk yang terjual bersamaan dengan produk lain
- Bagaimana memprediski tingkat penjualan
- Bagaimana menilai tingkat resiko dalam menentukan jumlah produksi suatu item.
- Bagaimana memprediksi prilaku bisnis di masa yang akan datang
Data mining dapat digunakan untuk mengcapture, menganlisis serta
menyimpan data yang bersifat real-time dan sangat besar, misal :
- Remote sensor yang ditempatkan pada suatu satelit.
- Teleskop yang digunakan untuk memindai langit.
- Simulasi saintifik yang membangkitkan data dalam ukuran terabytes.
Dear readers, after reading the Content please ask for advice and to provide constructive feedback Please Write Relevant Comment with Polite Language.Your comments inspired me to continue blogging. Your opinion much more valuable to me. Thank you.