Pendahuluan
Alasan utama mengapa data mining sangat
menarik perhatian industri informasi adalah dikarenakan tersedianya data dalam
jumlah yang besar dan semakin besarnya kebutuhan untuk mengubah data tersebut menjadi
informasi dan pengetahuan yang berguna.
Sebagai
cabang ilmu baru di bidang komputer, cukup banyak penerapan yang dapat dilakukan oleh Data Mining. Dengan didukung berbagai
bidang ilmu seperti artificial
intelligence, database, statistic, pemodelan matematika dan
pengolaan citra, sehingga membuat penerapan data mining menjadi makin luas.
Konsep Dasar Data Mining
Dari
beberpa definisi tentang Data Mining dapat disimpulkan bahwa Data Mining
merupakan proses mengekstrasi/menambang sebuah data yang berukuran besar untuk menggali
nilai tambah dari data tersebut yang nantinya sangat berguna untuk pengembangan.
Sumber
http://andyku.wordpress.com/2008/11/21/konsep-data-mining/
Keterangan;
- Data cleaning (untuk menghilangkan noise data yang
tidak konsisten) Data integration (dimana sumber data yang terpecah dapat di
satukan)
- Data selection ( di mana data yng relevan dengan
tugas analisis dikembalikan ke dalam database)
- Data transformation (di mana data berubah atau bersatu
menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau
operasi agresi)
- Data mining (proses esensial di mana metode yang
inlelejen digunakan untuk mengekstrak pola data)
- Pattern evolution (untuk mengidentifikasi pola yang
benar-benar menarik yang mewakili pengetahuan berdasrkan atas beberapa tindakan
yang menarik)
- Knowledge presentation (di mana gambaran teknik
visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang telah ditambang
kepada user)
Arsitektur data mining
- Database, data warehouse atau tempat peyimpanan lainnya.
- Server database atau data warehouse.
- Data mining engine.
- Pattern evolution module.
- Graphical user interface.
Jenis-jenis
data dalam data mining;
Relation Database
Sebuah system database, atau disebut
juga database management system (DBMS), mengandungsekumpulan data yang saling
berhubungan, dikenal sebagai sebuah database, dan satu set program perangkat
lunak untuk mengatur dan mengakses data tersebut.
Data Warehouse
Sebuah data warehouse merupakan sebuah ruang
penyimpanan informasi yang terkupul dari berbagai sumber, disimpandalam skema
yang menyatu, dan biasanya terletak pada sebuah site.
Kegunaan
data mining adalah untuk menspesifikasikan pola yang harus ditemukan dalam
tugas data mining. Secara umum tugas data mining dapat diklasifikasikan ke
dalam dua kategori: deskriptif dan prediktif. Tugas menambang secara deskriptif
adalah untuk mengklasifikasikan sifat umum suatu data di dalam database. Tugas
data mining secara prediktif adalah untuk mengambil kesimpulan terhadap data
terakhir untuk membuat prediksi.
- Konsep/Class Description
Data dapat diasosiasikan dengan
pembagian class atau konsep. Untuk contohnya, di toko elektronik pebagian class
untuk barang yang akan dijual termasuk komputer dan printer, dan konsep untuk
konsumen adalah big Spenders dan budget spenders. Hal tersebut sangat berguna
untuk menggambarkan pembagian class secara individual dan konsep secara
ringkas, laporan ringkas, dan juga pengaturan harga. Deskripsi suatu class atau
konsep seperti itu disebut class/concept
description.
- Association Analysis
Association analyisis adalah penemuan
association rules yang menunjukkan nilai kondisi suatu attribute yang terjadi
bersama-sama secara terus menuers dalam memberikan set data. Association analiysis
secara luas dipakai untuk market basket atau analisis transaksi.
-
Klasifikasi dan Prediksi
Klasifikasi dan prediksi mungkin perlu
diproses oleh analisis relevan, yang berusaha untuk mengidentifikasi atribut
atribut yang tidak ditambahkan pada proses klasifikasi dan prediksi.
Atribut-atribut ini kemudian dapat di keluarkan.
- Cluster Analysis
Tidak seperti klasifikasi dan
prediksi, yang menganalisis objek data dengan kelas yang terlabeli, clustering
menganalisis objeck data tanpa mencari keterangan pada label kelas yang
diketahui. Pada umumnya, label kelas tidak ditampilkan di dalam latihan data
simply, karena mereka tidak tahu bagaimana memulainya. Clustering dapat
digunakan untuk menghasilkan label-label.
Outlier Analysis
Outlier dapat dideteksi menggunakan
test yang bersifat statistik yang mengambil sebuah distribusi atau probabilitas
model untuk data, atau menggunakan langkah-langkah jarak jauh di mana objek
yang penting jauh dari cluster lainnya dianggap outlier.
Sebuah database mungkin mengandung
objek data yang tidak mengikuti tingkah laku yang umum atau model dari data.
Data ini disebut outlier.
- Evolution Analysis
Data analisis evolusi menggambarkan ketetapan
model atau kecendrungan objek yang memiliki kebiasaan berubah setiap waktu.
Meskipun ini mungkin termasuk karakteristik, deskriminasi, asosiasi,
kalsifikasi atau clustering data berdasarkan waktu, kelebihan yang jelas
seperti analisa termasuk analisa data time-series, urutan atau pencocokan pola
secara berkala, dan kesamaan berdasarkan analisa data.
Tujuan/Fungsi Data Mining
Tujuan
dari data mining adalah untuk mendapatkan
data-data penting yang dibutuhkan. Contoh kasusnya adalah jika kita
mempunyai kartu kredit, sudah pasti kita akan sering menerima surat berisi
brosur penawaran barang atau jasa. Apabila bank pemberi kartu kredit memiliki
satu juta nasabah, dan mengirimkan sebuah penawaran dengan biaya pengiriman
masing-masing sebesar Rp.1.000,- maka biaya yang akan dihabisakan mencapai 1
Milyar, jika Bank tersebut mengirimkan penawaran sekali sebulan sehingga setiap
tahunnya menghabiskan anggaran sebesar 12 Milyar. Akan tetapi mungkin hanya 10%
konsumen yang membeli, sisanya 90% dari dana tersebut terbuang sia-sia.
Persoalan
di atas merupakan salah satu yang dapat diatasi oleh data mining, dari sekian
banyak potensi permasalahan yang ada. Data mining dapat menambang data
transaksi belanja kartu kredit untuk melihat manakah pembeli-pembeli yang
memang potensial untuk membeli produk tertentu. Mungkin tidak sampai persis 10%
tapi bayangkan jika kita dapat menyaring 20% konsumen saja, tentunya 80% dapat
digunakan untuk keperluan lainnya.
Pustaka