Jumat, 28 September 2012

Konsep Dasar Data Mining

Pendahuluan
Alasan utama mengapa data mining sangat menarik perhatian industri informasi adalah dikarenakan tersedianya data dalam jumlah yang besar dan semakin besarnya kebutuhan untuk mengubah data tersebut menjadi informasi dan pengetahuan yang berguna.

Sebagai cabang ilmu baru di bidang komputer, cukup banyak penerapan yang dapat dilakukan oleh Data Mining. Dengan didukung berbagai bidang ilmu seperti artificial intelligence, database, statistic, pemodelan matematika dan pengolaan citra, sehingga membuat penerapan data mining menjadi makin luas.

Konsep Dasar Data Mining

Dari beberpa definisi tentang Data Mining dapat disimpulkan bahwa Data Mining merupakan proses mengekstrasi/menambang sebuah data yang berukuran besar untuk menggali nilai tambah dari data tersebut yang nantinya sangat berguna untuk pengembangan.


Sumber http://andyku.wordpress.com/2008/11/21/konsep-data-mining/

Keterangan;

-   Data cleaning (untuk menghilangkan noise data yang tidak konsisten) Data integration (dimana sumber data yang terpecah dapat di satukan)

-   Data selection ( di mana data yng relevan dengan tugas analisis dikembalikan ke dalam database)
-   Data transformation (di mana data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau operasi agresi)

-   Data mining (proses esensial di mana metode yang inlelejen digunakan untuk mengekstrak pola data)

-   Pattern evolution (untuk mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan berdasrkan atas beberapa tindakan yang menarik)

-   Knowledge presentation (di mana gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang telah ditambang kepada user)

Arsitektur data mining
  •       Database, data warehouse atau tempat peyimpanan lainnya.
  •       Server database atau data warehouse.
  •       Data mining engine.
  •       Pattern evolution module.
  •       Graphical user interface.
Jenis-jenis data dalam data mining;

    Relation Database
Sebuah system database, atau disebut juga database management system (DBMS), mengandungsekumpulan data yang saling berhubungan, dikenal sebagai sebuah database, dan satu set program perangkat lunak untuk mengatur dan mengakses data tersebut. 
           
    Data Warehouse
Sebuah data warehouse merupakan sebuah ruang penyimpanan informasi yang terkupul dari berbagai sumber, disimpandalam skema yang menyatu, dan biasanya terletak pada sebuah site.

Kegunaan data mining adalah untuk menspesifikasikan pola yang harus ditemukan dalam tugas data mining. Secara umum tugas data mining dapat diklasifikasikan ke dalam dua kategori: deskriptif dan prediktif. Tugas menambang secara deskriptif adalah untuk mengklasifikasikan sifat umum suatu data di dalam database. Tugas data mining secara prediktif adalah untuk mengambil kesimpulan terhadap data terakhir untuk membuat prediksi.

-   Konsep/Class Description
Data dapat diasosiasikan dengan pembagian class atau konsep. Untuk contohnya, di toko elektronik pebagian class untuk barang yang akan dijual termasuk komputer dan printer, dan konsep untuk konsumen adalah big Spenders dan budget spenders. Hal tersebut sangat berguna untuk menggambarkan pembagian class secara individual dan konsep secara ringkas, laporan ringkas, dan juga pengaturan harga. Deskripsi suatu class atau konsep seperti itu disebut class/concept description.

-   Association Analysis
Association analyisis adalah penemuan association rules yang menunjukkan nilai kondisi suatu attribute yang terjadi bersama-sama secara terus menuers dalam memberikan set data. Association analiysis secara luas dipakai untuk market basket atau analisis transaksi.

-    Klasifikasi dan Prediksi
Klasifikasi dan prediksi mungkin perlu diproses oleh analisis relevan, yang berusaha untuk mengidentifikasi atribut atribut yang tidak ditambahkan pada proses klasifikasi dan prediksi. Atribut-atribut ini kemudian dapat di keluarkan.

-    Cluster Analysis
Tidak seperti klasifikasi dan prediksi, yang menganalisis objek data dengan kelas yang terlabeli, clustering menganalisis objeck data tanpa mencari keterangan pada label kelas yang diketahui. Pada umumnya, label kelas tidak ditampilkan di dalam latihan data simply, karena mereka tidak tahu bagaimana memulainya. Clustering dapat digunakan untuk menghasilkan label-label.

Outlier Analysis
Outlier dapat dideteksi menggunakan test yang bersifat statistik yang mengambil sebuah distribusi atau probabilitas model untuk data, atau menggunakan langkah-langkah jarak jauh di mana objek yang penting jauh dari cluster lainnya dianggap outlier.

Sebuah database mungkin mengandung objek data yang tidak mengikuti tingkah laku yang umum atau model dari data. Data ini disebut outlier.

-   Evolution Analysis
Data analisis evolusi menggambarkan ketetapan model atau kecendrungan objek yang memiliki kebiasaan berubah setiap waktu. Meskipun ini mungkin termasuk karakteristik, deskriminasi, asosiasi, kalsifikasi atau clustering data berdasarkan waktu, kelebihan yang jelas seperti analisa termasuk analisa data time-series, urutan atau pencocokan pola secara berkala, dan kesamaan berdasarkan analisa data.

Tujuan/Fungsi Data Mining

Tujuan dari data mining adalah untuk mendapatkan data-data penting yang dibutuhkan. Contoh kasusnya adalah jika kita mempunyai kartu kredit, sudah pasti kita akan sering menerima surat berisi brosur penawaran barang atau jasa. Apabila bank pemberi kartu kredit memiliki satu juta nasabah, dan mengirimkan sebuah penawaran dengan biaya pengiriman masing-masing sebesar Rp.1.000,- maka biaya yang akan dihabisakan mencapai 1 Milyar, jika Bank tersebut mengirimkan penawaran sekali sebulan sehingga setiap tahunnya menghabiskan anggaran sebesar 12 Milyar. Akan tetapi mungkin hanya 10% konsumen yang membeli, sisanya 90% dari dana tersebut terbuang sia-sia.

Persoalan di atas merupakan salah satu yang dapat diatasi oleh data mining, dari sekian banyak potensi permasalahan yang ada. Data mining dapat menambang data transaksi belanja kartu kredit untuk melihat manakah pembeli-pembeli yang memang potensial untuk membeli produk tertentu. Mungkin tidak sampai persis 10% tapi bayangkan jika kita dapat menyaring 20% konsumen saja, tentunya 80% dapat digunakan untuk keperluan lainnya.

Pustaka

Cara Kerja Web Server


Web server merupakan perangkat lunak komputer yang berfungsi untuk menerima permintaan berupa http atau https dari web browser dan mengirimkan permintaan dalam bentuk halaman web.

Dalam proses kerja web server ini terdapat tiga aktor utama yaitu client (berupa komputer yang memiliki web browser), jaringan (internet atau intranet berfungsi sebagai pengubung anatar client dengan web server) dan web server itu sendiri  (komputer server).


Gambar Cara Kerja Web Server 
 
     Menerima permintaan (request) dari komputer client.
Pada proses ini diawali dengan adanya permintaan dari client berupa URL (http://...) yang diketikkan pada web browser. Kemudian melalui jaringan internet atau intranet, web server menerima permintaan tersebut  dan menindak lanjuti permintaan itu dengan mencari apa yang diminta client di komputer server.

     Mengirimkan permintaan client  (response).
Setelah permintaan client dicari di komputer server, web server akan meresponse. jika di temukan maka web server akan mngirimkan response dengan menampilkan halaman yang diminta di komputer client, sedangkan jika tidak ditemukan bisanya web server akan meresponse dengan memberikan pesan “404. Page Not Found”.

Perbandingan antara Litespeed dengan Nginx

Ada banyak macam web server diantaranya adalah Apache, Microsoft windows Web Server 2003 Internet Information Services (IIS), Lighttpd, Sun Java System Web Server, Xitami Web Server, Zeus Web Server, Litespeed Web Server dan Nginx Web Server. Masing-masing memiliki kelebihan dan kemurangan. Berikut perbandingan antara Litespeed dan Nginx web server.

·        Litespeed  Web Server
   
Kelebiahan Litespeed adalah;
1.      Kecepatan 50% lebih baik dalam memproses PHP .
2.      Performa enam kali lebih cepat dari pada Apache.
3.      Kompatibel dengan konfigurasi Apache.
4.      Memiliki pencegahan system overloading.
5.      Paket Hosting sangat murah dengan Space & Bandwitdh lebih besar.
Kekurangannya adalah;
6.      Dijual dengan harga tertentu.
7.      Pengguna masih sedikit dibandingkan dengan Apache/IIS.


·        Nginx Web Server
Kelebihan Nginx adalah;
1.      Open source.
2.      Performa yang tinggi , stabil dan memiliki banyak fitur.
3.      Mudah dikonfigurasi.
4.      Menggunkana sedikit semberdaya pada server.
5.      Tidak bergantung pada thread untuk melayani klien.
6.      Cendrung lebih kuat untuk hostingan banyak dibanding Litespeed.
Sedangkan kekurangannya adalah;
7.      Belum support IPV6.   
8.      Update yang cukup lama disbanding web server yang lain.
9.      Fast CGI yang tidak berfungsi sempurna.
10.  Pemakai tidak sebanyak Apache/ IIS.