Selamat datang di nHana bLog...
blog ini merupakan sarana pembelajaran,,,masih sederhana,,mohon saran dan bimbingannya...thengs ^^

Sabtu, 10 Maret 2012

Contoh Kasus Data Mining

Apakah kalian sudah pernah menonton film jepang yang berjudul Death Note 2: Last Name? Kalau sudah, mungkin bisa mengingat-ingat salah satu scene di mana Light menjelaskan tentang bagaimana cara mengetahui identitas 3rd Kira berdasarkan pembunuhan-pembunuhan yang dilakukan oleh Kira. Saya ga akan bercerita lebih jauh tentang film ini, namun saya ingin mengacu kepada scene tersebut. Di scene tersebut, ditunjukkan bagaimana Light dapat mengetahui identitas 3rd kira berdasarkan modus operandinya. Cara mendapatkan modus operandinya dilakukan dengan melakukan analisis terhadap kumpulan data pembunuhan. Data pembunuhan (yang mungkin juga dilakukan oleh orang lain) dikelompokkan berdasarkan waktu dan metode pembunuhan. Persoalannya adalah polisi tidak tahu bahwa pembunuhan itu dilakukan oleh siapa, apakah sudah pasti itu dilakukan oleh Kira atau mungkin juga dilakukan oleh orang lain yang membunuh dengan meniru metode pembunuhan Kira. Persoalan pengelompokan data ini dalam bidang informatik adalah salah satu contoh aplikasi Data Clustering di bidang riset/kajian Data Mining.


Data Mining menurut saya adalah teknik untuk mengekstrak pengetahuan ataupun pola yang menarik dari kumpulan besar data (biasanya tersimpan di dalam database) menjadi sebuah informasi bernilai dan bermanfaat.  Pengetahuan ini bersifat tersirat karena pengetahuan itu tersembunyi di dalam data dalam bentuk suatu pola. Kalau kita pengen tahu data penjualan tahun 2007, dan ternyata itu udah ada di database, yaa berarti (sesuai namanya) data penjualan tahun 2007 bukanlah pengetahuan. Selain itu pengetahuan juga non-trivial karena ya tentu saja, buat apa kita mendapatkan pengetahuan yang telah kita ketahui (trivial/common knowledge). Contoh common knowledge adalah semua yang melahirkan adalah wanita. Semua orang pasti mengetahuinya! Tapi kalau kita bisa mendapatkan informasi bahwa, misalnya, wanita yang melahirkan pada usia di atas 35 tahun mempunyai kecenderungan untuk meminta mobil pada saat ngidam, sekali lagi ini cuma misalnya loh, nah ini baru sebuah informasi baru yang menarik.


Apa sebenarnya pentingnya data mining bagi perusahaan? Ok, mari kita bayangkan kasus di bidang penggunaan kartu kredit. Apakah anda punya kartu kredit?  saya mempunyai contoh kasus yang berkaitan dengan kartu kredit. Suatu hari ayah ditelpon oleh bank yang menginformasikan dan mengkonfirmasi penggunaan kartu kredit yang tidak biasa, yaitu kartu kredit ayah digunakan di Malaysia untuk membeli sejumlah besar barang dengan pengeluaran yang sangat besar. Cerita cukup di sana saja, persoalannya sekarang adalah dari mana bank tahu bahwa sebuah transaksi itu  tergolong sebuah transaksi yang aneh. Hal ini dapat dideteksi secara otomatis dengan data mining.Data mining dapat mencari dengan pengetahuannya bahwa transaksi kartu kredit ayah tergolong aneh. Contoh kasus lain adalah program penawaran jasa/barang kepada customer.  Kalau penyedia layanan tahu bahwa sekelompok pelanggan biasa menelpon pada jam 17.00-18.00 (misalnya karena macet, maka iseng ngegosip dengan teman-temannya),  maka perusahaan dapat menarik pelanggan dari kelompok ini dengan menawarkan tarif yang bersaing dan menarik pada jam-jam tersebut. So, data mining dapat membantu meningkatkan kemampuan layanan sebuah perusahaan, baik di bidang keamanan ataupun juga kualitas layanan.


Data Mining merupakan disiplin ilmu yang kini sedang hot dimana-mana. Dipakai di industri perbankan sampai mikrobiologi. Data mining merupakan gabungan dari statistika, machine learning, database dan visualisasi. Ada tiga pilar data mining: data, teknik data mining dan modelling. Jadi harus ada data sebagai bahan untuk diolah. Dan yang penting kemampuan pemodelan. Bagaimana model yang kita pilih untuk menyelesaikan problem yang kita hadapi. Apakah klstering, klasifikasi atau prediksi. Setelah itu harus ada teknik data mining yang kita kuasai untuk menyelesaikan model yang kita punyai.

Tugas utama data mining adalah: Klastering, klasifikasi, prediksi, analisis pola berurutan dan asosiasi. Masing-masing tugas mempunyai tool yang berbeda. Klastering memerlukan kmeans, hirarchical clustering atau fuzzy c means. Klasifikasi memerlukan analisis diskriminan, decision tree, neural networks atau suppur vector machines. Sedangkan prediksi memerlukan regresi, support vector regresi, neural networks. Sebelum kita bisa menerapkan teknik mana yang akan diterapkan, kita harus memahami dulu kasus apa yang kita hadapi. Setelah itu perlu dilakukan data preprocessing sebelum bisa digunakan sebagai input untuk teknik data mining yang dipilih.


Dengan meningkatnya transaksi yang disimpan dengan sistem basis data sekarang ini, maka dibutuhkan proses untuk menangani data tersebut. Proses untuk menangani data tersebut dikenal dengan Knowledge Discovery in Databases (KDD). Data Mining adalah kegiatan untuk menemukan informasi atau pengetahuan yang berguna secara otomatis dari data yang jumlahnya besar. Data Mining merupakan salah satu proses dari keseluruhan proses yang ada pada Knowledge Discovery in Databases (KDD). KDD sendiri merupakan sekumpulan proses untuk menemukan pengetahuan yang bermanfaat dari data. KDD terdiri dari serangkaian langkah perubahan, termasuk data preprocessing dan juga post processing. Data preprocessing merupakan langkah untuk mengubah data mentah menjadi format yang sesuai untuk tahap analisis berikutnya.


Kumpulan proses dalam KDD meliputi : pembersihan data (data cleaning), integrasi data (data integration), pemilihan data (data selection), transformasi data (data transformation), penambangan data (data mining), evaluasi pola (pattern evaluation), dan presentasi pengetahuan (knowledge presentation). Berdasarkan definisi ini terlihat bahwa data mining hanya merupakan salah satu proses dari keseluruhan proses yang ada pada KDD, tetapi merupakan proses yang sangat penting dalam usaha menemukan pola-pola yang berguna dari sejumlah data yang besar (data tersebut bisa disimpan dalam basisdata, data warehouse, atau media penyimpanan informasi lainnya).


Implementasi (Penerapan)

Dalam bidang apasaja data mining dapat diterapkan? Berikut beberapa contoh bidang penerapan data mining:

- Analisa pasar dan manajemen.

Solusi yang dapat diselesaikan dengan data mining, diantaranya: Menembak target pasar, Melihat pola beli pemakai dari waktu ke waktu, Cross-Market analysis, Profil Customer, Identifikasi kebutuhan Customer, Menilai loyalitas Customer, Informasi Summary.

- Analisa Perusahaan dan Manajemen resiko.

Solusi yang dapat diselesaikan dengan data mining, diantaranya: Perencanaan keuangan dan Evaluasi aset, Perencanaan sumber daya (Resource Planning), Persaingan (Competition).

- Telekomunikasi.

Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harus ditangani secara manual.

- Keuangan.

Financial Crimes Enforcement Network di Amerika Serikat baru-baru ini menggunakan data mining untuk me-nambang trilyunan dari berbagai subyek seperti property, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money laundry) .

- Asuransi.

Australian Health Insurance Commision menggunakan data mining untuk mengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh peserta asuransi .

- Olahraga.

IBM Advanced Scout menggunakan data mining untuk menganalisis statistik permainan NBA (jumlah shots blocked, assists dan fouls) dalam rangka mencapai keunggulan bersaing (competitive advantage) untuk tim New York Knicks dan Miami Heat.

- Astronomi.

Jet Propulsion Laboratory (JPL) di Pasadena, California dan Palomar Observatory berhasil menemukan 22 quasar dengan bantuan data mining. Hal ini merupakan salah satu kesuksesan penerapan data mining di bidang astronomi dan ilmu ruang angkasa.

- Internet Web surf-aid

IBM Surf-Aid menggunakan algoritma data mining untuk mendata akses halaman Web khususnya yang berkaitan dengan pemasaran guna melihat prilaku dan minat customer serta melihat ke- efektif-an pemasaran melalui Web.

Contoh kasus penerapan: Implementasi data mining dengan teknik Clustering untuk melakukan Competitive Intelligence perusahaan.
Pembangunan perangkat lunak data mining dengan metode clustering menggunakan algoritma hirarki divisive untuk pengelompokan customer dalam studi kasus ini, fungsi – fungsi yang dipakai adalah fungsi untuk menentukan titik-titik pusat yang berguna sebagai pusat-pusat kelompok customer.


sumber : 

Tidak ada komentar:

Posting Komentar