Apakah kalian sudah pernah menonton film jepang yang
berjudul Death Note 2: Last Name?
Kalau sudah, mungkin bisa mengingat-ingat salah satu scene di mana Light menjelaskan
tentang bagaimana cara mengetahui identitas 3rd Kira berdasarkan
pembunuhan-pembunuhan yang dilakukan oleh Kira. Saya ga akan bercerita lebih
jauh tentang film ini, namun saya ingin mengacu kepada scene tersebut. Di scene
tersebut, ditunjukkan bagaimana Light dapat mengetahui identitas 3rd kira
berdasarkan modus operandinya. Cara
mendapatkan modus operandinya dilakukan dengan melakukan analisis terhadap
kumpulan data pembunuhan. Data
pembunuhan (yang mungkin juga dilakukan oleh orang lain) dikelompokkan
berdasarkan waktu dan metode pembunuhan. Persoalannya adalah polisi tidak tahu bahwa
pembunuhan itu dilakukan oleh siapa, apakah sudah pasti itu dilakukan oleh Kira
atau mungkin juga dilakukan oleh orang lain yang membunuh dengan meniru metode
pembunuhan Kira. Persoalan pengelompokan
data ini dalam bidang informatik adalah salah satu contoh aplikasi Data Clustering di
bidang riset/kajian Data
Mining.
Data Mining menurut saya adalah teknik untuk mengekstrak pengetahuan ataupun pola yang menarik dari kumpulan besar data (biasanya tersimpan di dalam database) menjadi sebuah informasi bernilai dan bermanfaat. Pengetahuan ini bersifat tersirat karena pengetahuan itu tersembunyi di dalam data dalam bentuk suatu pola. Kalau kita pengen tahu data penjualan tahun 2007, dan ternyata itu udah ada di database, yaa berarti (sesuai namanya) data penjualan tahun 2007 bukanlah pengetahuan. Selain itu pengetahuan juga non-trivial karena ya tentu saja, buat apa kita mendapatkan pengetahuan yang telah kita ketahui (trivial/common knowledge). Contoh common knowledge adalah semua yang melahirkan adalah wanita. Semua orang pasti mengetahuinya! Tapi kalau kita bisa mendapatkan informasi bahwa, misalnya, wanita yang melahirkan pada usia di atas 35 tahun mempunyai kecenderungan untuk meminta mobil pada saat ngidam, sekali lagi ini cuma misalnya loh, nah ini baru sebuah informasi baru yang menarik.
Apa sebenarnya pentingnya data mining bagi perusahaan? Ok, mari kita bayangkan kasus di bidang penggunaan kartu kredit. Apakah anda punya kartu kredit? saya mempunyai contoh kasus yang berkaitan dengan kartu kredit. Suatu hari ayah ditelpon oleh bank yang menginformasikan dan mengkonfirmasi penggunaan kartu kredit yang tidak biasa, yaitu kartu kredit ayah digunakan di Malaysia untuk membeli sejumlah besar barang dengan pengeluaran yang sangat besar. Cerita cukup di sana saja, persoalannya sekarang adalah dari mana bank tahu bahwa sebuah transaksi itu tergolong sebuah transaksi yang aneh. Hal ini dapat dideteksi secara otomatis dengan data mining.Data mining dapat mencari dengan pengetahuannya bahwa transaksi kartu kredit ayah tergolong aneh. Contoh kasus lain adalah program penawaran jasa/barang kepada customer. Kalau penyedia layanan tahu bahwa sekelompok pelanggan biasa menelpon pada jam 17.00-18.00 (misalnya karena macet, maka iseng ngegosip dengan teman-temannya), maka perusahaan dapat menarik pelanggan dari kelompok ini dengan menawarkan tarif yang bersaing dan menarik pada jam-jam tersebut. So, data mining dapat membantu meningkatkan kemampuan layanan sebuah perusahaan, baik di bidang keamanan ataupun juga kualitas layanan.
sumber :
Data Mining menurut saya adalah teknik untuk mengekstrak pengetahuan ataupun pola yang menarik dari kumpulan besar data (biasanya tersimpan di dalam database) menjadi sebuah informasi bernilai dan bermanfaat. Pengetahuan ini bersifat tersirat karena pengetahuan itu tersembunyi di dalam data dalam bentuk suatu pola. Kalau kita pengen tahu data penjualan tahun 2007, dan ternyata itu udah ada di database, yaa berarti (sesuai namanya) data penjualan tahun 2007 bukanlah pengetahuan. Selain itu pengetahuan juga non-trivial karena ya tentu saja, buat apa kita mendapatkan pengetahuan yang telah kita ketahui (trivial/common knowledge). Contoh common knowledge adalah semua yang melahirkan adalah wanita. Semua orang pasti mengetahuinya! Tapi kalau kita bisa mendapatkan informasi bahwa, misalnya, wanita yang melahirkan pada usia di atas 35 tahun mempunyai kecenderungan untuk meminta mobil pada saat ngidam, sekali lagi ini cuma misalnya loh, nah ini baru sebuah informasi baru yang menarik.
Apa sebenarnya pentingnya data mining bagi perusahaan? Ok, mari kita bayangkan kasus di bidang penggunaan kartu kredit. Apakah anda punya kartu kredit? saya mempunyai contoh kasus yang berkaitan dengan kartu kredit. Suatu hari ayah ditelpon oleh bank yang menginformasikan dan mengkonfirmasi penggunaan kartu kredit yang tidak biasa, yaitu kartu kredit ayah digunakan di Malaysia untuk membeli sejumlah besar barang dengan pengeluaran yang sangat besar. Cerita cukup di sana saja, persoalannya sekarang adalah dari mana bank tahu bahwa sebuah transaksi itu tergolong sebuah transaksi yang aneh. Hal ini dapat dideteksi secara otomatis dengan data mining.Data mining dapat mencari dengan pengetahuannya bahwa transaksi kartu kredit ayah tergolong aneh. Contoh kasus lain adalah program penawaran jasa/barang kepada customer. Kalau penyedia layanan tahu bahwa sekelompok pelanggan biasa menelpon pada jam 17.00-18.00 (misalnya karena macet, maka iseng ngegosip dengan teman-temannya), maka perusahaan dapat menarik pelanggan dari kelompok ini dengan menawarkan tarif yang bersaing dan menarik pada jam-jam tersebut. So, data mining dapat membantu meningkatkan kemampuan layanan sebuah perusahaan, baik di bidang keamanan ataupun juga kualitas layanan.
Data Mining merupakan
disiplin ilmu yang kini sedang hot dimana-mana. Dipakai di industri perbankan
sampai mikrobiologi. Data mining merupakan gabungan dari statistika, machine
learning, database dan visualisasi. Ada tiga pilar data
mining: data, teknik data mining dan modelling. Jadi harus ada data sebagai
bahan untuk diolah. Dan yang penting kemampuan pemodelan. Bagaimana model yang
kita pilih untuk menyelesaikan problem yang kita hadapi. Apakah klstering,
klasifikasi atau prediksi. Setelah itu harus ada teknik data mining yang kita
kuasai untuk menyelesaikan model yang kita punyai.
Tugas utama data mining
adalah: Klastering, klasifikasi, prediksi, analisis pola berurutan dan
asosiasi. Masing-masing tugas mempunyai tool yang berbeda. Klastering
memerlukan kmeans, hirarchical clustering atau fuzzy c means. Klasifikasi
memerlukan analisis diskriminan, decision tree, neural networks atau suppur
vector machines. Sedangkan prediksi
memerlukan regresi, support vector regresi, neural networks. Sebelum kita bisa
menerapkan teknik mana yang akan diterapkan, kita harus memahami dulu kasus apa
yang kita hadapi. Setelah itu perlu dilakukan data preprocessing sebelum
bisa digunakan sebagai input untuk teknik data mining yang dipilih.
Dengan meningkatnya
transaksi yang disimpan dengan sistem basis data sekarang ini, maka dibutuhkan
proses untuk menangani data tersebut. Proses untuk menangani data tersebut
dikenal dengan Knowledge Discovery in Databases (KDD). Data Mining adalah
kegiatan untuk menemukan informasi atau pengetahuan yang berguna secara
otomatis dari data yang jumlahnya besar. Data Mining merupakan salah
satu proses dari keseluruhan proses yang ada pada Knowledge Discovery in
Databases (KDD). KDD sendiri merupakan sekumpulan proses untuk menemukan
pengetahuan yang bermanfaat dari data. KDD terdiri dari serangkaian langkah
perubahan, termasuk data preprocessing dan juga post processing.
Data preprocessing merupakan langkah untuk mengubah data mentah menjadi
format yang sesuai untuk tahap analisis berikutnya.
Kumpulan proses dalam KDD
meliputi : pembersihan data (data cleaning), integrasi data (data
integration), pemilihan data (data selection), transformasi data (data
transformation), penambangan data (data mining), evaluasi pola (pattern
evaluation), dan presentasi pengetahuan (knowledge presentation).
Berdasarkan definisi ini terlihat bahwa data mining hanya merupakan
salah satu proses dari keseluruhan proses yang ada pada KDD, tetapi merupakan
proses yang sangat penting dalam usaha menemukan pola-pola yang berguna dari
sejumlah data yang besar (data tersebut bisa disimpan dalam basisdata, data
warehouse, atau media penyimpanan informasi lainnya).
Implementasi (Penerapan)
Dalam bidang apasaja data mining dapat diterapkan? Berikut
beberapa contoh bidang penerapan data mining:
- Analisa pasar dan manajemen.
Solusi yang dapat diselesaikan dengan data mining,
diantaranya: Menembak target pasar, Melihat pola beli pemakai dari waktu ke
waktu, Cross-Market analysis, Profil Customer, Identifikasi kebutuhan Customer,
Menilai loyalitas Customer, Informasi Summary.
- Analisa Perusahaan dan Manajemen resiko.
Solusi yang dapat diselesaikan dengan data mining,
diantaranya: Perencanaan keuangan dan Evaluasi aset, Perencanaan sumber daya
(Resource Planning), Persaingan (Competition).
- Telekomunikasi.
Sebuah perusahaan telekomunikasi menerapkan data
mining untuk melihat dari jutaan transaksi yang masuk, transaksi mana sajakah
yang masih harus ditangani secara manual.
- Keuangan.
Financial Crimes Enforcement Network di Amerika
Serikat baru-baru ini menggunakan data mining untuk me-nambang trilyunan dari
berbagai subyek seperti property, rekening bank dan transaksi keuangan lainnya
untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money
laundry) .
- Asuransi.
Australian Health Insurance Commision menggunakan data
mining untuk mengidentifikasi layanan kesehatan yang sebenarnya tidak perlu
tetapi tetap dilakukan oleh peserta asuransi .
- Olahraga.
IBM Advanced Scout menggunakan data mining untuk
menganalisis statistik permainan NBA (jumlah shots blocked, assists dan fouls)
dalam rangka mencapai keunggulan bersaing (competitive advantage) untuk tim New
York Knicks dan Miami Heat.
- Astronomi.
Jet Propulsion Laboratory (JPL) di Pasadena,
California dan Palomar Observatory berhasil menemukan 22 quasar dengan bantuan
data mining. Hal ini merupakan salah satu kesuksesan penerapan data mining di
bidang astronomi dan ilmu ruang angkasa.
- Internet Web surf-aid
IBM Surf-Aid menggunakan algoritma data mining untuk
mendata akses halaman Web khususnya yang berkaitan dengan pemasaran guna
melihat prilaku dan minat customer serta melihat ke- efektif-an pemasaran
melalui Web.
Contoh kasus penerapan: Implementasi data mining
dengan teknik Clustering untuk melakukan Competitive Intelligence perusahaan.
Pembangunan
perangkat lunak data mining dengan metode clustering menggunakan algoritma
hirarki divisive untuk pengelompokan customer dalam studi kasus ini, fungsi –
fungsi yang dipakai adalah fungsi untuk menentukan titik-titik pusat yang
berguna sebagai pusat-pusat kelompok customer. sumber :
Tidak ada komentar:
Posting Komentar