Apa itu Penambangan Data? Dasar dan Tekniknya.

Dasar dari revolusi industri keempat akan sangat bergantung pada Data dan Konektivitas(Connectivity) . Layanan Analisis(Analysis Services) yang mampu mengembangkan atau membuat solusi penambangan data akan memainkan peran kunci dalam hal ini. Ini bisa membantu dalam menganalisis dan memprediksi hasil dari perilaku pembelian pelanggan(customer purchasing behavior) untuk menargetkan pembeli potensial. Data akan menjadi sumber daya alam baru dan proses penggalian informasi yang relevan dari data yang tidak disortir ini akan menjadi sangat penting. Dengan demikian, pemahaman yang tepat tentang istilah – (term –) Data Mining , prosesnya, dan penerapannya dapat membantu kami dalam mengembangkan pendekatan holistik untuk kata kunci ini.

Dasar- dasar Data Mining(Data Mining Basics) dan Tekniknya

penambangan data

Data mining, juga dikenal sebagai Knowledge Discovery in Data ( KDD ) adalah tentang mencari penyimpanan data yang besar untuk mengungkap pola dan tren yang melampaui analisis sederhana. Namun, ini bukan solusi satu langkah tetapi proses multi-langkah dan diselesaikan dalam berbagai tahap. Ini termasuk:

1] Pengumpulan dan Persiapan Data

Dimulai dengan pengumpulan data dan organisasi yang tepat. Ini membantu secara signifikan meningkatkan peluang menemukan informasi yang dapat ditemukan melalui penambangan data

2] Pembuatan Model dan Evaluasi

Langkah kedua dalam proses data mining(mining process) adalah penerapan berbagai teknik pemodelan. Ini digunakan untuk mengkalibrasi parameter ke nilai optimal. Teknik yang digunakan sebagian besar bergantung pada kemampuan analitik yang diperlukan untuk mengatasi keseluruhan kebutuhan organisasi dan untuk sampai pada keputusan.

Mari kita periksa beberapa teknik data mining secara singkat. Ditemukan bahwa sebagian besar organisasi menggabungkan dua atau lebih teknik data mining bersama-sama untuk membentuk proses yang sesuai yang memenuhi kebutuhan bisnis mereka.

Baca(Read) : Apa Itu Big Data?

Teknik Penambangan Data

  1. Asosiasi –  (Association – )Asosiasi(Association) adalah salah satu teknik data mining yang dikenal luas. Di bawah ini, pola diuraikan berdasarkan hubungan antara item dalam transaksi yang sama. Oleh karena(Hence) itu, teknik ini juga dikenal sebagai teknik relasi(relation technique) . Pengecer merek besar mengandalkan teknik ini untuk meneliti kebiasaan/preferensi pembelian pelanggan. Misalnya, saat melacak kebiasaan membeli orang, pengecer mungkin mengidentifikasi bahwa pelanggan selalu membeli krim saat membeli cokelat, dan oleh karena itu menyarankan agar lain kali mereka membeli cokelat, mereka mungkin juga ingin membeli krim.
  2. Klasifikasi(Classification)Teknik penambangan data(data mining technique) ini berbeda dari yang di atas karena didasarkan pada pembelajaran mesin(machine learning) dan menggunakan teknik matematika seperti pemrograman Linier(Linear programming) , Pohon keputusan , (Decision)Jaringan saraf(Neural network) . Dalam klasifikasi, perusahaan mencoba membangun perangkat lunak yang dapat mempelajari cara mengklasifikasikan item data ke dalam kelompok. Misalnya, sebuah perusahaan dapat menentukan klasifikasi dalam aplikasi yang “mengingat semua catatan karyawan yang menawarkan diri untuk mengundurkan diri dari perusahaan, memprediksi jumlah individu yang kemungkinan besar akan mengundurkan diri dari perusahaan di masa depan.” Dalam skenario seperti itu, perusahaan dapat mengklasifikasikan catatan karyawan menjadi dua kelompok yaitu “tinggal” dan “tinggal”. Itu kemudian dapat menggunakan datanyaperangkat lunak penambangan(mining software) untuk mengklasifikasikan karyawan ke dalam kelompok terpisah yang dibuat sebelumnya.
  3. Clustering - Objek berbeda(Different) yang menunjukkan karakteristik serupa dikelompokkan bersama dalam satu cluster melalui otomatisasi. Banyak cluster seperti itu dibuat sebagai kelas dan objek (dengan karakteristik serupa) ditempatkan di dalamnya. Untuk lebih memahaminya, mari kita perhatikan contoh pengelolaan buku(book management) di perpustakaan. Di perpustakaan, koleksi buku yang sangat banyak dikatalogkan sepenuhnya. Item dari jenis yang sama terdaftar bersama-sama. Ini memudahkan kami menemukan buku yang kami minati. Demikian pula, dengan menggunakan teknik clustering(clustering technique) , kita dapat menyimpan buku-buku yang memiliki beberapa kesamaan dalam satu cluster dan memberinya nama yang sesuai. Jadi, jika seorang pembaca ingin mengambil buku yang relevan(book relevant)untuk minatnya, dia hanya perlu pergi ke rak itu daripada mencari di seluruh perpustakaan. Dengan demikian, teknik clustering(clustering technique) mendefinisikan kelas dan menempatkan objek di setiap kelas, sedangkan pada teknik klasifikasi, objek ditugaskan ke kelas yang telah ditentukan.
  4. Prediksi(Prediction) – Prediksi adalah teknik data mining(data mining technique) yang sering digunakan dalam kombinasi dengan teknik data mining(data mining technique) lainnya s. Ini melibatkan analisis tren, klasifikasi, pencocokan pola(pattern matching) , dan hubungan. Dengan menganalisis peristiwa atau kejadian masa lalu dalam urutan yang tepat, seseorang(sequence one) dapat dengan aman memprediksi peristiwa di masa depan. Misalnya, teknik analisis prediksi(prediction analysis technique) dapat digunakan dalam penjualan untuk memprediksi laba masa depan jika penjualan dipilih sebagai variabel independen dan laba(variable and profit) sebagai variabel dependen pada penjualan. Kemudian, berdasarkan data penjualan dan laba historis, dapat ditarik (sale and profit data)kurva regresi(regression curve) pas yang digunakan untukprediksi keuntungan(profit prediction) .
  5. Pohon keputusan(Decision trees) – Di dalam pohon keputusan(decision tree) , kita mulai dengan pertanyaan sederhana yang memiliki banyak jawaban. Setiap jawaban mengarah pada pertanyaan lanjutan untuk membantu mengklasifikasikan atau mengidentifikasi data sehingga dapat dikategorikan, atau agar dapat dibuat prediksi berdasarkan setiap jawaban. Sebagai contoh, Kami menggunakan pohon keputusan(decision tree) berikut untuk menentukan apakah akan bermain kriket ODI atau tidak : Data Mining Decision Tree : Mulai dari simpul akar(root node) , jika ramalan cuaca(weather forecast) memprediksi hujan maka, kita harus menghindari pertandingan untuk hari itu. Atau, jika ramalan cuaca(weather forecast) cerah, kita harus memainkan pertandingan.

Penambangan Data(Data Mining) adalah inti dari upaya analitik di berbagai industri dan disiplin ilmu seperti komunikasi, Asuransi(Insurance) , Pendidikan(Education) , Manufaktur(Manufacturing) , Perbankan dan Ritel(Banking and Retail) , dan banyak lagi. Oleh karena itu, memiliki informasi yang benar tentang hal itu sangat penting sebelum menerapkan teknik yang berbeda.



About the author

Hai, yang di sana! Saya seorang programmer komputer dengan pengalaman lebih dari 10 tahun di bidangnya. Saya berspesialisasi dalam mengembangkan dan memelihara perangkat lunak untuk pembaruan smartphone dan windows. Selain itu, saya menawarkan layanan saya sebagai perwakilan dukungan klien email bulanan.



Related posts