INDONESIAN JOURNAL ON DATA SCIENCE

Case Study The Utilization of Data Mining for Early Fraud Detection in Digital Financial Services

Amanda Syifa, Belva Calista, Wiwiek Nurkomala Dewi, Petrus Sokibi — Sun, 30 Nov 2025 00:00:00 +0700

The rapid development of digital financial services has significantly facilitated financial transactions while also increasing the risk of fraud, which can harm both individuals and institutions. This study leverages data mining techniques for early detection of suspicious transactions in digital financial services. A classification method was employed using a financial transaction dataset from a digital platform. The analysis involved applying machine learning algorithms to build a predictive model capable of distinguishing normal transactions from suspicious ones. Results indicate that the developed model achieves high accuracy in fraud detection, making it a reliable early warning system to prevent further losses. These findings demonstrate the substantial potential of data mining in enhancing the security of digital financial services through proactive fraud detection and mitigation.

Segmentation of Divorce Factors by Province in Indonesia in 2024 with K-Means and DBSCAN

Sun, 30 Nov 2025 00:00:00 +0700

Divorce is a complex social phenomenon that continues to increase in Indonesia. Based on data from 34 provinces, divorce is influenced by various factors, both internal and external to the household. This research aims to describe the main factors causing divorce based on national data and review relevant literature using machine learning methods, especially unsupervised learning techniques in the form of clustering. The dominant factors found include constant disputes and arguments, economic problems, domestic violence, abandonment of one of the parties, and infidelity. This research uses K-Means and DBSCAN algorithms to compare the results. It is known that the best modeling with Silhoutte Score comparison is DBSCAN of 0.331. DBSCAN with optimal clusters was obtained from a combination of epsilon parameter 2.9 and minimum sample 2. The clustering results were then further analyzed to evaluate the data distribution and identify the dominant characteristics in each cluster. These findings indicate the need for a multidisciplinary approach in understanding and addressing divorce issues in Indonesia in order to reduce the divorce rate and improve the quality of family life.

Eksplorasi Data Mining Dengan Teknik Statistik Untuk Pengolahan Big Data Transaksi Online

ridho prasetyo, Hardi Saputra, Wiwiwk Nurkomala Dewi, Putri Rizqiyah — Mon, 08 Dec 2025 00:00:00 +0700

Perkembangan teknologi digital telah meningkatkan volume transaksi online secara eksponensial, menciptakan tantangan dalam pengolahan big data. Data mining menggunakan teknik statistik merupakan solusi yang efektif untuk mengeksplorasi pola transaksi, mendeteksi anomali, serta melakukan segmentasi pelanggan. Penelitian ini menganalisis pola transaksi e-commerce menggunakan statistik deskriptif, Z-Score untuk deteksi anomali, serta K-Means Clustering untuk segmentasi pelanggan. Dengan dataset yang terdiri dari 50.000 transaksi selama enam bulan, ditemukan bahwa mayoritas pelanggan (60%) berada dalam kategori Low Spender, sementara 10% masuk kategori High Spender. Analisis Z-Score mengidentifikasi transaksi sebagai anomali jika nilai transaksi melebihi $500. Hasil penelitian menunjukkan bahwa pola transaksi pelanggan cenderung berulang dengan kecenderungan kategori belanja tertentu. Deteksi anomali dengan Z-Score memberikan wawasan mendalam untuk mengidentifikasi transaksi yang mencurigakan, yang dapat menjadi indikasi aktivitas penipuan atau kesalahan transaksi. Metode K-Means Clustering digunakan untuk mengelompokkan pelanggan menjadi lebih efektif, memberikan peluang bagi pelaku bisnis untuk meningkatkan strategi pemasaran dan personalisasi layanan. Dengan pendekatan eksplorasi data mining ini, perusahaan e-commerce dapat mengoptimalkan strategi bisnis, meningkatkan pengalaman pelanggan, serta memperkuat sistem deteksi anomali untuk mengurangi risiko transaksi yang tidak wajar. Penelitian ini juga membuka peluang untuk pengembangan lebih lanjut dalam penerapan model machine learning yang lebih kompleks guna meningkatkan akurasi dalam analisis big data transaksi online.

Prediksi Perilaku Konsumtif Remaja Menggunakan Algoritma Catboost Berbasis Machine Learning

Sifa Aurahman, Umi Mahmudah — Sun, 30 Nov 2025 00:00:00 +0700

Perilaku konsumtif pada remaja menjadi fenomena yang semakin marak dan berpotensi menimbulkan dampak negatif jangka panjang, seperti berkurangnya sikap hemat dan produktif. Ciri perilaku ini antara lain kebiasaan boros, pengeluaran berlebihan untuk memenuhi keinginan, serta mengikuti tren gaya hidup yang sedang berkembang. Penelitian ini bertujuan memprediksi perilaku konsumtif remaja berdasarkan faktor gaya hidup, penggunaan media sosial, dan lingkungan sosial menggunakan pendekatan machine learning. Metode yang digunakan adalah supervised learning dengan algoritma Categorical Boosting (CatBoost), yang mampu mengelola data kategorikal secara efisien dan merupakan pengembangan dari Gradient Boosting Decision Tree (GBDT). Model dibangun dengan mempelajari fitur-fitur yang relevan untuk mengklasifikasikan tingkat perilaku konsumtif. Hasil penelitian menunjukkan bahwa gaya hidup, media sosial, dan lingkungan sosial memiliki pengaruh signifikan terhadap perilaku konsumtif remaja, dengan tingkat akurasi prediksi sebesar 91,8% dan nilai AUC sebesar 0,93. Temuan ini diharapkan dapat menjadi dasar pengembangan strategi pencegahan perilaku konsumtif di kalangan remaja.

Studi Komperatif Penggunaan Algoritma Decision Tree dan K-NN (K-Nearest Neighbors) Pada Prediksi Pemilihan Warna Untuk Produksi Mobil Berdasarkan Minat Konsumen

Muhammad Farid Salafudin Firdaus, Agung Fatwanto — Sun, 30 Nov 2025 00:00:00 +0700

Semakin banyaknya brand mobil yang ada di Indonesia membuat perusahaan mobil melakukan inovasi terhadap produknya untuk menarik minat pembeli. Salah satu inovasi yang ditawarkan adalah warna mobil, hal ini karena warna mobil sebagai inovasi paling murah dan berpengaruh terhadap minat beli. Sebelum menentukan warna yang akan diproduksi, perusahaan perlu melakukan analisa pasar terhadap pola pemilihan warna terhadap minat beli. Hal ini bertujuan untuk menentukan jumlah varian warna dan juga model mobil yang akan diproduksi, agar tidak terjadi kerugian akibat mobil kurang diminati dengan alasan model dan warna tidak sesuai dengan keinginan sebagian besar pembeli. Oleh karena itu, dalam penelitian ini dilakukan studi komperatif untuk pemilihan mobil berdasarkan warna menggunakan Algoritma Decision Tree dan K-NN (K-Nearest Neighbors), dengan tujuan memberikan gambaran pola keinginan pembeli berdasarkan variabel yang sudah ditentukan yaitu Status (perkawinan), Model dan Umur. Pendekatan ini memberikan sudut pandang baru dalam memahami preferensi pasar otomotif melalui data mining. Pengujian ini menggunakan bantuan software Rapidminner dan menggunakan Algoritma Decision Tree dan K-NN (K-Nearest Neighbors). Hasil yang didapatkan menggunakan split data dengan nilai proporsi 80% sebagai data pelatihan dan 20% data uji, didapatkan hasil uji performance dengan nilai accuracy sebesar 70,31% untuk Algoritma Decision Tree dan 78,12% untuk Algoritma K-NN (K-Nearest Neighbors). Sehingga pola pemilihan warna menggunakan Algoritma K-NN (K-Nearest Neighbors) dapat digunakan sebagai pertimbangan perusahaan atau dealer mobil untuk mengukur kuantitas produksi berdasarkan warna dan mengukur stok persediaan mobil di dealer, sehingga mengurangi biaya penyimpanan.