INDONESIAN JOURNAL ON DATA SCIENCE https://ejournal.unjaya.ac.id/index.php/ijds <p><strong>Indonesian Journal of Data Science (IJDS) </strong><span class="Y2IQFc" lang="en">is a scientific journal that contains research results in the realm of data science (Data Science). The scope of the journal includes:</span></p> <p><br>1. Big Data<br>2. Machine Learning<br>3. Data Mining<br>4. Deep Learning<br>5. Artificial Intelligence</p> Lembaga Penelitian dan Pengabdian Kepada Masyarakat Universitas Achmad Yani Yogyakarta en-US INDONESIAN JOURNAL ON DATA SCIENCE 2987-7423 Analisis Perbandingan Pengukuran Jarak Algoritma K-Nearest Neighbor Dengan Menggunakan Data Breast Cancer Dan Data Heart Disease https://ejournal.unjaya.ac.id/index.php/ijds/article/view/1200 <table> <tbody> <tr> <td> <p><em>Breast Cancer </em>is a cancerous condition that appears in the breast area. This type of cancer is often experienced by women with a characteristic feature of <em>Breast Cancer</em>, namely the appearance of unusual lumps in the breast area. <em>Heart</em> or <em>Heart</em> <em>Disease</em> is a type of Non-Communicable <em>Disease</em> (PTM): which results in a fairly high mortality rate. <em>Heart</em> <em>Disease</em> is caused by several risk factors including smoking, an unhealthy lifestyle, high cholesterol, hypertension, and diabetes.</p> <p>Based on these facts, an appropriate algorithm is needed to classify Breast Caner and <em>Heart</em> <em>Disease</em> as an effort to prevent an increase in mortality rates due to <em>Breast Cancer</em> and <em>Heart</em> <em>Disease</em>. And the algorithm that will be used is the K-Nearest Neighbor algorithm with 3 distance measurement methods, namely <em>Euclidean distance</em>, <em>Manhattan distance</em>, and <em>Minkowsky distance </em>.</p> </td> </tr> </tbody> </table> <p>From the stages that have been carried out, the final results of the <em>Euclidean distance </em>method obtained an <em>Accuracy</em> value of 80.88% <em>Breast Cancer</em> data at K = 11, and 78.69% <em>heart</em> <em>Disease</em> data at K = 11. The <em>Manhattan distance</em> method obtained an <em>Accuracy</em> value of 89.71% of <em>Breast Cancer</em> data on K=11, and 78.69% of <em>Heart</em> <em>Disease</em> data on K=20.The <em>Minkowsky distance </em>&nbsp;method obtained an <em>Accuracy</em> value of 98.53% of <em>Breast Cancer</em> data on K=11, and 79.41% of <em>Heart</em> <em>Disease</em> data on K=11. This shows that the <em>Minkowsky distance </em>&nbsp;method works more optimally than the <em>Euclidean distance </em>and <em>Manhattan distance</em> methods.</p> Herdiesel Santoso Linda Pratiwi Copyright (c) 2023 INDONESIAN JOURNAL ON DATA SCIENCE 2023-11-29 2023-11-29 1 2 56 65 10.30989/ijds.v1i2.1200 Analisis Kepercayaan Masyarakat Tentang Kepolisian Indonesia di Twitter Menggunakan Latent Dirichlet Allocation (LDA) https://ejournal.unjaya.ac.id/index.php/ijds/article/view/1198 <p>Kepolisian Negara Republik Indonesia merupakan instansi yang bertugas untuk menjaga ketertiban dan keamanan masyarakat, menerapkan hukum, memberikan perlindungan, dukungan dan layanan kepada warga negara guna menjaga stabilitas dalam negeri. Namun, ditengah peran dari kepolisian itu sendiri, justru banyak kasus yang menyeret beberapa anggota polisi. Hal tersebut yang membuat masyarakat ramai membicarakannya di sosial media, salah satunya Twitter. Bahkan tagar-tagar yang berkaitan dengan kasus lingkup kepolisian juga sempat trending di Twitter. Dari hal tersebut, maka perlu dilakukan analisis terhadap topik kepercayaan masyarakat terhadap kepolisian. Analisis yang dilakukan menggunakan <em>Latent Dirichlet Allocation</em> (LDA). Hasil dari analisis yang dilakukan yaitu kepercayaan masyarakat terhadap kepolisian berkurang atas banyaknya kasus yang dilakukan anggota polisi saat ini. Analisis yang dilakukan menggunakan <em>Latent Dirichlet Allocation</em> (LDA) mengungkapkan bahwa kepercayaan publik terhadap kepolisian telah terkikis secara signifikan akibat banyaknya kasus yang melibatkan anggota kepolisian. Kesimpulan ini didukung oleh prevalensi tagar terkait kepolisian dan diskusi di platform media sosial seperti Twitter.</p> Bagas Dwi Santosa Nurul Fatimah Netania Indi Kusumaningtyas Ulfi Saidata Aesyi Herdiesel Santoso Copyright (c) 2023 INDONESIAN JOURNAL ON DATA SCIENCE 2023-11-29 2023-11-29 1 2 66 76 10.30989/ijds.v1i2.1198 Smart System Bagian dari Artifical Intellegence dalam Paradigma Keilmuan https://ejournal.unjaya.ac.id/index.php/ijds/article/view/1185 <table> <tbody> <tr> <td> <p>Artikel ini memuat pembahasan terhadap aspek filsafat sains pada domain smart system. Smart system yang merupakan sub dari Artificial Intellegence (AI) terus berkembang dan semakin banyak diterapkan di berbagai aspek kehidupan. Mulai dari aspek kesehatan, social, politik, budaya, pendidikan, bisnis, budaya, serta aspek lainnya. Melalui kajian filsafat sains baik dari pemikiran Thomas S. Kuhn dan Imre Lakatos, smart system termasuk dalam spesifikasi normal sains dan progresif sains yang ditandai dengan masih akan terus berkembangnya riset di bidang ini. Luasnya aspek pengembangan smart system ini menjadikan potensi riset yang mengandung bias penelitian, etis dan moral yang negative, serta pseudosains. Penulisan artikel ini menggunakan metode studi pustaka atau library research dan pendekatan analisis konten atau content analysis. Dari kajian filsafat sains diketahui upaya pencegahan dari pseudosains dapat dilakukan dengan mengedapankan failsifikasi, metode ilmiah, dan pembuatan aturan dan batasan yang jelas. Bias penelitian dapat dihindari dengan pemilihan metodologi riset yang terpantau dan terawasi melalui pengacakan sample. Nilai etika dan moralitas harus diperhatikan baik sebagai ilmuwan maupun individu dengan mengedapankan etika normative dan terapan.</p> </td> </tr> </tbody> </table> Laili Wahyunita Copyright (c) 2023 INDONESIAN JOURNAL ON DATA SCIENCE 2023-11-29 2023-11-29 1 2 77 83 10.30989/ijds.v1i2.1185 Klasifikasi Penyakit Hiperkolesterol Menggunakan Algoritma Decision Tree C4.5 https://ejournal.unjaya.ac.id/index.php/ijds/article/view/1192 <p>Hiperkolesterol merupakan faktor risiko penyebab kematian di usia muda. tercatat 4,4 juta kematian akibat hiperkolesterol atau sebesar 7,9% dari jumlah total kematian di usia muda. Hiperkolesterol&nbsp; merupakan salah satu jenis penyakit yang banyak dialami oleh masyarakat Indonesia. Pentingnya mengetahui gejala penyakit stroke sejak dini merupakan pencegahan awal. Maka dari itu, dilakukan penelitian untuk menganalisa data terkait penyebab hiperkolesterol. Adapun atribut yang terlibat dalam penyebab terjadinya hiperkolesterol yakni, usia, jenis kelamin, status merokok, dan index masa tubuh. Diperlukan algoritma tertentu untuk mengklasfikasikan atribut tersebut untuk mengevaluasi kelas suatu objek. Decision tree C4.5 merupakan algoritma yang paling banyak digunakan, dalam kasus ini akurasi dari algoritma Decision tree C4.5 merupakan Algoritma yang paling banyak digunakan, dalam kasus ini akurasi dalam algoritma Decision Tree C4.5 sebesar 80%.</p> Aprisarita Liya Yonal Supit Andi Muhammad Islah Copyright (c) 2023 INDONESIAN JOURNAL ON DATA SCIENCE 2023-11-29 2023-11-29 1 2 84 96 10.30989/ijds.v1i2.1192 Analisis Prediksi Kematian Pasien Covid-19 di Meksiko Menggunakan Algoritma Random Forest https://ejournal.unjaya.ac.id/index.php/ijds/article/view/1196 <p><em>This research aims to analyze and predict the deaths of </em><em>Covid-19</em><em>&nbsp;patients in Mexico using the Random Forest algorithm. The data used in this study is sourced from official sources, including the number of cases, symptoms, risk factors, and </em><em>Covid-19</em><em>&nbsp;patient mortality data. The first stage of this research is data preprocessing, where the acquired data is collected, cleaned, and prepared for analysis. Subsequently, data exploration is conducted to understand the characteristics and patterns within the dataset. Then, the Random Forest model is developed to predict the deaths of </em><em>Covid-19</em><em>&nbsp;patients based on relevant factors. Model evaluation is performed using accuracy, precision, recall, and F1-score metrics. The results of this research indicate that the random forest model can provide good predictions for </em><em>Covid-19</em><em>&nbsp;patient deaths in Mexico. The evaluation results show a high level of accuracy and satisfactory performance for the model. These findings can be used as guidance in decision-making and strategic planning to address the </em><em>Covid-19</em><em>&nbsp;pandemic in Mexico. This research contributes significantly to the field of predictive analysis and provides valuable insights in the efforts to manage the </em><em>Covid-19</em><em>&nbsp;pandemic</em><strong>.</strong></p> Dennis Fitri Salsabilla Arianti Latifah Arum Sulistyaningsih Mohamad Burhanudin Copyright (c) 2023 INDONESIAN JOURNAL ON DATA SCIENCE 2023-11-29 2023-11-29 1 2 97 105 10.30989/ijds.v1i2.1196