IDENTIFIKASI KALIMAT SITASI MENGGUNAKAN KOMBINASI METODE SUPPORT VECTOR MACHINE DAN FEATURE SELECTION

  • Raynaldi Fatih Amanullah
  • Ema Utami Universitas AMIKOM Yogyakarta
  • Andi Sunyoto Universitas AMIKOM Yogyakarta

Abstract

Jurnal ilmiah merupakan suatu karya ilmiah yang diterbitkan secara berkala oleh suatu organisasi atau institusi, kecerobohan penulisan dalam karya ilmiah dapat dianggap sebagai bentuk plagiarisme. Sehingga penulisan sitasi dalam karya ilmiah penting untuk diperhatikan, karena sitasi mampu memberikan pengakuan sumber acuan. Metode yang digunakan ialah Support Vector Machine (SVM) dan juga TF-IDF. Adapun dataset yang digunakan ialah CL-SciSumm 2018, yang selanjutnya diseleksi menggunakan TF-IDF guna mengurangi jumlah dimensi suatu dokumen, sehinga data lebih mudah diolah menggunakan SVM. Dari hasil klasifikasi kemudian dianalisa tingkat akurasi atau ketepatan dalam melakukan identifikasi dengan menggunakan skema k-Fold Cross Validation.  Hasil penelitian ini menunjukan bahwa penggunaan TF-IDF mampu mendukung metode SVM dalam melakukan identifikasi kalimat sitasi pada dokumen jurnal ilmiah dengan nilai akurasi dan f-measure sebesar 0,52 dan 0,66 dengan nilai k = 5, dari hasil tersebut terjadi kenaikan akurasi sebesar 0,04 dan f-measure sebesar 0,16.

References

Chen, J., Ji, D., Tan, C. L., dan Niu, Z. (2005). Unsupervised Feature Selection for Relation Extraction. Companion Volume to the Proceedings of Conference including Posters/Demos and tutorial abstracts, 262 - 267.

Faihah, R. T. (2010). Support Vector Machine (SVM). Madura: Universitas Trunojoyo.

Feldman, R., dan Sanger, J. (2007). The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge: Cambridge University Press.

Han, J., Kamber, M., dan Pei, J. (2012). Data Mining: Concepts and Techniques, Third Edition. Waltham: Morgan Kaufmann.

Istiana, P. (2013). Membuat Sitasi dan Daftar Pustaka. Workshop Literasi Informasi bagi Pustakawan. Yogyakarta: Universitas Sanata Dharma.

Kamber, M., dan Han, J. (2006). Data Mining: Concepts and Techniques Second Edition. San Francisco: Morgan Kaufmann Publisher.

Koncz, P., dan Paralic, J. (2011). An Approach to feature selection for sentiment analysis. 15th International Conference on Intelligent Engineering Systems (pp. 357 - 362). Solvakia: IEEE Xplore Digital Library.

Langgeni, D. P., Baizal, Z. A., dan W, Y. F. (2010). Clustering Artikel Berita Berbahasa Indonesia Menggunakan Unsupervised Feature Selection. Seminar Nasional Informatika 2010 (pp. 1 - 10). Yogyakarta: UPN Veteran Yogyakarta.

Maarif, A. A. (2015). Penerapan Algoritma TF-IDF untuk Pencarian Karya Ilmiah. Seminar Nasional Teknologi Informasi dan Komunikasi, 1-8.

Mantovani, R. P. (2016). Penentuan Fitur Supervised Learning dalam Identifikasi Kalimat Sitasi pada Makalah Ilmiah. Bandung: Universitas Telkom.

Nomoto, T. (2016). NEAL: A Neurally Enhanced Approach to Linking Citation and Reference. Bibliometric-enhanced Information Retrieval and Natural Language Processing for Digital Libraries (BIRNDL) (pp. 168 - 174). Newark: Central Europe Workshop Proceedings.

Nugroho, A. S., Witarto, A. B., dan Handoko, D. (2003). Support Vector Machine: Teori dan Aplikasinya dalam Bioinformatika.

Pathak, M. A. (2014). Begining Data Science with R. Switzerland: Springer International Publishing Switzerland.

Sophia, S. (2002). Petunjuk Sitasi Serta Cantuman Daftar Pustaka Bahan Pustaka Online: Seri Pengembangan Perpustakaan Pertanian, No. 25. Bogor: Departemen Pertanian Bogor.

Suri, D. J., dan Purnamasari, K. K. (2017). Perbandingan Seleksi Fitur untuk Klasifikasi Sentimen SVM Pada Twitter. Jurnal Ilmiah Komputer dan Informatika.

Suryoputro, G., Riadi, S., dan Sya'ban, A. (2012). Menulis Artikel untuk Jurnal Ilmiah. Jakarta Selatan: Uhamka Press.

Vapnik, V. N. (1999). An Overview of Statistical Learning Theory. IEEE Transactions On Neural Networks, 988 - 999.

Vercellis, C. (2009). Business Intelligence: Data Mining and Optimization for Decision Making. United Kingdom: John Wiley and Sons.

Wang, S., Li, D., Song, X., Wie, Y., dan Li, H. (2011). A Feature Selecetion Method Based on Improved Fisher's Discriminant Ratio for Text Sentiment Classification. Experty Systems with Applications (pp. 8696 - 8702). China: Elsevier.

Yahya, I. (2012). Persoalan Sitasi dalam Publikasi Ilmiah dan Usulan Strategi Produktif Penanggulanan Plagiarisme Secara Bersistem di UNS. Lokakarya Penanggulangan Tindak Plagiasi (pp. 1 - 7). Surakarta: Universitas Sebelas Maret Surakarta.

Zafikri, A. (2008). Implementasi Metode Term Frequency Inverse Document Frequency (TF-IDF) Pada Sistem Temu Kembali Informasi. Sumatra Utara: Universitas Sumatra Utara.

Zhang, W., dan Gao, F. (2011). An Improvement to Naive Bayes for Text Classification. Advanced in Control Engineering and Information Science (pp. 2160 - 2164). China: Elsevier.

Zifirdaus, A., dan Zifirdaus, I. (2005). Merebut Hati Audiens Internasional: Strategi Ampuh Meraih Publikasi di Jurnal Ilmiah. Jakarta: Gramedia.

Published
2019-12-03
How to Cite
Raynaldi Fatih Amanullah, Ema Utami, & Andi Sunyoto. (2019). IDENTIFIKASI KALIMAT SITASI MENGGUNAKAN KOMBINASI METODE SUPPORT VECTOR MACHINE DAN FEATURE SELECTION. Teknomatika: Jurnal Informatika Dan Komputer, 11(2), 165-177. Retrieved from https://ejournal.unjaya.ac.id/index.php/teknomatika/article/view/281
Section
Articles