Implementasi Algoritma Pembobotan TF-IDF dan Cosine Similarity untuk Penetapan Kategori Artikel pada Website Universitas Budi Luhur
DOI:
https://doi.org/10.70309/ticom.v10i3.38Keywords:
Information Retrieval, Klasifikasi Artikel, Pembobotan, TF-IDF, Cosine SimilarityAbstract
Universitas Budi Luhur merupakan universitas komputer swasta pertama di Indonesia yang sejak awal berdiri memiliki tujuan menghasilkan tenaga – tenaga trampil atau profesional di bidang komputer yang cerdas dan berbudi luhur. Sebagai institusi pendidikan Universitas Budi Luhur memiliki website yang saat ini menggunakan platform Content Management System (CMS) Wordpress untuk mempublikasikan kegiatannya. Salah satu masalah dalam penyebaran informasi di website adalah kategorisasi artikel yang dipublikasi oleh admin yang dapat mengakibatkan ambiguitas artikel, karena setiap admin memiliki persepsi yang berbeda pada tiap artikel, sehingga menimbulkan kebingungan dari sisi pembaca, juga ketika ingin menampilkan atau mencari artikel/berita yang sesuai dengan kategori. Pengkategorian artikel yang ambigu kerap kali terjadi disebabkan oleh kategori yang dipilih berdasarkan opini masing - masing admin. Penelitian ini bertujuan untuk membuat alat bantu yang dapat mengkategorikan artikel secara otomatis menggunakan teknik Information Retrieval. Metode yang digunakan untuk mengelola serta mengkategorikan informasi yaitu ruang vektor (Vector Space Model) menggunakan algoritma pembobotan TF-IDF dan Cosine Similarity. Hasil uji dari penelitian ini adalah akurasi ketepatan pada klasifikasi kategori terhadap dataset sebesar 61.11%.
References
M. M. Sya’bani and R. Umilasari, “Penerapan Metode Cosine Similarity dan Pembobotan TF/IDF pada Sistem Klasifikasi Sinopsis Buku di Perpustakaan Kejaksaan Negeri Jember,” JUSTINDO (Jurnal Sistem dan Teknologi Informasi Indonesia), vol. 3, no. 1, pp. 31-42, 2018.
P. M. Hasugian, J. Manurung, L. Logaraz, U. Ram, “Implementation of TF-IDF and Cosine Similarity Algorithms for Classification of Documents Based on Abstract Scientific Journals,” INFOKUM, vol. 9, no. 2, pp. 518-526, 2021.
M. Xu, L. He and X. Lin, "A Refined TF-IDF Algorithm Based on Channel Distribution Information for Web News Feature Extraction," 2010 Second International Workshop on Education Technology and Computer Science, 2010, pp. 15-19.
B. Herwijayanti, D.E. Ratnawati and L. Muflikhah. "Klasifikasi Berita Online dengan menggunakan Pembobotan TF-IDF dan Cosine Similarity," Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 2, no. 1 pp. 306-312, 2018.
N. D. Arianti, M. Irfan, U. Syaripudin, D. Mariana, N. Rosmawarni and D. S. Maylawati, "Porter Stemmer and Cosine Similarity for Automated Essay Assessment," 2019 5th International Conference on Computing Engineering and Design (ICCED), 2019, pp. 1-6.
A. N. Khusna and I. Agustina, "Implementation of Information Retrieval Using Tf-Idf Weighting Method On Detik.Com’s Website," 2018 12th International Conference on Telecommunication Systems, Services, and Applications (TSSA), 2018, pp. 1-4.
A. Mishra and S. Vishwakarma, "Analysis of TF-IDF Model and its Variant for Document Retrieval," 2015 International Conference on Computational Intelligence and Communication Networks (CICN), 2015, pp. 772-776.
M. Nursalman, J. Kusnendar and U. F. Fadhila, "Implementation of K-Nearest Neighbor with Cosine Similarity for Classification Abstract International Journal of Computer Science," 2018 International Conference on Information Technology Systems and Innovation (ICITSI), 2018, pp. 43-48.
H. Jiawei, M. Kamber, and J. Pei, Data Mining. Concepts and Techniques, 3rd Edition. 2012.
G. Miner, J. Elder, A. Fast, T. Hill, R. Nisbet, and D. Delen, “Practical Text Mining and Statistical Analysis for Non-structured Text Data Applications,” Academic Press, 2012.
R. Feldman and J. Sanger, “The Text Mining Handbook,” Cambridge: Cambridge University Press, 2006.
G. B. Shelly, T. J. Cashman, and H. J. Rosenblatt, “Systems analysis and design,” 9th ed. Boston: Course Technology, 2012.
J. Valacich and C. Schneider, “Information systems today: managing in the digital world,” 5th ed. Boston: Prentice Hall, 2012.
H. Bunyamin, C. P. Negara, and Informasi, “Aplikasi Information Retrieval (IR) CATA Dengan Metode Generalized Vector Space Model,” Jurnal Teknik Informatika dan Sistem Informasi, vol. 4, no. 1, pp. 29–38, 2017
Suprianto, Sunardi and A. Fadlil, “Aplikasi Sistem Temu Kembali Angket Mahasiswa Menggunakan Application of Information Retrieval for Opinion Student,” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 6, no. 1, pp. 33–40, 2019.