Aplikasi Pendeteksi Kalimat Kasar Bahasa Indonesia pada File Audio Menggunakan Jaccard similarity dan N-Gram

Authors

  • Muhammad Farras Majid Universitas Budi Luhur
  • Achmad Solichin Universitas Budi Luhur

DOI:

https://doi.org/10.70309/ticom.v12i1.100

Keywords:

hate speech, jaccard similarity, n-gram

Abstract

Di Indonesia, ujaran kebencian (hate speech) banyak sekali ditemukan di berbagai aplikasi media sosial. Bentuk ujaran kebencian dapat berupa tulisan, suara (audio), dan video. Salah satu ciri ujaran kebencian adalah keberadaan kata-kata kasar, baik yang terucap maupun tertulis. Selain berpotensi menimbulkan kebencian atau konflik, keberadaan kata kasar dapat menimbulkan dampak negatif bagi masyarakat, terutama anak-anak. Keterbukaan akses informasi bagi anak-anak melalui berbagai media sosial mengakibatkan dampak negatif jika anak-anak sering mendengar kata kasar, terutama dalam bentuk audio dan video. Hal tersebut dapat dianggap sebagai suatu kewajaran. Oleh karena itu, deteksi keberadaan kata kasar terutama pada media suara (audio) sangat penting untuk dilakukan. Pada penelitian ini, dikembangkan sebuah aplikasi yang dapat mendeteksi kata atau kalimat kasar dalam Bahasa Indonesia. Aplikasi tersebut dapat digunakan untuk memfilter konten-konten media sosial media. Pada penelitian ini digunakan metode Jaccard similarity  dan N-Gram untuk mendeteksi kata atau kalimat kasar pada sebuah file audio. Hasil penelitian menunjukkan bahwa penggunaan metode Jaccard similarity  dan N-Gram dapat diterapkan dengan baik untuk mendeteksi kata atau kalimat kasar dengan nilai akurasi sebesar 73,4% dan presisi sebesar 88,9%. Aplikasi yang dikembangkan dapat bermanfaat untuk masyarakat dalam mendeteksi dan menyaring kata atau kalimat kasar pada berbagai media, terutama media suara (audio).

References

zulkarnain, “STUDIA SOSIA RELIGIA,” 2020. [Daring]. Tersedia pada: http://jurnal.uinsu.ac.id/index.php/ssr

A. F. Hidayatullah, A. Aulia, F. Yusuf, K. P. Juwairi, R. Abida, dan N. Nayoan, “Identifikasi Konten Kasar pada Tweet Bahasa Indonesia,” 2019. [Daring]. Tersedia pada: https://t.co/YQCC0CM4gG

B. Wijaya dan V. C. Mawardi, “PENDETEKSI UJARAN KEBENCIAN PADA PLATFORM MEDIA SOSIAL TWITTER MENGGUNAKAN SUPPORT VECTOR MACHINE,” Teknik dan Kedokteran, vol. 1, no. 1, hlm. 11–17, 2023, doi: 10.24912/jsstk.v1i1.22746.

I. And dan D. Expert, “Deteksi Ujaran Kebencian dengan Metode Klasifikasi Naïve Bayes dan Metode N-Gram pada Dataset Multi-Label Twitter Berbahasa Indonesia INFORMASI ARTIKEL ABSTRAK,” 2022. [Daring]. Tersedia pada: http://index.unper.ac.id

M. Hakiem dan M. Ali Fauzi, “Klasifikasi Ujaran Kebencian pada Twitter Menggunakan Metode Naïve Bayes Berbasis N-Gram Dengan Seleksi Fitur Information Gain,” 2019. [Daring]. Tersedia pada: http://j-ptiik.ub.ac.id

D. K. Teologi, “STUDIA SOSIA RELIGIA.” [Daring]. Tersedia pada: http://jurnal.uinsu.ac.id/index.php/ssr

D. Marta, G. Leonarde Ginting, dan A. Hatuaon Sihite, “Deteksi Berita Palsu Tentang Vaksinasi Covid-19 Dengan Menggunakan Text Mining Dan Algoritma Cosine Similarity,” Nasional Teknologi Informasi dan Komputer), vol. 6, no. 1, 2022, doi: 10.30865/komik.v6i1.5738.

“4 Jaccard Similarity and k-Grams.”

P. Sulistiyawati dkk., “PREDIKSI KATA KASAR BERBAHASA INDONESIA MENGGUNAKAN MACHINE LEARNING BERBASIS MOBILE INFRASTRUCTURE,” Transmisi, vol. 24, no. 2, hlm. 55–61, Mei 2022, doi: 10.14710/transmisi.24.2.55-61.

I. And dan D. Expert, “Deteksi Ujaran Kebencian dengan Metode Klasifikasi Naïve Bayes dan Metode N-Gram pada Dataset Multi-Label Twitter Berbahasa Indonesia INFORMASI ARTIKEL ABSTRAK,” 2022. [Daring]. Tersedia pada: http://index.unper.ac.id

Sunardi, A. Yudhana, dan I. A. Mukaromah, “Implementasi Deteksi Plagiarisme Menggunakan Metode N-Gram dan Jaccard Similarity Terhadap Algoritma Winnowing,” TRANSMISI, vol. 20, no. 3, hlm. 105–110, 2018.

W. Desena dan A. Solichin, “Pencarian Abstrak Tugas Akhir Mahasiswa Berdasarkan Tingkat Kemiripan Menggunakan Algoritma Winnowing dan Jaccard Similarity pada Universitas Budi Luhur,” Jurnal Informatik, vol. 17, no. 2, hlm. 112–122, 2021.

K. Rinartha, “Simple Query Suggestion untuk Pencarian Artikel Menggunakan Jaccard Similarity,” Jurnal Ilmiah Rekayasa dan Manajemen Sistem Informasi, vol. 3, no. 1, hlm. 30–34, 2017.

Downloads

Published

30-09-2023

How to Cite

Majid, M. F., & Solichin, A. (2023). Aplikasi Pendeteksi Kalimat Kasar Bahasa Indonesia pada File Audio Menggunakan Jaccard similarity dan N-Gram . Jurnal Ticom: Technology of Information and Communication, 12(1), 14–19. https://doi.org/10.70309/ticom.v12i1.100