Penerapan Algoritma Cosine Similarity pada Text Mining Terjemah Al-Qur’an Berdasarkan Keterkaitan Topik
Abstract
Abstrak
Al-Qur’an merupakan sumber hukum dan panduan dalam pemecahan berbagai masalah umat Islam dalam menjalani kehidupan beragama, bermasyarakat, dan bernegara. Pemecaham masalah di dalam Al-Qur’an tidak hanya mengacu pada satu atau dua ayat. Jumlah ayat dan surat Al-Qur’an yang sangat banyak menyebabkan pencarian suatu ayat Al-Qur’an menggunakan cara konvensional akan memerlukan waktu lama. Oleh karena itu, dibutuhkan sebuah sistem untuk mengenali, mencari topik, dan mengelompokkan suatu permasalahan. Pencarian topik dalam terjemahan Al-Qur’an merupakan salah satu penerapan dari metode klasifikasi pengelompokan teks yang melakukan proses secara otomatis menempatkan dokumen teks ke dalam suatu kategori berdasarkan isi teks tersebut. Pengelompokan terjemah ayat Al-Qur'an berbahasa Indonesia dapat dilakukan berdasarkan tingkat kemiripan antar ayat. Algoritma yang bisa dipergunakan dalam permasalahan ini adalah Cosine Similarity. Algoritma ini akan menghitung tingkat kemiripan antar ayat yang akan menghasilkan beberapa kelompok ayat yang diambil untuk dibandingkan dengan index Al-Qur'an. Hasil penelitian menunjukkan bahwa tingkat kemiripan antar ayat sebesar 20% memberikan hasil terbaik pada pengelompokan index Al-Qur’an rata-rata sebesar 46,42%. Tingkat kemiripan antar terjemah ayat Al-Qur’an sebesar 40% memberikan rata-rata sebesar 15, 39% pada pengelompokan index Al-Qur’an. Untuk tingkat kemiripan antar ayat diatas 40%, ada kelompok similaritas ayat yang tidak masuk dalam index Al-Qur’an.
Abstract
Al-Qur’an as a Muslim holy book, contains life guidance and instructions on how to solve various problems faced by humans on earth. The Qur'an also discusses how life after death fetches every human being. The Qur'an has specific methods in grouping specific themes or problems. There are groupings based on the themes of the stories of previous people, groupings based on verses, juz, and groupings based on the place where the verses or letters of the Qur'an are revealed. In-text mining, grouping a text object can be done in various ways. One of them is based on the level of similarity. This text grouping method, of course, can be implemented in the Qur'an to find out specific patterns. The grouping of Indonesian verses in the Qur'an can be based on the level of similarity between verses using the Cosine Similarity algorithm. This algorithm will calculate the level of similarity between verses. This process will produce several groups of verses that will be taken to compare with the index of the Qur'an. The results showed that the similarity between verses was 20%, giving the best results with an average of 46.42%. The highest level of similarity where each group can still be included in the Al-Qur'an index is 40% with an average of 15, 39%. For the level of similarity between verses above 40%, there is a similarity group of verses that are not included in the Qur'anic index.
Keywords
Full Text:
PDFReferences
Atabik, A. (2014). Perkembangan Tafsir Modern di Indonesia. Perkembangan Tafsir Modern Di Indonesia, 318–322. Retrieved from http://journal.stainkudus.ac.id/index.php/Hermeneutik/article/viewFile/895/831
Azra, A. (2013). Edisi Perenial Jaringan Ulama Timur Tengah dan Kepulauan Nusantara Abad XVII & XVIII Akar Pembaharuan Islam Nusantara.
Chaerul Hadi, M. R. M. (2017). Implementasi Cosine Similarity Dalam Aplikasi Pencarian Ayat Al-Qur’an Berbasis Android. 6(2), 71–79.
Cios, K. J., Swiniarski, R. W., Pedrycz, W., & Kurgan, L. A. (2007). Data mining. [electronic resource] : a knowledge discovery approach Data Mining. Retrieved from http://sfx.fcla.edu/usf?genre=bookitem
Even-Zohar, Y. (2002). Introduction to text mining. Automated Learning Group National Center for Supercomputing Applications University of Illinois.
Hilwah, N., Kudus, A., & Sunendiari, S. (2017). Klasifikasi Text Mining untuk Terjemahan Ayat-Ayat Al- Qur’an menggunakan Metode Klasifikasi Naive Bayes. Prosiding Statistika, 2(2), 179–185.
Konchady, M. (2006). Text Mining Application Programming (Charles River Media Programming). Retrieved from http://www.amazon.com/Mining-Application-Programming-Charles-River/dp/1584504609
Marti Hearst. (2003). What Is Text Mining? Retrieved from http://people.ischool.berkeley.edu/~hearst/text-mining.html
Muflikhah, L., & L, D. Y. (2013). Penggalian Data dalam Penentuan Keterkaitan Topik pada Terjemahan Ayat- ayat Al-Qur ’ an. 1(1).
Ojo, A., & Adeyemo, A. (2012). Framework for Knowledge Discovery from Journal Articles Using Text Mining Techniques. African Journal of Computing & ICT. Retrieved from http://www.ajocict.net/uploads/Pre-print_-_O__Ojo___A_B__Adeyemo__2012___Framework_for_Knowledge_Discovery_from_Journal_Articles_Using_Text_Mining_Techniques.pdf
Robani, M., & Widodo, A. (2017). Algoritma K-Means Clustering Untuk Pengelompokan Ayat Al Quran Pada Terjemahan Bahasa Indonesia. Jurnal Sistem Informasi Bisnis, 6(2), 164. https://doi.org/10.21456/vol6iss2pp164-176
Septiawan, D., Suprayogi, D. A., Mukhtar, A. M., & Hatiyanto, W. (2010). Klasifikasi Iklan pada Online Shop dengan Metode Naive Bayes. (8).
Surya Agustian, I. S. W. (2014). Sistem Qur’an Retrieval Terjemahan Bahasa Indonesia Berbasis Web dengan Sistem Qur’an Retrieval Terjemah Bahasa Indonesia. (November). https://doi.org/10.13140/2.1.5168.6083
DOI: https://doi.org/10.18196/st.221235
Refbacks
- There are currently no refbacks.
Copyright (c) 2019 M Didik Rohmad Wahyudi
Editorial Office :
SEMESTA TEKNIKA
Faculty of Engineering, Universitas Muhammadiyah Yogyakarta.
Jln. Brawijaya Tamantirto Kasihan Bantul 55183 Indonesia
Telp:(62)274-387656, Fax.:(62)274-387656
Email: semesta_teknika@umy.ac.id, semestateknika@umy.university
Website: http://http://journal.umy.ac.id/index.php/st
Semesta Teknika is licensed under a Creative Commons Attribution 4.0 International License.