Penerapan Algoritma Cosine Similarity pada Text Mining Terjemah Al-Qur’an Berdasarkan Keterkaitan Topik

M Didik Rohmad Wahyudi

doi:10.18196/st.221235

Penerapan Algoritma Cosine Similarity pada Text Mining Terjemah Al-Qur’an Berdasarkan Keterkaitan Topik

M Didik Rohmad Wahyudi

Abstract

Abstrak

Al-Qur’an merupakan sumber hukum dan panduan dalam pemecahan berbagai masalah umat Islam dalam menjalani kehidupan beragama, bermasyarakat, dan bernegara. Pemecaham masalah di dalam Al-Qur’an tidak hanya mengacu pada satu atau dua ayat. Jumlah ayat dan surat Al-Qur’an yang sangat banyak menyebabkan pencarian suatu ayat Al-Qur’an menggunakan cara konvensional akan memerlukan waktu lama. Oleh karena itu, dibutuhkan sebuah sistem untuk mengenali, mencari topik, dan mengelompokkan suatu permasalahan. Pencarian topik dalam terjemahan Al-Qur’an merupakan salah satu penerapan dari metode klasifikasi pengelompokan teks yang melakukan proses secara otomatis menempatkan dokumen teks ke dalam suatu kategori berdasarkan isi teks tersebut. Pengelompokan terjemah ayat Al-Qur'an berbahasa Indonesia dapat dilakukan berdasarkan tingkat kemiripan antar ayat. Algoritma yang bisa dipergunakan dalam permasalahan ini adalah Cosine Similarity. Algoritma ini akan menghitung tingkat kemiripan antar ayat yang akan menghasilkan beberapa kelompok ayat yang diambil untuk dibandingkan dengan index Al-Qur'an. Hasil penelitian menunjukkan bahwa tingkat kemiripan antar ayat sebesar 20% memberikan hasil terbaik pada pengelompokan index Al-Qur’an rata-rata sebesar 46,42%. Tingkat kemiripan antar terjemah ayat Al-Qur’an sebesar 40% memberikan rata-rata sebesar 15, 39% pada pengelompokan index Al-Qur’an. Untuk tingkat kemiripan antar ayat diatas 40%, ada kelompok similaritas ayat yang tidak masuk dalam index Al-Qur’an.

Abstract

Al-Qur’an as a Muslim holy book, contains life guidance and instructions on how to solve various problems faced by humans on earth. The Qur'an also discusses how life after death fetches every human being. The Qur'an has specific methods in grouping specific themes or problems. There are groupings based on the themes of the stories of previous people, groupings based on verses, juz, and groupings based on the place where the verses or letters of the Qur'an are revealed. In-text mining, grouping a text object can be done in various ways. One of them is based on the level of similarity. This text grouping method, of course, can be implemented in the Qur'an to find out specific patterns. The grouping of Indonesian verses in the Qur'an can be based on the level of similarity between verses using the Cosine Similarity algorithm. This algorithm will calculate the level of similarity between verses. This process will produce several groups of verses that will be taken to compare with the index of the Qur'an. The results showed that the similarity between verses was 20%, giving the best results with an average of 46.42%. The highest level of similarity where each group can still be included in the Al-Qur'an index is 40% with an average of 15, 39%. For the level of similarity between verses above 40%, there is a similarity group of verses that are not included in the Qur'anic index.

Keywords

ext mining, cosine similarity, index Al-Qur’an, clustering

Full Text:

PDF

References

Atabik, A. (2014). Perkembangan Tafsir Modern di Indonesia. Perkembangan Tafsir Modern Di Indonesia, 318–322. Retrieved from http://journal.stainkudus.ac.id/index.php/Hermeneutik/article/viewFile/895/831

Azra, A. (2013). Edisi Perenial Jaringan Ulama Timur Tengah dan Kepulauan Nusantara Abad XVII & XVIII Akar Pembaharuan Islam Nusantara.

Chaerul Hadi, M. R. M. (2017). Implementasi Cosine Similarity Dalam Aplikasi Pencarian Ayat Al-Qur’an Berbasis Android. 6(2), 71–79.

Cios, K. J., Swiniarski, R. W., Pedrycz, W., & Kurgan, L. A. (2007). Data mining. [electronic resource] : a knowledge discovery approach Data Mining. Retrieved from http://sfx.fcla.edu/usf?genre=bookitem

Even-Zohar, Y. (2002). Introduction to text mining. Automated Learning Group National Center for Supercomputing Applications University of Illinois.

Hilwah, N., Kudus, A., & Sunendiari, S. (2017). Klasifikasi Text Mining untuk Terjemahan Ayat-Ayat Al- Qur’an menggunakan Metode Klasifikasi Naive Bayes. Prosiding Statistika, 2(2), 179–185.

Konchady, M. (2006). Text Mining Application Programming (Charles River Media Programming). Retrieved from http://www.amazon.com/Mining-Application-Programming-Charles-River/dp/1584504609

Marti Hearst. (2003). What Is Text Mining? Retrieved from http://people.ischool.berkeley.edu/~hearst/text-mining.html

Muflikhah, L., & L, D. Y. (2013). Penggalian Data dalam Penentuan Keterkaitan Topik pada Terjemahan Ayat- ayat Al-Qur ’ an. 1(1).

Ojo, A., & Adeyemo, A. (2012). Framework for Knowledge Discovery from Journal Articles Using Text Mining Techniques. African Journal of Computing & ICT. Retrieved from http://www.ajocict.net/uploads/Pre-print_-_O__Ojo___A_B__Adeyemo__2012___Framework_for_Knowledge_Discovery_from_Journal_Articles_Using_Text_Mining_Techniques.pdf

Robani, M., & Widodo, A. (2017). Algoritma K-Means Clustering Untuk Pengelompokan Ayat Al Quran Pada Terjemahan Bahasa Indonesia. Jurnal Sistem Informasi Bisnis, 6(2), 164. https://doi.org/10.21456/vol6iss2pp164-176

Septiawan, D., Suprayogi, D. A., Mukhtar, A. M., & Hatiyanto, W. (2010). Klasifikasi Iklan pada Online Shop dengan Metode Naive Bayes. (8).

Surya Agustian, I. S. W. (2014). Sistem Qur’an Retrieval Terjemahan Bahasa Indonesia Berbasis Web dengan Sistem Qur’an Retrieval Terjemah Bahasa Indonesia. (November). https://doi.org/10.13140/2.1.5168.6083

DOI: https://doi.org/10.18196/st.221235

Refbacks

There are currently no refbacks.

Editorial Office :

SEMESTA TEKNIKA

Faculty of Engineering, Universitas Muhammadiyah Yogyakarta.

Jln. Brawijaya Tamantirto Kasihan Bantul 55183 Indonesia

Telp:(62)274-387656, Fax.:(62)274-387656

Email: semesta_teknika@umy.ac.id, semestateknika@umy.university

Website: http://http://journal.umy.ac.id/index.php/st

Semesta Teknika is licensed under a Creative Commons Attribution 4.0 International License.

Username
Password
Remember me