Show simple item record

dc.contributor.authorThamrin, Husni
dc.contributor.authorSabardila, Atiqa
dc.date.accessioned2015-04-09T06:24:07Z
dc.date.available2015-04-09T06:24:07Z
dc.date.issued2014
dc.identifier.citationAdriani, M., Asian, J., Nazief, B., Tahaghoghi, S. M. M., & Williams, H. E., 2007. “Stemming Indonesian: A confix-stripping approach,” ACM Transactions on Asian Language Information Processing (TALIP), vol. 6, no. 4, hal. 1-33. Asian, J., Williams, H. E., Tahaghoghi, S. M. M., 2005, “Stemming Indonesian,” 28th Australian Computer Science Conference (ACS2005). Asy'arie, A. D., & Pribadi, A. W., 2009.. “Automatic news articles classification in indonesian language by using naive bayes classifier method.” dalam Proceedings of the 11th International Conference on Information Integration and Web-based Applications & Services, hal. 658-662. ACM. Bao, J.P., Lyon, C., Lane, P.C.R., Ji, W., Malcolm, J.A., 2007. “Comparing Different Text Similarity Methods,” UH Computer Science Technical Report, vol. 461 , University of Hertfordshire, dilihat 5 Januari 2012, <http://hdl.handle.net/2299/1772>. Banerjee, S., 2002. “Adapting the Lesk Algorithm for Word Sense Disambiguation to Wordnet,” Master Research Thesis, University of Minesota. Boyack, K., Newman, D., Duhon, R.J., Klavans, R., Patek, M., Biberstine, J.R., Shijvenaars, B., Skupin, A., Ma, N., Borner, K., 2011. “Clustering More than Two Million Biomedical Publications: Comparing the Accuracies of Nine Text-Based Similarity Approaches,” PLoS ONE 6(3): e18029, dilihat 5 Januari 2012, <doi:10.1371/journal.pone.0018029>. Cai, Z., McNamara, D.S., Louwerse, M., Hu, X., Rowe, M., Graesser, A.C., 2004. “NLS: A Non-Latent Similarity Algorithm,” Proc. 26th Ann. Meeting of the Cognitive Science Soc.(CogSci’04), hal. 180-185. Castillo, J. J., & Cardenas, M. E., 2010. “Using sentence semantic similarity based on WordNet in recognizing textual entailment,” dalam Advances in Artificial Intelligence–IBERAMIA 2010, hal. 366-375, Springer Berlin Heidelberg. Hamzah, A., 2009. “Temu Kembali Informasi Berbasis Kluster untuk Sistem Temu Kembali Informasi Teks Bahasa Indonesia ,” Jurnal Teknologi, vol.2, no.1, hal. 1-7. Hamzah, A., 2011. “Aplikasi N-Gram Untuk Deteksi Plagiat Pada Dokumen Teks ,” Prosiding Seminar Nasional Teknoin 2011. Hamzah, A., Soesianto, F., Susanto, A., Istiyanto, J.E., 2008. “Studi Kinerja FungsiFungsi Jarak dan Similaritas dalam Clustering Dokumen Teks Berbahasa Indonesia,” Prosiding Seminar Nasional Informatika 2008 (semnasIF 2008) , Yogyakarta. Islam, A. dan Inkpen, D., 2008. “Semantic Text Similarity Using Corpus-Based Word Similarity and String Similarity,” ACM Trans. Knowl. Discov. Data, vol. 2, No. 2, Artikel 10. Islam, A., dan Inkpen, D., 2009. “Real-word spelling correction using Google Web IT 3- grams,” dalam Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing: Volume 3, vol. 3 hal. 1241-1249. Association for Computational Linguistics. Islam, A., Milios, E., Keselj, V., 2012. “Text Similarity using Google Tri-Grams,” dalam 25th Canadian Conference on Advances in Artificial Intelligence, Mei 28-30, hal. 312-317. Leacock, C. dan Chodorow, M., 1998. “Combining Local Context and WordNet Sense Similiarity for Word Sense Disambiguation,” dalam WordNet, An Electronic Lexical Database, The MIT Press. Lesk, M.E., 1986. “Automatic Sense Disambiguation Using Machine Readable Dictionaries: How to tell a Pine Cone from an Ice Cream Cone,” dalam Proceedings of the SIGDOC Conference 1986, Toronto, Juni. Liu, H., Wang, P. Fei, 2013. “Assessing Sentence Similarity Using WordNet based Word Similarity,” Journal of Software, Vol. 8, No. 6, hal. 1451-1458. Malakasiotis, P., 2009. “Paraphrase recognition using machine learning to combine similarity measures,” dalam Proceedings of the ACL-IJCNLP 2009 Student Research Workshop, hal. 27-35. Association for Computational Linguistics. Malcolm, J.A., Lane, P.C.R., 2008. “Efficient Search for Plagiarism on the Web ,” Kuwait, vol. 2008, pp. 206-211. Mendes, S., Necsulescu, S., Bel, N., 2012. “Synonym extraction using a language graph model ” dalam Semantic Relations-II. Enhancing Resources and Applications. Metzler, D., Dumais, S., & Meek, C., 2007. “Similarity measures for short segments of text,” dalam Advances in Information Retrieval, hal. 16-27, Springer Berlin Heidelberg. Milhalcea, R., Corley, C., Strapparava, C., 2006. 'Corpus-based and Knowledge-based Measures of Text Semantic Similarity,” dalam Proceedings of the 21st national conference on Artificial intelligence, vol. 1, hal. 775-780. Mohler, M., & Mihalcea, R., 2009. “Text-to-text semantic similarity for automatic short answer grading,” dalam Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics, hal. 567-575. Association for Computational Linguistics. Mudjiono, Atika W., (2013). “Nick D'Aloisio, Remaja 17 Tahun Pencipta Aplikasi Rp 290 Miliar”, Kompas, 3 April, h. 16. Noh, S. Y., Kim, S., & Jung, C., 2006. “A lightweight program similarity detection model using xml and levenshtein distance,” FECS, hal. 3-9. O’Shea, J., Bandar, Z., Crockett, K., & McLean, D., 2008. “A comparative study of two short text semantic similarity measures” dalam Agent and Multi-Agent Systems: Technologies and Applications, hal. 172-181. Springer Berlin Heidelberg. Ochoa, E.D., 2012. An Analysis of the Application of Selected Search Engine Optimization (SEO) Techniques and Their Effectiveness on Google’s Search Ranking Algorithm , Thesis, California State University, Northbridge. Purwanto, D., 2012. “Bikin Apps, Remaja 16 Tahun Raih Investasi Rp 2,2 Miliar”, Kompas, dilihat 7 April 2013, <http://tekno.kompas.com>. Pusat Bahasa, 2009. Tesaurus Alfabetis Bahasa Indonesia, Bandung: Mizan. Sandhya, N., Lalitha, Y. S., Sowmya, V., Anuradha, K., & Govardhan, A., 2011. “Analysis of Stemming Algorithm for Text Clustering,” International Journal of Computer Science, no. 8. Serrano, M. Á., Flammini, A., & Menczer, F. 2009. “Modeling statistical properties of written text,” PloS one, vol. 4. no. 4, e5372. Sun, Z., Errami, M., Long, T., Renard, C., Choradia, N., Renard, C., Choradia, N., Garner, H., 2010. “Systematic Characterizations of Text Similarity in Full Text Biomedical Publications,” PloS ONE 5(9): e12704, dilihat 5 Januari 2012, <doi:10.1371/journal.pone.0012704>. Tala, F., 2003. A study of stemming effects on information retrieval in Bahasa Indonesia. Thamrin, H. dan Wantoro, J., 2012. “Pengembangan Modul Penilaian Otomatis terhadap Jawaban Soal Pendek Terbuka dalam Sistem E-Learning,” dalam Prosiding SNFT Umsida 2012, hal. B31-B38. Thamrin, H. dan Wantoro, J., 2014. “An Attempt to Create an Automatic Scoring Tool of Short Text Answer in Bahasa Indonesia,” dalam Proceeding of International Conference on Electrical Engineering, Computer Science and Informatics (EECSI 2014), Yogyakarta, pp. 96-98. Wenqian, J. I., Zhoujun, L. I., Wenhan, C. H. A. O., Xiaoming, C. H. E. N., 2009.”A New Method for Calculating Similarity between Sentences and Application on Automatic Abstracting,” Intelligent Information Management, vol. 1, no.1, hal. 3642. Winarsono, D., Siahaan D.D., Yuhana, U., 2009. “Sistem Penilaian Otomatis Kemiripan Kalimat Menggunakan Syntactic-Semantic Similarity pada Sistem E-Learning,” Kursor, vol. 5, no. 2, hal. 75-82. Wu, Z. dan Palmer, M., 1994. “Verb Semantics and Lexical Selection.” dalam Proceedings of the 32nd Annual Meeting of the Association for Computational Linguistics, Las Cruces, New Mexico. Yazdani, M., dan Popescu-Belis, A., 2012. “Computing text semantic relatedness using the contents and links of a hypertext encyclopedia,” Artificial Intelligence.in_ID
dc.identifier.urihttp://hdl.handle.net/11617/5614
dc.description.abstractAlgoritma similaritas semantik adalah urutan langkah untuk menghitung kemiripan kalimat atas dasar makna/konsep kata yang menyusun kalimat. Algoritma similaritas banyak diterapkan misalnya untuk software deteksi plagiasi, pengelompokan dokumen, dan software penerjemah. Penerapan algoritma similaritas semantik pada teks bahasa Indonesia belum banyak menunjukkan hasil antara lain karena belum adanya jejaring kata bahasa Indonesia. Penelitian ini mengupayakan penyusunan jejaring kata bahasa Indonesia dan melakukan studi “Efektivitas Algoritma Similaritas Semantik Berbasis Jejaring Kata dalam Mengukur Kemiripan Kalimat Bahasa Indonesia.” Tujuan dari program penelitian ini pada tahun pertama ada dua. Pertama adalah membuat sistem basis data kamus bahasa Indonesia yang menyediakan informasi tentang kata termasuk dalam konteks jejaring kata melalui web service. Kedua adalah membuat aplikasi yang menerapkan algoritma similaritas semantik berbasis jejaring kata atau kamus untuk mengukur similaritas kata, frase atau kalimat dalam sebuah kalimat bahasa Indonesia. Penelitian pada tahun pertama menghasilkan kamus online bahasa Indonesia yang dapat memberi informasi tentang kata, definisi kata, dan sinonim. Kamus online semacam ini sudah tersedia. Kamus yang dihasilkan dalam penelitian ini memberikan informasi tambahan yang tidak ada pada kamus lain yaitu informasi tentang hiponim dan meronim. Informasi tentang sinonim dan hiponim merupakan dasar pembentukan jejaring kata. Pengetahuan tentang kata, sinonim dan hiponim digunakan dalam penelitian ini sebagai ukuran keterkaitan antar kata. Keterkaitan antar kata digunakan dalam algoritma similaritas untuk mengukur kemiripan antar kalimat. Penggunaan pengetahuan tentang sinonim dan hiponim terbukti meningkatkan skor kemiripan antara kalimat yang mengandung kata berbeda namun mempunyai keterkaitan sebagai sinonim atau hiponim. Pengujian algoritma dilakukan lebih lanjut dengan menerapkan algoritman pada proses pengelompokan teks (text clustering). Objek pengelompokan teks diambil dari ratusan kalimat pendek yang diperoleh dari analisis SWOT (strength weakness opportunity threat) sebuah lembaga. Pengujian menunjukkan bahwa klustering berdasarkan kemiripan kalimat yang memanfaatkan pengetahuan sinonim dan hiponim tidak lebih baik dibanding klustering dengan perhitungan kemiripan kosinus biasa. Kesimpulan penelitian ini adalah bahwa skor kemiripan kalimat dapat diperbaiki jika algoritma memperhatikan keterkaitan makna antar kata. Pemanfaatan algoritma dalam proses klustering tidak memperbaiki hasil pengelompokan kalimat. Tahap berikutnya yang perlu dilakukan adalah membuat kumpulan dokumen (korpus) sebagai alat uji standar dari observasi tentang similaritas, menguji algoritma pada proses klasifikasi dokumen, dan menguji proses klustering pada dokumen dengan jumlah kata yang bervariasi.in_ID
dc.language.isoidin_ID
dc.publisherUniversitas Muhammadiyah Surakartain_ID
dc.subjectbahasa Indonesiain_ID
dc.subjecthiponimin_ID
dc.subjectsinonimin_ID
dc.subjectsimilaritas semantikin_ID
dc.subjectsimilaritasin_ID
dc.titleEfektivitas Algoritma Similaritas Semantik Berbasis Jejaring Kata Untuk Mengukur Kemiripan Kalimat Bahasa Indonesiain_ID
dc.typeTechnical Reportin_ID


Files in this item

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record