PENDEKATAN HYBRID PADA SISTEM PERINGKAS TEKS ARTIKEL BERITA BAHASA INGGRIS MENGGUNAKAN NATURAL LANGUAGE PROCESSING

Farah Raihanunnisa, Muhammad Arhami, Rahmad Hidayat

Abstract


Kegiatan mengumpulkan informasi melalui sejumlah artikel yang dilakukan dalam kehidupan sehari hari baik oleh kalangan pelajar, peneliti, jurnalis, dan sebagainya, memakan waktu yang relatif lama. Hal ini menimbulkan masalah ketika seseorang harus mengumpulkan informasi yang cukup dalam waktu yang terbatas. Penelitian ini bertujuan untuk membuat sebuah sistem peringkas teks otomatis yang dapat menghasilkan ringkasan yang relevant dan informatif sehingga membantu penggali informasi untuk dapat menemukan informasi penting dalam sebuah artikel dengan waktu yang lebih sedikit dibandingkan dengan membaca keseluruhan artikel. Sistem peringkas teks otomatis yang diajukan menerapkan NLP (Natural Language Processing) dengan pendekatan hybrid. Pendekatan hybrid merupakan gabungan dari dua teknik, yaitu teknik peringkasan ekstraktif dan teknik peringkasan abstraktif. Peringkasan ekstraktif merupakan peringkasan yang dilakukan dengan mengekstrak kalimat dari dokumen asli, Sedangkan peringkasan abstraktif dilakukan dengan menghasilkan kalimat baru mendekati peringkasan yang dihasilkan oleh manusia. Peringkasan ekstraktif yang dilakukan menggunakan algoritma Textrank, sedangkan teknik peringkasan abstraktif dilakukan dengan menerapkan arsitektur Transformer. Textrank merupakan pendekatan berbasis graph, sedangkan transformer merupakan rangkaian algoritma berbasis encoder decoder. Pengujian model dilakukan dengan menerapkan teknik pengujian ROUGE (Recall Oriented Understudy for Gisting Evaluation), dimana rouge melakukan pengujian berdasarkan n-gram kata. Hasil yang diperoleh pada penelitian ini menunjukkan nilai F1-Score 0.34 pada ROUGE-1, 0.15 pada ROUGE-2, dan 0.25 pada ROUGE-L.

Keywords


Arsitektur Transformer; Pendekatan Hybrid; Peringkas Teks Otomatis; Recall Oriented Understudy for Gisting Evaluation; Textrank

Full Text:

PDF

References


H. Bryan et al., “Pemanfaatan Text Summarization Dengan Support Vector Machine Dan K-Nearest Neighbor Pada Analisis Sentimen Untuk Mempermudah Pengguna Membaca Review Game Steam,” J. Infra, vol. 10, no. 1, pp. 31–36, 2022.

Y. J. Kumar, O. S. Goh, H. Basiron, N. H. Choon, and P. C. Suppiah, “A review on automatic text summarization approaches,” J. Comput. Sci., vol. 12, no. 4, pp. 178–190, 2016, doi: 10.3844/jcssp.2016.178.190.

A. Raj, S. E. M, and D. P. S, “A Systematic Survey on Multi-document Text Summarization,” Int. J. Adv. Trends Comput. Sci. Eng., vol. 10, no. 6, pp. 3148–3153, 2021, doi: 10.30534/ijatcse/2021/111062021.

A. N. Ammar and S. Suyanto, “Peringkasan Teks Ekstraktif Menggunakan Binary Firefly Algorithm,” Indo-JC, vol. 5, no. September, pp. 31–42, 2020, doi: 10.21108/indojc.2020.5.2.440.

L. Pertiwi, “Penerapan Algoritma Text Mining, Steaming Dan Texrank Dalam Peringkasan Bahasa Inggris,” Bimasati, vol. 1, no. 3, pp. 100–104, 2022.

D. Suleiman and A. Awajan, “Deep Learning Based Abstractive Text Summarization: Approaches, Datasets, Evaluation Measures, and Challenges,” Math. Probl. Eng., vol. 2020, 2020, doi: 10.1155/2020/9365340.

R. Varma, “SJSU ScholarWorks A Hybrid Approach for Multi-document Text Summarization,” San Jose State University, 2019.

R. Mihalcea and P. Tarau, “TextRank: Bringing order into texts,” Proc. 2004 Conf. Empir. Methods Nat. Lang. Process. EMNLP 2004 - A Meet. SIGDAT, a Spec. Interes. Gr. ACL held conjunction with ACL 2004, vol. 85, pp. 404–411, 2004.

J. Pragantha, Eris, and V. C. M, “Penerapan Algoritma TextRank untuk Automatic Summarization pada Dokumen Berbahasa Indonesia,” Ilmu Tek. dan Komuter, vol. 1, no. 1, pp. 71–78, 2017.

A. Vaswani et al., “Attention is all you need,” Adv. Neural Inf. Process. Syst., vol. 2017-Decem, no. Nips, pp. 5999–6009, 2017.

J. Zhang, Y. Zhao, M. Saleh, and P. J. Liu, “PEGASUS: Pre-Training with extracted gap-sentences for abstractive summarization,” 37th Int. Conf. Mach. Learn. ICML 2020, vol. PartF16814, pp. 11265–11276, 2020.




DOI: https://dx.doi.org/10.36080/telematikamkom.2679

Refbacks

  • There are currently no refbacks.


Copyright (c) 2023 Telematika MKOM

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Universitas Budi Luhur Jl. Raya Ciledug,Petukangan Utara,Jakarta Selatan 12260 Telp. (021) 5869225, 5853753 ext 227, 228 Fax. (021) 5869225