Kannada text summarization using Latent Semantic Analysis

Perkembangan teknologi yang pesat membuat kita lebih mudah dalam menemukan informasi-informasi yang dibutuhkan. Permasalahan muncul ketika informasi tersebut sangat banyak. Semakin banyak informasi dalam sebuah modul maka akan semakin panjang isi teks dalam modul tersebut. Hal tersebut akan memakan waktu yang cukup lama untuk memahami inti informasi dari modul tersebut. Salah satu solusi untuk mendapatkan inti informasi dari keseluruhan modul dengan cepat dan menghemat waktu adalah dengan membaca ringkasannya. Cara cepat untuk mendapatkan ringkasan sebuah dokumen adalah dengan cara peringkasan teks otomatis. Peringkasan teks otomatis (Automatic Text Summarization) merupakan teks yang dihasilkan dari satu atau lebih dokumen, yang mana hasil teks tersebut memberikan informasi penting dari sumber dokumen asli, serta secara otomatis hasil teks tersebut tidak lebih panjang dari setengah sumber dokumen aslinya. Penelitian ini bertujuan untuk menghasilkan peringkasan teks otomatis pada modul pembelajaran berbahasa Indonesia dan mengetahui hasil akurasi peringkasan teks otomatis yang menerapkan metode Cross Latent Semantic Analysis (CLSA). Jumlah data yang digunakan pada penelitian ini sebanyak 10 file modul pembelajaran yang berasal dari modul para dosen Universitas Mercu Buana, dengan format .docx sebanyak 5 file dan format .pdf sebanyak 5 file. Penelitian ini menerapkan metode Term Frequency-Inverse Document Frequency (TF-IDF) untuk pembobotan kata dan metode Cross Latent Semantic Analysis (CLSA) untuk peringkasan teks. Pengujian akurasi pada peringkasan modul pembelajaran dilakukan dengan cara membandingkan hasil ringkasan manual oleh manusia dan hasil ringkasan sistem. Yang mana pengujian ini menghasilkan rata-rata nilai f-measure, precision, dan recall tertinggi pada compression rate 20% dengan nilai berturut-turut 0.3853, 0.432, dan 0.3715.

Download Full-text

A Hybrid Approach of Text Summarization Using Latent Semantic Analysis and Deep Learning

2018 International Conference on Advances in Computing, Communications and Informatics (ICACCI) ◽

10.1109/icacci.2018.8554848 ◽

2018 ◽

Cited By ~ 1

Author(s):

Chintan Shah ◽

Anjali Jivani

Keyword(s):

Deep Learning ◽

Latent Semantic Analysis ◽

Semantic Analysis ◽

Hybrid Approach ◽

Text Summarization

Download Full-text

Arabic Text Summarization Based on Latent Semantic Analysis to Enhance Arabic Documents Clustering

International Journal of Data Mining & Knowledge Management Process ◽

10.5121/ijdkp.2013.3107 ◽

2013 ◽

Vol 3 (1) ◽

pp. 79-95 ◽

Cited By ~ 15

Author(s):

Hanane Froud ◽

Abdelmonaime Lachkar ◽

Said Alaoui Ouatik

Keyword(s):

Latent Semantic Analysis ◽

Semantic Analysis ◽

Text Summarization ◽

Arabic Text ◽

Arabic Text Summarization

Download Full-text

Single Document Text Summarization of a Resource-Poor Language using an Unsupervised Technique

International Journal of Engineering and Advanced Technology - Regular Issue ◽

10.35940/ijeat.a2250.109119 ◽

2019 ◽

Vol 9 (1) ◽

pp. 6278-6281

Keyword(s):

Latent Semantic Analysis ◽

Semantic Analysis ◽

Singular Value ◽

Text Summarization ◽

Text Document ◽

Automatic Text Summarization ◽

Resource Poor ◽

Value Decomposition ◽

Scarcity Of Resources ◽

Automatic Text

Automatic text summarization of a resource-poor language is a challenging task. Unsupervised extractive techniques are often preferred for such languages due to scarcity of resources. Latent Semantic Analysis (LSA) is an unsupervised technique which automatically identifies semantically important sentences from a text document. Two methods based on Latent Semantic Analysis have been evaluated on two datasets of a resource-poor language using Singular Value Decomposition (SVD) on different vector-space models. The performance of the methods is evaluated using ROUGE-L scores obtained by comparing the system generated summaries with human generated model summaries. Both the methods are found to be performing better for shorter documents than longer ones.

Download Full-text