Analisis Topic Modeling Journal ArXiv Menggunakan Metode K-Means dengan Algoritma Dimensionality Reduction dan t-SNE Model

Akhmad, Dema Riandi (2024) Analisis Topic Modeling Journal ArXiv Menggunakan Metode K-Means dengan Algoritma Dimensionality Reduction dan t-SNE Model. Undergraduate thesis, Universitas Muhammadiyah Malang.

[thumbnail of pendahuluan.pdf]
Preview
Text
pendahuluan.pdf

Download (834kB) | Preview
[thumbnail of Bab 1.pdf]
Preview
Text
Bab 1.pdf

Download (178kB) | Preview
[thumbnail of BAB 2.pdf]
Preview
Text
BAB 2.pdf

Download (246kB) | Preview
[thumbnail of BAB 3.pdf]
Preview
Text
BAB 3.pdf

Download (322kB) | Preview
[thumbnail of BAB 4.pdf] Text
BAB 4.pdf
Restricted to Registered users only

Download (412kB) | Request a copy
[thumbnail of BAB 5.pdf] Text
BAB 5.pdf
Restricted to Registered users only

Download (147kB) | Request a copy
[thumbnail of POSTER dema.pdf]
Preview
Text
POSTER dema.pdf

Download (634kB) | Preview

Abstract

Sinergi antara Cluster K-means dan Principal Component Analysis (PCA) dalam pemodelan topik menghadirkan pendekatan yang ampuh untuk menyaring pola dari data tekstual. Cluster K-means, sebuah teknik pembelajaran tanpa pengawasan, unggul dalam mengelompokkan titik data yang serupa, menjadikannya penting dalam mengelompokkan konten tekstual ke dalam topik yang koheren. Proses ini memungkinkan ekstraksi tema atau subjek mendasar dalam kumpulan data yang luas. PCA berfungsi sebagai metode reduksi dimensi, mengungkap pola-pola penting dengan mengurangi kompleksitas data berdimensi tinggi. Ketika diterapkan pada pemodelan topik, PCA membantu mengidentifikasi fitur atau dimensi yang paling berpengaruh dalam kumpulan data tekstual, meningkatkan kemampuan interpretasi dan memfasilitasi analisis yang mendalam. Integrasi Cluster K-means dan PCA menawarkan kerangka kerja yang kuat untuk pemodelan topik yang efisien. Dengan menggunakan K-means untuk mengkategorikan data teks ke dalam kelompok yang mewakili topik berbeda dan selanjutnya memanfaatkan PCA untuk reduksi dimensi, metodologi gabungan ini memberdayakan peneliti untuk mengungkap dan memahami tema laten secara efektif. Kesimpulannya, penggabungan Cluster K-means dengan PCA mewakili jalan yang menjanjikan bagi para peneliti untuk mencari wawasan berbeda dari kumpulan data tekstual. Pendekatan terpadu ini memfasilitasi ekstraksi topik yang komprehensif, membantu penemuan pengetahuan dan proses pengambilan keputusan di berbagai domain. Penelitian kali ini menunjukan antara metode Kmeans dengan menggunakan algoritma pereduksi dimensi PCA memberikan hasil yang sangat memuaskan dengan mengkombinasi visualisasi antara algortma t-SNE dan UMAP.

Item Type: Thesis (Undergraduate)
Student ID: 201710370311116
Keywords: Cluster, Topic Modeling, Kmeans, Principal Component Analysis (PCA), t-SNE, UMAP.
Subjects: P Language and Literature > PE English
Q Science > Q Science (General)
Q Science > QA Mathematics
Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Q Science > QA Mathematics > QA76 Computer software
Z Bibliography. Library Science. Information Resources > Z665 Library Science. Information Science
Divisions: Faculty of Engineering > Department of Informatics (55201)
Depositing User: 201710370311116 demariandi
Date Deposited: 26 Jun 2024 08:39
Last Modified: 26 Jun 2024 08:39
URI: https://eprints.umm.ac.id/id/eprint/7479

Actions (login required)

View Item
View Item