Media sosial telah berevolusi menjadi alun-alun digital global, sebuah ruang publik virtual di mana masyarakat mengutarakan opini secara real-time terhadap berbagai isu yang terjadi (Ramadhani dan Prihantoro, 2023). Di antara berbagai platform yang ada, X (sebelumnya Twitter) menonjol karena ragam opini penggunanya yang mentah dan tanpa filter terhadap suatu subjek (Wang et al., 2022). Sifatnya yang terbuka, format teks yang bebas dan ringkas, penyebaran informasi yang sangat cepat, serta tanggapan yang instan (Vicente, 2023) menjadikannya sebuah tempat yang secara konstan merefleksikan sentimen, harapan, dan kekecewaan publik. Media sosial bukan hanya sekadar tempat bersosialisasi, tetapi juga dapat menjadi tempat untuk menanggapi kebijakan yang krusial di era demokrasi modern.
Salah satu fenomena yang cukup ramai dan berkelanjutan dibahas di media sosial ini adalah program Makan Bergizi Gratis yang digagas oleh Presiden Prabowo Subianto. Program ini berambisi dalam mencapai tujuan untuk meningkatkan pembangunan sumber daya manusia dengan pemenuhan kebutuhan nutrisi masyarakat, khususnya anak-anak usia sekolah (Kiftiyah et al., 2025). Program tersebut diharapkan dapat terlaksana dengan baik sehingga masalah pada gizi anak dapat teratasi meski beberapa orang masih khawatir akan keberlangsungan dari program tersebut.
Namun, program ini masih menghadapi tantangan dalam mengidentifikasi kekuatan dan kelemahannya untuk kebutuhan evaluasi berkelanjutan (Fatimah et al., 2024). Evaluasi program sosial sangat penting agar implementasi selanjutnya dapat memberikan dampak yang selaras dengan tujuan awal program (Wlezien dan Soroka, 2021). Metode evaluasi tradisional, seperti survei nasional atau focus group discussion (FGD) memang menawarkan kedalaman analisis yang cukup baik, tetapi seringkali terhambat oleh kendala seperti waktu yang lama, biaya yang sangat tinggi, dan cakupan sampel yang terbatas. Proses evaluasi perlu dilakukan sesegera mungkin agar kesalahan yang sama terulang kembali serta dapat mencegah kejadian buruk lainnya yang dapat menghambat keberlangsungan program.
Salah satu solusi yang dapat digunakan untuk kegiatan evaluasi tahap awal adalah analisis sentimen, sebuah pendekatan yang memanfaatkan kemampuan komputasi linguistik, dan kecerdasan buatan untuk mengekstraksi informasi, menganalisis opini, serta memahami emosi dari data teks tertulis dalam jumlah besar (Agarwal, 2025). Analisis sentimen dapat memanfaatkan data yang lebih besar dengan kemampuan pengolahan data berlabel yang lebih cepat sehingga dapat membantu dalam efisiensi secara tenaga dan waktu. Ia berfungsi sebagai sistem peringatan dini (early warning system) yang memberikan gambaran cepat mengenai respons publik sebelum evaluasi mendalam yang lebih formal dilakukan. Analisis sentimen juga dapat dimanfaatkan untuk data yang diambil secara real-time sehingga dapat membantu dalam mengidentifikasi perubahan topik pada suatu sentimen.
Pengambilan data dapat dilakukan dengan memanfaatkan fitur resmi dari X secara langsung berbentuk data mentah dengan kekurangan yaitu terbatasnya jumlah data dan kesempatan pengambilan, atau menggunakan bantuan dari pihak ketiga untuk mengambil data berdasarkan keyword pencarian. Keunggulannya adalah jumlah data yang diambil dapat lebih banyak dengan batasan pengambilan yang lebih fleksibel.
Setelah diambil, data kemudian diberi label sesuai dengan sentimennya. Biasanya, pebalelan pada data yang tidak telalu banyak masih dapat dilakukan secara manual, Namun, pada data yang lebih besar secara kuantitas, pelabelan lebih direkomendisikan untuk dilakukan secara otomatis. Salah satu caranya adalah dengan memanfaatkan IndoBERT, yaitu sebuah model berbasis BERT yang telah dikembangkan khusus untuk teks berbahasa Indonesia sehingga pengembang tidak perlu menerjemahkan data ke dalam bahasa Inggris serta berguna bagi kebutuhan pelabelan data secara semantik sehingga sesuai dengan makna kalimatnya (Koto et al., 2020).
Data kemudian dibersihkan dengan cara memperbaiki kesalahan penulisan, mengganti istilah yang tertulis dengan kata yang bermakna serupa, penghapusan elemen-elemen atau simbol-simbol yang tidak relevan seperti tautan atau mention, dan menyeragamkan huruf menjadi kecil. Tahap ini sangat penting untuk memastikan mesin dapat memproses data secara konsisten.
Analisis sentimen bekerja dengan menerapkan metode-metode berbasis komputasi dalam mengubah data teks menjadi bentuk numerik untuk kebutuhan proses statistika. Kemudian, data tersebut dipecah per kata menggunakan metode Tokenization dan pengubahan kata imbuhan menjadi kata dasar dengan metode Lemmatization. Setiap kata kemudian dihitung bobotnya dengan menggunakan metode TF-IDF (Term Frequency-Inverse Document Frequency). Tujuannya adalah untuk mengetahui seberapa penting kemunculan kata tersebut pada suatu kalimat. Setelah pembobotan, sebagian data dijadikan sebagai bahan latih untuk model pembelajaran mesin yang akan belajar mengklasifikasikan data. Setelah diajari, model kemudian diuji kembali menggunakan sebagian data tadi untuk dilihat performanya sebagai evaluasi. Pembelajaran berupa pengenalan pola dalam penggabungan beberapa kata dalam satu kalimat yang dapat mengarahkan ke salah satu label sentimen. Jika hasilnya baik, model dapat diterapkan untuk data lainnya dalam memprediksi data yang belum dilabeli.
Pembuatan model klasifikasi sentimen dapat dilakukan dengan metode yang beragam. Salah satu algoritma yang dapat digunakan adalah Random Forest, sebuah metode yang membangun banyak decision tree atau pohon keputusan dan menggabungkan hasil prediksi mereka sehingga dapat menghasilkan akurasi yang lebih baik dan model yang tidak bias atau dalam istilah lain tahan terhadap overfit (Han et al., 2020). Random Forest melakukan pemilihan kategori dengan mengambil sub dataset (bootstrap) secara acak sebagai sampel data untuk membangun decision tree berjumlah sebanyak N-sampel dengan hanya menggunakan sebagian fitur pada setiap node (Khomsah, 2021). Pada masalah klasifikasi, masing-masing pohon akan melakukan pemilihan untuk kelas yang dipilih dengan hasil pemilihan terbanyak akan dijadikan sebagai prediksi akhir.
Hasil pemodelan dapat dimanfaatkan untuk pencarian wawasan. Metode yang dapat membantu adalah visualisasi. Metode tersebut mengubah bentuk data dari angka-angka menjadi representasi yang lebih mudah dipahami. Sebagai contoh kasus, pengamat perlu melihat distribusi dari setiap sentimen yang sudah ditentukan. Pada kasus biasanya, jumlah label ditentukan berdasar pada tiga sentimen, yaitu positif, netral, dan negatif. Melalui ketiga label tersebut, dapat dibuat visualisasi sebagai representasi dari jumlah data berdasarkan masing-masing label untuk dianalisis seberapa jauh persepsi masyarakat terhadap program yang telah diterapkan. Pengamat dapat mengubah data yang awalnya berbentuk tabel menjadi diagram batang sehingga lebih mudah untuk dibandingkan secara visual. Selain diagram batang, diagram lingkaran juga dapat membantu untuk melihat rasio populasi secara persentasi sehingga lebih mudah untuk diidentifikasi.
Dari hasil analisis tadi menunjukkan bahwa sentimen positif datang dari mayoritas orang tua yang ingin anaknya terdukung secara gizi. Sedangkan untuk sentimen negatif, kemungkinan bukan hanya dari orang yang menolak program tersebut, tetapi ada yang merasa khawatir akan keberlangsungan program tersebut atau bahkan ada yang sudah mengalami dampak dari kesalahan pada pelaksanaan program tersebut. Visualisasi tidak hanya berpaku pada distribusi data saja, tetapi juga pada kata yang sering muncul. Visualisasi awan kata dapat membantu untuk mengetahui apa yang paling sering dibahas berdasarkan kata yang sering muncul pada data. Misalkan awan kata positif didominasi oleh kata “sehat”, “terbantu”, dan “lanjutkan”, lalu awan kata negatif didominasi oleh kata “menu”, “kualitas”, dan “korupsi”.
Analisis sentimen tidak hanya membantu dalam proses perhitungan, tetapi dalam pengarahan analisis untuk tindakan awal. Dalam evaluasi komunikasi publik, pemerintah dapat melihat bagaimana sentimen berubah setelah merilis pernyataan pers atau klarifikasi mengenai anggaran. Jika sentimen negatif tidak berkurang, artinya komunikasi masih belum efektif dan perlu pendekatan yang berbeda. Lalu pada perbaikan spesifik program, jika kata “menu” dan “variasi” sering muncul di awan kata negatif, ini adalah masukan langsung bagi tim pelaksana untuk mengevaluasi kembali standar gizi dan variasi makanan yang diberikan agar tidak monoton dan tetap disukai anak-anak. Dengan demikian, pihak penanggung jawab dapat menganalisis secara detail dalam upaya mengembangkan pelaksanaan program lebih baik dan terencana.
Meski begitu, analisis sentimen memiliki beberapa tantangan yang dapat diselesaikan dengan pengembangan teknologi lebih lanjut. Salah satunya adalah dalam menghadapi kalimat sarkasme atau ironi. Kalimat seperti “Programnya ‘bagus’ banget, sampai semua orang rebutan” bisa jadi salah diinterpretasikan oleh mesin sebagai sentimen positif karena adanya kata ‘bagus’. Selain itu, sebuah cuitan yang merupakan potongan kecil dari percakapan yang lebih besar dapat menyebabkan kesalahan konteks sehingga makna bisa menjadi bias. Bisa demografi juga bisa terjadi karena akses internet yang masih belum merata di beberapa lokasi pelosok di Indonesia. Lalu, hal yang cukup mengganggu distribusi sentimen adalah bot atau buzzer, orang yang bertujuan untuk meningkatkan sentimen baik melalui pembelaan meski suatu fenomena yang terjadi adalah hal buruk.
Meskipun memiliki keterbatasan, analisis sentimen menawarkan metode penyelesaian masalah dalam cara pengambilan keputusan untuk mengevaluasi kebijakan publik. Pendekatan tersebut bukanlah pengganti metode evaluasi tradisional, melainkan sebuah pelengkap yang sangat kuat yang memberikan kecepatan, skala, dan kedalaman yang sebelumnya sulit dicapai. Dengan memanfaatkan opini publik, pengamat dapat menjadi lebih tanggap, responsif, dan adaptif. Program seperti Makan Bergizi Gratis dapat terus disempurnakan berdasarkan umpan balik yang nyata dan berkelanjutan untuk memastikan bahwa tujuan mulianya untuk generasi masa depan Indonesia benar-benar tercapai melalui pemenuhan gizi pada anak-anak.
Referensi:
Fatimah, S., Rasyid, A. and Arwakon, H.O. (2024) ‘Kebijakan Makan Bergizi Gratis di Indonesia Timur : Tantangan , Implementasi , dan Solusi untuk Ketahanan Pangan Pendahuluan’, Journal of Governance and Policy Innovation, 4(1), pp. 14–21.
Han, S., Kim, H. and Lee, Y.S. (2020) ‘Double Random Forest’, Machine Learning, 109, pp. 1569-1586.
Kiftiyah, A., Palestina, F. A., Abshar, F. U., Rofiah, K. (2023) ‘Program Makan Bergizi Gratis (MBG) dalam Perspektif Keadilan Sosial dan Dinamika Sosial – Politik’, Jurnal Keindonesiaan, 3(2), pp. 1–10.
Khomsah, S. (2021) ‘Sentiment Analysis on Youtube Comments using Word2vec and Random Forest’, Telematika: Jurnal Informatika dan Teknologi Informasi, 18(1), pp. 61-72.
Koto, F., Rahimi, A., Lau., J.H., and Baldwin, T. (2020) ‘IndoLEM and IndoBERT: A Benchmark Dataset and Pre-trained Language Model for Indonesian NLP’, The 28th International Conference on Computational Linguistics, pp. 757-770.
Ramadhani, R.W. and Prihantoro, E. (2023) ‘Digital Movement of Opinion #BLACKLIVESMATTER in Creating Public Opinion About Black Lives Matter’, Jurnal Komunikasi Ikatan Sarjana Komunikasi Indonesia, 8(1), pp. 39–48.
Vicente, P. (2023) Sampling Twitter users for social science research: evidence from a systematic review of the literature, Quality and Quantity. Springer Netherlands.
Wang, Y.; Guo, J.; Yuan, C.; Li, B. Sentiment Analysis of Twitter Data. Appl. Sci. 2022, 12, 11775.
Wlezien, C. and Soroka, S. (2021) ‘Public Opinion and Public Policy’, Oxford Research Encyclopedia of Politics, Available at: https://doi.org/10.1093/acrefore/9780190228637.013.74 (Accessed: 18 May 2025).