Data Science dalam Prediksi Harga Saham: Menjelajahi Masa Depan dengan Analisis Berbasis Data

Oleh : Muhsin Askari Alhabsyi (10522041)

Dunia investasi saham sangatlah aktif. Setiap keputusan untuk membeli dan menjual memiliki risiko yang signifikan, dan harga dapat berubah dalam hitungan menit. Investor selalu mencari cara yang lebih baik untuk membuat keputusan.

Pertanyaan yang terlintas adalah bagaimana jika kita dapat menggunakan banyak data pasar untuk memprediksi harga saham? Topik ini akan membuktikan bahwa data science dapat menjadi alat yang sangat efektif untuk membantu investor, bahkan investor pemula untuk membuat keputusan yang lebih cerdas daripada hanya mengikuti apa yang dikatakan orang lain.

Pada tahap pertama, informasi tentang saham dikumpulkan. Ini termasuk harga pembukaan, harga tertinggi, harga terendah, harga penutupan, dan volume perdagangan harian dari berbagai saham populer. Lalu, sentimen pasar dapat memengaruhi harga saham juga akan dikumpulkan dari berita finansial atau media sosial karena hal tersebut juga dapat memengaruhi harga pasar.

Seringkali data mentah ini tidak lengkap. Ada yang hilang atau formatnya tidak tepat. Proses selanjutnya adalah pre-processing dan pembersihan data agar data siap diolah. Selain itu, dilakukan proses feature engineering, yaitu membuat variabel baru yang lebih relevan dari data yang sudah tersedia. Sebagai contoh, indikator teknis seperti Relative Strength Index atau Moving Average dihitung dari data harga. Dengan data yang lebih berkualitas, hasil prediksi dari aplikasi menjadi lebih akurat. Bagian ini memiliki peranan yang sangat penting.

Berbagai algoritma machine learning dicoba untuk menjadi otak dalam memprediksi pasar saham. Beberapa model kemudian diuji untuk mengetahui performa terbaiknya.

  • Model Regresi Waktu (Time Series Models): Pendekatan dimulai dengan model klasik seperti ARIMA (Autoregressive Integrated Moving Average) yang dirancang khusus untuk menangani data berurutan.
  • Machine Learning Klasik: Model seperti Random Forest Regressor dan Gradient Boosting Machines juga digunakan. Model-model ini unggul dalam mengenali pola non-linear dan interaksi kompleks dalam data harga saham serta berbagai indikator teknis lainnya.
  • Deep Learning (Neural Networks): Sebagai pendekatan paling ambisius, digunakan Long Short-Term Memory (LSTM) Networks. Model ini sangat sesuai untuk data deret waktu seperti saham karena kemampuannya dalam “mengingat” pola jangka panjang dari data historis, yang sering kali memengaruhi pergerakan harga di masa mendatang.

Setelah setiap model dilatih menggunakan data historis, kinerjanya diuji menggunakan data yang belum pernah digunakan sebelumnya. Untuk menentukan model yang memberikan prediksi paling mendekati kenyataan, digunakan metrik evaluasi seperti Root Mean Squared Error (RMSE) sebagai alat pembanding akurasi antar model.

Tujuan utama dari pengembangan ini bukan hanya menghasilkan model prediksi yang berfungsi secara teknis, tetapi juga menghadirkan aplikasi yang dapat digunakan secara praktis. Dibuat antarmuka yang sederhana dan intuitif, memungkinkan pengguna untuk memasukkan simbol saham dan melihat hasil prediksi dalam bentuk grafik yang jelas. Proses ini mencakup pengembangan di sisi front-end maupun back-end aplikasi.

Aplikasi kemudian diuji secara menyeluruh, baik dari segi akurasi prediksi maupun kemudahan penggunaan. Data saham dari berbagai periode dimasukkan untuk dibandingkan dengan hasil prediksi, lalu dievaluasi terhadap harga aktual. Algoritma terus disempurnakan berdasarkan hasil pengujian tersebut.