PENGENALAN
Di tengah peningkatan populasi global dan tingginya permintaan pangan, sektor akuakultur atau budidaya perikanan memainkan peran penting dalam menyediakan sumber protein hewani yang berkelanjutan. Salah satu tantangan besar dalam akuakultur adalah melakukan penghitungan ikan secara akurat, terutama di lingkungan dengan kepadatan tinggi. Penghitungan ikan yang tepat sangat penting untuk mengelola kepadatan kolam, jadwal pemberian pakan, serta memantau kesehatan ikan dan kualitas air.
Namun, metode konvensional seperti penghitungan manual dan teknik akustik memiliki banyak keterbatasan yang berdampak pada keakuratan data dan efisiensi manajemen akuakultur. Untuk mengatasi masalah ini, sebuah pendekatan berbasis deep learning yang dikenal sebagai LDNet telah dikembangkan untuk menghitung ikan dalam jumlah besar. LDNet didukung oleh strategi augmentasi data yang inovatif, IMBDA (Image Manipulation-Based Data Augmentation), untuk menghasilkan hasil yang lebih akurat dan dapat diandalkan.
Selain itu, metodologi penghitungan ikan yang didorong oleh pembelajaran mendalam saat ini memerlukan sejumlah besar data pelatihan, yang mengharuskan proses pelabelan yang memakan banyak sumber daya. Adegan dengan kepadatan tinggi mungkin menunjukkan baik tumpang tindih maupun occlusion, yang menambah kompleksitas proses pelabelan. Selain itu, pengumpulan data ikan sering kali bersifat intrusif dan rentan mempengaruhi perkembangan ikan. Untuk mengatasi tantangan ini, makalah ini memperkenalkan Kerangka Penghitungan Ikan Akurasi Tinggi menggunakan sampel pelatihan terbatas dengan Jaringan Pembuatan Peta Kepadatan (LDNet) dan strategi augmentasi data inovatif: strategi Augmentasi Data Berbasis Manipulasi Gambar (IMBDA).
Strategi IMBDA mencakup serangkaian teknik peningkatan citra, secara efektif memperluas dataset pelatihan dan memperkenalkan keberagaman dengan mensimulasikan berbagai kondisi rumit yang kemungkinan akan ditemui selama pengumpulan di dunia nyata. LDNet terdiri dari modul ekstraksi fitur berbasis VGG19 dan header generasi peta kepadatan dengan perhatian saluran yang diterapkan.
Berbeda dengan regresi tingkat piksel konvensional yang disertai dengan peta kepadatan GT, LDNet menggunakan fungsi kerugian berbasis Optimal Transport (OT) yang tidak seimbang untuk mengawasi generasi peta kepadatan. Pendekatan inovatif ini meningkatkan kemampuan jaringan untuk menangkap hubungan spasial yang rumit dan pola dalam adegan dengan kepadatan tinggi.
Singkatnya, makalah ini berkontribusi dalam hal-hal berikut:
Desain LDNet dengan Ekstraksi Fitur yang Ditingkatkan dan Generasi Peta Kepadatan: Sebuah struktur LDNet baru, yang menggabungkan ekstraksi fitur dan pembuatan peta kepadatan, diperkenalkan. Dengan mengintegrasikan perhatian saluran, ia dengan mahir menangkap fitur universal ikan dalam berbagai kondisi. Selain itu, fungsi kerugian berbasis OT yang tidak seimbang diperkenalkan untuk lebih akurat mengukur kualitas peta kepadatan yang dihasilkan.
Strategi IMBDA Inovatif untuk Augmentasi Data: Makalah ini memperkenalkan strategi IMBDA sebagai teknik augmentasi data yang pionir untuk memfasilitasi augmentasi data pelatihan, memungkinkan LDNet mencapai akurasi penghitungan yang tinggi bahkan ketika dilatih dengan jumlah sampel pelatihan yang terbatas.
Pembuatan Dataset Fish Count-824: Makalah ini menetapkan dataset jumlah ikan yang komprehensif, mencakup berbagai kondisi pencahayaan dan efek bayangan. Dataset yang baru saja dikurasi ini, yang dikenal sebagai Fish Count 824, akan menjadi sumber daya yang berharga untuk memajukan penelitian dalam metodologi penghitungan ikan.
1. Tantangan dalam Penghitungan Ikan
Penghitungan ikan secara manual memerlukan tenaga kerja yang besar dan sering kali mengakibatkan stres pada ikan akibat manipulasi fisik atau pengangkatan ikan dari kolam. Selain itu, metode penghitungan akustik, yang menggunakan sonar atau peralatan berbasis gelombang suara, hanya cocok di lingkungan tertentu. Gelombang suara dapat mengalami gangguan atau distorsi akibat perubahan lingkungan air, sehingga hasil penghitungan menjadi kurang akurat. Peralatan ini juga cukup mahal, sehingga tidak selalu menjadi pilihan praktis untuk skala akuakultur yang lebih kecil atau area dengan anggaran terbatas.
Sementara itu, metode berbasis visi komputer atau computer vision telah menjadi alternatif yang menjanjikan. Computer vision memanfaatkan teknologi pengenalan objek dan pengolahan citra digital yang digabungkan dengan algoritma kecerdasan buatan untuk menghitung ikan secara real-time. Dengan metode ini, ikan tidak perlu dikeluarkan dari air sehingga stres pada ikan bisa diminimalisir. Akan tetapi, untuk mencapai akurasi yang tinggi, diperlukan dataset yang besar dengan variasi lingkungan yang cukup untuk melatih model deep learning secara efektif.
2. LDNet: Framework Berbasis Peta Kepadatan untuk Penghitungan Ikan
LDNet atau Low Density Network adalah sebuah model jaringan saraf dalam (deep neural network) yang dirancang khusus untuk mengatasi tantangan dalam penghitungan ikan. LDNet menggunakan pendekatan peta kepadatan (density map) yang memetakan posisi ikan di dalam gambar dan kemudian menghitung jumlah ikan berdasarkan kepadatan area. Pendekatan ini lebih efisien dalam menangani objek dengan kepadatan tinggi dibandingkan dengan metode deteksi objek yang konvensional.
efektivitas LDNets melalui beberapa kasus uji. Pertama, kami mempertimbangkan model PDE linear untuk menganalisis kemampuan LDNets dalam mengekstrak representasi laten kompak dari model yang secara progresif kurang cocok untuk direduksi. Kemudian, kami mempertimbangkan versi masalah tolok ukur yang bergantung pada waktu dalam dinamika fluida. Akhirnya, kami membandingkan LDNets dengan metode canggih dalam tugas yang menantang, yaitu mempelajari dinamika persamaan Monodomain yang digabungkan dengan model Aliev-Panfilov,model PDE eksitasi-propagasi yang sangat non-linear yang digunakan dalam bidang pemodelan elektrofisiologi jantung, yang kami anggap sebagai versi satu dimensi dan dua dimensi. Untuk detail lebih lanjut tentang kasus uji dan hasilnya, kami merujuk pembaca yang tertarik ke SI.
LDNet terdiri dari dua modul utama, yaitu modul ekstraksi fitur dan modul pembuatan peta kepadatan. Kombinasi kedua modul ini memungkinkan LDNet untuk menangkap detail karakteristik ikan dalam kondisi lingkungan yang beragam, baik dari segi pencahayaan maupun sudut pengambilan gambar.
Modul Ekstraksi Fitur
Arsitektur jaringan LDNet terdiri dari dua komponen penting: modul ekstraksi fitur dan modul pembuatan peta kepadatan. Dalam modul ekstraksi fitur, jaringan VGG19 (Simonyan dan Zisserman, 2015) digunakan sebagai elemen front-end, dengan penghapusan lapisan pooling dan lapisan fully connected di terminalnya. Konfigurasi yang disesuaikan ini dengan mahir mengekstrak informasi fitur yang rumit dari gambar input. Modul ekstraksi fitur mencakup serangkaian lapisan konvolusi dan pooling, meningkatkan kedalaman jaringan melalui integrasi beberapa kernel konvolusi 3 × 3. Penggabungan strategis ini memperkaya kapasitas jaringan saraf untuk menangkap baik kekayaan semantik maupun atribut lokal yang melekat dalam gambar.
Modul pembuatan peta kepadatan, yang merupakan bagian belakang dari LDNet, menggabungkan SEBlock yang diperkenalkan oleh Hu et al. (2020), bersamaan dengan lapisan konvolusi untuk meningkatkan kemampuan pemodelan jaringan. Secara khusus, modul generasi peta kepadatan terdiri dari tiga lapisan konvolusi dan tiga modul perhatian saluran SEBlock. SEBlock melakukan adaptive global average pooling pada peta fitur input untuk mengompresi informasi setiap saluran fitur. Vektor fitur yang dipooled secara global ini kemudian melewati dua lapisan fully connected. Lapisan fully connected pertama melakukan reduksi dimensi, mengurangi dimensi dari vektor fitur. Selanjutnya, lapisan fully connected kedua mengembalikan vektor fitur ke jumlah saluran aslinya. Vektor fitur yang dihasilkan berfungsi sebagai bobot yang sesuai dengan setiap saluran fitur, menilai kontribusi setiap saluran terhadap representasi fitur akhir. Pada akhirnya, fitur dari setiap saluran diskalakan secara multiplikatif oleh bobot yang sesuai, yang menghasilkan peta fitur yang diperkaya dengan bobot adaptif.
Modul Pembuatan Peta Kepadatan
Modul pembuatan peta kepadatan dalam LDNet bertugas untuk mengubah fitur-fitur yang diekstraksi dari gambar menjadi peta kepadatan yang menunjukkan distribusi ikan dalam area gambar. Di sini, LDNet menggunakan mekanisme atensi saluran (channel attention) yang membantu jaringan dalam memperkuat fitur-fitur penting, terutama pada area yang mengandung kepadatan ikan lebih tinggi. Dengan begitu, modul ini dapat menangkap distribusi spasial ikan yang lebih akurat. Selain itu, fungsi kerugian berbasis Optimal Transport (OT) yang tidak seimbang diterapkan untuk memastikan jaringan dapat menghasilkan peta kepadatan yang lebih representatif.
3. IMBDA: Strategi Augmentasi Data untuk Melatih Model
Dalam pengembangan model deep learning, kualitas dan variasi dataset sangat penting. Tanpa dataset yang mencakup variasi kondisi lingkungan yang luas, model cenderung mengalami masalah overfitting, yang berarti model hanya berfungsi baik pada data pelatihan dan gagal ketika diterapkan pada kondisi nyata. Untuk mengatasi masalah ini, strategi augmentasi data IMBDA dirancang khusus untuk memperluas variasi data pelatihan. IMBDA memperkaya dataset dengan menciptakan variasi gambar melalui manipulasi gambar menggunakan berbagai teknik.
Beberapa teknik utama dalam IMBDA meliputi:
- Pembalikan Horizontal dan Vertikal: Teknik ini membuat model mampu mengenali ikan dari berbagai orientasi, yang sangat membantu saat ikan berada dalam posisi yang tidak teratur di dalam kolam.
- Penambahan Noise Gaussian: Noise membantu simulasi kondisi gambar yang kurang jelas, seperti gambar dengan gangguan visual.
- Pengaburan Gerakan (Motion Blur): Gerakan ikan yang cepat menghasilkan efek buram pada gambar. Dengan menerapkan motion blur pada data pelatihan, model menjadi lebih siap menghadapi kondisi ikan yang bergerak cepat.
- Penyesuaian Kecerahan dan Kontras: Variasi pencahayaan di lingkungan akuakultur dapat menyebabkan kesulitan dalam pendeteksian. Penyesuaian ini membantu model mengenali ikan di bawah berbagai tingkat pencahayaan.
Dengan menerapkan IMBDA, dataset yang semula terbatas dapat diperluas menjadi ribuan gambar dengan variasi yang luas, sehingga model LDNet menjadi lebih robust dalam menghadapi perubahan kondisi di dunia nyata.
4. Dataset Fish Count-824
Untuk mendukung pelatihan LDNet, disusun dataset khusus yang diberi nama Fish Count-824. Dataset ini mencakup 824 gambar ikan dengan resolusi tinggi sebesar 3024×4032 piksel, yang mencakup kondisi pencahayaan, bayangan, dan kepadatan yang bervariasi. Fish Count-824 disusun menggunakan perangkat lunak anotasi labelme untuk melabeli titik-titik posisi ikan dalam setiap gambar. Berbagai variasi kondisi ini membantu dalam memastikan bahwa model dapat mendeteksi ikan di berbagai lingkungan, seperti akuarium dengan pencahayaan rendah atau kolam terbuka dengan pencahayaan alami.
5. Evaluasi Kinerja LDNet dengan IMBDA
Pengujian terhadap LDNet menunjukkan bahwa kombinasi LDNet dan IMBDA mampu mencapai kinerja yang sangat baik dalam penghitungan ikan. Pada dataset Fish Count-824, model ini berhasil mencapai akurasi 99,01% dalam penghitungan ikan, dengan Mean Absolute Error (MAE) sebesar 8,27 dan Root Mean Squared Error (RMSE) sebesar 9,97. LDNet juga diuji pada dataset non-akuatik seperti CARPK (penghitungan kendaraan) dan PUCPR+ (penghitungan objek padat), serta dataset Penaeus_1k untuk penghitungan larva. Hasil ini menunjukkan bahwa LDNet dengan IMBDA memiliki kemampuan generalisasi yang baik dan dapat diterapkan pada berbagai skenario objek padat lainnya.
6. Analisis Ablasi untuk Menilai Komponen LDNet
Untuk mengevaluasi kontribusi dari masing-masing komponen dalam LDNet, dilakukan analisis ablation. Analisis ini bertujuan untuk memahami bagaimana masing-masing bagian seperti IMBDA, channel attention, dan fungsi kerugian OT berkontribusi terhadap kinerja keseluruhan model. Hasil dari analisis ini menunjukkan bahwa:
- IMBDA berperan signifikan dalam memperluas variasi data sehingga model mampu belajar dari berbagai kondisi lingkungan.
- Channel Attention memungkinkan LDNet untuk fokus pada area yang lebih relevan dan meningkatkan ketelitian dalam penghitungan ikan pada kepadatan tinggi.
- Fungsi Kerugian Optimal Transport (OT) memastikan bahwa peta kepadatan yang dihasilkan oleh model sesuai dengan distribusi kepadatan yang sebenarnya dari ikan, sehingga model dapat menghitung ikan dengan akurasi yang lebih baik.
7. Potensi Aplikasi dan Pengembangan Masa Depan
Dengan kemampuannya untuk menghitung ikan di lingkungan padat, LDNet memiliki berbagai potensi aplikasi. Model ini dapat digunakan dalam berbagai sektor yang membutuhkan penghitungan objek secara akurat, seperti:
- Transportasi: LDNet dapat diterapkan untuk menghitung kendaraan di jalan raya guna mendukung sistem manajemen lalu lintas.
- Peternakan: Model ini juga relevan untuk menghitung ternak di peternakan atau satwa liar di area konservasi, sehingga memudahkan pengelolaan populasi.
- Penerapan di Industri: Dengan berbagai kemampuan modifikasinya, LDNet juga bisa dikembangkan untuk aplikasi penghitungan produk di lini produksi industri, terutama di pabrik-pabrik dengan volume produk tinggi.
Pengembangan lebih lanjut pada LDNet dapat mencakup:
- Penggunaan Generative Adversarial Networks (GAN) untuk augmentasi data tambahan, sehingga memungkinkan LDNet menangani kondisi lingkungan yang lebih kompleks.
- Peningkatan Struktur Jaringan: Modifikasi lebih lanjut pada jaringan LDNet, misalnya dengan menambah lapisan atensi, dapat meningkatkan kemampuan model dalam mengenali objek pada lingkungan padat.
- Ekspansi Dataset: Menambah variasi jenis ikan dan kondisi akuarium dalam dataset Fish Count-824 agar LDNet semakin mampu menangani perbedaan kondisi nyata.
8. Kesimpulan
LDNet dan IMBDA memberikan solusi inovatif yang efisien untuk tantangan penghitungan ikan dalam akuakultur. Melalui pendekatan peta kepadatan, LDNet terbukti dapat menghitung ikan secara akurat bahkan dalam kondisi kepadatan tinggi. IMBDA juga memainkan peran penting dengan memperkaya data pelatihan, sehingga model menjadi lebih tangguh dalam berbagai kondisi lingkungan. Hasil penelitian ini tidak hanya relevan bagi akuakultur, tetapi juga memiliki potensi untuk diterapkan di sektor lain yang memerlukan penghitungan objek padat.
Penggunaan LDNet dan IMBDA dalam sistem penghitungan otomatis mampu meningkatkan efisiensi dan ketelitian dalam manajemen populasi ikan, sekaligus membuka jalan bagi aplikasi teknologi ini di industri yang lebih luas.