Application of Machine Learning and Geographic Information Systems for Determining Optimal Solar Power Plant Locations: A Case Study in Purbalingga
Rahadian Muhammad Izha 1, Muhammad Syaiful Alim*2, Mohammad Irham Akbar*3
1,2,3Electrical Engineering, Engineering Faculty, Universitas Jenderal Soedirman, Indonesia
Email: 1rahadian.izha@mhs.unsoed.ac.id, 2muhammad.syaiful.aliim@unsoed.ac.id, 3mohammad.irham@unsoed.ac.id
(Article received: date; Revision: date; published: date)
Abstract
This research combines Machine Learning (ML) and Geographic Information System (GIS) approaches to identify optimal locations for solar power plants in Purbalingga, Central Java, Indonesia. The study addresses the increasing frequency of extreme weather events by promoting renewable energy solutions. Using ML regression models to predict solar radiation potential and GIS for spatial analysis, the research aims to determine ideal locations for solar power installation. This initiative supports global efforts to combat climate change by promoting clean and sustainable energy sources.
Keywords: Solar Power Plants, Machine Learning, Geographic Information Systems, Renewable Energy, Site Selection, Random Forest, Histogram Gradient Boosting.
PENGGUNAAN MACHINE LEARNING DAN SISTEM INFORMASI GEOGRAFIS UNTUK MENENTUKAN LOKASI IDEAL PEMASANGAN PLTS STUDI KASUS DAERAH PURBALINGGA
Abstrak
Penelitian ini menggabungkan pendekatan Machine Learning (ML) dan Sistem Informasi Geografis (SIG) untuk mengidentifikasi lokasi optimal pembangunan Pembangkit Listrik Tenaga Surya (PLTS) di Purbalingga, Jawa Tengah. Penelitian ini merespons peningkatan frekuensi cuaca ekstrem dengan mempromosikan solusi energi terbarukan. Dengan menggunakan model regresi ML untuk memprediksi potensi radiasi matahari dan SIG untuk analisis spasial, penelitian ini bertujuan menentukan lokasi ideal untuk instalasi PLTS. Inisiatif ini mendukung upaya global dalam mengatasi perubahan iklim dengan mempromosikan sumber energi bersih dan berkelanjutan.
Kata kunci: Pembagkit Listrik Tenaga Surya, Machine Learning, Sistem Informasi Geografis, Energi Terbarukan, Pemilihan Lokasi, Random Forest, Histogram Gradient Boosting.
PENDAHULUAN (huruf besar, 10pt, tebal)
Peningkatan frekuensi cuaca ekstrem telah menjadi permasalahan global yang mendesak, khususnya mempengaruhi negara-negara seperti Indonesia. Intensitas kejadian ini yang semakin meningkat telah mengakibatkan kerusakan infrastruktur signifikan, degradasi lingkungan, dan dampak terhadap manusia, yang membutuhkan strategi mitigasi dan adaptasi segera. Dalam konteks ini, pengembangan sumber energi terbarukan, khususnya Pembangkit Listrik Tenaga Surya (PLTS), muncul sebagai solusi krusial. Namun, penentuan lokasi optimal untuk instalasi PLTS tetap menjadi tantangan kompleks, melibatkan berbagai faktor yang saling terkait yang secara signifikan mempengaruhi efisiensi energi dan biaya operasional.
Ketergantungan Indonesia yang tinggi terhadap bahan bakar fosil, terutama batubara, terus memberikan kontribusi besar terhadap emisi gas rumah kaca dan pencemaran lingkungan. Menurut International Energy Agency, Indonesia menghasilkan 557 juta ton emisi CO2 pada tahun 2021, dengan 51% berasal dari batubara dan 43% dari sektor pembangkit listrik [1]. Persistensi subsidi bahan bakar fosil, yang mencapai USD 8,6 miliar pada tahun 2019 (meningkat 27% dari 2017-2019), telah secara signifikan menghambat transisi energi dan upaya dekarbonisasi Indonesia [2].
Energi surya menawarkan alternatif menjanjikan untuk mengatasi tantangan energi dan lingkungan Indonesia. Jawa Tengah, khususnya wilayah Purbalingga, menunjukkan potensi signifikan untuk pengembangan tenaga surya, dengan tingkat radiasi matahari yang menguntungkan dan kondisi geografis yang sesuai. Menurut Laporan Neraca Energi Nasional 2022, Jawa Tengah memiliki potensi surya sebesar 185,9 GW [3], memposisikannya sebagai lokasi strategis untuk pengembangan infrastruktur tenaga surya. Pemerintah daerah juga menunjukkan komitmen terhadap pengembangan energi terbarukan dengan menawarkan dukungan dan insentif bagi proyek-proyek hijau [4].
Terlebih lagi, penggunaan panel surya PV sebagai pilihan utama dalam transisi menuju sistem energi yang lebih bersih dan berkelanjutan telah menjadi tren global yang semakin populer dengan didorong oleh sejumlah alasan yang mendasarinya. Meningkatnya efisiensi teknologi fotovoltaik, harga yang semakin terjangkau, serta tingginya pasokan dan permintaan panel surya PV membuatnya menjadi pilihan diminati dalam memanfaatkan tenaga surya [5].
Pemasangan Pembangkit Listrik Tenaga Surya (PLTS) telah menjadi fokus utama dalam upaya untuk mengurangi ketergantungan pada sumber energi fosil yang terbatas dan mereduksi emisi gas rumah kaca. Laporan yang dikeluarkan oleh International Renewable Energy Agency (IRENA) menunjukkan bahwa pembangkit listrik tenaga surya membantu mengurangi emisi karbon dioksida di seluruh dunia dan mendukung upaya yang dilakukan untuk mengurangi dampak global warming. Selain itu, energi surya menjadi semakin kompetitif secara ekonomi dibandingkan dengan sumber energi konvensional karena efisiensi dan biaya instalasi yang terus menurun. Kebijakan pemerintah yang mendukung dan memberikan insentif untuk energi terbarukan telah mendorong peningkatan kapasitas energi surya di seluruh dunia [6].
Panel surya membutuhkan radiasi matahari sebagai energi utama untuk mengubahnya menjadi listrik. Radiasi matahari merujuk pada energi yang dipancarkan oleh matahari yang mencakup spektrum elektromagnetik luas termasuk cahaya tampak, ultraviolet, dan inframerah. Radiasi matahari diukur dalam watt per meter persegi (Wh/m2) yang menyatakan jumlah total radiasi di permukaan Bumi per satuan area. Potensi energi yang dapat dihasilkan oleh sistem tenaga surya sangat dipengaruhi oleh radiasi matahari. Radiasi matahari yang mencapai permukaan Bumi terdiri dari radiasi langsung dan difus, di mana radiasi langsung berasal langsung dari matahari tanpa hambatan, sementara radiasi difus merupakan radiasi yang telah tersebar oleh atmosfer. Sementara radiasi matahari global adalah total jumlah radiasi tak terganggu yang dipancarkan oleh matahari, yang mencakup baik radiasi langsung maupun tersebar/difus [7].
Dengan demikian, mengetahui estimasi radiasi matahari pada suatu daerah menjadi penting dalam menentukan potensi daya listrik yang dapat dihasilkan. Dalam penelitian oleh Parvathy et al. membahas pengembangan model regresi untuk memprediksi pancaran matahari global di Malaysia dengan menggunakan berbagai parameter atmosfer. Model dengan beberapa parameter yang menggabungkan suhu, curah hujan, kelembapan relatif, tekanan, dan kecepatan angin menunjukkan akurasi tertinggi [8]. Dalam penelitian ini, radiasi matahari global menjadi target variabel dalam membangun model prediktif ML.
Faktor lingkungan dan atmosfer secara signifikan mempengaruhi radiasi matahari dan kinerja sistem fotovoltaik melalui berbagai mekanisme. Temperatur mempengaruhi radiasi matahari secara tidak langsung melalui stabilitas atmosfer dan pembentukan awan, serta mempengaruhi efisiensi panel surya, dengan kinerja optimal pada 25°C dan penurunan efisiensi pada suhu yang lebih tinggi [9]. Endapan Air (Precipitable Water Vapor / PWV) mempengaruhi radiasi melalui penyerapan dan hamburan di atmosfer, dengan tingkat PWV yang lebih tinggi umumnya menghasilkan pengurangan radiasi matahari langsung [10]. Kelembapan relatif mempengaruhi radiasi terutama melalui pembentukan awan dan distribusi uap air, mempengaruhi komponen radiasi langsung dan difus [11]. Tekanan udara secara tidak langsung mempengaruhi radiasi matahari melalui hubungannya dengan kondisi cuaca, di mana tekanan tinggi biasanya berkorelasi dengan langit yang lebih cerah dan peningkatan radiasi [12]. Kecepatan angin memiliki dampak langsung yang minimal terhadap radiasi matahari, terutama mempengaruhi pergerakan awan dan kondisi atmosfer lokal [8].
Penelitian ini menggunakan Machine Learning (ML) dan Sistem Informasi Geografis (SIG) untuk memprediksi area potensial untuk instalasi PLTS di Purbalingga. ML merupakan metodologi komputasi yang canggih dalam ranah kecerdasan buatan. Kecerdasan Buatan (AI) merupakan paradigma teknologi transformatif yang bertujuan mengembangkan sistem cerdas yang mampu mensimulasikan proses kognitif manusia, seperti belajar, bernalar, memecahkan masalah, persepsi, dan pemahaman bahasa. Dengan memanfaatkan algoritme kompleks, pembelajaran mesin, dan metode komputasi, AI memungkinkan mesin memperoleh pengetahuan secara otonom, beradaptasi dengan input baru, dan menyelesaikan tugas yang biasanya membutuhkan kecerdasan manusia [13]. Penelitian akademis oleh pakar terkemuka seperti Mitchell dan LeCun et al. menyoroti potensi AI untuk merevolusi industri, mengatasi tantangan global kompleks, dan secara fundamental mengubah interaksi manusia-mesin [14], [15]. Lanskap AI kontemporer ditandai dengan berbagai pendekatan, termasuk machine learning, deep learning, jaringan saraf, dan model komputasi lanjut yang secara bertahap meningkatkan kinerjanya melalui proses belajar iteratif.
ML memfasilitasi kapasitas sistem untuk secara mandiri memperoleh pengetahuan dan meningkatkan kinerja melalui pembelajaran pengalaman tanpa memerlukan intervensi pemrograman eksplisit. Pemodelan prediktif merupakan subbidang dari pembelajaran mesin yang berkaitan dengan perumusan algoritma dan model statistik yang membedakan pola dalam data yang ada untuk menghasilkan perkiraan yang tepat mengenai hasil prospektif [16]. Pendekatan ML, khususnya menggunakan algoritma regresi Random Forest dan Histogram Gradient Boosting, akan menganalisis data meteorologi termasuk suhu, endapan air, kelembaban relatif, tekanan, dan kecepatan angin dalam rangka memprediksi nilai radiasi matahari (GHI).
Random Forest (RF) merupakan algoritme ML ansambel yang memanfaatkan kemampuan prediktif kolektif dari beberapa pohon keputusan untuk menghasilkan model yang tangguh dan akurat. Dikembangkan oleh Leo Breiman dan Adele Cutler pada awal 2000-an, pendekatan ini mengatasi keterbatasan pohon keputusan individu dengan menciptakan kumpulan pohon yang secara kolektif memberikan prediksi lebih stabil dan terverifikasi [17]. Sedangkan Histogram Gradient Boosting (HGB) merupakan teknik machine learning ansambel lanjutan, yang termasuk dalam keluarga gradient boosting, yang membangun model prediktif dengan secara bertahap membangun learner lemah yang secara kolektif menciptakan sistem prediktif tangguh berkinerja tinggi [18].
RF dan HGB adalah metode pembelajaran ansambel yang kuat yang telah mendapatkan popularitas signifikan dalam aplikasi ML. Meskipun kedua algoritma menggunakan pohon keputusan sebagai pembelajaran dasar, keduanya berbeda secara fundamental dalam pendekatan membangun ansambel dan menangani tugas prediksi. RF menggunakan teknik ansambel paralel melalui bagging (bootstrap aggregating), di mana beberapa pohon ditumbuhkan secara independen menggunakan subset acak dari data dan fitur. Sebaliknya, HGB menggunakan pendekatan ansambel sekuensial, membangun pohon secara iteratif di mana setiap pohon berikutnya bertujuan untuk mengoreksi kesalahan pohon sebelumnya. Berdasarkan dokumentasi dan benchmark scikit-learn, HGB umumnya menunjukkan kinerja yang lebih unggul, terutama dengan dataset yang lebih besar, dan menawarkan waktu pelatihan lebih cepat karena pendekatan binning berbasis histogram untuk fitur kontinyu [19].
Sementara itu, Sistem Informasi Geografis (SIG) muncul sebagai subset atau bagian khusus dari Sistem Informasi. Sistem informasi (SI) merupakan landasan fundamental dari infrastruktur organisasi modern, mencakup jaringan terintegrasi teknologi, data, dan sumber daya manusia yang memfasilitasi manajemen informasi dan proses pengambilan keputusan. Arsitektur dasar sistem informasi terdiri dari lima komponen esensial: perangkat keras, perangkat lunak, data, prosedur, dan manusia. Kerangka kerja ini, sebagaimana ditetapkan oleh Laudon dan Laudon, memungkinkan organisasi maupun pengguna untuk mengumpulkan, memproses, menyimpan, dan mendistribusikan informasi secara efektif [20].
Sistem Informasi Geografis (SIG) adalah sistem komputer yang digunakan untuk memanipulasi data geografis atau spasial. Sistem ini diimplementasikan menggunakan perangkat keras dan perangkat lunak komputer yang digunakan untuk memvalidasi, mengedit, menyimpan, menangkap, memodifikasi, dan memperbarui data. Selain itu, berfungsi sebagai pencarian dan tampilan data, pengelolaan dan pertukaran data, manipulasi data, dan analisis data [21]. Penelitian yang dilakukan oleh Zhang et al. mengevaluasi potensi energi surya di Cina melalui pendekatan berbasis SIG. Studi ini mengevaluasi potensi energi surya di Cina dengan memeriksa distribusi spasial-temporal sumber daya energi surya, mengecualikan faktor pembatas, dan memperkirakan potensi geografis, teknologi, dan ekonomi. Hasilnya menunjukkan bahwa Cina memiliki sumber daya surya yang melimpah dan stabil serta heterogenitas spasial yang signifikan. Hanya 25,19% lahan di Cina yang cocok untuk pembangkit listrik PV skala besar, dengan Provinsi Xinjiang diidentifikasi sebagai lokasi terbaik [22].
Penelitian ini menggunakan ArcGIS Pro untuk memproses dan menganalisis data geospasial, mengintegrasikan medan alam, area pemukiman, dan pola penggunaan lahan. SIG memungkinkan pengguna untuk melakukan analisis spasial yang kompleks, seperti mencari pola geografis, analisis penggunaan lahan, dan menghitung kedekatan antar fitur. Keakuratan dan resolusi data spasial sangat mempengaruhi kualitas analisis dan hasil yang dihasilkan dari aplikasi SIG [23].
Integrasi metode ML dan SIG menawarkan pendekatan inovatif untuk mengidentifikasi lokasi PLTS optimal. Metodologi ini memungkinkan analisis komprehensif terhadap pola meteorologi kompleks dan fitur geografis, berpotensi merevolusi perencanaan dan implementasi infrastruktur energi terbarukan di Indonesia. Penelitian ini bertujuan untuk berkontribusi pada pengembangan energi berkelanjutan Indonesia sambil mengatasi tantangan kritis perubahan iklim dan pelestarian lingkungan.
METODE PENELITIAN
Penelitian ini menggunakan kerangka kerja metodologis empat tahap untuk mengintegrasikan teknik pembelajaran mesin dengan sistem informasi geografis untuk penentuan lokasi pembangkit listrik tenaga surya yang optimal.
-
Tahap Persiapan dan Pengumpulan Data
Tahap awal dari penelitian ini berfokus pada integrasi sistematis dari set data meteorologi dan geospasial. Data meteorologi diperoleh dari National Solar Database (NSRDB) yang mencakup periode tiga tahun (2018-2020) untuk wilayah Purbalingga. Data ini mencakup parameter atmosfer yang penting termasuk suhu, tekanan atmosfer, kecepatan angin, kelembaban relatif, curah hujan, dan radiasi matahari (GHI). Resolusi temporal dari data meteorologi dipertahankan pada interval per hari [24]. Bersamaan dengan pengumpulan data meteorologi, data geospasial didapatkan dari OpenStreetMap [25] dan Advanced Land Observing Satellite (ALOS) [26], yang menggabungkan fitur-fitur medan alam, pola pemukiman, dan klasifikasi penggunaan lahan. Data geospasial ini akan diintegrasikan dalam analisis spasial menggunakan Sistem Informasi Geografis (SIG), memungkinkan evaluasi komprehensif terhadap faktor geografis yang berpotensi menjadi lokasi ideal instalasi PLTS..
Prosedur prapemrosesan data diimplementasikan dengan mengikuti pendekatan tiga langkah. Pertama, deteksi outlier dilakukan dengan menggunakan metode Interquartile Range (IQR) untuk mengidentifikasi dan menangani nilai anomali dalam set data meteorologi. Kedua, analisis nilai yang hilang dilakukan, dengan kesenjangan yang diatasi melalui teknik interpolasi yang sesuai berdasarkan kedekatan temporal dan spasial. Terakhir, semua variabel dikenakan prosedur standarisasi untuk memastikan kompatibilitas dalam analisis selanjutnya.
-
2.
Tahap Analisis Eksplorasi Data
Tahap analisis data eksplorasi disusun untuk mengungkapkan pola temporal dan spasial dalam kumpulan data terintegrasi. Analisis temporal difokuskan pada pemeriksaan statistik pola radiasi matahari dan korelasinya dengan parameter meteorologi. Hal ini mencakup perhitungan statistik deskriptif dan identifikasi pola musiman yang dapat mempengaruhi intensitas radiasi matahari. Analisis temporal menggunakan teknik dekomposisi deret waktu untuk memisahkan komponen tren, musiman, dan residu dari data radiasi matahari.
Analisis spasial dilakukan melalui eksplorasi sistematis terhadap faktor geografis, dengan menggunakan koordinat lintang dan bujur wilayah Purbalingga sebagai titik referensi. Analisis ini menggabungkan pengembangan matriks korelasi spasial untuk mengidentifikasi hubungan antara fitur geografis dan intensitas radiasi matahari. Teknik visualisasi tingkat lanjut juga digunakan, termasuk pembuatan grafik deret waktu untuk pola temporal, peta panas untuk analisis distribusi spasial, dan plot korelasi untuk pemeriksaan hubungan antar variabel. Visualisasi ini sangat penting dalam mengidentifikasi pola tersembunyi dan anomali yang menginformasikan tahap pemodelan selanjutnya.
-
3.
Tahap Pengembangan Model
Tahap pengembangan model menerapkan pendekatan pembelajaran mesin yang canggih yang menggabungkan algoritma Random Forest dan Histogram Gradient Boosting. Rekayasa fitur dimulai dengan pengembangan fitur siklik harian dan musiman untuk menangkap pola temporal dalam radiasi matahari. Fitur-fitur yang direkayasa ini dirancang untuk mewakili siklus tahunan dan diurnal dari pola radiasi matahari. Dataset kemudian dipartisi menjadi set pelatihan dan pengujian, dengan data enam bulan terakhir dicadangkan untuk validasi model.
Prapemrosesan data pada tahap ini melibatkan standardisasi menggunakan metode Standard Scaler untuk menormalkan variabel prediktor dan memastikan skala yang seragam di semua fitur. Implementasi pembelajaran mesin mengikuti pendekatan dua tahap: pelatihan model awal menggunakan parameter standar dari pustaka scikit-learn, diikuti dengan pengoptimalan hiperparameter melalui validasi silang pencarian acak. Parameter utama yang dioptimalkan termasuk jumlah pohon keputusan, kedalaman pohon maksimum, sampel minimum untuk pemisahan, dan laju pembelajaran. Validasi model menggunakan k-fold cross-validation untuk memastikan penilaian kinerja yang kuat dan meminimalkan risiko overfitting.
-
4.
Tahap Analisis Hasil Prediktif Sistem
Tahap terakhir mengintegrasikan prediksi pembelajaran mesin dengan analisis geospasial yang komprehensif menggunakan ArcGIS Pro. Integrasi ini dimulai dengan identifikasi lima lokasi potensial yang menunjukkan karakteristik radiasi matahari yang optimal berdasarkan prediksi model. Lokasi-lokasi ini menjadi sasaran evaluasi multi-kriteria yang menggabungkan perspektif geografis dan infrastruktur.
Kerangka kerja analisis spasial mencakup beberapa komponen. Analisis zona penyangga sejauh 2 kilometer dilakukan di sekitar setiap lokasi kandidat untuk menilai interaksi dengan fitur geografis di sekitarnya. Penilaian kesesuaian penggunaan lahan menggunakan analisis overlay berbobot yang menggabungkan beberapa kriteria termasuk pola penggunaan lahan saat ini, karakteristik lereng, dan kedekatan dengan infrastruktur yang ada. Analisis kedekatan pemukiman mengevaluasi aksesibilitas dan potensi dampak sosial, sementara evaluasi topografi menilai kelayakan konstruksi melalui analisis medan yang terperinci. Terakhir, analisis daerah aliran sungai dilakukan untuk menilai dampak visual dan potensi integrasi lingkungan.
HASIL DAN PEMBAHASAN
3.1. Pengumpulan Data
Pengumpulan data dalam penelitian ini mengintegrasikan tiga sumber utama: National Solar Resource Database (NSRDB) yang dikelola oleh National Renewable Energy Laboratory (NREL) untuk data meteorologi dan radiasi matahari, serta OpenStreetMap dan Advanced Land Observing Satellite (ALOS) untuk akuisisi data geospasial. NSRDB menyediakan dataset komprehensif yang tersimpan dalam format HDF5 di server Amazon Web Services, yang diakses melalui Highly Scalable Data Service (HSDS). Proses pengumpulan data dari NSRDB mengikuti rangkaian sistematis, diawali dengan perolehan kredensial API dari NREL, dilanjutkan dengan ekstraksi metadata dan pengindeksan temporal dari database. Selanjutnya, dilakukan ekstraksi dan unscaling data khusus untuk wilayah Purbalingga, yang kemudian dikonversi dan disimpan dalam format CSV untuk memfasilitasi prosedur analisis lanjutan.
Komponen geospasial penelitian ini memanfaatkan data OpenStreetMap yang diakses melalui layanan GeoFabrik, menyediakan informasi spasial yang mencakup klasifikasi penggunaan lahan, jaringan jalan, sebaran bangunan, titik-titik lokasi strategis, serta fitur geografis seperti gunung dan sungai. Untuk melengkapi analisis topografis, data Digital Surface Model diperoleh dari ALOS, yang memungkinkan ekstraksi informasi kemiringan dan inklinasi medan. Integrasi sumber-sumber data ini membangun fondasi yang kokoh untuk analisis spasial yang diperlukan dalam identifikasi lokasi optimal untuk instalasi Pembangkit Listrik Tenaga Surya.
3.2. Praproses Data
Penelitian ini memanfaatkan dataset yang diperoleh dari National Solar Database (NSRDB) yang disediakan oleh National Renewable Energy Laboratory (NREL). Dataset ini memiliki karakteristik spasial dan temporal, di mana data spasial mencakup informasi geografis Purbalingga, sedangkan data temporal meliputi pengukuran meteorologi yang tercatat sepanjang tahun. Dataset lengkap terdiri dari 179.744 pengamatan yang mencakup data harian di 164 lokasi di Purbalingga selama periode 2018-2020, meliputi koordinat bujur dan lintang, ketinggian, kelembapan relatif, endapan air, temperatur udara, tekanan, kecepatan angin, dan Global Horizontal Irradiance (GHI).
Prapemrosesan data awal sangat penting untuk membangun dataset yang disempurnakan dan berkualitas tinggi. Proses ini mencakup identifikasi dan penanganan nilai yang hilang serta outlier yang dapat mempengaruhi hasil analisis dan akurasi model. Proses penanganan outlier menggunakan dua metode: Interquartile Range (IQR) dan rolling window. Metode IQR merupakan teknik statistik yang mengidentifikasi outlier melalui perhitungan rentang yang didefinisikan oleh kuartil pertama (Q1) dan kuartil ketiga (Q3) dari dataset, di mana outlier dicirikan sebagai titik data yang berada di bawah Q1 - 1,5 IQR atau melebihi Q3 + 1,5 IQR. Strategi non-parametrik ini untuk mendeteksi penyimpangan signifikan dari 50% pusat data sangat menguntungkan dalam menganalisis distribusi miring atau dataset yang tidak mengikuti distribusi normal. Sedangkan metode rolling window merupakan pendekatan dinamis yang menganalisis titik data dengan memeriksa subset bergerak (jendela) dari dataset sepanjang waktu, membandingkan setiap titik dalam jendela dengan ukuran statistik seperti rata-rata, median, atau deviasi standar untuk mengidentifikasi anomali. Dengan menggeser jendela ini di seluruh dataset, teknik ini memungkinkan penilaian kontekstual terhadap outlier, menangkap variasi lokal dan perubahan temporal yang mungkin tidak terdeteksi dalam metode deteksi outlier statis.
Metode IQR mengidentifikasi 710 outlier dalam nilai GHI di seluruh dataset. Fase berikutnya menerapkan fungsionalitas yang menggabungkan analisis berbasis lokasi dan bulanan, mengidentifikasi 634 outlier. Pemeriksaan lebih lanjut menggunakan metode rolling window mengungkapkan penyimpangan tambahan dengan total 6.724 outlier teridentifikasi, yang merepresentasikan 3,74% dari dataset.
Dampak dari prosedur manajemen outlier menghasilkan peningkatan nilai rata-rata GHI dari 203,43 menjadi 206,01 W/m², mengindikasikan koreksi terhadap nilai-nilai ekstrem rendah tertentu. Standar deviasi menurun dari 50,10 menjadi 46,40, menunjukkan kontraksi dalam variabilitas data dan potensi pengukuran yang lebih seragam. Pengurangan standar deviasi ini dengan tetap mempertahankan rata-rata yang sebanding mengimplikasikan bahwa prosedur manajemen outlier secara efektif mengeliminasi atau menyesuaikan nilai-nilai ekstrem sambil mempertahankan pola distribusi data secara keseluruhan.
Gambar 1. Nilai GHI Sebelum dan Setelah Penanganan Outlier pada Titik Koordinat -7.48, 109.33
Perubahan yang relatif minimal dalam nilai rata-rata (peningkatan sekitar 1,27%) bersamaan dengan pengurangan standar deviasi yang substansial (penurunan 7,39%) mendemonstrasikan bahwa prosedur manajemen outlier berhasil mengurangi pembacaan anomali tanpa secara signifikan memodifikasi kecenderungan sentral dataset. Hasil ini sangat krusial untuk data radiasi matahari, karena menjaga integritas variasi asli sambil mengeliminasi pengukuran yang keliru untuk analisis dan pengembangan model pembelajaran mesin selanjutnya.
3.3. Analisis Temporal
Analisis temporal mengungkapkan pola radiasi matahari dalam berbagai skala temporal di Purbalingga, Indonesia. Pemeriksaan data tahunan menunjukkan bahwa rata-rata radiasi matahari (GHI) puncak tercatat pada tahun 2019 sebesar 213,69 W/m², diikuti tahun 2018 sebesar 205,94 W/m², sementara mencapai titik terendah pada tahun 2020 sebesar 198,43 W/m². Pengamatan ini mengindikasikan adanya variabilitas antar-tahunan yang signifikan. Gambar 2 mengilustrasikan pola dan variasi yang berbeda dalam nilai GHI pada berbagai skala temporal.
Gambar 2. Analisis Temporal Terhadap Radiasi Matahari (GHI)
Analisis musiman memperlihatkan pengaruh sistem iklim ganda Indonesia. Musim kemarau yang berlangsung dari April hingga September menunjukkan nilai GHI rata-rata yang lebih tinggi sebesar 213,96 W/m², berbeda dengan musim hujan sebesar 198,04 W/m², menunjukkan perbedaan sekitar 8%. Pola ini selaras dengan kondisi meteorologi umum, di mana langit yang lebih cerah selama musim kemarau memfasilitasi penetrasi radiasi matahari yang lebih besar ke permukaan Bumi.
Rata-rata bulanan mengungkapkan pola temporal yang lebih terperinci. Nilai GHI tertinggi teramati pada bulan September (237,46 W/m²) dan Oktober (225,37 W/m²), bertepatan dengan masa transisi dari musim kemarau ke musim hujan. Sebaliknya, nilai terendah terjadi pada bulan Desember (179,82 W/m²) dan Januari (185,70 W/m²), selama puncak musim hujan. Variasi bulanan ini menunjukkan pola siklus tahunan yang jelas dengan rentang 57,64 W/m² antara bulan tertinggi dan terendah. Rata-rata harian menunjukkan variabilitas tertinggi dengan rentang nilai 86 hingga 317 W/m², mencerminkan pengaruh pola cuaca jangka pendek serta kondisi atmosfer dan topografi lokal. Variasi frekuensi tinggi ini sangat bermanfaat untuk memahami keandalan radiasi matahari harian untuk aplikasi energi.
3.4. Analisis Spasial
Purbalingga merupakan kabupaten di Jawa Tengah, Indonesia, yang terletak di antara koordinat 7°18'-7°48' LS dan 109°18'-109°57' BT. Karakteristik topografi wilayah ini ditandai dengan gradien ketinggian yang mencolok, dengan lereng Gunung Slamet (3.428m) mendominasi wilayah utara dan menurun ke dataran rendah di selatan, menghasilkan profil topografi heterogen yang secara substansial mempengaruhi kondisi iklim lokal dan pola radiasi matahari. Temuan analisis spasial di Purbalingga mengungkapkan pola signifikan dalam distribusi radiasi matahari (GHI) di berbagai lokasi. Analisis menunjukkan nilai GHI rata-rata berkisar dari sekitar 169 W/m² hingga 224 W/m², disertai dengan standar deviasi antara 39-60 W/m². Gambar 3 mengilustrasikan distribusi spasial radiasi matahari (GHI) dalam wilayah Kabupaten Purbalingga.
Gambar 3. Distribusi Radiasi Matahari (GHI) di Purbalingga
Analisis mengungkapkan hubungan yang jelas berbeda antara fitur topografi dan pola radiasi matahari. Wilayah selatan Purbalingga (mencakup garis lintang -7,42 hingga -7,48) secara konsisten menunjukkan nilai GHI rata-rata yang lebih tinggi (sekitar 217-224 W/m²) dengan standar deviasi yang lebih rendah (39-41 W/m²). Area ini berkorespondensi dengan dataran rendah Purbalingga yang umumnya memiliki lebih sedikit hambatan terhadap radiasi matahari. Sebaliknya, wilayah utara (meliputi garis lintang -7,18 hingga -7,26) menampilkan variabilitas yang lebih besar dalam nilai GHI (berkisar dari 169 hingga 202 W/m²) dengan standar deviasi yang lebih tinggi (45-60 W/m²). Variabilitas ini selaras dengan topografi Purbalingga, karena wilayah utara mencakup lereng Gunung Slamet, di mana medan yang beragam dapat mempengaruhi penerimaan radiasi matahari akibat variasi ketinggian dan efek pembayangan. Wilayah tengah menunjukkan nilai-nilai menengah, mengindikasikan transisi topografi yang menghubungkan area pegunungan di utara dan wilayah dataran rendah di selatan.
3.5. Korelasi GHI terhadap Data Meteorologi
Analisis korelasi mengungkapkan hubungan signifikan antara radiasi matahari (Global Horizontal Irradiance, GHI) dan berbagai variabel meteorologi dalam dataset. Koefisien korelasi dapat berfluktuasi dari -1 hingga 1, di mana -1 menunjukkan korelasi negatif sempurna, 0 menandakan tidak adanya korelasi, dan 1 menunjukkan korelasi positif sempurna. Korelasi antara GHI dan variabel meteorologi ini diilustrasikan dalam peta panas pada Gambar 4.
Gambar 4. Korelasi GHI dan Data Meteorologi
Analisis menunjukkan bahwa GHI memperlihatkan berbagai tingkat korelasi dengan parameter meteorologi yang berbeda. Korelasi paling menonjol teramati pada kelembapan relatif, menunjukkan korelasi negatif sedang sekitar -0,484. Pengamatan ini mengindikasikan bahwa ketika kelembapan relatif meningkat, GHI cenderung menurun. Fenomena ini logis mengingat bahwa peningkatan kelembapan sering mengindikasikan peningkatan tutupan awan atau kelembapan atmosfer, sehingga melemahkan radiasi matahari yang mencapai permukaan Bumi. Endapan air juga menunjukkan korelasi negatif dengan GHI (-0,306), mengindikasikan bahwa peningkatan kadar air atmosfer berkorelasi dengan penurunan nilai GHI. Hubungan ini selaras dengan prinsip fisika, karena peningkatan uap air di atmosfer dapat mengakibatkan hamburan dan penyerapan radiasi matahari. Sebaliknya, suhu dan tekanan udara menunjukkan korelasi positif lemah dengan GHI (masing-masing 0,164 dan 0,216). Nilai tersebut mengindikasikan bahwa nilai suhu dan tekanan yang lebih tinggi menunjukkan kecenderungan minimal untuk bertepatan dengan peningkatan nilai GHI, meskipun korelasinya tidak kuat. Kecepatan angin menunjukkan korelasi positif lemah yang serupa (0,189) dengan GHI.
Matriks korelasi juga mengungkapkan hubungan menarik antar variabel. Suhu dan tekanan atmosfer menunjukkan korelasi positif tinggi (0,882), sementara kedua variabel tersebut memperlihatkan korelasi negatif sedang dengan kelembapan relatif (-0,585 dan -0,595). Hal ini mengindikasikan bahwa peningkatan suhu dan tekanan umumnya berasosiasi dengan penurunan tingkat kelembapan relatif, yang konsisten dengan prinsip-prinsip dasar meteorologi.
3.6. Korelasi GHI terhadap Topografi
Data yang digunakan mencakup wilayah Purbalingga dengan garis lintang dari sekitar -7,18° hingga -7,48° dan garis bujur dari 109,18° hingga 109,57°. Nilai rata-rata GHI bervariasi di seluruh wilayah, dengan beberapa area menerima lebih dari 220 W/m² sementara yang lain menerima kurang dari 180 W/m². Analisis korelasi spasial menunjukkan hubungan signifikan antara fitur topografi dan radiasi matahari (GHI) di Purbalingga. Koefisien korelasi menunjukkan bahwa garis lintang (-0,841) dan ketinggian (-0,768) memiliki korelasi negatif yang kuat dengan GHI, sementara garis bujur (0,115) memiliki korelasi positif yang lemah. Nilai tersebut menandakan bahwa nilai GHI cenderung berkurang secara nyata seiring beralih ke utara (peningkatan garis lintang) dan ke ketinggian lebih tinggi. Dampak bujur dapat diabaikan karena hasil analisis menunjukkan bahwa posisi timur-barat memberikan pengaruh minimal pada tingkat radiasi matahari.
Gambar 5. Korelasi GHI dengan Garis Bujur, Lintang, dan Elevasi
3.7. Performa Model
-
Kepentingan Fitur
Analisis kepentingan fitur memberikan wawasan mengenai variabel mana yang memberikan pengaruh terbesar pada prediksi yang dihasilkan oleh model random forest. Model ini memperhitungkan faktor meteorologi, spasial, dan temporal untuk meramalkan radiasi matahari (GHI). Tabel 1 menunjukkan peringkat kepentingan fitur dalam model random forest.
Tabel 1. Kepentingan Fitur oleh Model Random Forest
Fitur | Kepentingan Fitur |
---|---|
Kelembapan relatif | 0.261797 |
Endapan air | 0.199118 |
Hari dalam setahun-sin | 0.143310 |
Hari dalam setahun-cos | 0.124471 |
Kecepatan angin | 0.119247 |
Temperatur Udara | 0.061133 |
Bujur | 0.023264 |
Lintang | 0.021571 |
Tekanan | 0.020271 |
Ketinggian | 0.010259 |
Musim-sin | 0.009070 |
Musim-cos | 0.005386 |
Musim hujan | 0.001103 |
Dua fitur yang paling menonjol adalah kelembapan relatif (kepentingan 26,2%) dan endapan air (kepentingan 19,9%). Peningkatan kelembapan dan kadar air di atmosfer dapat menghamburkan dan menyerap radiasi matahari, sehingga mengurangi kuantitas radiasi matahari yang mencapai permukaan Bumi. Selanjutnya, kecepatan angin (kepentingan 11,9%) dapat mempengaruhi pergerakan awan pada ketinggian tertentu. Suhu udara (kepentingan 6,1%) memainkan peran minor, berpotensi mempengaruhi dinamika dan kelembapan atmosfer. Perlu dicatat bahwa variabel tekanan menunjukkan kepentingan minimal (2,0%), mengindikasikan bahwa fitur meteorologi ini dapat diabaikan.
Selain itu, model random forest memberikan bobot yang substansial pada fitur siklus temporal yang berasal dari hari-hari dalam setahun (hari-dalam-setahun-sin dan hari-dalam-setahun-cos menyumbang 26,8% dari kepentingan). Transformasi sinus/kosinus memastikan transisi yang mulus antar periode waktu, merepresentasikan bahwa 31 Desember memang mendekati 1 Januari dalam siklus tahunan. Sementara klasifikasi musim (musim hujan) dan fitur siklus musiman (musim-sin dan musim-cos) menunjukkan kepentingan minimal, mengindikasikan model lebih bergantung pada representasi siklus waktu harian yang kontinu. Terakhir, fitur topografi termasuk garis lintang, bujur, dan ketinggian memiliki kepentingan moderat (total 5,5%), menunjukkan bahwa lokasi mempengaruhi prediksi radiasi matahari, meskipun pada tingkat yang lebih rendah dibandingkan kondisi meteorologi dalam model ini.
-
2.
Model Pembelajaran Mesin dan Performa Model
Penelitian ini menggunakan metode pembelajaran ansambel yaitu Random Forest dan Histogram Gradient Boosting, masing-masing melakukan regresi untuk memprakirakan nilai GHI. Setiap model akan dilakukan penyesuaian hiperparameter, yang mana model awal dibedakan dengan hiperparameter yang mengikuti konfigurasi standar, sementara model berikutnya menyajikan hiperparameter yang telah menjalani prosedur penyesuaian menggunakan teknik randomizedSearchCV.
Berbeda dengan GridSearchCV, yang melakukan pemeriksaan komprehensif terhadap nilai parameter yang telah ditentukan, RandomizedSearchCV memungkinkan Peneliti untuk menggambarkan distribusi parameter potensial dan kemudian melakukan pengambilan sampel acak dari distribusi ini. Metode ini menunjukkan efisiensi komputasi yang unggul, terutama dalam konteks model yang dicirikan oleh ruang hiperparameter yang luas, karena memiliki kapasitas untuk mencakup spektrum yang luas dari konfigurasi prospektif sambil memanfaatkan sumber daya komputasi yang lebih sedikit. Dengan menetapkan jumlah iterasi pada 10, maka dapat melakukan eksplorasi ruang hiperparameter dengan komputasi minimal, menjadikannya sangat menguntungkan untuk model pembelajaran mesin seperti RF dan HGB Regressor, yang memerlukan beberapa hiperparameter yang saling berhubungan yang secara signifikan mempengaruhi keakuratan model.
Model yang disesuaikan ini menunjukkan beragam pengaturan untuk hiperparameter tertentu dibandingkan dengan konfigurasi model dasar seperti yang ditampilkan pada Tabel . Selanjutnya, metrik performa seperti kesalahan kuadrat rata-rata (RMSE), kesalahan absolut rata-rata (MAE), dan R-kuadrat dari masing-masing model pembelajaran mesin yang disebutkan di atas disajikan dalam Tabel 3.
Tabel 2. Parameter Setiap Model Pembelajaran Mesin
Model | Parameter Model |
---|---|
Random Forest | max_depth=20, min_samples_leaf=4, min_samples_split=10, n_jobs=-1, oob_score=True, random_state=42 |
Random Forest (disesuaikan) | max_depth=11, max_features=None, max_samples=0.8416317594127292, min_samples_leaf=8, min_samples_split=16, n_estimators=134, n_jobs=-1, oob_score=True, random_state=42) |
Histogram Gradient Boosting | early_stopping=True, max_depth=20, min_samples_leaf=4, random_state=42 |
Histogram Gradient Boosting (disesuaikan) | early_stopping=True, l2_regularization=0.3854165025399161, learning_rate=0.014630213143862116, max_bins=129, max_depth=29, max_iter=191, min_samples_leaf=7, random_state=42 |
Tabel 3. Performa Model Pembelajaran Mesin
Model | Metrik | Pelatihan | Pengujian |
---|---|---|---|
Random Forest | RMSE | 10.51 | 41.11 |
MAE | 6.88 | 33.08 | |
R2 | 0.9484 | 0.2131 | |
Random Forest (disesuaikan) | RMSE | 24.45 | 41.35 |
MAE | 18.37 | 33.66 | |
R2 | 0.7209 | 0.2038 | |
Histogram Gradient Boosting | RMSE | 24.78 | 40.47 |
MAE | 19.37 | 32.93 | |
R2 | 0.7133 | 0.2373 | |
Histogram Gradient Boosting (disesuaikan) | RMSE | 31.14 | 39.20 |
MAE | 24.74 | 32.14 | |
R2 | 0.5472 | 0.2844 |
Sebagai kesimpulan, semua model tampaknya mengalami overfitting pada data pelatihan sampai tingkat tertentu, sebagaimana dibuktikan dengan metrik kesalahan yang meningkat dan skor R² yang berkurang pada data pengujian. Model Histogram Gradient Boosting yang disesuaikan menunjukkan performa paling menguntungkan pada data uji yang menunjukkan generalisasi yang unggul dibandingkan dengan model lain.
Gambar 6. Nilai GHI Sebenarnya Dibandingkan Predksi
Gambar 4.9 yang disajikan di atas menggambarkan performa model secara keseluruhan. Kedua model menunjukkan korelasi positif antara nilai radiasi matahari (GHI) aktual dan yang prediksi, sebagaimana dibuktikan oleh titik-titik data yang kira-kira melekat pada garis diagonal yang memanjang dari kuadran kiri bawah ke kuadran kanan atas. Pengamatan ini menunjukkan bahwa model-model pembelajaran mesin dapat menangkap tren umum dalam data. Namun demikian, masih terdapat penyebaran yang cukup besar di sekitar garis diagonal, yang mengindikasikan bahwa prediksi tidak sempurna dan masih ada ruang untuk perbaikan.
3.8. Analisis Geospasial Menggunakan ArcGIS
Analisis ini menggunakan modul Python ArcGIS Pro (arcpy) yang beroperasi bersamaan dengan perangkat lunak Arcgis Pro untuk menjalankan beberapa analisis spasial pada situs kandidat yang diidentifikasi dari analisis pembelajaran mesin sebelumnya. Analisis spasial yang dilakukan yaitu memproses beberapa lapisan data geografis, termasuk pola penggunaan lahan, karakteristik medan, dan kedekatan infrastruktur, untuk menciptakan penilaian kelayakan yang menyeluruh.
Gambar 6. Wilayah Purbalingga Beserta Data Geospasialnya
-
Evaluasi Ketersediaan Lahan
Analisis ini melakukan evaluasi terhadap kesesuaian penggunaan lahan untuk instalasi surya dengan meneliti berbagai klasifikasi penggunaan lahan dalam zona penyangga yang digambarkan di sekitar lokasi kandidat. Fungsi ini menggunakan sistem penilaian tertimbang di mana setiap klasifikasi penggunaan lahan dialokasikan skor kompatibilitas mulai dari 0 (tidak sesuai) hingga 1 (sangat sesuai). Dalam data yang diperoleh, padang rumput (0,9) dianggap paling tepat, sedangkan zona perumahan, ritel, dan militer (0,0) dianggap tidak cocok. Analisis ini membagi data penggunaan lahan ke dalam zona penyangga, kemudian menghitung persentase area untuk setiap klasifikasi penggunaan lahan, dan menerapkan bobot yang telah ditentukan untuk menghasilkan skor kompatibilitas tertimbang. Namun demikian, analisis penulis tidak membuahkan hasil karena tidak adanya data penggunaan lahan di area studi. Keterbatasan ini tidak secara inheren membatalkan prosedur pemilihan lokasi, tetapi sangat penting untuk lebih bergantung pada kriteria alternatif seperti nilai GHI, karakteristik medan, dan analisis kedekatan untuk membuat penentuan tentang kesesuaian lokasi.
-
2.
Perhitungan Jarak ke Infrastruktur Utama
Hasil dari analisis menggambarkan jarak antara kandidat situs instalasi surya dan berbagai fitur topografi yang signifikan. Perhitungan jarak dilakukan untuk beragam infrastruktur dan fitur alam seperti bangunan, gunung, tempat menarik, jalan raya, dan saluran air. Nilai jarak dinyatakan dalam derajat desimal (koordinat geografis), dimana nilai kecil menunjukkan jarak yang lebih dekat dan sebaliknya.
Tabel 4. Perhitungan Jarak ke Berbagai Fitur di Wilayah Purbalingga
Tipe Fitur | Jarak Minimum | Jarak Maksimum | Keterangan |
---|---|---|---|
Bangunan | 0.000636 (Situs 3) | 0.003528 (Situs 5) | Jarak dengan bangunan sangat dekat |
Tempat menarik (POI) | 0.015669 (Situs 4) | 0.039127 (Situs 2) | Rentang jarak sedang |
Jalan | 0.000417 (Situs 3) | 0.003223 (Situs 5) | jarak yang sangat dekat dengan akses jalan |
Saluran Air | 0.000565 (Situs 1) | 0.007005 (Situs 5) | Jarak kedekatan yang bervariasi terhadap saluran air |
Gunung | 0.097529 (Situs 3) | 0.172800 (Situs 4) | Jarak yang relatif lebih jauh dibandingkan dengan fitur lainnya |
Kedekatan Bangunan terdapat jarak yang sangat dekat (0,001°-0,003°) menunjukkan lokasi berada di dekat bangunan. Sedangkan kedekatan dengan pegunungan terdapat jarak yang relatif lebih jauh (0,097°-0,172°) menunjukkan lokasi yang lebih jauh dari daerah pegunungan. Lalu tempat-tempat menarik (POI) memiliki jarak sedang (0,015°-0,039°) yang menunjukkan aksesibilitas yang wajar. Kedekatan Jalan terdapat jarak yang sangat dekat (0,0004-0,003°), menunjukkan aksesibilitas yang baik. Sedangkan kedekatan dengan saluran air terdapat jarak yang dekat (0,0005°-0,007°) yang menunjukkan kedekatan dengan fitur air
Dari kelima kandidat situs, situs 3 memiliki aksesibilitas yang sangat baik, dengan jarak terdekat dengan jalan (0,00042°) sambil menjaga jarak aman dari pegunungan. Lalu terdapat situs 4 yang memiliki jarak terdekat dengan POI serta terjauh dari area pegunungan, sehingga berpotensi menjadi pilihan yang seimbang tergantung pada kriteria lainnya.
-
3.
Evaluasi Aspek Kemiringan dan Medan
Analisis aspek kemiringan dan medan mengungkapkan atribut topografi yang krusial untuk lima situs kandidat instalasi surya dengan memeriksa gradien kemiringan dan aspek arah medan, seperti yang ditunjukkan pada Tabel 6. Analisis kemiringan menunjukkan medan yang sangat landai di semua situs, dengan kemiringan berkisar antara 0,33° hingga 2,00°. Situs 2 dan 3 memiliki gradien tertinggi pada 1,99°, sementara Situs 4 menampilkan medan paling datar dengan kemiringan 0,33°, diikuti oleh Situs 5 pada 0,46° dan Lokasi 1 pada 0,73°. Nilai kemiringan yang konsisten rendah ini sangat menguntungkan untuk instalasi PLTS, karena biasanya berkaitan dengan biaya konstruksi yang lebih rendah dan proses pemasangan yang lebih sederhana.
Tabel 5. Hasil Evaluasi Kemiringan dan Aspek Medan
Situs | Kemiringan | Aspek Medan | Rata-rata GHI | Skor Gabungan |
---|---|---|---|---|
1 | 0,7344 | 18,43 | 216,66 | 0,05359 |
2 | 1,9973 | 215,53 | 215,67 | 0,05373 |
3 | 1,9973 | 144,46 | 215,79 | 0,06244 |
4 | 0,3284 | 225,00 | 212,17 | 0,06663 |
5 | 0,4645 | 270,00 | 218,13 | 0,07113 |
Sedangkan, analisis aspek medan menggambarkan arah kompas kemiringan yang menunjukkan variasi arah yang signifikan di antara situs-situs tersebut. Situs 1 menghadap Utara-Timur Laut (18,43°), situs 2 dan 4 menghadap Barat Daya (masing-masing 215,54° dan 225,00°), situs 3 menghadap Tenggara (144,46°), sementara situs 5 menghadap langsung ke Barat (270,00°). Mengingat penempatan geografis Indonesia di Belahan Bumi Selatan, maka aspek yang menghadap ke utara umumnya lebih diutmakan untuk paparan radiasi matahari yang optimal yang menjadikan keselarasan situs 1 sangat menguntungkan. Namun demikian, pertimbangan aspek harus dievaluasi bersama dengan faktor-faktor penting lainnya seperti nilai radiasi matahari (GHI), pola iklim lokal, dan aksesibilitas lokasi untuk memastikan lokasi yang paling tepat untuk instalasi surya.
-
4.
Evaluasi Jarak Pandang
Penilaian jarak pandang menjelaskan visibilitas di lima lokasi potensial untuk instalasi surya, dengan setiap situs menunjukkan rasio jarak pandang yang identik sekitar 7,72e-08 (0,0000000772 atau 0,00000772%). Rasio jarak pandang yang sangat rendah dan seragam di semua lokasi menandakan bahwa area yang dapat diamati dari setiap situs sangat dibatasi dalam kaitannya dengan luas total analisis (yang digambarkan oleh radius luar 5000 meter dalam penilaian jarak pandang). Nilai identik di semua situs juga menunjukkan bahwa medannya sangat analog di setiap situs. Meskipun analisis jarak pandang biasanya berperan dalam menilai dampak visual dan potensi efek silau dari instalasi surya di daerah yang berdekatan, nilai rendah yang seragam dalam penelitian ini menunjukkan bahwa dampak visual dari lokasi mana pun tidak penting.
DISKUSI
4.1. Analisis Lokasi Optimal dari Pembelajaran Mesin
Penilaian perkiraan spasial ini menilai konsistensi prediksi radiasi matahari (GHI) di berbagai lokasi menggunakan beberapa metrik. Analisis ini menjelaskan hasil dari upaya pembelajaran mesin yang bertujuan untuk mengidentifikasi lokasi yang optimal untuk instalasi pembangkit listrik tenaga surya di Purbalingga dengan meneliti pola GHI di 164 lokasi yang berbeda. Hasilnya mengungkapkan lima situs paling ideal yang dipilih berdasarkan konsistensi dan besarnya GHI.
Hasil penelitian menunjukkan bahwa lokasi yang paling menjanjikan berada di sekitar koordinat -7,42°LS hingga -7,46°LS dan 109,35°BT hingga 109,49°BT. Lokasi-lokasi tersebut menunjukkan nilai Root Mean Square Error (RMSE) yang relatif rendah (berkisar antara 36,5 hingga 40,2 W/m²) dan nilai R-kuadrat yang baik, terutama untuk model Histogram Gradient Boosting (0,11 hingga 0,19). Koefisien variasi (cv) untuk lokasi-lokasi tersebut berkisar antara 0,183 hingga 0,192, yang mengindikasikan pola GHI yang konsisten selama periode pengamatan, seperti yang diperlihatkan pada Tabel 6.
Tabel 6. Lima Situs yang Menerima Radiasi Matahari Paling Konsisten
Lintang | Bujur | RF RMSE | HGB RMSE | Standar Deviasi | Rata-rata_ghi | Konsistensi Variasi | Skor Gabungan |
---|---|---|---|---|---|---|---|
-7.42 | 109.45 | 39.96 | 37.11 | 39.76 | 216.66 | 0.1835 | 0.0535 |
-7.42 | 109.47 | 40.23 | 36.97 | 39.87 | 215.67 | 0.1848 | 0.0537 |
-7.42 | 109.49 | 39.65 | 37.25 | 39.74 | 215.79 | 0.1841 | 0.0624 |
-7.46 | 109.35 | 39.51 | 36.54 | 40.69 | 212.17 | 0.1918 | 0.0666 |
-7.42 | 109.41 | 39.58 | 37.21 | 40.67 | 218.13 | 0.1864 | 0.0711 |
Analisis menunjukkan bahwa lima situs terbaik mempertahankan nilai GHI rata-rata antara 212—218 W/m² dengan standar deviasi sekitar 40 W/m² menunjukkan potensi dan stabilitas radiasi matahari yang signifikan. Karakteristik ini membuatnya sangat kondusif untuk instalasi pembangkit listrik tenaga surya karena kemungkinan besar akan menghasilkan energi yang konsisten dan efisien sepanjang tahun. Situs berkinerja paling optimal berada di -7,42° LS, 109,45° BT, dengan nilai kumulatif terendah 0,0536 menandakan bahwa situs ini memberikan kesetimbangan optimal antara nilai rata-rata GHI 216,67 W/m² serta konsistensinya. Situs ini menunjukkan presisi prediksi yang kuat dengan RMSE sebesar 37,11 W/m² untuk model Gradient Boosting Histogram menunjukkan pola GHI yang dapat diandalkan. Gambar 4.10 menggambarkan peta konsistensi radiasi matahari (GHI) di 164 lokasi di Kabupaten Purbalingga
Gambar 7. Peta Lokasi Konsistensi GHI di Purbalingga
4.2. Lokasi Optimal untuk Pemasangan PLTS
Hasil dari analisis geospasial disajikan pada Tabel yang menunjukkan bahwa Situs 1 sebagai situs paling menjanjikan dengan skor akhir tertinggi 0,477 (peringkat 1) dan kinerja GHI yang kuat sebesar 216,67 W/m² (peringkat 2 untuk sumber daya surya). Situs 4 menyusul sebagai opsi terbaik kedua dengan skor akhir 0,446 (peringkat 2), meskipun memiliki nilai GHI terendah 212,17 W/m² (peringkat 5), situs ini menonjolkan karakteristik menguntungkan lainnya seperti kemiringan minimal (0,33°) dan kedekatan infrastruktur yang baik (jarak rata-rata 0,004). Situs 3 menempati peringkat ketiga dengan skor 0,310, menunjukkan karakteristik yang seimbang di semua kriteria. Situs 5, meskipun memiliki nilai GHI tertinggi 218,13 W/m² (peringkat 1), menempati peringkat keempat secara keseluruhan dengan skor 0,284, terutama karena jarak rata-rata ke infrastruktur yang jauh lebih besar (0,125). Situs 2 menempati peringkat terakhir dengan skor 0,259 dengan nilai GHI moderat, karena kemiringan yang lebih curam (1,99°) dan jarak infrastruktur yang relatif jauh (0,027). Yang perlu dicatat, semua lokasi menunjukkan skor kompatibilitas penggunaan lahan nol dan rasio jarak pandang yang identik (7,72e-08), menunjukkan faktor-faktor ini tidak menentukan atau memiliki keterbatasan data. Analisis menunjukkan bahwa meskipun potensi sumber daya surya (GHI) penting, faktor lain seperti karakteristik medan dan aksesibilitas infrastruktur secara signifikan mempengaruhi kesesuaian lokasi secara keseluruhan. Gambar menampilkan lima situs kandidat paling ideal untuk instalasi pembangkit listrik tenaga surya.
Tabel 7. Lima Situs yang Menerima Radiasi Matahari Paling Konsisten
Situs | Rata-rata GHI | Kesesuaian Lahan | Rata-rata Jarak ke Infrastruktur | Kemiringan | Jarak Pandang | Skor Akhir |
---|---|---|---|---|---|---|
1 | 216.66 | 0 | 0.0020 | 0.7344 | 0,0000000772 | 0.476 |
2 | 215.67 | 0 | 0.0267 | 1.9973 | 0,0000000772 | 0.258 |
3 | 215.79 | 0 | 0.0022 | 1.9973 | 0,0000000772 | 0.310 |
4 | 212.17 | 0 | 0.0040 | 0.3284 | 0,0000000772 | 0.446 |
5 | 218.13 | 0 | 0.1251 | 0.4645 | 0,0000000772 | 0.283 |
Gambar 8. Lima Situs Paling Ideal untuk Instalasi Pembangkit LIstrik Tenaga Surya
KESIMPULAN
Penelitian ini menghasilkan beberapa temuan signifikan dalam konteks integrasi machine learning dengan Sistem Informasi Geografis untuk prediksi radiasi matahari dan identifikasi lokasi optimal Pembangkit Listrik Tenaga Surya (PLTS).
-
Evaluasi performa model menunjukkan bahwa Histogram Gradient Boosting dengan optimasi hiperparameter mencapai tingkat akurasi prediksi radiasi matahari yang superior dibandingkan dengan model Random Forest. Keunggulan ini memvalidasi peran signifikan machine learning dalam mengidentifikasi dan mengevaluasi lokasi-lokasi potensial untuk instalasi PLTS secara lebih akurat dan efisien.
-
Analisis spasial menggunakan ArcGIS Pro terhadap lima lokasi potensial yang diidentifikasi melalui model machine learning mengungkapkan bahwa tiga dari lima lokasi yang diidentifikasi menunjukkan kesesuaian optimal untuk instalasi PLTS berdasarkan kriteria teknis dan geografis yang telah ditetapkan. Hasil ini memberikan landasan empiris yang kuat untuk pengambilan keputusan dalam perencanaan dan pengembangan infrastruktur energi terbarukan di wilayah studi.
-
Analisis spasial menggunakan ArcGIS Pro terhadap lima lokasi potensial yang diidentifikasi melalui model machine learning mengungkapkan bahwa tiga dari lima lokasi yang diidentifikasi menunjukkan kesesuaian optimal untuk instalasi PLTS berdasarkan kriteria teknis dan geografis yang telah ditetapkan. Hasil ini memberikan landasan empiris yang kuat untuk pengambilan keputusan dalam perencanaan dan pengembangan infrastruktur energi terbarukan di wilayah studi.
DAFTAR PUSTAKA
[1] “Total CO2 emissions from energy,” International Energy Agency, 2021. Diakses: 1 Juli 2024. [Daring]. Tersedia pada: https://www.iea.org/countries/indonesia/emissions
[2] U. Simanjuntak, “Subsidi Energi Fosil Menghambat Transisi Energi.” Diakses: 9 Maret 2024. [Daring]. Tersedia pada: https://iesr.or.id/subsidi-energi-fosil-menghambat-transisi-energi
[3] “Laporan Analisis Neraca Energi Nasional 2022.” Sekretariat Jenderal Dewan Energi Nasional, September 2022. Diakses: 10 Maret 2024. [Daring]. Tersedia pada: den.go.id/publikasi/Neraca-Energi
[4] “Peraturan Gubernur (PERGUB) Provinsi Jawa Tengah Nomor 29 Tahun 2021 tentang Petunjuk Pelaksanaan Peraturan Daerah Provinsi Jawa Tengah Nomor 12 Tahun 2018 Tentang Rencana Umum Energi Daerah Provinsi Jawa Tengah.” Database Peraturan BPK, 17 November 2021. Diakses: 28 Juli 2024. [Daring]. Tersedia pada: https://peraturan.bpk.go.id/Details/192590/pergub-prov-jawa-tengah-no-29-tahun-2021
[5] M. Jefferson, “HOW SOLAR ENERGY BECAME CHEAP: A MODEL FOR LOW‐CARBON INNOVATION by Gregory F.NemetRoutledge (2019), 238 pp. ISBN: 978‐0367136574 (hb, £88.00); 978–0367136598 (pb, £27.99); 978–0367136604 (e‐book, £27.99; e‐book rental from £17.50),” Econ. Aff., vol. 39, no. 3, hlm. 437–438, Okt 2019, doi: 10.1111/ecaf.12365.
[6] “Renewable Power Generation Costs in 2020.” International Renewable Energy Agency, 2021. Diakses: 17 April 2024. [Daring]. Tersedia pada: https://www.irena.org/-/media/Files/IRENA/Agency/Publication/2021/Jun/IRENA_Power_Generation_Costs_2020.pdf?rev=c9e8dfcd1b2048e2b4d30fef671a5b84
[7] K. E. Trenberth, “Earth’s Energy Balance,” dalam Encyclopedia of Energy, Elsevier, 2004, hlm. 859–870. doi: 10.1016/B0-12-176480-X/00050-2.
[8] H. Ahmed Kutty, M. H. Masral, dan P. Rajendran, “Regression Model to Predict Global Solar Irradiance in Malaysia,” Int. J. Photoenergy, vol. 2015, hlm. 1–7, 2015, doi: 10.1155/2015/347023.
[9] S. Dubey, J. N. Sarvaiya, dan B. Seshadri, “Temperature Dependent Photovoltaic (PV) Efficiency and Its Effect on PV Production in the World – A Review,” Energy Procedia, vol. 33, hlm. 311–321, 2013, doi: 10.1016/j.egypro.2013.05.072.
[10] V. Kelsey, S. Riley, dan K. Minschwaner, “Atmospheric precipitable water vapor and its correlation with clear-sky infrared temperature observations,” Atmospheric Meas. Tech., vol. 15, no. 5, hlm. 1563–1576, Mar 2022, doi: 10.5194/amt-15-1563-2022.
[11] D. Yang dan J. M. Bright, “Worldwide validation of 8 satellite-derived and reanalysis solar radiation products: A preliminary evaluation and overall metrics for hourly data over 27 years,” Sol. Energy, vol. 210, hlm. 3–19, Nov 2020, doi: 10.1016/j.solener.2020.04.016.
[12] L. Ahmad, A. Biswas, J. Warland, dan I. Anjum, “Atmospheric Pressure and Solar Radiation,” dalam Climate Change and Agrometeorology, Singapore: Springer Nature Singapore, 2023, hlm. 17–51. doi: 10.1007/978-981-99-4863-5_3.
[13] S. Russell dan P. Norvig, Artificial intelligence: a modern approach, Third edition. Boston: Pearson, 2016.
[14] S. Genovese, “Artificial Intelligence: A Guide for Thinking Humans: Comments on the book by Melanie Mitchell,” ORDO, vol. 71, no. 1, hlm. 444–449, Jun 2020, doi: 10.1515/ordo-2021-0028.
[15] Y. LeCun, Y. Bengio, dan G. Hinton, “Deep learning,” Nature, vol. 521, no. 7553, hlm. 436–444, Mei 2015, doi: 10.1038/nature14539.
[16] G. James, D. Witten, T. Hastie, R. Tibshirani, dan J. Taylor, An Introduction to Statistical Learning: with Applications in Python. dalam Springer Texts in Statistics. Cham: Springer International Publishing, 2023. doi: 10.1007/978-3-031-38747-0.
[17] L. Breiman, “Random Forests,” Mach. Learn., vol. 45, no. 1, hlm. 5–32, 2001, doi: 10.1023/A:1010933404324.
[18] T. Chen dan C. Guestrin, “XGBoost: A Scalable Tree Boosting System,” dalam Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Francisco California USA: ACM, Agu 2016, hlm. 785–794. doi: 10.1145/2939672.2939785.
[19] “Comparing Random Forests and Histogram Gradient Boosting models.” Diakses: 13 Desember 2024. [Daring]. Tersedia pada: https://scikit-learn.org/stable/auto_examples/ensemble/plot_forest_hist_grad_boosting_comparison.html
[20] K. C. Laudon dan J. P. Laudon, Management information systems: managing the digital firm, Sixteenth edition, Global edition. Harlow: Pearson, 2020.
[21] T. Bernhardsen, Geographic information systems: an introduction, 3rd ed. New York, NY: Wiley, 2002.
[22] Y. Zhang, J. Ren, Y. Pu, dan P. Wang, “Solar energy potential assessment: A framework to integrate geographic, technological, and economic indices for a potential analysis,” Renew. Energy, vol. 149, hlm. 577–586, Apr 2020, doi: 10.1016/j.renene.2019.12.071.
[23] P. A. Longley, M. F. Goodchild, D. J. Maguire, dan D. W. Rhind, Geographic information science & systems, Fourth edition. Hoboken, N.J: Wiley, 2015.
[24] M. Sengupta, Y. Xie, A. Lopez, A. Habte, G. Maclaurin, dan J. Shelby, “The National Solar Radiation Data Base (NSRDB),” Renew. Sustain. Energy Rev., vol. 89, hlm. 51–60, Jun 2018, doi: 10.1016/j.rser.2018.03.003.
[25] OpenStreetMap contributors, “Central Java retrieved from https://planet.osm.org/.” 2024. Diakses: 15 Mei 2024. [Daring]. Tersedia pada: https://www.openstreetmap.org/
[26] “ALOS Global Digital Surface Model ‘ALOS World 3D - 30m (AW3D30).’” April 2024. Diakses: 15 November 2024. [GeoTIFF]. Tersedia pada: https://www.eorc.jaxa.jp/ALOS/en/dataset/aw3d30/aw3d30_e.htm