
Gambar 1. Konsep Prediksi Kelarutan dalam
Pelarut Organik dengan Machine Learning (Ye & Ouyang, 2021)
Sumber : https://jcheminf.biomedcentral.com/articles/10.1186/s13321-021-00575-3
Solubility atau kelarutan adalah parameter kritis dalam pengembangan obat yang memengaruhi bioavailabilitas, distribusi, metabolisme, ekskresi, dan toksisitas obat (ADMET). Kelarutan juga menjadi faktor utama dalam desain formulasi farmasi, sintesis bahan aktif, dan rute pengolahan kimia. Namun, prediksi kelarutan secara akurat menjadi tantangan besar karena kompleksitas proses pelarutan yang melibatkan energi kisi, energi solvasi, ionisasi zat terlarut, dan interaksi fase larutan (Ahmad et al., 2024).
Pendekatan tradisional menggunakan model termodinamika dan QSPR (Quantitative Structure-Property Relationship) untuk memprediksi kelarutan sering terkendala oleh kebutuhan data eksperimen yaTng rumit. Sebagai alternatif, algoritma machine learning (ML) menjadi solusi yang lebih efisien dan fleksibel. Dalam pengembangan terbaru, beberapa algoritma seperti Random Forest (RF), Support Vector Machine (SVM), dan neural network digunakan untuk memprediksi kelarutan obat dalam pelarut organik dan air. Hasil penelitian menunjukkan bahwa model berbasis ML mampu mencapai akurasi hingga ±0.7 logS, mendekati batas kesalahan data eksperimen (Boobier & Hose, 2020).
Gambar konsep pada Gambar 1. menunjukkan bagaimana algoritma memanfaatkan fitur struktural senyawa (seperti sidik jari ECFP6) dan kondisi fisik seperti suhu untuk memprediksi kelarutan. Proses pelarutan dikarakterisasi melalui tiga aspek utama: interaksi solut-solut, solut-pelarut, dan pelarut-pelarut. Model ML menggunakan representasi molekul seperti SMILES untuk memetakan hubungan antara properti fisikokimia dan kelarutan. Model seperti Residual Gated Graph Neural Network (RGNN) terbukti efektif dalam menangkap pola spasial dan hubungan antara atom, sehingga meningkatkan akurasi prediksi molekuler secara signifikan (Ye & Ouyang, 2021).
Dalam penelitian prediksi kelarutan asam salisilat, enam algoritma ML (termasuk Random Forest dan k-Nearest Neighbors) diaplikasikan pada 13 jenis pelarut. Random Forest memberikan hasil terbaik dengan kesalahan minimum sebesar 0.00016835, menunjukkan keunggulan metode ini dalam menangani data yang kompleks. Metode ini memungkinkan prediksi kelarutan dengan efisiensi tinggi untuk kebutuhan farmasi, termasuk dalam pemilihan pelarut (Hossein et al., 2024).

Gambar 2. Prediksi Kelarutan Asam Salisilat Berdasarkan Variabel
Input dan Output Menggunakan Algoritma Random Forest (Hossein et al., 2024)
Sumber : https://www.sciencedirect.com/science/article/pii/S277250812400019X
Selain efisiensi, interpretasi model juga sangat penting. LightGBM, misalnya, mengungkap hubungan antara kelarutan dan fitur struktural seperti berat molekul dan energi interaksi. Hal ini membantu ilmuwan memahami bagaimana karakteristik kimia memengaruhi kelarutan, sehingga mendukung optimasi struktur molekul dalam pengembangan obat (Ye & Ouyang, 2021).
Sebagai aplikasi praktis, model ML dapat mempercepat proses pemilihan pelarut dalam desain formulasi farmasi, sehingga mengurangi ketergantungan pada eksperimen laboratorium yang mahal dan memakan waktu. Dengan integrasi data molekuler dalam jumlah besar, algoritma seperti RGNN dan LightGBM tidak hanya memberikan akurasi tinggi tetapi juga efisiensi dalam memprediksi kelarutan berbagai jenis senyawa organik (Ahmad et al., 2024).
Penulis :
Zahrani Dian Lestari (22416248201126), FM22C, Farmasi Universitas Buana Perjuangan Karawang
DAFTAR PUSTAKA
Ahmad, W., Tayara, H., & Shim, H. (2024). SolPredictor : Predicting Solubility with Residual Gated Graph Neural Network. International Journal of Molecular Sciences, 25(715), 1–13. https://www.mdpi.com/1422-0067/25/2/715
Boobier, S., & Hose, D. R. J. (2020). Machine learning with physicochemical relationships : solubility prediction in organic solvents and water. Nature Communications, 11, 1–10. https://www.nature.com/articles/s41467-020-19594-z
Hossein, S., Besharati, Z., & Abdolrasoul, S. (2024). Salicylic acid solubility prediction in different solvents based on machine learning algorithms. Digital Chemical Engineering, 11(May), 1–7. https://www.sciencedirect.com/science/article/pii/S277250812400019X
Ye, Z., & Ouyang, D. (2021). Prediction of small ‑ molecule compound solubility in organic solvents by machine learning algorithms. Journal of Cheminformatics, 3, 1–13. https://jcheminf.biomedcentral.com/articles/10.1186/s13321-021-00575-3
Penulis: Zahrani Dian Lestari – 22416248201126 – FM22C – Farmasi UBP Karawang