PENERAPAN METODE NEURAL NETWORK BERBASIS PARTICLE SWAM OPTIMIZIED UNTUK PREDIKSI
KESUBURAN PADA PRIA
Hilda Amalia
Manajemen Informatika AMIK BSI
Jakarta
Jl. RS. Fatmawati no.24
email : Hilda.ham@bsi.ac.id
ABSTRAK
Tingkat
kesuburan merupakan hal yang harus diperhatikan khususnya bagi para pria dewasa
ini dikarenakan ketidaksuburan merupakan
masalah global yang terjadi pada pasangan suami istri. ketidaksuburan dapat
mengakibatkan pasangan suami istri tidak dapat hamil. Ketidaksuburan pada salah
satu pasangan khususnya pria dapat mengakhiri garis keturunan. Tinggi nya
tingkat ketidaksuburan pada masyarakat
pada dewasa ini dapat disebabkan oleh beberapa hal diantara faktor lingkungan
dan gaya hidup masyarakat saat ini. Penelitian sebelumnya mengenai tingkat
kesuburan sudah pernah dilakukan yaitu dengan menggunakan metode artificial
neural network dan menghasilkan akurasi 82%. Dalam penulisan ini akan dilakukan
peningkatan akurasi metode neural network untuk prediksi kesuburan pria melalui
air mani dengan menggunakan metode particle
swam optimazed(PSO). Dari hasil
penelitian diketahui bahwa penggunaan metode optimasi dapat meningkatkan
akurasi metode yang digunakan, dalam penelitian ini diperoleh akurasi yang baru
untuk metode neural network yang ditingkatkan kinerjanya menggunakan PSO
menjadi 92%.
I. PENDAHULUAN
Ketidaksuburan
merupakan masalah global, yang mempengaruhi rata-rata 8-12 persen pasangan di
seluruh dunia. Meskipun jarang diakui secara sosial, ketidaksuburan pada
laki-laki merupakan kontribusi untuk setidaknya setengah dari semua kasus di seluruh dunia dan ketidaksuburan merupakan
hal syang paling sulit untuk mengobati (Inhorn,
2002). Beberapa hal yang mempengaruhi tingkat kesuburan pada pria yaitu dapat
disebabkan karena penyakit ataupun juga efek lingkungan dan pekerjaan serta
gaya hidup masyarakat (Gilera etc, 2012). Untuk mengevaluasi ketidaksuburan
pada laki-laki, dokter menggunakan data
yang diperoleh dari analisis sperma. Analisis air mani adalah prediktor yang
baik dari potensi kesuburan pria (Kolettis, 2003). As-sisted Reproductive Technology (ART) adalah salah satu dari
banyak perawatan yang tersedia Pilihan untuk menyembuhkan ketidaksuburan.
Namun, efisiensi pengobatan ART masih tidak memadai (Mileski etc, 2013). Proses
analisis data medis memerlukan canggih teknik untuk pengolahan, penyimpanan dan
pengaksesan informasi data. Teknik tradisional tidak cukup mampu untuk
menghasilkan hasil yang optimal dari lengkap atau data yang berlebihan melalui
proses analisis (Durairaj & Sathyavathi, 2013).
Penggunaan
informasi yang efektif dan teknologi sangat penting untuk perawatan kesehatan.
Ha ini dibutuhkan oleh organisasi yang bergerak dibidang kesehatan untuk tetap
kompetitif pada saat ini. Tantangan yang dihadapi ketika mencoba untuk memahami
besar, beragam, dan sering Sumber data yang kompleks dari cukup. Dalam upaya
untuk mengubah informasi menjadi pengetahuan, organisasi perawatan kesehatan
yang menerapkan teknologi data mining dapat digunakan untuk membantu
mengendalikan biaya perawatan dan meningkatkan efektivitas perawatan pasien.
Data
mining dapat digunakan untuk membantu memprediksi perilaku pasien masa depan
dan untuk meningkatkan program pengobatan. Data mining telah digunakan dalam
sejumlah domain nonmedis (Sivanandam,
2006). Dengan mengidentifikasi pasien berisiko tinggi, dokter akan lebih baik
memberikan perawatan pasien hari ini sehingga tidak menimbulkan masalah yang
berarti dikemudian hari (sivanandam, 2006).
Oleh karena itu, perlu dilakukan analisis data
menggunakan teknik-teknik data mining. Data mining secara umum sudah diakui
sebagai salah satu cara mengektrak data menjadi pengetahuan yang berharga.
Penelitian mengenai tingkat kesuburan pada pria dengan menganalisa kwalitas air
mani sudah pernah dilakukan dengan metode artifial neural network(Girela etc,
2012), komparasi metode basyien network dan naïve bayes (Kahki etc, 2013). Dalam
penelitian ini metode data minin yang akan digunakan yaitu metode data mining.
Dan peningkatan kinerja akurasi metode neural network menggunakan metode
optimasi particle swam optimized(PSO).
II. KAJIAN LITERATUR
2.1 Data
Mining
Data
mining adalah analisis data yang besar pada set data untuk menemukan hubungan terduga dan untuk
meringkas data dalam cara baru yang sama-sama dimengerti dan berguna bagi
pemilik data (Larose, 2007). data mining
seharusnya lebih tepat bernama "pertambangan pengetahuan dari data”. Banyaknya
data, ditambah dengan kebutuhan untuk alat analisis data yang kuat, memiliki
digambarkan sebagai situasi miskin kaya data tetapi informasi. Yang tumbuh
cepat, luar biasa jumlah data, dikumpulkan dan disimpan dalam repositori data
yang besar dan banyak, memiliki jauh melebihi kemampuan manusia untuk pemahaman
tanpa alat yang kuat.
Banyaknya
data, ditambah dengan kebutuhan untuk alat analisis data yang kuat, telah
digambarkan sebagai kaya data tapi miskin informasi. Jumlah data yang tumbuh
secara cepat, dikumpulkan dan disimpan dalam repositori data yang besar dan
banyak, telah jauh melampaui kemampuan manusia untuk memahami data-data tesebut
tanpa mampu mengelolah data tersebut. Akibatnya, data yang dikumpulkan dalam
repositori data yang besar menjadi ”kuburan data” (Han & Kamber, 2007).
2.2 Metode Neural Network
Neural network adalah suatu usaha untuk meniru fungsi
otak manusia. Otak manusia diyakini terdiri dari jutaan unit pengolahan kecil,
yang disebut neuron, yang bekerja secara parallel (Shukla, Tiwari, & Kala,
2010). Generalized Regression neural Network (GRNN) Generalisasi adalah
kemampuan ANN untuk memberikan jawaban yang benar untuk input yang tidak
diketahui. Generalisasi adalah ukuran dari seberapa baik sistem telah dilatih.
Generalisasi diukur dengan kinerja dari sistem untuk mengatur data pengujian.
Kemampuan generalisasi ANN itu maka harus setinggi mungkin. (Shukla, Tiwari,
& Kala, 2010).
Penemuan algoritma backpropagation untuk multilayer
perceptron, merupakan metode yang sistematis untuk training sehingga bisa
dilakukan dan lebih efisien. Algoritma backpropagation
berasal dari learning rule Widrow dan
Hoff, disusun oleh Werbos (1974), dibuat oleh Parker (1985), Rumelhart Hinton, Williams
(Rumelhart dan Williams, 1986) dan peneliti lainnya (Maimon, 2005).
Multilayer perceptron (MLP) disebut juga multilayer feedforward neural network merupakan algoritma yang
paling luas digunakan. Menurut Wong, Bodnovich dan Selvi (1997), sekitar 95%
aplikasi bisnis yang menggunakan neural network, memakai algoritma ini
(Vecellis, 2009).
Langkah pembelajaran dalam algoritma backproparagation adalah sebagai beikut
(Myatt, 2007):
- Inisialisasi bobot jaringan secara acak (biasanya
antara -0.1 sampai 1.0).
- Untuk setiap data pada data training, hitung
input untuk simpul berdasarkan nilai input bobot jaringan saat itu,
menggunakan rumus:
Keterangan:
Oi =
output simpul i dari layer sebelumnya
Wij =
bobot relasi dari simpul i pada layer sebelumnya ke simpul j.
θj = bias (sebagai pembatas).
Berdasarkan input dari langkah
dua, selanjutnya membangkitkan output untuk simpul menggunakan fungsi aktifasi
sigmoid:
4. Hitung
nilai error antara nilai yang diprediksi dengan nilai yang sesungguhnya
menggunakan rumus:
Keterangan:
Outputj =
output actual dari simpul j.
Targetj =
nilai target yang sudah diketahui pada data training
5. Setelah
nilai error dihitung, selanjutnya dibalik ke layer sebelumnya (backpropagated). Untuk menghitung nilai error pada hidden layer menggunakan rumus:
Keterangan:
Outputj = output actual
dari simpul j
Errork = error simpul k.
wjk = bobot relasi dari
simpul j ke simpul k pada layer berikutnya
6. Nilai
error yang dihasilkan dari langkah sebelumnya digunakan untuk memperbaharui
bobot relasi menggunakan rumus:
Keterangan:
wij =
bobot relasi dari unit i pada layer sebelumnya ke unit j
l =
learning rate (konstanta, nilainya antara 0 sampai dengan 1)
errorj = error pada output
layer simpul j
outputi = output dari simpul
2.3 Particle
Swam optimized
Optimization Particle Swarm (PSO) adalah algoritma pencarian
berbasis populasi dan diinisialisasi dengan populasi solusi acak yang disebut
partikel (Abraham, 2006). PSO merupakan metode pencarian penduduk yang berasal
dari studi tentang pergerakan sekelompok burung atau ikan. Serupa dengan algoritma
genetika (GA), PSO melakukan pencarian menggunakan populasi (kawanan) individu
(partikel) yang akan memperbaharui dari iterasi ke iterasi.
Cari solusi yang optimal, setiap
partikel bergerak ke arah posisi terbaik sebelumnya dan posisi terbaik global.
Sebagai contoh, partikel-i dinyatakan sebagai: xi = (xi1, xi2, .... xid) dalam
ruang d-dimensi. Posisi sebelumnya terbaik dari partikel-i disimpan dan
dinyatakan sebagai pbesti = (pbesti, 1, pbesti, 2, ... pbesti, d). Partikel
terbaik Index antara semua partikel dalam kelompok kawanan dinyatakan sebagai
gbestd. Kecepatan partikel I-th dinyatakan sebagai: vi = (vi, 1, vi, 2, ....
vi, d). Modifikasi kecepatan dan posisi setiap partikel dapat dihitung dengan
menggunakan kecepatan arus dan jarak pbesti, d untuk gbestd seperti yang
ditunjukkan dalam persamaan berikut:
1.
vi, vi d = w *, d + c1 * R * (pbesti, d - xi, d) + c2 * R * (gbestd - xi, d)
2. xid = xi, vi + d, d
dimana:
Vi,
d = kecepatan partikel pada iterasi ke-i i
w
= faktor bobot inersia
3.
c1, c2 = Konstan Percepatan (learning rate)
R
= Nomor Acak (0-1)
xi,
d = posisi saat partikel pada iterasi ke-i i
pbesti
= posisi sebelumnya terbaik dari partikel ke-i (Abraham, 2009)
III. METODELOGI PENELITIAN
Pada penelitian ini data yang digunakan adalah data yang
tersimpan pada uci repository yaitu sebanyak 101 data. Atribut yang digunakan
sebanyak Sembilan atribut dengan satu label hasil. Dalam melakukan penelitian
ini berikut tahapan penelitan yang dilakukan:
Gambar 2 Tahapan Penelitian yang
digunakan
a.
Pengumpulan Data
Data
diambil dari web yang menyediakan dataset yang dapat digunakan untuk keperluan
penelitian yaitu dataset fertility yang ada uci repository dengan alamat http://archive.ics.uci.edu/ml/datasets/Fertility.
Data yang diolah sebanyak 101 record dengan 9 parameter dan satu label hasil.
Parameter yang digunakan adalah musim saat analisis data, umur, penyakit saat
kecil (misalnya cacar air, gondok, polio), kecelakan atau trauma yang dialami,
pernah dibedah, demam tinggi pada tahun lalu, frekuensi konsumsi alcohol,
kebiasaan merokok, jumlah jam yang dihabiskan untuk duduk perhari. Dan yang
terakhir adalah parameter hasil yaitu output Normal (N), diubah (O). normal
mengidentifikasikan bahwa kondisi air mani tidak mengalami masalah dan kategori
subur dan diubah berarti kondisi air mani bermasalah atau tidak subur.
b. Pengolahan Awal Data
Untuk
mendapatkan data yang berkualitas,
beberapa teknik yang dilakukan adalah sebagai berikut (vecellis, 2009):
(1)
Data validation,
untuk mengidentifikasi dan menghapus data yang ganjil (outlier/noise), data yang tidak konsisten, dan data yang tidak
lengkap (missing value).
(2)
Data integration and Transformation, untuk meningkatkan akurasi dan efisiensi algoritma.
Data yang digunakan dalam penulisan ini bernilai kategorikal.
(3)
Data size reduction and dicrtization, untuk
memperoleh data set dengan jumlah atribut dan record yang lebih sedikit tetapi
bersifat informatif.
Dikarenakan data yang diperoleh dari repository
sehingga data yang diperoleh telah melalui tahapan pengolahan data seperti
diatas. Berikut tranformasi data yang dilakukan oleh pemilik data. Atribut
musin terdapat empat kategori musim dingin, semi, panas dan hujan dikonversi
menjadi -1,-0,0.33,1. Usia pada saat analisis diisi dari 18-36 dikonversi dari
0-1. Penyakit pada masa kecil 1 untuk ya yang mempunyai penyakit dan 2 untuk
tidak punya penyakit
c. Metode
yang diusulkan
Dalam
penelitian ini akan dilakukan perbandingan nilai akurasi antara metode neural
networkn dengan model yang dihasilkan oleh metode neural network yang ditingkatkan akurasinya dengan
menggunakan Particle Swan optimized(PSO).
Berikut ilustrasi penggunaan metode yang diusulkan
dalam penelitian:
Gambar 3
Ilustrasi Penggunaan metode yang Diusulkan
IV. PEMBAHASAN
4.1 Ekperimen dan Pengujian Metode
Dalam
penelitian metode yang digunakan adalah metode Neural network dan tool yang
digunakan untuk mengolah data yang ada adalah RapidMiner. Dari hasil pengolahan
tersebut diperoleh hasil seperti berikut:
Sumber : RapidMiner
Gambar 4 Hasil Neural Network
Neural
net yang dihasilkan adalah multilayer
procreptron, pada pengolahan data neural net terdapat tiga layer. Pada
lapisan pertama adalah layer input,
lapisan kedua hidden layer dan
lapisan layer ketiga adalah layer output.
Pada lapisan input layer terdapat
sembilan node dengan satu node
bias, pada hidden layer terdapat
tujuh node hidden layer dengan satu node bias, dan pada layer output terdapat dua node
yaitu ya dan tidak.
Berikut
adalah langkah-langkah ekperimen yang dilakukan dengan menggunakan tool
RapidMiner untuk pengolahan data dengan metode neural net yang ditingkatkan
akurasinya menggunakan PSO:
Sumber:
Rapidminer
Gambar 5 langkah pertama ekperimen
Double klik model Optimized
maka akan muncul modul seperti berikut:
Sumber:Rapidminer
Gambar 6 langkah kedua ekperimen
Kemudian didalam modul validation pastikan model yang digunakan
adalah neural net, seperti berikut:
Sumber: Pengolahan data
dengan Rapidminer
Gambar 7 langkah ketiga ekperimen
4.2 Pengujian Hasil
Dalam pengujian hasil
ekperimen digunakan penilaian Ckurasi menggunaan kurva ROC dan Confussion Matrix
Berikut adalah confusion
matrix dan kurva ROC untuk mentode neural network saja tanpa dioptimasikan
dengan particle swam optimized (PSO):
Gambar 8 Confusion
Matrix Metode Neural Network
Sumber: hasil pengolahan data dengan Rapidminer
Gambar 9 Kurva ROC
Metode Neural network
Berikut adalah kurva ROC dan confusion matrix dari pengolahan data menggunakan neural
network yang ditingkatkan kinerjanya dengan menggunakan PSO, berikut adalah
gambarnya:
Sumber: Hasil pengolahan data dengan Rapidminer
Gambar 10 Confusion Matrix Neural
Network berbasis PSO
Berikut
tampilan untuk kurva ROC dari metode neural network yang ditingkatkan
kinerjanya dengan menggunakan PSO:
Sumber:Hasil Pengolahan data dengan Rapidminer
Gambar 11 Kurva ROC
neural network berbasis PSO
V. KESIMPULAN
Dari penelitian yang dilakukan
dengan menggunakan data fertility yang diperoleh melalui web uci repository,
kemudian data diolah menggunakan metode neural network dan metode neural
network yang ditingkatkan kinerjanya menggunakan metode optimasi PSO. Maka
diperoleh hasil akurasi yang lebih baik yaitu dengan menggunakan neural network
berbasis PSO yaitu nilai akurasinnya sebesar 92%, jauh lebih tinggi dibandingan
jika hanya menggunakan metode neural network saja yaitu sebesar 88%. Sedangan
untuk. Sehingga dapat disimpulkan bahwa dengan melakukan peningkatan kinerja
metode dengan menggunankan metode optimasi particle swam optimized (PSO) lebih
baik kinerjanya daripada hanya menggunakan metode neural networknya saja.
5.
Referensi
Inhorn, 2002, Global infertility and
the globalization of new reproductive
technologies: illustrations from Egypt, Social Science & Medicine 56 (2003)
1837–1851, Elsevier Science Ltd. All rights reserved.
Gilera etc, 2012, Predicting seminal
quality with artificial intelligence methods, Expert Systems with Applications
39 (2012) 12564–12573
Kolettis, P. N. 2003. Evaluation of the
subfertile man. American Family Physician, 67(10), 2165–2172
Durairaj & Sathyavathi, 2013,
Applying Rough Set Theory for Medical Informatics Data Analysis, International
Journal of Scientific Research in Computer Science and Engineering, Vol-1,
Issue-5 ISSN: 2320-7639
Mileski etc, 2013, Comparison of
Artificial Neural Networks and Logistic Regression Analysis in Pregnancy
Prediction Using the In Vitro Fertilization Treatment, STUDIES IN LOGIC,
GRAMMAR AND RHETORIC 35 (48), ISBN 978–83–7431–392–6 ISSN 0860-150X DOI:
10.2478/slgr-2013-0033
Sivanandam, 2006, Introduction to Data
Mining and its Applications, Springer, New York
Kahki etc, 2013, A model based on
Bayesian Network for prediction of IVF Success Rate, 7thSASTech 2013, Iran,
Bandar-Abbas. 7-8 March
Larose, D. T. (2005). Discovering
Knowledge in Databases. New Jersey: John Willey & Sons Inc.Myatt, Glenn J.
Making Sense of Data: A Practical Guide to Exploratory Data Analysis and Data
Mining. New Jersey: John Wiley & Sons, Inc.
Shukla, A., Tiwari, R., & Kala, R.
(2010). Real Life Application of Soft Computing. Taylor and Francis Groups,
LLC.
Maimon, 2005, Data Mining and Discovery
Handbook Second Edition, ISBN
978-0-387-09822-7 e-ISBN 978-0-387-09823-4, Springer, New York
Vecellis, 2009, Business Intelligence :
Data Mining and Optimization for Decision Making, Ltd. ISBN: 978-0-470-51138-1,
United Kingdom, John Wiley & Sons
Han, J., & Kamber, M. (2007). Data
Mining Concepts and Techniques. San Fransisco: Mofgan Kaufan Publisher Han, J., & Kamber, M. (2007). Data Mining Concepts
and Techniques. San Fransisco: Mofgan Kaufan Publisher
Tidak ada komentar:
Posting Komentar