Kamis, 05 November 2015

Jurnal-PENERAPAN METODE NEURAL NETWORK BERBASIS PARTICLE SWAM OPTIMIZIED UNTUK PREDIKSI KESUBURAN PADA PRIA

PENERAPAN METODE NEURAL NETWORK BERBASIS PARTICLE SWAM OPTIMIZIED UNTUK PREDIKSI KESUBURAN PADA PRIA
Hilda Amalia

 Manajemen Informatika AMIK BSI Jakarta
Jl. RS. Fatmawati no.24
email : Hilda.ham@bsi.ac.id

                                                                                                                                                                                      
ABSTRAK

Tingkat kesuburan merupakan hal yang harus diperhatikan khususnya bagi para pria dewasa ini dikarenakan  ketidaksuburan merupakan masalah global yang terjadi pada pasangan suami istri. ketidaksuburan dapat mengakibatkan pasangan suami istri tidak dapat hamil. Ketidaksuburan pada salah satu pasangan khususnya pria dapat mengakhiri garis keturunan. Tinggi nya tingkat ketidaksuburan  pada masyarakat pada dewasa ini dapat disebabkan oleh beberapa hal diantara faktor lingkungan dan gaya hidup masyarakat saat ini. Penelitian sebelumnya mengenai tingkat kesuburan sudah pernah dilakukan yaitu dengan menggunakan metode artificial neural network dan menghasilkan akurasi 82%. Dalam penulisan ini akan dilakukan peningkatan akurasi metode neural network untuk prediksi kesuburan pria melalui air mani dengan menggunakan metode particle swam optimazed(PSO). Dari hasil penelitian diketahui bahwa penggunaan metode optimasi dapat meningkatkan akurasi metode yang digunakan, dalam penelitian ini diperoleh akurasi yang baru untuk metode neural network yang ditingkatkan kinerjanya menggunakan PSO menjadi 92%.  




I. PENDAHULUAN
Ketidaksuburan merupakan masalah global, yang mempengaruhi rata-rata 8-12 persen pasangan di seluruh dunia. Meskipun jarang diakui secara sosial, ketidaksuburan pada laki-laki merupakan kontribusi untuk setidaknya setengah dari semua kasus  di seluruh dunia dan ketidaksuburan merupakan hal syang paling sulit  untuk mengobati (Inhorn, 2002). Beberapa hal yang mempengaruhi tingkat kesuburan pada pria yaitu dapat disebabkan karena penyakit ataupun juga efek lingkungan dan pekerjaan serta gaya hidup masyarakat (Gilera etc, 2012). Untuk mengevaluasi ketidaksuburan pada  laki-laki, dokter menggunakan data yang diperoleh dari analisis sperma. Analisis air mani adalah prediktor yang baik dari potensi kesuburan pria (Kolettis, 2003). As-sisted Reproductive Technology (ART) adalah salah satu dari banyak perawatan yang tersedia Pilihan untuk menyembuhkan ketidaksuburan. Namun, efisiensi pengobatan ART masih tidak memadai (Mileski etc, 2013). Proses analisis data medis memerlukan canggih teknik untuk pengolahan, penyimpanan dan pengaksesan informasi data. Teknik tradisional tidak cukup mampu untuk menghasilkan hasil yang optimal dari lengkap atau data yang berlebihan melalui proses analisis (Durairaj & Sathyavathi, 2013).
Penggunaan informasi yang efektif dan teknologi sangat penting untuk perawatan kesehatan. Ha ini dibutuhkan oleh organisasi yang bergerak dibidang kesehatan untuk tetap kompetitif pada saat ini. Tantangan yang dihadapi ketika mencoba untuk memahami besar, beragam, dan sering Sumber data yang kompleks dari cukup. Dalam upaya untuk mengubah informasi menjadi pengetahuan, organisasi perawatan kesehatan yang menerapkan teknologi data mining dapat digunakan untuk membantu mengendalikan biaya perawatan dan meningkatkan efektivitas perawatan pasien.
Data mining dapat digunakan untuk membantu memprediksi perilaku pasien masa depan dan untuk meningkatkan program pengobatan. Data mining telah digunakan dalam sejumlah  domain nonmedis (Sivanandam, 2006). Dengan mengidentifikasi pasien berisiko tinggi, dokter akan lebih baik memberikan perawatan pasien hari ini sehingga tidak menimbulkan masalah yang berarti dikemudian hari (sivanandam, 2006).
 Oleh karena itu, perlu dilakukan analisis data menggunakan teknik-teknik data mining. Data mining secara umum sudah diakui sebagai salah satu cara mengektrak data menjadi pengetahuan yang berharga. Penelitian mengenai tingkat kesuburan pada pria dengan menganalisa kwalitas air mani sudah pernah dilakukan dengan metode artifial neural network(Girela etc, 2012), komparasi metode basyien network dan  naïve bayes (Kahki etc, 2013). Dalam penelitian ini metode data minin yang akan digunakan yaitu metode data mining. Dan peningkatan kinerja akurasi metode neural network menggunakan metode optimasi particle swam  optimized(PSO).
II. KAJIAN LITERATUR
2.1 Data  Mining
Data mining adalah analisis data yang besar pada  set data  untuk menemukan hubungan terduga dan untuk meringkas data dalam cara baru yang sama-sama dimengerti dan berguna bagi pemilik data (Larose, 2007). data mining seharusnya lebih tepat bernama "pertambangan pengetahuan dari data”. Banyaknya data, ditambah dengan kebutuhan untuk alat analisis data yang kuat, memiliki digambarkan sebagai situasi miskin kaya data tetapi informasi. Yang tumbuh cepat, luar biasa jumlah data, dikumpulkan dan disimpan dalam repositori data yang besar dan banyak, memiliki jauh melebihi kemampuan manusia untuk pemahaman tanpa alat yang kuat.
Banyaknya data, ditambah dengan kebutuhan untuk alat analisis data yang kuat, telah digambarkan sebagai kaya data tapi miskin informasi. Jumlah data yang tumbuh secara cepat, dikumpulkan dan disimpan dalam repositori data yang besar dan banyak, telah jauh melampaui kemampuan manusia untuk memahami data-data tesebut tanpa mampu mengelolah data tersebut. Akibatnya, data yang dikumpulkan dalam repositori data yang besar menjadi ”kuburan data” (Han & Kamber, 2007).

2.2 Metode Neural Network
Neural network adalah suatu usaha untuk meniru fungsi otak manusia. Otak manusia diyakini terdiri dari jutaan unit pengolahan kecil, yang disebut neuron, yang bekerja secara parallel (Shukla, Tiwari, & Kala, 2010). Generalized Regression neural Network (GRNN) Generalisasi adalah kemampuan ANN untuk memberikan jawaban yang benar untuk input yang tidak diketahui. Generalisasi adalah ukuran dari seberapa baik sistem telah dilatih. Generalisasi diukur dengan kinerja dari sistem untuk mengatur data pengujian. Kemampuan generalisasi ANN itu maka harus setinggi mungkin. (Shukla, Tiwari, & Kala, 2010).
Penemuan algoritma backpropagation untuk multilayer perceptron, merupakan metode yang sistematis untuk training sehingga bisa dilakukan dan lebih efisien. Algoritma backpropagation berasal dari learning rule Widrow dan Hoff, disusun oleh Werbos (1974), dibuat oleh Parker (1985), Rumelhart Hinton, Williams (Rumelhart dan Williams, 1986) dan peneliti lainnya (Maimon, 2005).
Multilayer perceptron (MLP) disebut juga multilayer feedforward neural network merupakan algoritma yang paling luas digunakan. Menurut Wong, Bodnovich dan Selvi (1997), sekitar 95% aplikasi bisnis yang menggunakan neural network, memakai algoritma ini (Vecellis, 2009).
Langkah pembelajaran dalam algoritma backproparagation adalah sebagai beikut (Myatt, 2007):
  1. Inisialisasi bobot jaringan secara acak (biasanya antara -0.1 sampai 1.0).
  2. Untuk setiap data pada data training, hitung input untuk simpul berdasarkan nilai input bobot jaringan saat itu, menggunakan rumus:

                                                                

Keterangan:
Oi            = output simpul i dari layer sebelumnya
Wij          = bobot relasi dari simpul i pada layer sebelumnya ke simpul j.
                θj             = bias (sebagai pembatas).
                Berdasarkan input dari langkah dua, selanjutnya membangkitkan output untuk simpul menggunakan fungsi aktifasi sigmoid:

                              

                                                            
4.             Hitung nilai error antara nilai yang diprediksi dengan nilai yang sesungguhnya menggunakan rumus:
              

Keterangan:
Outputj                  = output actual dari simpul j.
Targetj                   = nilai target yang sudah diketahui pada data training
5.             Setelah nilai error dihitung, selanjutnya dibalik ke layer sebelumnya (backpropagated). Untuk menghitung nilai error pada hidden layer menggunakan rumus:
              
                                                                               
               

Keterangan:
Outputj = output actual dari simpul j
Errork    = error simpul k.
wjk          = bobot relasi dari simpul j ke simpul k pada layer berikutnya
6.             Nilai error yang dihasilkan dari langkah sebelumnya digunakan untuk memperbaharui bobot relasi menggunakan rumus:
              

                          

                Keterangan:
                wij          = bobot relasi dari unit i pada layer sebelumnya ke unit j
l               = learning rate (konstanta, nilainya antara 0 sampai dengan 1)
                errorj     = error pada output layer simpul j
                outputi   = output dari simpul
2.3 Particle Swam optimized
                Optimization Particle Swarm (PSO) adalah algoritma pencarian berbasis populasi dan diinisialisasi dengan populasi solusi acak yang disebut partikel (Abraham, 2006). PSO merupakan metode pencarian penduduk yang berasal dari studi tentang pergerakan sekelompok burung atau ikan. Serupa dengan algoritma genetika (GA), PSO melakukan pencarian menggunakan populasi (kawanan) individu (partikel) yang akan memperbaharui dari iterasi ke iterasi.
                Cari solusi yang optimal, setiap partikel bergerak ke arah posisi terbaik sebelumnya dan posisi terbaik global. Sebagai contoh, partikel-i dinyatakan sebagai: xi = (xi1, xi2, .... xid) dalam ruang d-dimensi. Posisi sebelumnya terbaik dari partikel-i disimpan dan dinyatakan sebagai pbesti = (pbesti, 1, pbesti, 2, ... pbesti, d). Partikel terbaik Index antara semua partikel dalam kelompok kawanan dinyatakan sebagai gbestd. Kecepatan partikel I-th dinyatakan sebagai: vi = (vi, 1, vi, 2, .... vi, d). Modifikasi kecepatan dan posisi setiap partikel dapat dihitung dengan menggunakan kecepatan arus dan jarak pbesti, d untuk gbestd seperti yang ditunjukkan dalam persamaan berikut:
1. vi, vi d = w *, d + c1 * R * (pbesti, d - xi, d) + c2 * R * (gbestd - xi, d)
2.  xid = xi, vi + d, d
dimana:
Vi, d = kecepatan partikel pada iterasi ke-i i
w = faktor bobot inersia
3. c1, c2 = Konstan Percepatan (learning rate)
R = Nomor Acak (0-1)
xi, d = posisi saat partikel pada iterasi ke-i i
pbesti = posisi sebelumnya terbaik dari partikel ke-i (Abraham, 2009)

III. METODELOGI PENELITIAN
Pada penelitian ini data yang digunakan adalah data yang tersimpan pada uci repository yaitu sebanyak 101 data. Atribut yang digunakan sebanyak Sembilan atribut dengan satu label hasil. Dalam melakukan penelitian ini berikut tahapan penelitan yang dilakukan:













 






















Gambar 2 Tahapan Penelitian yang digunakan

a.         Pengumpulan Data
Data diambil dari web yang menyediakan dataset yang dapat digunakan untuk keperluan penelitian yaitu dataset fertility yang ada uci repository dengan alamat http://archive.ics.uci.edu/ml/datasets/Fertility. Data yang diolah sebanyak 101 record dengan 9 parameter dan satu label hasil. Parameter yang digunakan adalah musim saat analisis data, umur, penyakit saat kecil (misalnya cacar air, gondok, polio), kecelakan atau trauma yang dialami, pernah dibedah, demam tinggi pada tahun lalu, frekuensi konsumsi alcohol, kebiasaan merokok, jumlah jam yang dihabiskan untuk duduk perhari. Dan yang terakhir adalah parameter hasil yaitu output Normal (N), diubah (O). normal mengidentifikasikan bahwa kondisi air mani tidak mengalami masalah dan kategori subur dan diubah berarti kondisi air mani bermasalah atau tidak subur.
b.             Pengolahan Awal Data
Untuk mendapatkan  data yang berkualitas, beberapa teknik yang dilakukan adalah sebagai berikut (vecellis, 2009):
(1)  Data validation, untuk mengidentifikasi dan menghapus data yang ganjil (outlier/noise), data yang tidak konsisten, dan data yang tidak lengkap (missing value).
(2)  Data integration and Transformation, untuk meningkatkan akurasi dan efisiensi algoritma. Data yang digunakan dalam penulisan ini bernilai kategorikal.
(3)  Data size reduction and dicrtization, untuk memperoleh data set dengan jumlah atribut dan record yang lebih sedikit tetapi bersifat informatif.

Dikarenakan data yang diperoleh dari repository sehingga data yang diperoleh telah melalui tahapan pengolahan data seperti diatas. Berikut tranformasi data yang dilakukan oleh pemilik data. Atribut musin terdapat empat kategori musim dingin, semi, panas dan hujan dikonversi menjadi -1,-0,0.33,1. Usia pada saat analisis diisi dari 18-36 dikonversi dari 0-1. Penyakit pada masa kecil 1 untuk ya yang mempunyai penyakit dan 2 untuk tidak punya penyakit

c.      Metode yang diusulkan
Dalam penelitian ini akan dilakukan perbandingan nilai akurasi antara metode neural networkn dengan model yang dihasilkan oleh metode neural network  yang ditingkatkan akurasinya dengan menggunakan Particle Swan optimized(PSO).
Berikut ilustrasi penggunaan metode yang diusulkan dalam penelitian:
 

















Gambar 3 Ilustrasi Penggunaan metode yang Diusulkan


IV. PEMBAHASAN
4.1 Ekperimen dan Pengujian Metode
             Dalam penelitian metode yang digunakan adalah metode Neural network dan tool yang digunakan untuk mengolah data yang ada adalah RapidMiner. Dari hasil pengolahan tersebut diperoleh hasil seperti berikut:


                Sumber : RapidMiner
Gambar 4 Hasil Neural Network


Neural net yang dihasilkan adalah multilayer procreptron, pada pengolahan data neural net terdapat tiga layer. Pada lapisan pertama adalah layer input, lapisan kedua hidden layer dan lapisan layer ketiga adalah layer output. Pada lapisan input layer terdapat sembilan node dengan  satu node bias, pada hidden layer terdapat tujuh node hidden layer dengan satu node bias, dan pada layer output terdapat dua node yaitu ya dan tidak.
Berikut adalah langkah-langkah ekperimen yang dilakukan dengan menggunakan tool RapidMiner untuk pengolahan data dengan metode neural net yang ditingkatkan akurasinya menggunakan PSO:

Sumber: Rapidminer
Gambar 5 langkah pertama ekperimen

Double klik model Optimized maka akan muncul modul seperti berikut:

Sumber:Rapidminer
Gambar 6 langkah kedua ekperimen

Kemudian didalam modul validation pastikan model yang digunakan adalah neural net, seperti berikut:
Sumber: Pengolahan data dengan Rapidminer
Gambar 7 langkah ketiga ekperimen

4.2 Pengujian Hasil
Dalam pengujian hasil ekperimen digunakan penilaian Ckurasi menggunaan kurva ROC dan Confussion Matrix
Berikut adalah confusion matrix dan kurva ROC untuk mentode neural network saja tanpa dioptimasikan dengan particle swam optimized (PSO):


Gambar 8 Confusion Matrix Metode Neural Network
Sumber: hasil pengolahan data dengan Rapidminer
Gambar 9 Kurva ROC Metode Neural network

Berikut adalah kurva ROC dan confusion matrix  dari pengolahan data menggunakan neural network yang ditingkatkan kinerjanya dengan menggunakan PSO, berikut adalah gambarnya:

Sumber: Hasil pengolahan data dengan Rapidminer
Gambar 10 Confusion Matrix Neural Network berbasis PSO
Berikut tampilan untuk kurva ROC dari metode neural network yang ditingkatkan kinerjanya dengan menggunakan PSO:
Sumber:Hasil Pengolahan data dengan Rapidminer
Gambar 11 Kurva ROC neural network berbasis PSO

V. KESIMPULAN
                Dari penelitian yang dilakukan dengan menggunakan data fertility yang diperoleh melalui web uci repository, kemudian data diolah menggunakan metode neural network dan metode neural network yang ditingkatkan kinerjanya menggunakan metode optimasi PSO. Maka diperoleh hasil akurasi yang lebih baik yaitu dengan menggunakan neural network berbasis PSO yaitu nilai akurasinnya sebesar 92%, jauh lebih tinggi dibandingan jika hanya menggunakan metode neural network saja yaitu sebesar 88%. Sedangan untuk. Sehingga dapat disimpulkan bahwa dengan melakukan peningkatan kinerja metode dengan menggunankan metode optimasi particle swam optimized (PSO) lebih baik kinerjanya daripada hanya menggunakan metode neural networknya saja.



5. Referensi
Inhorn, 2002, Global infertility and the globalization of  new reproductive technologies: illustrations from Egypt, Social Science & Medicine 56 (2003) 1837–1851, Elsevier Science Ltd. All rights reserved.
Gilera etc, 2012, Predicting seminal quality with artificial intelligence methods, Expert Systems with Applications 39 (2012) 12564–12573
Kolettis, P. N. 2003. Evaluation of the subfertile man. American Family Physician, 67(10), 2165–2172
Durairaj & Sathyavathi, 2013, Applying Rough Set Theory for Medical Informatics Data Analysis, International Journal of Scientific Research in Computer Science and Engineering, Vol-1, Issue-5 ISSN: 2320-7639
Mileski etc, 2013, Comparison of Artificial Neural Networks and Logistic Regression Analysis in Pregnancy Prediction Using the In Vitro Fertilization Treatment, STUDIES IN LOGIC, GRAMMAR AND RHETORIC 35 (48), ISBN 978–83–7431–392–6 ISSN 0860-150X DOI: 10.2478/slgr-2013-0033
Sivanandam, 2006, Introduction to Data Mining and its Applications, Springer, New York
Kahki etc, 2013, A model based on Bayesian Network for prediction of IVF Success Rate, 7thSASTech 2013, Iran, Bandar-Abbas. 7-8 March
Larose, D. T. (2005). Discovering Knowledge in Databases. New Jersey: John Willey & Sons Inc.Myatt, Glenn J. Making Sense of Data: A Practical Guide to Exploratory Data Analysis and Data Mining. New Jersey: John Wiley & Sons, Inc.
Shukla, A., Tiwari, R., & Kala, R. (2010). Real Life Application of Soft Computing. Taylor and Francis Groups, LLC.
Maimon, 2005, Data Mining and Discovery Handbook Second Edition, ISBN 978-0-387-09822-7 e-ISBN 978-0-387-09823-4, Springer, New York
Vecellis, 2009, Business Intelligence : Data Mining and Optimization for Decision Making, Ltd. ISBN: 978-0-470-51138-1, United Kingdom, John Wiley & Sons

Han, J., & Kamber, M. (2007). Data Mining Concepts and Techniques. San Fransisco: Mofgan Kaufan Publisher Han, J., & Kamber, M. (2007). Data Mining Concepts and Techniques. San Fransisco: Mofgan Kaufan Publisher

Tidak ada komentar:

Posting Komentar