KLASIFIKASI NON LINIER - Teknik Elektro UGM
KLASIFIKASI NON LINIER - Teknik Elektro UGM
KLASIFIKASI NON LINIER - Teknik Elektro UGM
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
minimum lokal. Dalam [Mill 96] prosedur deterministic annealing digunakan untuk melatih<br />
jaringan, dengan potensi ditingkatkan untuk menghindari minimum lokal (lihat Bab 15).<br />
Pilihan terakhir dari fungsi biaya tergantung pada masalah yang spesifik di bawah<br />
pertimbangan. Namun, seperti yang ditunjukkan dalam [Kaya 91], di sejumlah praktis situasi<br />
penggunaan alternatif, untuk kuadrat terkecil, fungsi biaya tidak selalu mengarah pada<br />
peningkatan kinerja substansial.<br />
Sebuah Kerangka kerja Bayesian untuk Pelatihan Jaringan<br />
Semua fungsi biaya sejauh ini dianggap bertujuan untuk komputasi satu set nilai optimal<br />
untuk parameter yang tidak diketahui dari jaringan. Sebuah pemikiran alternatif adalah<br />
melihat fungsi distribusi probabilitas dari bobot diketahui, ω, dalam bobot ruang. Gagasan di<br />
balik pendekatan ini berasal dari teknik inferensi Bayesian yang digunakan untuk perkiraan<br />
suatu pdf parametrik yang tidak diketahui, sebagaimana kita bahas dalam Bab 2. Mengikuti<br />
langkah-langkah dasar untuk jenis pelatihan jaringan, yang dikenal sebagai pembelajaran<br />
Bayesian, adalah (misalnya, [Mack 92a]):<br />
Asumsikan model untuk distribusi prior p(ω) dari bobot. Ini harus agak luas dalam bentuk,<br />
untuk memberikan kesempatan yang sama untuk berbagai nilai agak besar.<br />
Misalkan Y = {y (i), i = 1,2,..., N} menjadi set pelatihan vektor output yang diinginkan untuk<br />
data masukan yang diberikan set X = {x (i), i = 1,2,. . . N}. Asumsikan model untuk fungsi<br />
likelihood p(Y│ω), misalnya, Gaussian 4 . ( 4 Strictly berbicara kita harus menulis P (Y│ω, X).<br />
Namun semua probabilitas dan pdf dikondisikan pada X dan kami menghilangkan untuk<br />
kenyamanan notasi).<br />
Ini pada dasarnya model distribusi eror antara output yang benar dan nilai-nilai yang<br />
diinginkan, dan ini adalah tahap dimana data input pelatihan datang ke tempat kejadian.<br />
Menggunakan teorema Bayes, kita memperoleh<br />
dimana<br />
. Pdf posterior yang dihasilkan akan lebih<br />
berbentuk tajam sekitar nilai ω 0 , karena telah belajar dari data pelatihan yang tersedia.<br />
Menafsirkan output yang benar dari suatu jaringan,<br />
, karena masingmasing<br />
kelas probabilitas, dikondisikan pada input x dan vektor bobot ω, probabilitas kelas<br />
bersyarat dihitung dengan rata-rata lebih dari semua ω [Mack 92b]:<br />
Biaya komputasi utama yang terkait dengan jenis teknik ini dibutuhkan integrasi dalam ruang<br />
multidimensi. Ini bukan tugas yang mudah, dan berbagai implementasi praktis telah<br />
diusulkan dalam literatur. Lebih lanjut diskusi tentang masalah ini adalah di luar cakupan<br />
buku ini. Sebuah pengantar yang bagus untuk pembelajaran Bayesian, termasuk diskusi<br />
tentang implementasi praktis yang terkait, disediakan dalam [Bish 95].