28.11.2014 Views

KLASIFIKASI NON LINIER - Teknik Elektro UGM

KLASIFIKASI NON LINIER - Teknik Elektro UGM

KLASIFIKASI NON LINIER - Teknik Elektro UGM

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

minimum lokal. Dalam [Mill 96] prosedur deterministic annealing digunakan untuk melatih<br />

jaringan, dengan potensi ditingkatkan untuk menghindari minimum lokal (lihat Bab 15).<br />

Pilihan terakhir dari fungsi biaya tergantung pada masalah yang spesifik di bawah<br />

pertimbangan. Namun, seperti yang ditunjukkan dalam [Kaya 91], di sejumlah praktis situasi<br />

penggunaan alternatif, untuk kuadrat terkecil, fungsi biaya tidak selalu mengarah pada<br />

peningkatan kinerja substansial.<br />

Sebuah Kerangka kerja Bayesian untuk Pelatihan Jaringan<br />

Semua fungsi biaya sejauh ini dianggap bertujuan untuk komputasi satu set nilai optimal<br />

untuk parameter yang tidak diketahui dari jaringan. Sebuah pemikiran alternatif adalah<br />

melihat fungsi distribusi probabilitas dari bobot diketahui, ω, dalam bobot ruang. Gagasan di<br />

balik pendekatan ini berasal dari teknik inferensi Bayesian yang digunakan untuk perkiraan<br />

suatu pdf parametrik yang tidak diketahui, sebagaimana kita bahas dalam Bab 2. Mengikuti<br />

langkah-langkah dasar untuk jenis pelatihan jaringan, yang dikenal sebagai pembelajaran<br />

Bayesian, adalah (misalnya, [Mack 92a]):<br />

Asumsikan model untuk distribusi prior p(ω) dari bobot. Ini harus agak luas dalam bentuk,<br />

untuk memberikan kesempatan yang sama untuk berbagai nilai agak besar.<br />

Misalkan Y = {y (i), i = 1,2,..., N} menjadi set pelatihan vektor output yang diinginkan untuk<br />

data masukan yang diberikan set X = {x (i), i = 1,2,. . . N}. Asumsikan model untuk fungsi<br />

likelihood p(Y│ω), misalnya, Gaussian 4 . ( 4 Strictly berbicara kita harus menulis P (Y│ω, X).<br />

Namun semua probabilitas dan pdf dikondisikan pada X dan kami menghilangkan untuk<br />

kenyamanan notasi).<br />

Ini pada dasarnya model distribusi eror antara output yang benar dan nilai-nilai yang<br />

diinginkan, dan ini adalah tahap dimana data input pelatihan datang ke tempat kejadian.<br />

Menggunakan teorema Bayes, kita memperoleh<br />

dimana<br />

. Pdf posterior yang dihasilkan akan lebih<br />

berbentuk tajam sekitar nilai ω 0 , karena telah belajar dari data pelatihan yang tersedia.<br />

Menafsirkan output yang benar dari suatu jaringan,<br />

, karena masingmasing<br />

kelas probabilitas, dikondisikan pada input x dan vektor bobot ω, probabilitas kelas<br />

bersyarat dihitung dengan rata-rata lebih dari semua ω [Mack 92b]:<br />

Biaya komputasi utama yang terkait dengan jenis teknik ini dibutuhkan integrasi dalam ruang<br />

multidimensi. Ini bukan tugas yang mudah, dan berbagai implementasi praktis telah<br />

diusulkan dalam literatur. Lebih lanjut diskusi tentang masalah ini adalah di luar cakupan<br />

buku ini. Sebuah pengantar yang bagus untuk pembelajaran Bayesian, termasuk diskusi<br />

tentang implementasi praktis yang terkait, disediakan dalam [Bish 95].

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!