28.11.2014 Views

KLASIFIKASI NON LINIER - Teknik Elektro UGM

KLASIFIKASI NON LINIER - Teknik Elektro UGM

KLASIFIKASI NON LINIER - Teknik Elektro UGM

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

memenuhi kriteria tertentu, yang menjamin bahwa algoritma gradient descent menyatu untuk<br />

solusi tersebut, asalkan satu ada. Kelas ini fungsi biaya dikenal sebagai fungsi well-formed.<br />

Sekarang kita akan menyajikan fungsi biaya jenis ini, yang cocok untuk tugas-tugas<br />

pengenalan pola.<br />

Jaringan multilayer melakukan pemetaan nonlinear dari vektor input x ke nilai output<br />

untuk masing-masing node output k = 1,2,. . . k L , dimana ketergantungan<br />

pemetaan pada nilai-nilai bobot ditampilkan secara eksplisit. Dalam bab 3 kita telah melihat<br />

bahwa, jika kita mengadopsi fungsi kuadrat biaya termurah dan output yang diinginkan y k<br />

adalah biner (milik atau tidak dalam kelas ω k ), kemudian untuk nilai optimal bobot ω* output<br />

yang sesuai jaringan, ŷ k , adalah pengaruh optimal kuadrat terkecil dari probabilitas<br />

posterior P (ω k │x) (pertanyaan tentang baik atau buruk perkiraan ini akan menarik untuk<br />

kami). Pada titik ini kita akan mengadopsi interpretasi probabilistik dari output riil ŷ k sebagai<br />

dasar fungsi biaya kami akan dibangun. Mari kita berasumsi bahwa output yang diinginkan<br />

nilai-nilai, ŷ k , bersifat independen variabel-variabel biner acak dan ŷ k yang masing-masing<br />

probabilitas posterior bahwa variabel acak adalah 1 [Hint90, Baum 88].<br />

Fungsi biaya cross-entropi kemudian didefinisikan oleh<br />

J mengambil nilai minimum ketika y k (i) = ŷ k (i) dan untuk minimum nilai respon yang<br />

diinginkan biner adalah nol. Ada berbagai penafsiran dari fungsi biaya [Hint 90, Baum 88,<br />

Gish 90, Rich 91]. Mari kita mempertimbangkan, untuk contoh, vektor keluaran y(i) bila x(i)<br />

muncul di input. Ini terdiri dari 1 di node kelas benar dan nol untuk lainnya. Jika kita<br />

memperhitungkan bahwa probabilitas node k menjadi l(0) adalah ŷ k (i)(l - ŷ k (i)) dan dengan<br />

mempertimbangkan node secara independen, kemudian<br />

dimana ketergantungan pada i telah tertekan untuk kenyamanan notasi. Kemudian mudah<br />

untuk memeriksa bahwa hasil J dari loglikelihood negatif pelatihan sepasang sampel. Jika<br />

y k (i) adalah probabilitas benar pada (0,1) kemudian mengurangkan nilai minimum dari J<br />

(4.30) menjadi<br />

Untuk nilai biner y k di atas masih berlaku jika kita menggunakan nilai batas 0 ln0 =0.<br />

Hal ini tidak sulit untuk menunjukkan(Masalah 4.5) bahwa fungsi biaya cross entropi<br />

tergantung pada kesalahan relatif dan bukan pada kesalahan mutlak, seperti pasangan<br />

kuadrat kecil, sehingga memberikan bobot yang sama untuk nilai kecil dan besar.<br />

Selanjutnya, telah menunjukkan bahwa itu memenuhi kondisi fungsi terbentuk baik [Adal<br />

97]. Akhirnya, dapat ditunjukkan bahwa mengadopsi fungsi biaya cross entropi dan nilai

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!