Vektör Makinaları Temelli Hiperspektral Sınıflandırma için Seyreklik ...

More documents

Recommendations

Info

$Page 1 %XODQÕN 6 ]JHo LOH *|U QW 6WDELOL]DV\RQX M ...$

T ( φ( x) = ( φ1( x) , φ2( x) , K , φM( x) ) ) doğrusal ağırlıklandırılmış toplamı olarak ifade edilen fonksiyonlar ( y ( x ) ) ile tanımlanmaktadır. M ∑ i= 1 T ( ) ( ) y( xw ; ) = wφx = wφ x (1) i i Eğitim aşamasında amaç, daha önceden görülmemiş giriş vektörlerinin hangi sınıfta olduğunu doğru tahmin edebilmek amacı ile eğitim verisindeki her i x ile ilişkili i w parametrelerini bulmaktır. Eğitim işlemi sırasında i w parametrelerin çoğunluğu otomatik olarak sıfırlanmaktadır ve sıfırlanmayan w i değerleri ile ilişkili giriş vektörleri ilgililik vektörleri olmakta ve test aşamasında kullanılmaktadır. Destek vektör makineleri [3] denetimli (supervised) sınıflandırma ve regresyon için gelişmiş teknoloji sunmaktadır. DVM’ler, öğrenme boyunca, ayırma düzlemi (aşırı düzlem) ile bunun her iki tarafında bulunan veri örnekleri arasındaki mesafenin maksimum olması için düzlemin pozisyonunu optimize etmektedir. DVM iki sınıfa ait örnekler arasındaki karar yüzeyini oluştururken yüzeyin iki sınıfa olan uzaklığını en yüksek dereceye çıkarmaya çalışmaktadır. DVM karar fonksiyonu olarak denklem (2)’yi kullanmaktadır. N y( xw ; ) = wK xx , + w (2) ∑ i= 1 ( ) 0 i i Burada i w her x i ile ilişkili ağırlık parametresini, ( ) , K ⋅ ⋅ kernel fonksiyonunu göstermektedir. DVM [3] son zamanlarda multispektral [4] ve hiperspektral [5] görüntülerde regresyon ve sınıflandırma problemlerini çözmek için uygulanmıştır. DVM hakkında daha ayrıntılı bilgi için [3-5]’e bakılabilir. Destek vektör makineleri denetimli (supervised) sınıflandırma için gelişmiş teknoloji olmasına rağmen olasılıksal çıkış verememe, ödünleşim parametre hesabı gereksinimi (örneğin C değeri) ve Mercer kernel fonksiyonlarına bağımlılık gibi dezavantajları vardır. DVM için bahsedilen dezavantajlar, DVM’nin Bayes davranış gösteren biçimi olan İVM sınıflandırma yöntemi kullanılarak çözülmektedir. Ayrıca İVM az sayıda kernel fonksiyonu gerektirmektedir. Destek vektör makineleri ile karşılaştırıldığında sınıflandırma (test) süresi İVM kullanılarak, daha az kernel fonksiyonu kullanılması nedeni ile azalmaktadır. t ∈ 0,1 olarak İki sınıflı sınıflandırma için hedef bilgisi { } alınabilmektedir. Burada sadece iki değer (0 ve 1) olduğundan dolayı ptw ( ) için Bernoulli dağılımı kullanılmaktadır. − y Lojistik sigmoid bağlantı fonksiyonu σ ( y) = 1/(1 + e ) doğrusal model üretmek amacı ile y( x ) ’e uygulanmaktadır. Bernoulli dağılımı kullanılarak benzerlik ifadesi tn ∈{ 0,1} için denklem (3)’de gösterildiği gibi ifade edilmektedir. n N ∏ { } { } 1 tn ⎡ ⎤ p( tw) = σ y( xn; w) ⎣1 −σ y( xn; w ) ⎦ n (3) n= 1 Ağırlık parametrelerinin önsel olasılığı denklem 4 ile gösterilmektedir. N p( w α ) = ∏ i= 1 2 αi αiwi exp( − ) 2π 2 (4) Burada = ( α , α , , α ) T α 1 2 K N hiperparametreleri ifade etmektedir. Bayes teoremi kullanılarak ağırlık parametrelerinin sonsal olasılıkları hesaplanmaktadır. p( tw) p( wα) p( wtα , ) = p( t α) Burada p( tw ) benzerliği, p( w α ) önsel olasılığı, p( t α ) ise kanıtı (evidence) göstermektedir. w değerleri analitik olarak elde edilemez. Bu nedenle [10]’de kullanılan Laplace yaklaşım prosedürü w değerlerini elde etmek için kullanılmaktadır. Geçerli α değerleri ile ilişkili w ağırlık değerleri sonsal (posterior) dağılım kullanılarak bulunmaktadır. pw ( / , tα) doğrusal olarak pt (/ wpw ) ( / a ) ile orantılıdır. Bu nedenle maksimum w’yi bulmak için denklem (6) kullanılabilmektedir. log { p( tw) p( wα) } = N 1 T ∑[ tnlog yn + (1 −tn)log(1 − yn) ] − wAw 2 (6) n= 1 { ( ; ) } yn = σ yxn w ’dir. Sonsal olasılık ifadesi geçerli α değerlerini kullanarak en olası w değerlerini bulmak için aşamalı çözüm kullanılmaktadır. Denklem (6) düzenlenmiş logistik logaritmik benzerlik fonksiyonudur ve aşamalı en büyüklemeyi gerektirmektedir. En olası w değerlerini bulmak için aşamalı yeniden ağırlıklandırılmış en yakın kareler yöntemi (‘iteratively-reweighed least-squares’) [11] kullanılmaktadır. Denklem (6) ile gösterilen ifadenin iki kere w’ye bağlı türevi alınarak Hessian matrisi elde edilmektedir ve elde edilen ifade denklem (7) ile gösterilmektedir. T ∇∇ log p( wtα , ) =− ( Φ ΒΦ+ A ) (7) w w wMP Β ( 1 2 −t (5) Β = diag( β , β ,..., β ) ) köşegen matrisidir ve { yx ( ) } 1 { yx ( ) } N βn = σ n ⎡⎣ −σ n ⎤⎦ ile ifade edilmektedir. Hessian denkleminin değili alınırak ve terslenerek kovaryans matrisi ∑ elde edilmektedir. Σ = ( Φ ΒΦ+ A ) T −1 T w ΣΦ Βt ˆ MP = ˆ −1 t = Φw MP + Β ( t−y ) Yukarıdaki denklemler genelleştirilmiş yakın kareler probleminin çözülmesi sonucu oluşmaktadır. w MP değerlerini (8)
elde ettikten sonra i γ α = denklemini α değerleri 2 , yeni i i wi kullanarak güncellenmektedir. Burada w i , i. ortalama sonsal ağırlık ve i 1 i ii, N γ α = − ’dir. N ii kovaryans matrisinin i. köşegen elemanıdır. Optimizasyon işlemleri sırasında birçok α i yüksek değerler almakta ve bu nedenle ilişkili ağırlık parametreleri atılmaktadır ve seyreklik sağlanmaktadır. 3. DVM ve İVM Öncesi Ön-Bölütleme DVM ve İVM eğitim aşamasından önce eğitim verisini azaltarak hiperspektral verinin sıkıştırılması amacı ile kortalama [1] ve geliştirilmiş faz korelasyonu [2] olmak üzere iki farklı bölütleme yöntemi kullanılmaktadır. Ön bölütlenmiş DVM ve İVM algoritmasında başlangıç olarak eğitim verisi, yöntemlerden biri kullanılarak boyut azaltmak amacı ile bölütlenmektedir. Her bir sınıf için oluşturulan küme sayısı her bir sınıftaki eğitim verisi sayısı ile ilişkilidir. Düşük eğitim verisine sahip olan bir sınıf düşük küme sayısına sahip olmaktadır. Bölütleme işleminden sonra her kümenin ortalama vektörü bu kümenin özellik vektörü olarak alınmaktadır ve elde edilen bu özellik vektörleri DVM ve İVM eğitim aşamasında kullanılmaktadır. 4. RANSAC DVM ve İVM RANSAC yaklaşımı [12]’da önerilmiştir. Bu çalışma kapsamında önerilen RANSAC DVM ve İVM yönteminde eğitim verisinden rasgele alt kümeler seçilmektedir. İVM sınıflandırma için ilgililik vektörleri, DVM sınıflandırma için destek vektörleri bu alt kümelerin eğitim aşamasında kullanılmasıyla elde edilmektedir. Eğitim verisinden seçilen alt küme dışında kalan diğer eğitim verileri bağımsız geçerlilik sınaması aşamasında kullanılarak sınıflandırma başarımı hesaplanmaktadır ve eğer sınıflandırma başarımı yüksek ise, eğitim kümesinden rasgele seçilen o veri seti için elde edilen vektörler test verisinde de kullanılarak sınıflandırma işlemi gerçekleştirilmektedir. Sınıflandırma başarımı istenen değerde değilse aynı işlem yeni alt küme seçilerek tekrar gerçekleştirilmektedir. Sınıflandırma başarımının istenen kadar yüksek olmaması durumunda sürekli rasgele veriler seçilerek işlem süresinin uzamasını engellemek amacı ile maksimum sınıflandırma başarımına sahip veri kümesinin eğitilmesi sonucu oluşan ilgililik vektörleri ve destek vektörleri sınıflandırma (test) aşamasında kullanılmaktadır. 5. Deneysel Sonuçlar DVM ve İVM sınıflandırma yöntemleri 220 bant içeren 1992 yılında kuzeybatı Indiana’nın Indian Pine test alanında alınan hiperspektral görüntüsüne uygulanmıştır. Atmosferik gürültü içeren bantlar atılarak 200 bant kullanılmıştır. Özgün sınıf bilgisi verisinde 16 sınıf bulunmaktadır. Fakat, bazı sınıfların eleman sayısı çok düşük olduğundan veri miktarı büyük olan 9 sınıf seçilerek, bu sınıflar 4757 eğitim verisi ve 4588 test verisi elde etmek için kullanılmıştır. Her sınıf için seçilen eğitim ve test verilerinin miktarları Tablo 1’de gösterilmektedir. DVM ve İVM sınıflandırma için en sık kullanılan kerneller doğrusal, çok terimli ve radyal taban kernel fonksiyonlarıdır. Bu çalışmada İVM ve DVM sınıflandırma için RTF kerneli kullanılmıştır. Radyal tabanlı kernel fonksiyonu: 2 K( x , x ) = exp( −γx −x ) (9) i j i j Hızlı eğitim süresi sağladığı için çoklu DVM ve İVM sınıflandırma için bire-bir çoklu sınıflandırma [3] kullanılmıştır. İVM yöntemi ikili sınıflandırma ile sınırlandırılmadığı halde pratikte çoklu sınıflandırma kullanımı azdır ve Hessian matrisinin boyutu sınıf sayısı artıkça arttığı için işlem yükünü arttırmaktadır. Tablo 2 ve Tablo 3 farklı sıkıştırma oranlarında DVM ve İVM sınıflandırma sonuçlarını göstermektedir. Elde edilen sonuçlarda DVM sınıflandırma için C parametresi 40 ve DVM ve İVM sınıflandırmada kullanılan RTF kerneli için gama değeri (γ ) 2 seçilmiştir. Hiperspektral görüntünün ön bölütlenmiş İVM ve DVM ile sınıflandırılması sonucu elde edilen sınıflandırma başarımları ve İVM sınıflandırma için kullanılan İV sayısı DVM sınıflandırma için kullanılan DV sayısı farklı kernel parametreleri için Tablo 4’de gösterilmektedir. SB sınıflandırma başarımını göstermektedir. Ön bölütleme işlemi uygulanmadan direk İVM ve DVM sınıflandırma sonuçları Tablo 6’da verilmektedir. Deneysel sonuçlar İVM sınıflandırma yönteminin DVM ile karşılaştırıldığında benzer sınıflandırma başarımının daha az kernel fonksiyonu ile elde edildiğini göstermektedir. Seyreklik elde etmek amacıyla İVM tercih edilebilmektedir. Ön bölütleme ve RANSAC yaklaşımının sınıflandırma başarımındaki azalma karşılığında DVM sınıflandırma için destek vektör sayısını İVM sınıflandırma için ilgililik vektör sayısını azalttığı gözlemlenmektedir. K-ortalama İVM faz korelasyonu İVM (FK-İVM) ile karşılaştırıldığında yaklaşık aynı ilgililik vektör sayısında daha iyi sınıflandırma başarımı sağlamaktadır. RANSAC İVM (R-İVM) ise daha çok ilgilik vektörleri kullanarak K-ortalama İVM’den (K-İVM) daha iyi sınıflandırma başarımı sağlamaktadır. Ön bölütlenmiş ve RANSAC İVM eğitim aşamasındaki zaman performansı nedeni ile ön bölütlenmiş ve RANSAC DVM’ye göre tercih edilmektedir. İVM eğitim aşaması DVM ‘den 7–8 kat fazla [10] olmasına rağmen sınıflandırma (test) aşaması DVM’den 7–8 kat daha azdır. 6. Sonuçlar Bu çalışmada hiperspektral görüntülere ön-işlem uygulandıktan sonra DVM ve İVM sınıflandırma yöntemlerinin uygulanması gerçekleştirilmiştir. Önerilen yöntem İVM sınıflandırma için İV sayısını DVM sınıflandırma için DV sayısını azaltmaktadır ve düşük karmaşıklık gerektiren hedef tanıma uygulamaları gibi gerçek zamanlı uygulamalar için uygundur. Önerilen yaklaşımlar ile sınıflandırma başarımında kabul edilebilir bir düşüş karşılığında seyreklik sağlanmıştır. Seyreklik model
Page 1: Vektör Makinaları Temelli Hipersp

Vektör Makinaları Temelli Hiperspektral Sınıflandırma için Seyreklik ...

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?