11.07.2015 Views

Å eit - Vidzemes Augstskola

Å eit - Vidzemes Augstskola

Å eit - Vidzemes Augstskola

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

186 187ir nedaudz uzlabojusies – nepareizi klasificēti vien seši ieraksti astoņu vietā, taču klasifikācijas kokaizmērs ir palielinājies, jo nepieciešams klasificēt vairāk klasēs nekā sākotnējos datos. Atribūtu vērtībudekompozīcijas izmantošana uzlaboja veiktspēju vēl vairāk, samazinot arī klasifikatora izmēru, jo tiekizmantotas augstāka abstrakcijas līmeņa atribūtu vērtības, kas arī novērš pārapmācības iespēju.3. tabula. Klasifikācijas rezultāti Lapgraužu datu kopaiKļūda %Nepareiziklasificētoierakstu skaitsVirsotnesKoka lielumsLapas1. tabula. Klasifikācijas rezultāti Īrisu datu kopaiKļūda %Nepareiziklasificētoierakstu skaitsVirsotnesKoka lielumsLapasBez AVT un KD 48.65 % 36 10 9KD 32,43 % 24 10 9AVT 1,35 % 1 6 4Bez AVT un KD 5,33% 8 19 17KD 4% 6 46 41AVT 3,33% 5 11 8Klasifikācijas rezultāti Zīļu datu kopai redzami 2. tabulā. Izmantojot klašu dekompozīciju, klasifikācijasprecizitāte uzlabojusies par 5%, taču arī šajā gadījumā klasifikācijas koka izmērs ir palielinājies, josākotnējā klasifikācijā izmantota klasifikācija, kas visiem ierakstiem piešķir vienu un to pašu klasi.Izmantojot atribūtu vērtību taksonomiju, precizitāte uzlabojās vēl vairāk, lai arī koks palielinājās,salīdzinot ar sākotnējo klasifikāciju.2. tabula. Klasifikācijas rezultāti Zīļu datu kopaiKļūda %Nepareiziklasificētoierakstu skaitsVirsotnesKoka lielumsBez AVT un KD 28,21 % 11 1 1KD 23,08 % 9 13 12AVT 20,51 % 8 5 4LapasKlasifikācijas rezultāti Lapgraužu datu kopai parādīti 3. tabulā. Var redzēt, ka klašu dekompozīcijasizmantošana uzlaboja klasifikācijas precizitāti, lai gan koka izmērs ir palicis tāds pats. Savukārtatribūtu vērtību taksonomijas izmantošana ievērojami uzlaboja klasifikācijas precizitāti, samazinot arīklasifikatora izmēru, kas saistīts ar atribūtu augstāku abstrakcijas līmeņu vērtību izmantošanu, kas ļaujizmantot vairāk atribūtu, un īpatnējo datu kopas struktūru, kurā klases ir labi atdalāmas, taču nelielāierakstu skaita dēļ klasifikācijas kļūda ir lielāka, neizmantojot atribūtu vērtību taksonomijas.Lapgraužu datu kopas klasifikācijai konstruētie klasifikatori ir redzami 2. attēlā. Augšpusē (a) ir redzamsklasifikācijas koks, kas izveidots ar sākotnējiem datiem, neizmantojot nevienu no metodēm. Tas saturtikai vienu atribūtu un visas tā vērtības. Savukārt apakšā redzamais koks (b) ir izveidots, izmantojotatribūtu vērtību dekompozīciju, un izmanto augstākus atribūtu vērtību abstrakcijas līmeņus, kas ļaujizveidot divu līmeņu koku tam pašam nelielajam ierakstu skaitam. Koka precizitāte ir palielinājusies,jo tiek izmantoti abi atribūti un klases 2 dimensiju telpā pārklājas mazāk nekā to projekcijas uz vienaatribūta ass.Hep(a)(b)Hep8Hep9 10 11HepHepcLeņķis12HeiPlatumsHei2. attēls. Klasifikācijas koki Lapgraužu datu kopai.1314HeiLeņķisKopumā var secināt, ka datu kopu īpašību izmantošana ietekmēja klasifikācijas rezultātus un klasifikatorustruktūru, tāpēc to ietekme uz klasifikācijas stratēģijas izvēli ir vērā ņemama un jāiekļauj klasifikatoruizvēles sistēmā.idcCon1516HeikConHeiHei<strong>Vidzemes</strong> <strong>Augstskola</strong>s 4.Studentu pētniecisko darbu konferences rakstu krājums<strong>Vidzemes</strong> <strong>Augstskola</strong>s 4.Studentu pētniecisko darbu konferences rakstu krājums

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!