11.07.2015 Views

Å eit - Vidzemes Augstskola

Å eit - Vidzemes Augstskola

Å eit - Vidzemes Augstskola

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

180 181iespējams sasniegt ar izplūdušo PRISM algoritmu, pie nosacījuma, ka nav pārāk liels intervālu (janepārtraukti dati) vai konstanto vērtību (ja kategoriski dati) skaits.NAPFM algoritma darbībā ir mazāk iespēju izpausties nejaušības principam, jo sākotnējās piederībasfunkcijas tiek aprēķinātas, izmantojot stingras matemātiskas darbības. Turpretī izplūdušajā PRISMalgoritmā iespējams ieviest subjektīvus vērtējumus. Nozīmīgo atribūtu un piederības funkcijumeklēšanas algoritms ir precīzāks, taču tas nav piemērots visām datu kopām, jo, ja nozīmīgoatribūtu skaits lielāks par diviem, tas sarežģī aprēķinus. Izplūdušais PRISM algoritms ir universālāks,jo ar to iespējams darboties gan ar skaitliskiem, gan kategoriskiem datiem, taču piederības funkcijuaprēķināšanas gaita ir sarežģīta.Pastāv arī iespēja izvēlēties algoritmu atkarībā no sākotnējiem datiem – ja dati ir skaitliski un nepārtraukti,tad NAPFM algoritmu iespējams izmantot bez datu transformācijas. Attiecīgi, ja dati ir kategoriski, tadvar izmantot tikai izplūdušo PRISM.Ja nākotnē pētījumos būtu iespējams piemērot NAPFM algoritmu izmantošanai arī kategoriskiemdatiem, tad tas noteikti kļūtu par universāli lietojamu algoritmu, jo tas nav tik atkarīgs no lēmējpersonasattieksmes, kā tas ir ar izplūdušo PRISM. Vēl nākotnē ieteiktu salīdzināt NAPFM algoritmu ar tāmodifikāciju MMTF, kā arī apskatīt citu PRISM algoritma modifikāciju – FAQR.Literatūras sarakstsHong T.P., Lee C.H. Induction of fuzzy rules and membership functions from traning examples - FuzzySets and Systems - Vol.84 (1996), pp. 33-47.Hong T. P., Chen J. B. Finding relevant attributes and membership functions - Fuzzy Sets and Systems- Vol. 103, No. 3 (1999), pp. 389-404.Cendrowska, J. PRISM: an algorithm for inducing modular rules - Internat. J. Man – Machine Studies. -Vol. 27 (1987), pp. 349-370.Wang C. H., Liu J. F., Hong T. P., Tseng S.S. A fuzzy inductive learning strategy for modular rules - Fuzzysets and Systems. - Vol. 103 (1999), pp. 91–105.Bramer, M. Principles of Data Mining – London: Springer – Verlag London Limited, 2007. – 343 p.Asuncion A., Newman, D.J., UCI Machine Learning Repository Irvine, CA:University of California, Schoolof Information and Computer Science (2007). Link http://www.ics.uci.edu/~mlearn/MLRepository.html. - last viewed in may 2010.Gasparovica M., Aleksejeva L. A Comparative Analysis of Prism and MDTF Algorith // Proceedingsof Mendel 16th International Conference of Soft Computing 2010, Brno, Czech Republic, 23-25 June,2010, pp. 191 – 197.Gasparovica M., Aleksejeva L. A study on the behaviour of the algorithm for finding relevant attributesand membership functions // Scientific Proceedings of Riga Technical University. Issue 5, ComputerScience. Information Technology and Management Science. - Vol.40 (2009), pp.75-80.Wang C.H., Tsai C.J., Hong T.P., Tseng S.S. Fuzzy Inductive Learning Strategies // Applied Intelligence.- Vol. 18 (2003), pp.179 – 193.Hong T. P., Chen J. B. Processing individual fuzzy attributes for fuzzy rule induction, Fuzzy Sets andSystems. - Vol. 112, No. 1 (2000), pp. 127-140.Meta-informācijas izmantošana klasifikācijas uzdevumosUsing Meta-Information in Classification TasksInese Poļaka, Rīgas Tehniskās universitātes absolventeDarba zinātniskais vadītājs: Dr.hab.sc.comp. Arkādijs BorisovsRezumējumsKlasifikācijas uzdevums ir populārs datu ieguves uzdevums dažādās sfērās – medicīnā, finansēs,bioloģijā u.c., un tā risināšanai ir izstrādātas daudzas metodes. Viena no populārākajām pieejāmklasifikācijas uzdevuma risināšanā ir lēmumu koku izmantošana, jo modeļu izveide aizņem salīdzinošimaz resursu un tos ir viegli interpretēt arī konkrētās sfēras speciālistiem, kas nepārzina šīs metodes.Darbā tiek apskatīta datu struktūras meta-informācijas izmantošana datu ieguves klasifikācijasuzdevumā. Meta-informācija var tikt izmantota piemērotākā klasifikatora un tā parametru izvēlē, kāarī datiem piemērotāka klasifikatora projektēšanā. Tiek aplūkots modelis, pēc kura principa darbojasklasifikatoru izvēles sistēma, kas balstās uz meta-informācijas par datiem izmantošanu.Darbā apskatītas divas metodes, kas izmanto datu struktūras informāciju klasifikatoru projektēšanāar mērķi izveidot datiem pielāgotus, kompaktus un precīzus klasifikatorus. Klašu dekompozīcijā arhierarhiskās klasterizācijas palīdzību tiek aprakstīta klašu iekšējā struktūra, sadalot klases apakšklasēs,lai uzlabotu klasifikatoru precizitāti. Uz atribūtu vērtību taksonomiju pamata konstruētos lēmumuklasifikatoros tiek izmantota atribūtu iekšējā struktūra, lai konstruētu klasifikatorus, kas izmanto atribūtuvērtības dažādos abstrakcijas līmeņos.Datu struktūras meta-informācijas izmantošanas ietekme uz klasifikatoriem tiek eksperimentālipārbaudīta, izmantojot reālās dzīves datus. Abu aplūkoto metožu izmantošana zīmīgi uzlabo klasifikatoruveiktspēju, salīdzinot ar klasifikatoriem, kas konstruēti, neizmantojot šīs metodes, kas pierāda metainformācijasizmantošanas lietderīgumu. Tāpat tiek apskatīti sarežģījumi, ar kuriem nākas saskarties,veidojot uz meta-informācijas balstītas klasifikatoru izvēles sistēmas, un veidoti ieteikumi tālākajamdarbam.AbstractClassification task is a popular data mining task in various fields – health, finance, biology etc. andmany methods have been developed to solve it. One of the most popular approaches is using decisiontrees for classification because building models does not require much resource and the models areinterpretable for experts who do not know these methods.The article examines possibilities of using meta-information about data structure in data miningclassification task. Meta-information can be used in choosing the most suitable classifier and itsparameters as well as building a classifier that fits the data. The research also outlines a model of aclassifier selection system that is based on the use of meta-information about data.The research analyzes two methods that use information about data structure in building classifiersto design classifiers that fit data, are compact and accurate. Class decomposition uses hierarchicalclassification to describe class structures by dividing them into subclasses to increase efficiency of<strong>Vidzemes</strong> <strong>Augstskola</strong>s 4.Studentu pētniecisko darbu konferences rakstu krājums<strong>Vidzemes</strong> <strong>Augstskola</strong>s 4.Studentu pētniecisko darbu konferences rakstu krājums

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!