10.07.2015 Views

Elektroniski sagatavots arī Vidzemes Augstskolas 4. Studentu

Elektroniski sagatavots arī Vidzemes Augstskolas 4. Studentu

Elektroniski sagatavots arī Vidzemes Augstskolas 4. Studentu

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

170 171INFORMĀCIJAS SABIEDRĪBAIzplūdušo likumu izmantošana klasifikācijas uzdevumu risināšanāUsing Fuzzy Rules for Solving Classification TasksMadara Gasparoviča, Rīgas Tehniskās universitātes absolventeDarba zinātniskā vadītāja: Dr.sc.ing. Ludmila AleksejevaRezumējumsPētījuma mērķis ir izpētīt un analizēt izplūdušos klasifikācijas algoritmus, noskaidrot to priekšrocībasattiecībā pret klasiskiem algoritmiem un sniegt rekomendācijas algoritmu praktiskam lietojumam. Tiešicilvēku nespēja saprasties ar datoriem un jebkuru programmējamu aparatūru lingvistiskos jēdzienosbijis viens no priekšnoteikumiem, kāpēc šis virziens ir tik perspektīvs. Visbiežāk dabā un reālajā dzīvēir sastopami dati, kas pieder klasei tikai daļēji (piemēram, lietains laiks pieder klasei „labs laiks” arvarbūtību 0.3). Tādējādi klasiski dati, kuriem viegli var noteikt to piederību – pieder vai nepieder, irretāk sastopami. Tāpēc arī algoritmi, kas spēj klasificēt izplūdušus datus, kļūst aizvien vajadzīgāki unneaizvietojamāki dažādās dzīves jomās, kur nepieciešams ar tehniku saprasties lingvistiskos jēdzienos.Darbā tiek izmantotas datu ieguves, matemātiskās loģikas, informācijas teorijas metodes, izplūdusīloģika, kā arī modulāro likumu iegūšanas pieeja un automātiska piederības funkciju konstruēšana.Darba ietvaros tika izpētīti klasiskais PRISM un izplūdušais PRISM algoritmi, lai noskaidrotu atšķirībasun iespējas uzlabot rezultātu, izmantojot izplūduma jēdzienu. Salīdzināti dažādi izplūdušie algoritmisavā starpā - izplūdušais PRISM un Nozīmīgo atribūtu un piederības funkciju meklēšanas algoritms,lai noskaidrotu izplūdušo klasifikācijas algoritmu darbības principus. Pētītas citas radniecīgas metodesizplūdušu datu klasificēšanā. Definēta katra algoritma piemērotība pētāmām datu kopām, lai sasniegtulabākas kvalitātes rezultātus. Sākotnēji tika veikti eksperimenti, lai noskaidrotu prasības datu kopām,pēc tam tika meklētas atbilstošās datu kopas un ar perspektīvākajām veikti papildu eksperimenti, laiatlasītu atbilstošās izmantošanai salīdzinošajā algoritmu iespēju pētīšanā. Sastādīts eksperimentuplāns perspektīvākajām datu kopām ar mērķi veikt izplūdušo klasifikācijas algoritmu salīdzinošoanalīzi. Sniegtas rekomendācijas algoritmu izmantošanas iespējām, atkarībā no datu kopas sastāva unstruktūras.Darba secinājumos apkopota praktiski izmantojama informācija šo algoritmu lietojumam, atbilstošidatu kopai. Aprakstīti arī iespējamie tālākie pētījuma attīstības virzieni.AbstractThe goal of the research is to explore and analyze fuzzy classification algorithms, determine theiradvantages over classical algorithms and give recommendations for practical use of the algorithms.The inability of humans to understand computers and any other programmable hardware in linguisticterms has been one of the prerequisites for this trend to be so perspective. Most of the data availablein real life and nature belong only partly to any predefined class, e.g. rainy weather belongs to theclass ‘good weather’ with probability 0,3. Thus, classical data that have easily definable membership(belongs or does not belong) are rare. Therefore algorithms that can classify fuzzy data are becomingmore necessary and irreplaceable in various scopes of life where there is a need to understandmachinery using linguistic terms.The research uses data mining, mathematical logic and information theory methods, fuzzy logic,technique for extracting modular rules and automatic construction of membership functions.Classical PRISM and fuzzy PRISM algorithms were explored within this work to determine theirdifferences and possibilities to improve results using fuzzy techniques. Different fuzzy algorithms werecompared with each other – fuzzy PRISM and Finding relevant attributes and membership functionsalgorithm, to determine working principles of fuzzy classification algorithms. Other related methodsthat classify fuzzy data were also studied. The suitability of each algorithm for explored data setswas defined in order to achieve better results. Experiments were carried out to initially determinerequirements towards data sets, then a search for suitable data sets was conducted and the mostperspective ones were chosen for further experiments to select the most suitable data sets for usein a comparative study of possibilities of the algorithms. A plan of experiments was made for themost perspective data sets to perform a comparative analysis of fuzzy classification algorithms. Theresearch gives recommendations for possibilities of use of the algorithms, depending on compositionand structure of a data set.Conclusions of the work give practical information about the use of these algorithms according tofeatures of a data set and outline possible directions of future research.Atslēgas vārdi: izplūdušie JA - TAD klasifikācijas likumi, piederības funkcijas, modulārie likumi, datuieguve, UCI datiIevadsIzplūdušie klasifikācijas algoritmi ir spējīgi darboties ar izplūdušiem datiem. Dabā reti klases ir precīziatdalītas, parasti to robežas nav precīzi noteiktas, t.i., tās ir izplūdušas. Pētījuma mērķis ir izpētīt unanalizēt izplūdušos klasifikācijas algoritmus, noskaidrot to priekšrocības attiecībā pret klasiskiemalgoritmiem un sniegt rekomendācijas algoritmu praktiskai izmantošanai. Darba ietvaros tika izpētītiklasiskais PRISM un izplūdušais PRISM algoritmi, lai noskaidrotu atšķirības un iespējas uzlabot rezultātu,izmantojot izplūduma jēdzienu. Salīdzināti dažādi izplūdušie algoritmi savā starpā - izplūdušaisPRISM un Nozīmīgo atribūtu un piederības funkciju meklēšanas algoritms, lai noskaidrotu izplūdušoklasifikācijas algoritmu darbības principus.Izplūdušās sistēmas, kas spēj automātiski iegūt JA-TAD likumus no skaitliskiem datiem, ir izstrādātastikai nesen. Lielākajai daļai no tām, lai veiktu apmācību, ir nepieciešams iepriekš definēt piederībasfunkcijas. 1996. gadā Hongs (T.P. Hong) un Lī (Y.C. Lee) piedāvāja metodi, kas automātiski var iegūtJA-TAD likumus un piederības funkcijas. (Hong, Lee, 1996) 1999. gadā autori savu metodi uzlabo(Hong, Chen, 1999:389-404) – tā sākumā atlasa nozīmīgākos atribūtus, no kuriem tiek iegūtas sākumapiederības funkcijas. Izmantojot tās, notiek lēmumu tabulu konstruēšana, no kurām vēlāk var iegūtgalīgos (izšķirošos) izplūdušos JA-TAD likumus un piederības funkcijas. 1987. gadā Cendrovska (JadziaCendrowska) publicē savu pētījumu par algoritmu PRISM kas, lai arī balstīts uz ID3, rezultātus attēlomodulāro likumu veidā (Cendrowska, 1987). Algoritma galvenais mērķis ir iegūt klasifikācijas likumustieši no apmācības kopas datiem, tādējādi atrisinot galveno ID3 algoritma nepilnību. Lai uzlabotu ID3rezultātu, radikāli jāmaina pamata indukcijas stratēģija. Šis izplūdušais apmācības algoritms izmantoizplūduma koncepciju mašīnu apmācībā, kas bāzēta maksimālā informācijas labuma izmantošanā, lai<strong>Vidzemes</strong> <strong>Augstskolas</strong> <strong>4.</strong><strong>Studentu</strong> pētniecisko darbu konferences rakstu krājums<strong>Vidzemes</strong> <strong>Augstskolas</strong> <strong>4.</strong><strong>Studentu</strong> pētniecisko darbu konferences rakstu krājums

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!