172 173spētu darboties ar lingvistisku informāciju. Izplūdušais PRISM apmācības algoritms rada izplūdušosnoteikumus no lingvistiskas sākuma informācijas, kas atšķiras no tradicionālās informācijas ar to, kapirmajai ir piederības klases funkciju vērtības, bet otrajai konkrētas klases (Wang, Liu, Hong Tseng,1999).Darba pirmajā daļā tiks sniegts visu izmantojamo algoritmu sīkāks aprakts soļu veidā. Otrajā daļā tiksapskatītas pētījumā izmantotās metodes un reālās datu kopas. Rezultāti tiek apkopoti nākamajā darbadaļā. Šo pētījumu noslēdz secinājumi, rekomendācijas un iespējamie pētījuma nākamie attīstībasvirzieni.Izplūdušais PRISM algoritmsIzplūdušo likuma „JA inducētā noteikuma stāvoklis ,TAD klase “ spēku aprēķina, izmantojotizplūdušo Baijesa funkciju, kur ir -tais ieraksts apmācības kopā (Wang, Tsai, Hong, Tseng, 2003):Teorētiskais pamatojumsŠajā darba nodaļā tiks sīkāk aplūkotas izmantotās metodes, klasiskais PRISM algoritms un izplūdušaisPRISM algoritms, kā arī Nozīmīgo atribūtu un piederības funkciju meklēšanas algoritms un to galveniedarbības principi pa soļiem. Pētījumā tika izvēlēts PRISM algoritms, jo tas ir viens no pamatalgoritmiem,kurš izstrādāts jau 1987.gadā (Cendrowska, 1987) un kas aktualitāti nav zaudējis arī mūsdienās, jo šīalgoritma modifikācija - izplūdušais PRISM - ir šī pētījuma objekts (Wang, Liu, Hong Tseng, 1999).Nozīmīgo atribūtu un piederības funkciju algoritms ir citu zinātnieku ilgu gadu pētījuma rezultātsdarbam ar izplūdušiem datiem Hong, Lee, 1996, Hong, Chen, 1999). Abi izplūdušie algoritmi izmantopavisam dažādas stratēģijas izplūdušu datu klasifikācijai, tādējādi rosinot interesi veikt salīdzinošoseksperimentus, lai noskaidrotu katra algoritma iespējas.Kad inducētā likuma precizitāte ir augstāka par iepriekš noteiktu patiesības līmeni , t.i.,, tad specializācijas process tiek izbeigts, norādot, ka inducētais likums ir iegūts. Izplūdušāapmācības algoritma soļi, kas jāveic katrai klasei pēc kārtas:Ievieš nulles kompleksu jeb tukšu datu kopu, aizpildītu ar nulles vērtībām, kas algoritma darbībasgaitā tiek aizpildītas ar iegūtajiem likumiem;Mēra izplūdušo informācijas labumu katram iespējamajam atlasītājam no apmācības kopas:PRISM algoritmsIndukcijas algoritma darbības soļi katrai klasei, kas pieder apmācības kopai , aprakstīti nākamajospunktos (Cendrowska, 1987):kur un ir aktīvā un iepriekšējā izplūdusī informācija:Aprēķina klases parādīšanās varbūtību klasifikācijai katrai atribūtu pāru vērtībai, kurierakstu skaits apmācības kopā:Izvēlās atlasītāju , kuram ir maksimāls;Izvēlas , kuram ir maksimāls, un izveido apmācošās kopas apakškopu, kas ietver visasinstances, kas satur izvēlēto, un aprēķina informatīvumu:Pievieno atlasītāju kompleksam . t.i. un aprēķina ;Ja ir virs predefinētā patiesības līmeņa , tad pāriet uz 6. soli; pretējā gadījumā, tiek izveidotaAtkārto 1. un 2. soli šajā apakškopā, kamēr tā satur tikai klases instances. Samazinātais likums ir visuatribūtu – vērtību pāru – konjunkcija (apvienojums), kas tika izmantota, veidojot apakškopu;No apmācības kopas tiek izņemtas visas instances (piemēri), kurus pārklāj šis likums;Atkārto 1.-<strong>4.</strong> soli, kamēr visas instances no klases ir izņemtas.Kad vienai klasei visi likumi ir izveidoti un apmācības kopā nav palikušas klases instances, tadsākotnējā datu kopa tiek atjaunota un algoritma 1.-5. solis tiek veikts ar nākamo vērtību. Šisprocess jāatkārto, kamēr no visām klasēm ir izveidoti likumi (Cendrowska 1987:349-370, Bramer, 2007).jauna apmācības kopa, kurā katrs eksemplārs ir - aptverts ar atlasītāju un algoritms atgriežas uz2. soli;Formē likumu „Ja TAD “;Izņem visus eksemplārus, kuri ir - aptverti ar likumu „Ja TAD “, no oriģinālās datu kopas;Atkārto 1. līdz 7. soli, kamēr visi eksemplāri, kuri - pieder klasei ir izņemti no oriģinālās apmācībaskopas (Wang, Liu, Hong, Tseng, 1999).Kad visi likumi ir izveidoti vienai klasei, tad tiek atjaunota sākotnējā datu kopa un algoritms turpina iegūtlikumus nākamajai klasei (Wang, Liu, Hong, Tseng, 1999).<strong>Vidzemes</strong> <strong>Augstskolas</strong> <strong>4.</strong><strong>Studentu</strong> pētniecisko darbu konferences rakstu krājums<strong>Vidzemes</strong> <strong>Augstskolas</strong> <strong>4.</strong><strong>Studentu</strong> pētniecisko darbu konferences rakstu krājums
174 175Nozīmīgo atribūtu un piederības funkciju meklēšanas (NAPFM) algoritmsNAPFM algoritma darbība saistīta ar trim posmiem: I. Nozīmīgo atribūtu meklēšanu; II. Sākumapiederības funkciju meklēšanu un III. Lēmumu likumu iegūšanu.Pieņemsim, eksemplāru nokrīt atribūta intervālā , tad piederības funkcijaspunkts intervālam, ir vidējā vērtība no eksemplāriem, kuri nokrīt dotajā intervālā, un to aprēķina:I Nozīmīgo atribūtu meklēšana.Sakārto apmācības eksemplāru katra atribūtavērtības augošā secībā.Katrai piederības funkcijai atrast punktus un pēc formulām: .Katrai atribūta vērtībaisaskaita, cik daudz eksemplāru pieder katrai klasei.Saskaita, cik daudz eksemplāru (pie atribūta ) vērtības pieder tikai vienai klasei.Izskaitļo katram atribūtam derīguma pakāpi (fitness degree) izmantojot , kas ir apmācībaselementu kopējais skaits.Sakārto atribūtus augošā secībā pēc derīguma pakāpes vērtībām. Izvēlas nozīmīgākos atribūtus pēcprocedūras, kur tiek izvēlēts pats nozīmīgākais atribūts un pārbaudīta tā derīguma pakāpe, ja atribūtaderīguma pakāpe ir lielāka vai vienāda ar 0,9, tad procedūra savu darbu beidz, pretējā gadījumā tiekmeklēta divu nozīmīgāko atribūtu kombinācija un to piederības pakāpju reizinājums tiek salīdzināts aruzdoto sākuma slieksni . Ja arī divu atribūtu piederības pakāpju reizinājums neapmierina uzdotonosacījumu, tiek pievienots nākamais atribūts (Gasparovica, Aleksejeva, 2009).III Lēmumu likumu iegūšanaKonstruē sākuma lēmumu bāzi. Katra dimensija atspoguļo nozīmīgu atribūtu.Vienkāršo sākotnējā lēmuma bāzi ar mērķi apvienot un likvidēt nevajadzīgās šūnas.Pārkonstruē piederības funkcijas un izrēķina jaunos intervālus.Šajā solī, iegūst izplūdušos JA-TAD likumus no lēmumu bāzes. Katra ailīte lēmumu bāzē,kurai pieder noteikta klase, tiek izmatota, lai sastādītu likumu:Lai pārbaudītu iegūto lēmumu bāzi, nepieciešams izmantot testa kopas datus (Hong, Chen, 1999).II Sākuma piederības funkciju meklēšanaAtrod sākotnējo grupas skaitu katram nozīmīgākam atribūtam: .Katram nozīmīgajam atribūtam atrod diapazonu .Katram nozīmīgajam atribūtam atrod grupas intervāluPētījuma metodeDarbā tiek izmantotas datu ieguves, matemātiskās loģikas, informācijas teorijas metodes, izplūdusīloģika, kā arī modulāro likumu iegūšanas pieeja un automātiska piederības funkciju konstruēšana. Laipārbaudītu un salīdzinātu dažādos algoritmus - nepieciešams izmantot dažādas reālas datu kopas. NoKalifornijas universitātes datu repozitorijā pieejamajām (Asuncion, Newman, 2007) datiem, tika atlasītasčetras datu kopas, kas atbilst pētījumos nepieciešamajiem kritērijiem (Gasparovica, Aleksejeva, 2010).Sīkāks izmantojamo datu kopu apkopojums redzams 1.tabulā.Nosaka iespējamu minimālu nozīmīgāatribūta vērtību. To aprēķina, lai nodrošinātu precīzākuiedalījumu intervālos: .Sadala atrasto diapazonu grupās, tā, lai -tā grupa sāktos ar šādu vērtību -un beigtos ar , kur .Atrod punktu katrai piederības funkcijai. Izmanto trijstūra (triangular) piederības funkciju, laiprecizētu katra intervāla izplūdumu (fuzzyness). Šī piederības funkcija tiek definēta ar trim vērtībām.<strong>Vidzemes</strong> <strong>Augstskolas</strong> <strong>4.</strong><strong>Studentu</strong> pētniecisko darbu konferences rakstu krājums<strong>Vidzemes</strong> <strong>Augstskolas</strong> <strong>4.</strong><strong>Studentu</strong> pētniecisko darbu konferences rakstu krājums