Paper - Hogeschool Gent

More documents

Recommendations

Info

$C:\Olmo\compositie\Caprice\finale versie paganini.sib$

Hoofdstuk 5. Resultaten 54 2. Liever Een Seut. Dan Een Slet Lyk Ghy.. c: 3. euhm dikke slet, ’kzou ma kalm doen ze. 4. Noem mij slet, noem mij bitch. Noem mij wat je wilt, mij boeit het geen moer. Maar bitch, je weet toch ; jij bent hier de hoer. 5. je hoeft niet in de boom te hangen om een eikel te zijn Aanhalingen van de actualiteit, vaak in een spottende context. Sleutelwoorden: pedofiel, kerk (deze sleutelwoorden zijn uiteraard variabel) 1. Ben je pedofiel & zoek je werk? ga dan soliciteren by de kerk 2. seg manne zijde ne pedofiel zonder werk? voor mijn part moogde gerust is gaan solliciteren in de kerk. daar hebben ze er al wel genoeg, dus ge komt misschien op de wachtlijst te staan, maar geen nood, ooit moogde wel is naar de gevangenis gaan (: Vragenlijsten met ongepaste vragen. De vragenlijsten worden frequent gekopieerd en bevatten al snel 30 vragen of meer. Bepaalde vragen (zie voorbeelden) kunnen echter niet door de beugel. De voorbeelden zijn hier ingekort en de ongepaste vragen geselecteerd. Sleutelwoorden: slaan, kussen 1. [ ] Me tegen een muur duwen en kussen? [ ] Naar mijn thuis komen en gewoon chillen? [ ] Me slaan? [ ] Me slaan als ik het vroeg? [ ] Me kussen? [ ] Willen dat ik jou kus? 2. 17. Ben ik lief? 18. Hoe lang ken je me al? ... 33. Hebben we ooit al seks gehad? 34. Zou je Seks met me willen ?
Hoofdstuk 6 Conclusie Tijdens het onderzoek werden goede resultaten genoteerd voor de classificatie van tekst- documenten door een gesuperviseerd leeralgoritme. De verschillende componenten, feature selector en text classifier, werden uitvoerig belicht. Op basis van de resultaten uit eigen tests werd beslist dat een support vector machine als text classifier gecombineerd met mutual information als feature selector de combinatie is die de beste cijfers geeft. Een ongelijke klassenverdeling vormt een probleem voor het efficiënt classificeren van tekst- documenten. Dit probleem kan het best aangepakt worden door het onevenwichtig in de data op één of andere manier door te voeren in de trainingsdata van de text classifier. Zo- wel onevenwichtig trainen op documenten als het onevenwichtig trainen op features levert significante verbeteringen. In het beste geval wordt een F1 measure van 91,6% bereikt. Zowel precision als recall liggen daarbij boven de 90%. Het opnemen van clusteringsfeatures tijdens de classificatie levert slechts in een zeer beperkt gebied een verbetering. Dit gebied wordt afgebakend door de hoeveelheid gebruikte features om de klassen te definiëren. De extra informatie die uit de clustering kan gehaald worden, is evenwel niet miniem en nodigt uit tot verder onderzoek. Met de juiste trainingsdocumenten moet de classifier in staat zijn om niet enkel seksueel misbruik, maar bijvoorbeeld ook gevallen van depressie, pestgedrag of spam te detecteren. 55
Page 1 and 2:
Geassocieerde faculteit Toegepaste
Page 3 and 4:
Sentimentdetectie op Sociale Netwer
Page 5 and 6:
Abstract Deze scriptie gaat over he
Page 7 and 8:
Inhoudsopgave 1 Introductie 1 2 The
Page 9 and 10:
Hoofdstuk 1 Introductie Tijdens dez
Page 11 and 12: Hoofdstuk 2 Theoretische achtergron
Page 13 and 14: Hoofdstuk 2. Theoretische achtergro
Page 33 and 34: Hoofdstuk 3. Data 25 3.2 Vereiste d
Page 35 and 36: Hoofdstuk 3. Data 27 na revisie een
Page 37 and 38: Hoofdstuk 3. Data 29 3.2.3 Realisti
Page 39 and 40: Hoofdstuk 4. Implementatie 31 Het i
Page 41 and 42: Hoofdstuk 4. Implementatie 33 Alle
Page 43 and 44: Hoofdstuk 5. Resultaten 35 Beoordel
Page 45 and 46: Hoofdstuk 5. Resultaten 37 Bij de u
Page 47 and 48: Hoofdstuk 5. Resultaten 39 F1 1,00
Page 49 and 50: Hoofdstuk 5. Resultaten 41 5.3 Feat
Page 51 and 52: Hoofdstuk 5. Resultaten 43 De voll
Page 53 and 54: Hoofdstuk 5. Resultaten 45 Een onev
Page 55 and 56: Hoofdstuk 5. Resultaten 47 F1 F1 1,
Page 57 and 58: Hoofdstuk 5. Resultaten 49 gaat, st
Page 59 and 60: Hoofdstuk 5. Resultaten 51 Inzoomen
Page 61: Hoofdstuk 5. Resultaten 53 2. Afsch
Page 65 and 66: Bibliografie 1ste Keuze BV (2012).
Page 67 and 68: Bibliografie 59 S. Zhu, X. Ji, W. X
Page 69 and 70: Bijlage A Woordenlijsten A.1 Nederl
Page 71 and 72: Bijlage A. Woordenlijsten 63 37. do
Page 73 and 74: Bijlage A. Woordenlijsten 65 19. ji
Page 75 and 76: Bijlage B. Resultaattabellen 67 Het
Page 77 and 78: Bijlage B. Resultaattabellen 69 Eve
Page 83 and 84: Bijlage C. Figuren 75 F1 1,00 0,95
Page 85 and 86: Bijlage C. Figuren 77 F1 F1 1,00 0,
Page 87 and 88: Bijlage C. Figuren 79 F1 1,00 0,95
Page 89: Bijlage D Afkortingen AUC − area
show all

Paper - Hogeschool Gent

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?