03.05.2013 Views

Paper - Hogeschool Gent

Paper - Hogeschool Gent

Paper - Hogeschool Gent

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Abstract<br />

Deze scriptie gaat over het detecteren van seksueel misbruik op sociale netwerken met be-<br />

hulp van tekstuele data. Om te beginnen worden in een theoretisch stuk de verschillende<br />

onderdelen van het detectieproces naar voor gebracht. Er worden drie feature selectors<br />

en drie text classifiers uitvoerig belicht. Hierbij werd gesteund op werken van Pang &<br />

Lee (2008) en Manning et al. (2008). Vooraleer ingegaan wordt op de resultaten worden<br />

ook de oorsprong en de inhoud van de testdata uitgelegd waarna ook nog enkele bijzon-<br />

derheden aan de implementatie naar voor worden gebracht. Het resultaatgedeelte van<br />

deze scriptie geeft een stapsgewijze verklaring voor de verschillende keuzes die er gemaakt<br />

werden om tot een oplossing te komen voor het detectieprobleem. Het voorlaatste stuk<br />

van de resultaten behandelt enkele pogingen om de resultaten nog verder te verbeteren<br />

door het probleem van een onevenwichtige dataset aan te pakken. Hiermee wordt in het<br />

classificatieproces een precision en een recall van boven de 90% gerealiseerd. Het resultaat-<br />

hoofdstuk wordt afgesloten met nog enkele vaststellingen uit de tijdens de verbeteringsfase<br />

uitgevoerde clustering die kunnen dienen als basis voor verder onderzoek.<br />

iv

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!