Paper - Hogeschool Gent
Paper - Hogeschool Gent
Paper - Hogeschool Gent
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Abstract<br />
Deze scriptie gaat over het detecteren van seksueel misbruik op sociale netwerken met be-<br />
hulp van tekstuele data. Om te beginnen worden in een theoretisch stuk de verschillende<br />
onderdelen van het detectieproces naar voor gebracht. Er worden drie feature selectors<br />
en drie text classifiers uitvoerig belicht. Hierbij werd gesteund op werken van Pang &<br />
Lee (2008) en Manning et al. (2008). Vooraleer ingegaan wordt op de resultaten worden<br />
ook de oorsprong en de inhoud van de testdata uitgelegd waarna ook nog enkele bijzon-<br />
derheden aan de implementatie naar voor worden gebracht. Het resultaatgedeelte van<br />
deze scriptie geeft een stapsgewijze verklaring voor de verschillende keuzes die er gemaakt<br />
werden om tot een oplossing te komen voor het detectieprobleem. Het voorlaatste stuk<br />
van de resultaten behandelt enkele pogingen om de resultaten nog verder te verbeteren<br />
door het probleem van een onevenwichtige dataset aan te pakken. Hiermee wordt in het<br />
classificatieproces een precision en een recall van boven de 90% gerealiseerd. Het resultaat-<br />
hoofdstuk wordt afgesloten met nog enkele vaststellingen uit de tijdens de verbeteringsfase<br />
uitgevoerde clustering die kunnen dienen als basis voor verder onderzoek.<br />
iv