12.07.2015 Views

Deelrapport 2: De weg naar Haren - Universiteit Twente

Deelrapport 2: De weg naar Haren - Universiteit Twente

Deelrapport 2: De weg naar Haren - Universiteit Twente

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>De</strong> Facebook data bevatten 52.227 berichten die door jongeren geplaatst zijn op de evenement-pagina “PROJECT X –HAREN” 12 . <strong>De</strong> data gaan van 7 september tot en met 3 oktober. <strong>De</strong>ze data zijn op verzoek en idee van Ritzo ten Cateverzameld en beschikbaar gesteld door Rienk Prinsen van Clockwork. Als consequentie van het scrapingproces zijn doorgebruikers geüploade afbeeldingen helaas niet opgenomen in de dataset. Wel zijn alle verwijzingen vanuit berichten meteen url <strong>naar</strong> externe websites, video’s en afbeeldingen in de dataset opgenomen.<strong>De</strong> Twitter data bevatten ruim 500.000 berichten en zijn verzameld door te zoeken op de volgende termen: <strong>Haren</strong> ORprojectX OR facebookfeest OR facebook-feest OR relschoppers OR Gem<strong>Haren</strong> OR projectXharen OR stationstraat.<strong>De</strong> data lopen van 19 tot 22 september. Ook zijn er vanuit Twitter foto’s verzameld. <strong>De</strong>ze data zijn verzameld doorHarro Ranter.Alleen de data die publiek beschikbaar waren zijn gedownload. Sommige mensen hebben hunberichten inmiddels verwijderd. Zowel het Facebook als het Twitter bestand bevat korte tekstberichten,een ‘timestamp’ en de naam van de verzender. Gerelateerd hieraan is er een privacy-issue.Hoewel sommige mensen een schuilnaam hebben, gebruikt een groot deel van de mensen opFacebook en Twitter zijn of haar eigen naam. <strong>De</strong> mogelijkheid bestaat om de data uit de bestandenterug te leiden tot een persoon. Om de privacy van deze mensen te waarborgen zullen in dit rapportresultaten alleen geanonimiseerd worden weergegeven.<strong>De</strong> mogelijkheid om deze sociale mediagegevens vast te leggen biedt nieuwe kansen voor onderzoekmaar roept ook nieuwe vragen en problemen op. Zo zijn de data enerzijds heel rijk omdat ze preciesweergeven wat mensen (online) hebben gezegd. Anderzijds zijn de data arm: alleen de tekst en denaam van de zender is bekend. Zo is het bijvoorbeeld onbekend welke achtergrondkenmerken dezemensen hebben. Ook is onzichtbaar wat zich allemaal in privé conversaties (zowel offline als online)afspeelt. Daarmee is de zeggingskracht van de analyse beperkt.Een tweede probleem is dat men, door de grote hoeveelheid data, min of meer is genoodzaakt decomputer te laten zoeken <strong>naar</strong> relevante informatie. Taal is echter zo contextgevoelig dat hetsimpel<strong>weg</strong> zoeken op woorden niet leidt tot valide resultaten. Enkele voorbeelden om dit teillustreren:• Het woord ‘<strong>Haren</strong>’ kan slaan het op dorp maar ook op haren kammen, verven of knippen. Ook kanmet het woord ‘film’ de film Project X worden aangeduid maar kan ook een filmpje op YouTubeworden bedoeld. Met de nodige zoekfilters kan het probleem wel enigszins worden verzacht.Wanneer echter verschillende fenomenen qua betekenis dicht bij elkaar liggen schieten ookzoekfilters tekort.• Ook cynisme, sarcasme en ironie zijn een probleem voor het zoeken met behulp van computers:‘Ja, haha, leuk feestje’ kan heel verschillende dingen betekenen afhankelijk van de context waarinhet wordt gezegd.• <strong>De</strong> taal die gebruikt wordt op Facebook houdt het midden tussen schrijf- en spreektaal. Zo komthet woord feest of feestje in vele varianten voor (e.g. Feeesje, Feeeeestje, Feesjuh). Wij hebbenmaar liefst 44 manieren om het woord feestje te schrijven gevonden.Hoewel de data ons voor een aantal beperkingen stellen hebben we toch geprobeerd door middelvan verschillende analyses antwoord te geven op een aantal vragen. Hoe verloopt het berichtenverkeeren het aantal aanmeldingen in de loop van de tijd? Kunnen bepaalde groepen wordenonderscheiden? Hoe ontwikkelt zich het netwerk in de loop van de tijd? Welke onderwerpen komenaan bod op welke momenten? Wat is bijvoorbeeld de rol van de massamedia en de sociale12https://www.facebook.com/events/172851989506342COMMISSIE ‘PROJECT X’ HAREN | 20

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!