30.10.2017 Views

MÉMOIRE - Laure Botella

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Dans leur livre J. Cagé, N. Hervé et M.L. Viaud fournissent les résultats de deux études scientifiques,<br />

issues d’un travail qui a commencé en 2012, publiées en 2016 puis en 2017, avant d’être rassemblées<br />

dans leur livre à dimension plus pédagogique. Il·elles ont réalisé une analyse des contenus de<br />

l’ensemble des articles de presse, édités sur internet, sur l’année 2013. La collecte de données a<br />

ainsi porté sur « 2 548 634 documents, soit environ 7000 documents par jour » 166 . En utilisant des<br />

méthodes de « big data », et en créant leurs propres algorithmes de comparaison, ils en sont arrivés<br />

au chiffre de 64%. Il·elles ont également démontré que 19% des documents n’ont aucune originalité,<br />

quand 21% le sont entièrement (graphique de droite ci-dessus, reproduction de la page 52 de leur<br />

livre). S’il·elles reconnaissent que l’analyse sémantique réalisée est quantitative et non qualitative<br />

(pas de détection de ce qui est positif ou négatif par exemple), ils indiquent aussi que « leur corpus<br />

de médias ne comprend ni les agrégateurs, ni les réseaux sociaux, qui prennent aujourd’hui une<br />

importance croissante dans la propagation de l’information sur Internet » 167 . Il est donc fort probable<br />

que le chiffre de 64% serait plus élevé avec leur prise en compte, d’autant que les retweets avec ou<br />

sans commentaires, et donc les « copié-collé », sont le principe même de la transmission de<br />

l’information sur Twitter.<br />

166<br />

Ibid. P. 27<br />

167<br />

Ibid. P. 93<br />

58

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!