Chapitre 1. Historique et état du marché - Sciences Po Spire

OpenEdition Press 

................................................................................................................................................................................................................................................................................................ 

Chapitre 1. Historique et état du 

marché 

................................................................................................................................................................................................................................................................................................ 

Avertissement 

Le contenu de ce site relève de la législation française sur la propriété intellectuelle et est la propriété exclusive de 

l'éditeur. 

Les œuvres figurant sur ce site peuvent être consultées et reproduites sur un support papier ou numérique sous 

réserve qu'elles soient strictement réservées à un usage soit personnel, soit scientifique ou pédagogique excluant 

toute exploitation commerciale. La reproduction devra obligatoirement mentionner l'éditeur, le nom de la revue, 

l'auteur et la référence du document. 

Toute autre reproduction est interdite sauf accord préalable de l'éditeur, en dehors des cas prévus par la législation 

en vigueur en France. 

Revues.org est un portail de revues en sciences humaines et sociales développé par le Cléo, Centre pour l'édition 

électronique ouverte (CNRS, EHESS, UP, UAPV). 

................................................................................................................................................................................................................................................................................................ 

Référence électronique 

Dominique Boullier et Audrey Lohard, « Chapitre 1. Historique et état du marché », in Opinion mining et ‎Sentiment 

analysis (« Collection « Sciences Po │ médialab » », n o 1) , 2012 [En ligne], mis en ligne le 19 mars 2012, consulté le 

22 mars 2012. URL : http://press.openedition.org/204 

Éditeur : Cléo/OpenEdition 

http://press.openedition.org 

http://www.revues.org 

Document accessible en ligne sur : 

http://press.openedition.org/204 

Document généré automatiquement le 22 mars 2012. 

Licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Pas de Modification 3.0 France

Chapitre 1. Historique et état du marché 


Chapitre 1. Historique et état du marché 2 

1 Depuis l’arrivée du web 2.0, l’intérêt va croissant pour connaître les opinions des internautes 

qui s’y expriment spontanément et en temps réel. Cette masse de données d’opinions est 

accessible avec des outils de fouille du web, avec une collection d’informations constamment 

renouvelée. Des sites se sont spécialisés dans le recueil de ces opinions dans certains domaines 

(critiques de cinéma par exemple) et les internautes ont pris l’habitude de consulter les avis et 

notes déposés par les autres dès qu’ils doivent prendre une décision d’achat pour un produit 

technique, ou encore pour une réservation d’hôtel. Les avis, les opinons intéressent donc les 

internautes et ont suscité des applications et services multiples, ce qui provoque un cercle 

vertueux d’encouragement à donner son avis et même à se faire reconnaître comme donnant 

des avis pertinents et suivis par les autres. Mais ces données intéressent également des marques 

et des cabinets d’études qui tentent de connaître ce « sentiment agrégé des foules ». Souvent 

sensibles au fantasme « votre réputation peut être détruite à cause d’un commentaire de blog », 

les marques se soucient de leur identité en ligne mais cherchent également à mieux connaître 

les attentes et critiques que les internautes leur adressent. D’où le développement croissant 

des techniques pour capter ces évaluations des internautes, allant du simple dénombrement de 

commentaires positifs ou négatifs à l’analyse plus fine des contenus de ces commentaires. 

Ce que change le web 2.0 

2 Il n’a pas fallu attendre l’arrivée d’internet et plus particulièrement celle du web 2.0 pour 

pratiquer l’analyse de sentiment. Ce que pensent et disent les gens est un sujet d’intérêt 

scientifique depuis au moins un siècle, politique depuis plus de cinquante ans et, depuis peu, 

un sujet d’intérêt commercial. 

3 Scientifique d’abord, puisque dès le début du XX e siècle, William Stern 1 , puis Gordon Allport 

et Leo Postman 2 s’intéressent au phénomène de la rumeur et tentent de la définir et d’en 

établir les mécanismes fondamentaux. Via le « bouche à oreille », les messages peuvent être 

réduits, simplifiés, transformés. Certains détails peuvent être valorisés au détriment d’autres 

en fonction de la sensibilité ou du contexte social de celui qui transmet le message. Quand 

ce dernier ne relève pas tout simplement d’une pure invention, mais s’impose en raison de 

l’ampleur que lui confère sa transmission à grande échelle (et l’on pense au phénomène 

actuel des hoax qui envahissent régulièrement le web) ! La rumeur devient un phénomène 

identifiable, analysable et mesurable. Après la psychologie sociale, la psychanalyse et la 

sociologie s’emparent de l’objet « rumeur » 3 . On débat sur son caractère fondé (réelle 

information) ou non (simple projection de fantasme), et elle est entrée désormais dans le champ 

des études médiatiques et du management des marques 4 . 

4 Les sondages quant à eux se sont développés depuis la fin de la seconde guerre mondiale. 

Partant du principe qu’il existe une opinion publique, comme le disait Tarde des publics des 

journaux en distinguant cette opinion de la foule, les sondages consistent à créer des méthodes 

et des indicateurs pour la mesurer et ce faisant pour la faire exister vraiment. La dimension 

performative des sondages a souvent été mentionnée, parfois pour critiquer leurs justifications 

mêmes, plus souvent pour proposer des règles de contrôle de leur méthodologie qui éviterait 

de mesurer un pur artefact provoqué par le dispositif. En effet, les sondages obligent de fait les 

personnes interrogées à se poser des questions qu’elles n’ont peut-être jamais eu l’occasion de 

se poser ou à avoir une opinion sur un sujet qu’elles ignorent complètement (ce que Converse 

ou Bourdieu ont utilisé pour en faire la critique). D’autres ont pu critiquer leurs méthodes 

et notamment la prétention de représentativité, réalisée en France sous forme de quotas et 

à l’étranger sous forme d’échantillons aléatoires, ce qui vaut là encore des critiques aux 

méthodes françaises, dépendantes du fait que l’INSEE ne traite pas de questions politiques 

ou religieuses, ce qui rend l’accès à des échantillons aléatoires sur la population complète 

impossibles. Mais par leur répétition, dès lors qu’ils utilisent les mêmes principes, on peut 

considérer que les sondages détectent quelque chose des « mouvements d’opinion » (mais ici 

ce sont bien les mouvements qui sont importants, avec maintien de la même méthode) et que



dans le même temps ils ont fini par faire exister l’opinion comme entité supposée indépendante 

des méthodes pour y accéder. 

5 C’est pourquoi les études d’opinion mining reprennent les mêmes principes sans trop 

s’interroger sur le statut de cette opinion, considérant que, à force de sondages, elle a fini par 

exister. Or, ce que vont mesurer les dispositifs d’opinion mining relève de conversations plus 

que d’opinions constituées par les méthodes qui leur donnent le statut d’opinion. Cet écart 

est malgré tout sous-estimé délibérément dans les offres commerciales. Cependant, nombreux 

sont ceux qui parleront plutôt d’e-réputation, ce qui est sans doute plus correct, puisque c’est 

bien la notoriété médiatique que l’on mesurera sur les médias. 

6 Ces approches sont donc bien éloignées d’un souci de représentativité de la population, 

établie en fonction de critères sociodémographiques, tels que l’INSEE les définit. Les études 

d’opinion se prévalent toujours de leur capacité à corréler tous les attributs et opinions 

des personnes sondées à leurs propriétés socio-démographiques. Ce lien personnel permet 

ensuite des agrégats qui prétendront à la validité statistique par rapport à une population 

de référence. Cependant, il sera tenu compte des intervalles de confiance, selon la taille de 

l’échantillon rapportée à celle de la population, qui devraient relativiser les résultats mais qui 

sont très souvent oubliés dans les publications des médias, ce qui entraîne des confusions, des 

critiques et une controverse permanente. En réalité, bien d’autres opérations sont nécessaires 

pour maintenir cet « effet de représentativité » face à tous les problèmes de constitution de 

l’échantillon ou de récupération/exploitation des données : mais tous les redressements qui 

font la cuisine ou l’art des sondeurs professionnels sont rarement explicités car la demande 

sociale/médiatique n’attend pas cette garantie scientifique mais seulement son approximation. 

C’est la même posture qui justifiera les approximations innombrables de la plupart des offres 

en opinion mining et sentiment analysis. 

7 Avec l’émergence du marketing relationnel dans les années 1990, apparaissent les outils de 

CRM (Consumer Relationship Management ou en français GRC, Gestion de Relation Client). 

Le souci de produire du reporting sur toutes les activités les plus fines de l’entreprise fait 

partie de l’évolution contemporaine des entreprises dominées par les impératifs de la finance, 

au point de produire des reports trimestriels rarement fondés mais utiles pour l’orientation 

des marchés financiers. Les outils de e-réputation n’échappent pas à ce même impératif, 

notons-le en passant, et leur destinataire est avant tout l’actionnaire bien plus que les stratèges 

de l’entreprise eux-mêmes, puisqu’une réputation mise à mal sur le web peut se traduire 

en un instant par un décrochage boursier. Par ailleurs, la féroce compétition entre marques 

pour conserver des clients dont la solvabilité est de plus en plus problématique, conduit à 

privilégier des outils de suivi qui peuvent alerter sur tout changement de comportement, sur 

toute insatisfaction et qui peuvent servir de base de lancement à des propositions commerciales 

nouvelles, personnalisées et monétisant tout ce qui peut l’être dans cette relation. 

8 Le suivi des consommateurs et l’exploitation des retours clients ont reposé sur le 

développement, depuis les années 2000, d’un appareillage de traçabilité et d’agrégation 

particulièrement sophistiqué, dont une bonne partie est désormais automatisée. De nombreuses 

données de consommation pour un client abonné ou fidélisé par une carte (dont il 

laisse l’exploitation des données à l’enseigne par exemple) peuvent être exploitées 

directement, puisqu’il s’agit de traces d’actes d’achat ou de commandes ou de demandes 

d’interventions, etc. Elles n’ont donc pas de rapports avec les données d’opinion. Cependant, 

les marques ont su désormais exploiter tous les outils de traçabilité des avis plus ou moins 

informels émis en direct sur leurs sites ou sur des sites de consommation. Dans ce dernier 

cas, les marques perdent souvent la connexion avec l’identité des clients et les croisements 

sont moins directs mais le travail de corrélation se fait au niveau d’agrégats géographiques, de 

segments de marché, etc. Par ailleurs, de nombreuses méthodes de marketing déjà anciennes 

sont toujours exploitées pour générer du retour client ou au contraire des attentes de client (lors 

de phases d’innovations). Les entretiens téléphoniques et les focus groups sont massivement 

utilisés pour faire exister ce client évanescent ou supposé, tout autant fantomatique que 

l’opinion que nous évoquions en introduction. Nous avons proposé de regrouper toutes ces 

méthodes sous le terme de dispositifs de production « d’êtres intermédiaires », c’est-à-dire



de tenants lieux des utilisateurs/clients réels souvent difficiles à atteindre. Le statut virtuel 

de ces êtres intermédiaires ne les empêche pas d’avoir un rôle décisif dans la suite de la 

conception ou dans le traitement des retours clients 5 . Nous avions pris notamment l’exemple 

de la mère Denis utilisée comme « être totem » pour servir d’argument imparable lorsque 

l’on veut valider ou invalider un produit à destination d’un grand public non instruit. Toutes 

les typologies, sociostyles et autres tendances qui permettent de produire des regroupements 

synthétiques de la description des comportements ne font pas autre chose que produire ces 

êtres intermédiaires. Cela n’invalide en rien ces travaux, car, et il faut y insister, seraient-ils 

absents, qu’une marque trouverait toujours un moyen d’imaginer ses clients ou qu’un parti ne 

pourrait s’empêcher de se représenter ses électeurs. Ce souci d’information plus argumentée 

est avant tout stratégique et ne cherche donc pas de validation scientifique ultime. Cependant, 

il en empruntera les protocoles et les arguments, lorsque c’est nécessaire. Les chercheurs en 

sciences sociales doivent de leur côté s’imposer des contraintes plus importantes mais ils sont 

de fait dans la même situation. Comme le font les botanistes et les pédologues de la forêt 

amazonienne de Boa Vista dans cet article fameux de Bruno Latour 6 , les chercheurs en sciences 

sociales travaillent constamment à aligner des traductions successives du monde, à s’assurer 

que les transformations qu’ils leur font subir sont acceptables (mais il s’agit pourtant de 

transformations) et de ce fait à manipuler aussi des êtres intermédiaires que sont des catégories, 

des typologies, voire des idéaux-types qui valent pour l’infinie diversité des individus et des 

opinions recueillies. 

9 L’adoption massive des outils du web 2.0 par le public a renforcé l’intérêt pour le sentiment 

analysis, qui vise directement l’analyse de la tonalité, positive ou négative, des opinions 

recueillies. Les canaux d’expression spontanée des internautes se sont démultipliés (blogs, 

réseaux sociaux, systèmes de microblogging) et regorgent d’avis sur des produits, marques, 

personnalités, politiques publiques, etc. Il est même possible de considérer les conversations 

web (qui sont devenues en tant que telles un objet d’analyse et de suivi notamment dans 

les relations avec les marques, voir « les marques en conversation ») comme une entreprise 

collective d’évaluation permanente de tout : articles de presse (à travers des commentaires), 

blogs anonymes (à travers des commentaires, des liens, des flux RSS, des tweets pour les 

signaler), pages web pour des produits, des événements, des personnes (que l’on attache 

directement sur son mur Facebook), etc. 

Les propriétés discursives des données recueillies 

10 Cette prolifération n’est en rien réduite par les analyses d’opinion mining ou de sentiment 

analysis. Au contraire, on peut même dire que, commercialement, tout pousse actuellement 

à rester dans l’indifférenciation des matériaux linguistiques recueillis, quitte à trouver le 

moyen de les calculer différemment selon les plates-formes par exemple mais jamais selon 

leur statut énonciatif. Pourtant, le terme opinion puis celui de sentiment sont particulièrement 

polysémiques. Tentons de dissiper certaines ambiguïtés au contraire pour éviter les fausses 

promesses. 

11 Le matériau linguistique recueilli sur le web lors d’un crawl (moisonnage) à visée d’opinion 

mining qui sera analysé ensuite, relève de plusieurs types d’énoncés : 

• un jugement ; 

• une évaluation ; 

• une opinion ; 

• un avis ; 

• un sentiment ; 

• un goût ; 

• un récit d’expérience ; 

• un récit de pratique ; 

12 Tous ces types d’énoncés possèdent des statuts différents mais se retrouvent mêlés dans toute 

collecte. C’est souvent le cas dans les enquêtes qualitatives classiques aussi, mais l’analyse 

peut par la suite faire la différence, alors que, pour tout questionnaire fermé, il est nécessaire 

de bien différencier le statut de ces énoncés par avance puisque de la clarté de cette distinction



dépendra la possibilité ou non d’un traitement quantitatif correct. Entre toutes ces expressions 

(et nous éliminons ici les questions d’intensité ou de registre de langues qui complexifient 

l’affaire), plusieurs dimensions sont en jeu. Les uns n’ont d’existence que verbalisés, d’autres 

peuvent garder un statut tacite ou non verbal tels le goût, l’expérience ou les pratiques. Dans 

tous les cas, nous avons affaire à ce que les ethnométhodologues appellent des « comptes 

rendus », des « accounts » 7 . Ce qui veut dire qu’il ne s’agit en aucun cas de traces de 

consommations ou de pratiques effectives, enregistrées automatiquement par des capteurs de 

divers types, mais bien de comptes rendus de ces pratiques, soumis de ce fait à toute la variété 

des modalisations, des connotations et des associations présentes dans tout discours. 

13 Nous reprendrons cette discussion plus précisément dans le cadre de nos analyses pour les 

sciences humaines et sociales (voir le chapitre 6, « Sentiment analysis et SHS »), car elles 

ne sont guère considérées comme pertinentes pour l’instant dans les offres présentes sur le 

marché. 

14 Textuels ou iconographiques (emoticons, étoiles – système de vote sur Amazon , RT sur 

Twitter, etc.), les marqueurs de tonalité et les recommandations irriguent la toile et sont autant 

d’indices de nos ressentis que certaines agences ou laboratoires s’empressent de répertorier et 

d’analyser. L’importance de ces saillances perceptives est très bien analysée par les sciences 

cognitives, à l’aide d’outils comme l’eye tracking qui permet de suivre à la trace les points 

de fixation et leur durée sur un écran. La constitution de certains de ces marqueurs en routines 

perceptives (comme les étoiles sur Amazon ou sur des sites d’évaluation de films) constitue 

un vocabulaire qui fait convention et qui a tout autant de poids sinon plus que les expressions 

les plus élaborées. En effet, le temps extrêmement limité de la perception de ces saillances 

permet d’effectuer une première sélection quitte à affiner les critères ensuite. 

15 Dans une économie de l’attention 8 , recommandations, avis et votes en tous genres sont des 

indices précieux d’évaluation de la popularité en ligne, souvent qualifiée de manière abusive 

et « fourre-tout » d’e-réputation. Mais ces classements de fait sont aussi des indices pour 

s’orienter dans une offre pléthorique. Mieux encore, les qualités des biens qui sont essentielles 

à la décision d’achat, ne sont pas accessibles sans en avoir fait l’expérience. Ces biens 

d’expérience 9 exigent du temps et un risque pour les évaluer par l’expérience elle-même. Si les 

critiques de cinéma font l’objet d’une telle exploitation par les outils d’opinion mining, c’est 

qu’elles constituent une expérience par procuration pour un bien d’expérience de longue durée 

(plus qu’une chanson qu’on peut écouter) au sein d’une offre abondante. Les avis exprimés 

aident ainsi à s’orienter dans le choix, comme le faisaient les critiques auparavant combinées 

aux conversations amicales : désormais, toutes ces sources sont disponibles et traçables sur 

le réseau. 

16 Plus important encore pour les marques (mais aussi pour les politiques ou les administrations), 

le suivi de ces traces de conversation sur le web permet d’effectuer de la veille de façon 

nettement plus réactive qu’auparavant. Certes, les données sont très hétérogènes et pas aussi 

fiables qu’un travail d’enquête mais le veilleur y gagne un changement d’échelle de sa 

surveillance, changement d’échelle dans l’espace, dans la capacité de traitement automatisée, 

et partant, dans les délais de réactivité. Car il ne s’agit pas de veille stratégique dans ce cas, 

qui doit aller chercher d’autres types de documents et de sources, mais bien de veille de 

réputation. Les incidences d’une vague d’opinions défavorables générées à partir d’un bruit, 

d’une rumeur, d’une information confidentielle postée publiquement, que ces informations 

ou rumeurs soient fondées ou non par ailleurs, sont telles sur la réputation et partant sur 

les cours des actions, que les marques ont l’obligation de surveiller, voire même de piloter 

leur réputation à partir des conversations web. Le domaine du social media monitoring s’est 

développé pour répondre à ces véritables angoisses parfois et doit être distingué du community 

management qui cherche, lui, à créer des liens effectifs avec des clients et à faire vivre une 

communauté attachée à la marque. Le social média monitoring adopte une focale beaucoup 

plus ouverte et propose des outils pour non seulement identifier ces marqueurs d’opinion en 

ligne, mais aussi intervenir directement pour gérer les effets de réputation qui s’ensuivent.

Ce que changent les techniques du datamining 

La collecte de données en masse 



17 Ces données (qui sont des opinions, des avis, des commentaires) sont produites en masse, 

alors que les contributions du public étaient jusqu’ici limitées au courrier des lecteurs ou aux 

sondages et enquêtes fort longs et coûteux. Dès lors, ce changement d’échelle est comme 

toujours une amplification 10 potentielle tout à la fois : 

• des tendances participatives de la démocratie ; 

• de la visibilité d’opinions jusqu’ici marginales ; 

• de la puissance d’influence sur les esprits de tous les médias relayés par le public luimême 

; 

• de la focalisation collective immédiate sur des thèmes qui sont répliqués à grande 

vitesse ; 

• de la réflexivité d’une société sur son propre climat, son humeur (mood), ce qui n’était 

pas encore arrivé ; 

• d’une possibilité de traiter statistiquement des informations subjectives même non 

catégorisées ou indexées ; 

• des outils de monitoring qui sont autant de tableaux de bord permanents de l’opinion ; 

• des comparaisons entre types de données, émetteurs, propriétés des réseaux, des flux, etc. 

qui ouvrent des pistes infinies, d’autant plus qu’on ne sait pas vraiment ce qu’on pourrait 

y chercher ! 

L’automatisation de la collecte des corpus puis du traitement… 

et de l’analyse ? 

18 La masse des données étant quasi infinie, une tendance à automatiser au maximum les 

procédures de collecte, d’archivage, de constitution des bases de données, s’est manifestée qui 

ne fait que renforcer la fascination pour les masses de données disponibles. Puis le traitement 

linguistique lui-même a dû être automatisé, même si certaines approches sont encore très 

rustiques et approximatives. Mais la tendance serait aussi à rechercher l’automatisation de 

l’analyse elle-même, soit pour laisser la main à la société prestataire de service soit pour fournir 

des outils de pilotage direct par les clients qui demandent de l’opinion mining. Nous verrons 

cependant qu’il ne saurait en aucun cas être question de se passer d’une activité d’interprétation 

propre à des experts, spécialisés par domaines qui plus est. 

L’accessibilité via les API à des sources spécifiques 

19 La tendance aux développements de service reposant non plus sur les protocoles du Web mais 

sur des protocoles propriétaires est importante et la diffusion des « apps » pour les mobiles 

ne fait qu’encourager cette tendance. On aurait pu craindre dès lors une fermeture de l’accès 

à ces données pour des robots indépendants de l’entreprise qui gère le service. Or, avec le 

principe des API (Application Programming Interfaces) et leur mise à disposition fréquente 

par les services en question, une partie des données (voire toutes pour Twitter, si on dispose 

de la puissance de calcul nécessaire) peut être réexploitée par des développeurs qui créent les 

applications qui utilisent les API et peuvent moissonner les données de ces services. Cela étant, 

rien ne permet de garantir dans la durée une telle politique et, pour Facebook par exemple, 

la partie la plus importante des données personnelles ou d’activité est réservée à l’usage de 

Facebook voire de ses partenaires dûment référencés et payeurs pour un tel accès. La donnée 

personnelle en général est devenue un « asset » qui fait l’objet de beaucoup de convoitises. 

Quelques limites des données recueillies sur le web 2.0 

à ne pas oublier 

20 Malgré toutes les promesses faites par les services à vocation commerciale, il est nécessaire 

de pointer certaines limites de ces prestations qui sont liées à la nature informelle des données 

recueillies et à leurs enjeux commerciaux ou stratégiques. Nous en présentons seulement deux 

ici pour l’instant car ce sont des prérequis, les limites proprement linguistiques seront traitées 

dans les parties plus techniques.



Les opinions recueillies sont-elles sincères ? 

21 Nous avons évoqué rapidement l’intérêt stratégique de la veille informationnelle et l’enjeu 

représenté par le social media monitoring. Dès lors, il était fatal que les avis qui se propagent 

sur le net fassent l’objet de tentatives de manipulation en tous genres, comme l’est déjà le 

ranking de Google, avec l’apport des services de SEO, Search Engine Optimizers, pour faire 

monter un site dans les résultats sur une requête donnée (que Google s’échine à contrer et à 

désorienter lorsque leurs manœuvres sont grossières). Des sociétés sont désormais rémunérées 

pour rédiger des faux avis. Ce travail de production de faux avis fait l’objet parfois d’une 

chasse par les internautes eux-mêmes qui savent petit à petit débusquer les trolls dans un débat 

ou encore les commentaires délibérément orientés par la marque, le vendeur du produit, le 

parti ou l’émetteur du message d’origine. Des techniques d’ingénierie linguistique peuvent 

même prétendre désormais en débusquer la plupart dès lors que leurs formes d’expression sont 

un peu trop stéréotypées 11 . Les opinions émises sur le web ont donc à la fois le défaut d’être 

spontanées et de ne pas être spontanées, d’être instrumentalisées par les marques par exemple. 

Certains critiques déplorent le caractère trop spontané de ces réactions, beaucoup trop brutes 

et sans argumentation, mais il n’est pas rare que les mêmes critiques enchaînent aussitôt pour 

critiquer le caractère manipulatoire des opinions affichées, sous-entendant qu’elles n’ont rien 

d’authentiques. Argument quelque peu contradictoire car on peut alors y déceler une intention 

délibérée, une volonté d’influencer qui fera appel à tous les ressorts de l’argumentation que 

l’on requalifiera ou disqualifiera alors en propagande. Mais il est nécessaire d’être averti de 

ce caractère artificiel de certains effets d’opinion, puisque ces médias, comme les autres, sont 

l’objet de stratégies délibérées pour exercer une influence 12 . 

Sait-on vraiment qui parle ? 

22 L’émergence des outils de publication de masse sur le web s’est accompagnée d’une 

disparition de l’auteur certifié et identifié comme tel et cela perturbe tous les repères. En effet, 

il reste impossible de savoir vraiment qui se cache derrière le pseudonyme d’un commentaire, 

l’auteur d’un blog ou même un compte Facebook. Facebook a réussi cependant à instituer 

une convention de présentation de soi qui tend à rester très rattachée à son identité légale, 

celle fournie par l’état-civil. Mais il n’existe aucune garantie sur ce plan et nombreux sont 

les profils « fake », créés délibérément pour une opération particulière ou pour éviter d’être 

reconnu, sans parler des pages et des groupes qui peuvent être l’objet d’échanges très actifs. Or, 

cette absence de garantie sur l’identité des auteurs des opinions recueillies semblerait parfois 

invalider toute possibilité d’exploitation de leur contenu. Il faut en fait reconnaître ces limites 

même si elles vont à l’encontre des habitudes et des façons de faire des sociétés de sondage 

ou des sociologues traditionnels. Dans cette tradition, les expressions recueillies sont aussitôt 

agrégées et corrélées à des propriétés sociales considérées a priori comme explicatives des 

comportements. On ne s’inquiète pas tant alors de l’authenticité des identités sur le web que 

de l’absence de propriétés sociales attachées, telles que l’âge, le genre, la CSP, le niveau de 

diplôme, la préférence partisane, etc. En effet, ce sont ces agrégations d’opinions particulières, 

fondées sur ces attributs, qui sont intéressantes pour les sondages de façon à expliquer des 

régularités de comportements. Sur ce plan, il est vrai qu’il faut abandonner tout espoir de 

récupérer ce type d’informations à propos de la masse d’opinions qui circulent sur le web, 

quand bien même on parviendrait à identifier certaines de ces expressions en suivant à la trace 

des pseudonymes pour les « démasquer » ou en les reliant à des profils Facebook supposés 

authentiques (c’est-à-dire correspondant à la fiction administrative qu’est l’identité) ou encore 

en normalisant les accès aux forums par des identifiants certifiés. C’est en fait un autre statut 

de l’expression qui circule qu’il faut prendre en compte, beaucoup plus situé « en surface » 

et sans espoir d’explications par des « causes sociales » fondées sur des agrégats d’attributs. 

Les « conversations », elles, peuvent être suivies à la trace, mais avec certaines limites : tout 

se passe comme si on les écoutait de l’autre côté de la porte, à travers un filtre et un masque, 

tout en étant capable de très bien entendre les propos tenus et de les exploiter numériquement 

mais sans jamais voir les interlocuteurs. Car le grand avantage de cette absence de référence 

à certaines propriétés sociales des individus qui s’expriment, tient à l’absence de réduction



des propos a priori par l’observateur (les fameuses grilles d’entretien) et à la possibilité, 

une fois ces données agrégées et calculées de revenir si nécessaire et cela sans effort, au 

verbatim lui-même. Chose qui devenait impossible avec les questionnaires ou même avec 

les entretiens qualitatifs qui restaient dans les limbes de l’enquête, dans l’arrière-cuisine que 

personne ne devait aller observer s’il n’avait les titres requis (et même avec !). Sur le web 2.0, 

toutes ces expressions peuvent certes être calculées et agrégées à partir de leur expression 

brute et spontanée, mais en plus il est possible d’y retourner à tout moment, pour vérifier 

les expressions exactes. Cet effet de transparence de la méthode peut parfois constituer un 

artifice et prétendre à l’évidence. Mais il correspond aux exigences des clients, des lecteurs, qui 

sont désormais souvent aussi instruits que les experts qui livraient les interprétations fermées 

comme autant d’oracles à prendre au pied de la lettre. Rien ne pourra cependant garantir que 

les faux avis, désormais automatisables, ne deviennent aussi une ressource pour les stratèges 

de l’opinion sur internet 13 . 

Les domaines d’application 

23 Comme le rappellent Pang et Lee dans « Opinion Mining and Sentiment Analysis » 14 , « ce que 

les autres pensent » est régulièrement convoqué dans tout processus décisionnel, que ce soit en 

vue de l’achat d’un bien, dans le contexte d’une élection, ou encore pour évaluer la réputation 

de son entreprise. Et ce phénomène n’est pas né avec le web. 

Les avis ordinaires ont une influence 

24 Il est en effet aisé d’observer comment les réseaux relationnels jouent un rôle tout aussi 

important que les avis d’experts du domaine. Les autorités avaient certes plus de poids 

médiatique jusqu’ici et finissaient par être considérées comme les seules sources fiables. 

Mais avec le web 2.0 en particulier, le « bruit » des non-experts menace clairement leur 

monopole médiatique. Cependant, bien avant, l’orientation et les choix se faisaient aussi par 

des canaux d’influence qui jouaient plutôt sur la proximité sociale et culturelle. Ainsi, pour un 

avis médical, je peux tenter d’obtenir le diagnostic du meilleur médecin du domaine dans ma 

ville, dans mon pays voire au-delà, pour avoir des garanties. Mais dans le même temps, l’avis 

de ma belle-sœur qui a eu le même problème que moi ou celui de mon copain d’enfance qui 

a fait des études d’infirmier peuvent m’être tout aussi précieux, car ils vont avoir l’immense 

avantage de me parler dans ma langue, de prendre en compte ma situation et mon expérience 

car ils la partagent. Dans un ouvrage qui date de la préhistoire du numérique 15 , nous avions 

proposé cette distinction entre frapper à la porte exacte (le scientifique, l’expert, l’autorité du 

domaine) et frapper à la bonne porte (le bon tuyau, le coup de main, le bouche à oreille). L’un 

n’exclut pas l’autre. Michel de Certeau et Luce Giard en avaient déjà fait une description dans 

L’Ordinaire de la communication 16 . Mais avec le web, ces avis ordinaires sont disponibles 

en abondance, sur des sites médicaux comme Doctissimo, et grâce à cette prolifération des 

avis, l’un d’entre eux finit par parler dans notre langue de situations voisines et peut dès 

lors prendre une grande valeur. Ces avis peuvent donc constituer une ressource personnelle 

importante et c’est pour cette raison qu’ils attirent le public en masse (selon Médiamétrie/ 

NetRatings, le site Doctissimo faisait partie en juin 2011 du top 30 des sites les plus visités 

en France, avec 7 944 000 visiteurs uniques par mois et 564 000 visiteurs uniques par jour 17 .) 

Leur agrégation dans des moyennes ou des classements peut atténuer leur portée de proximité 

culturelle mais pour une première approche, ces avis, même agrégés, peuvent donner une 

orientation sommaire. Et ce processus est opératoire non plus seulement pour les individus 

lambda mais aussi pour les marques, pour les politiques, qui veulent avoir accès à ces avis 

ordinaires, qui reconstituent l’équivalent d’un réseau d’influence personnel. 

Les entreprises 

25 Car à côté de la consultation des avis en ligne pour un usage personnel dans la vie courante, 

la collecte et l’analyse des opinions des individus sont devenues des sources d’informations 

précieuses pour les entreprises. Alors que le recueil des opinions des consommateurs a eu 

pendant longtemps un caractère fastidieux, sans garantir que les avis recueillis soient spontanés



(organisation de focus groups, recours à des consultants, enquêtes et questionnaires, etc.), 

l’accessibilité de ces informations, dès lors qu’elles se retrouvent postées en ligne par les 

consommateurs eux-mêmes, autorise des analyses à grande échelle (opinions en provenance 

du monde entier). 

26 Le marketing a rapidement compris l’intérêt du sentiment analysis. Des agences vendent aux 

entreprises la traque des moindres mots sur leur image, sur leurs produits. 

27 Dans le domaine du product review mining : notamment à partir des sites d’avis de 

consommateurs. Les consommateurs viennent y échanger des avis et trouver des conseils pour 

leurs décisions d’achat (produits technologiques, voitures, voyage et hôtels, etc.). Selon le 7 e 

baromètre sur les comportements d’achat des internautes de Médiamétrie et de la FEVAD 18 . 

« Ce sont désormais près de 9 internautes sur 10 (86 %) qui déclarent avoir consulté 

un site internet avant d’acheter un produit, qu’ils aient finalement effectué cet achat 

sur internet ou bien en magasin. […] Les deux tiers d’entre eux consultent les 

portails et moteurs de recherche ou les sites marchands pour consulter les fiches 

produits. 6 sur 10 arpentent les sites marchands pour lire les avis des internautes. 

Et enfin près de la moitié d’entre eux (49 %) recherche de l’information sur les 

comparateurs de prix ». 

28 Le sentiment analysis permet non seulement de catégoriser les avis au sujet d’un produit (cf. le 

système de review classification, comme dans le cas des critiques de cinéma), d’en proposer 

des résumés, mais aussi de détailler à un niveau fin ces avis (quelle dimension du produit 

est appréciée, quelle autre dimension ne l’est pas – on parle alors de « features »). Il peut 

également aider à lutter contre le spam en contribuant à détecter les faux avis postés par des 

agences (cf. note 11). Le site d’enchères en ligne eBay utilise également des outils de sentiment 

analysis pour repérer les meilleures critiques et les rendre accessibles plus facilement parmi 

toutes les revues de produits (et les spams commerciaux) que présente le site. L’équipe des 

eBay Research Labs a en effet défini des indicateurs de qualité d’un avis sur un produit parmi 

lesquels la réputation de l’auteur de l’avis au sein de la communauté des utilisateurs d’eBay, 

son « seller degree » qui reflète le cas échéant quel type de vendeur ou d’acheteur il est, et 

enfin un « expertise degree » qui reflète la connaissance que l’auteur peut avoir sur un type 

de produits 19 . 

29 Dans le domaine du e-commerce et du CRM (ou GRC en français) : acquérir des 

connaissances sur ses consommateurs ou anticiper leurs attentes est possible à partir de la 

collecte des avis de consommateurs sur un produit, un service, une marque. Le contrôle 

qualité des produits peut s’en servir comme d’une veille. Il est aussi possible d’améliorer la 

relation client/fournisseur en récupérant les critiques ou avis favorables. Les évolutions à venir 

des marchés de consommation courante peuvent être anticipées par des signes précurseurs 

dans les tonalités des conversations dès lors qu’on dispose d’un étalon en temps normal 

ou favorable pour percevoir ces changements rapides 20 . Une autre application du sentiment 

analysis proposée par eBay permet de rechercher la présence de mots-clés sur Twitter pour 

détecter les pannes du service signalées par les utilisateurs, avant même que l’alerte ne soit 

donnée par le système d’enchères lui-même. 

30 Mais le sentiment analysis a également trouvé d’autres applications. 

31 Dans le domaine financier (prédiction de tendances de marché par exemple). Ainsi dans 

leur article « Predicting Movie Sales from Blogger Sentiment » 21 , Gilad Mishne et Natalie 

Glance utilisent des techniques de sentiment analysis pour améliorer la prédiction du succès 

commercial d’un film à partir des blogs. Ils montrent que le constat selon lequel le volume 

de citations d’un produit dans les blogs est corrélé avec la réussite financière du produit, 

peut être amélioré, au moins dans le domaine du cinéma, en analysant le sentiment positif 

exprimé dans les blogs au sujet d’un film, avant sa sortie en salle, et en le comparant avec 

son score au box office. L’utilisation des techniques de sentiment analysis contribuerait ainsi à 

construire de meilleures prédictions que la mesure du simple buzz, surtout si elle était associée 

à d’autres types de données comme le genre du film et le moment de sa sortie. Une autre 

utilisation du sentiment analysis dans le domaine financier est la classification des dépêches



financières afin d’observer l’impact éventuel de ces dernières sur le prix des actions cotées 

en Bourse. C’est ce type d’application que présentent Michel Généreux, Thierry Poibeau et 

Moshe Kopple dans leur article « Sentiment analysis using automatically labelled financial 

news items » 22 en faisant l’hypothèse que « la réaction du marché suite à la publication d’une 

dépêche reliée à une action particulière est un bon indicateur de la polarité de la nouvelle et 

qu’un algorithme d’apprentissage à partir de ces dépêches permet de construire un système 

qui donne à l’investisseur une source d’information supplémentaire qui peut être exploitée de 

façon avantageuse dans une stratégie d’investissement » 23 . 

32 Dans le domaine de la veille. Les techniques de sentiment analysis, parce qu’elles permettent 

de classer de grandes quantités de textes, rapports, conversations informelles sur des produits 

ou des dirigeants d’entreprises, etc., peuvent être utilisées dans le domaine de la veille, qu’elle 

soit économique, technologique, stratégique ou institutionnelle. Ainsi espère-t-on par exemple 

mettre en place des systèmes d’évaluation de la réputation des entreprises en rassemblant dans 

des bases de données des faits et opinions trouvés sur le web et permettant de tracer le profil 

de telle ou telle entreprise 24 . 

33 Dans le domaine politique. La publication croissante sur internet de textes à teneur politique 

(lois, rapports, billets de blogs politiques, etc.) et le constat que la politique ne se fait 

plus seulement dans les hémicycles mais aussi dans les débats en ligne, a conduit certains 

chercheurs à utiliser les techniques de sentiment analysis pour déterminer l’accord ou le 

désaccord des commentateurs avec telle ou telle proposition de loi. Dans leur article « Get out 

the vote : Determining support or opposition from Congressional floor-debate transcripts 25 », 

Matt Thomas, Bo Pang et Lillian Lee espèrent faciliter la reconnaissance du positionnement 

d’un orateur dans un débat politique grâce au sentiment analysis. D’autres recherches tentent 

par exemple d’analyser en masse les commentaires et opinions des citoyens américains lors de 

l’élaboration des réglementations proposées par les agences indépendantes du gouvernement 26 . 

34 Dans le domaine de la publicité en ligne. Si la publicité en ligne, ciblée et contextuelle, s’est 

considérablement développée ces dernières années, elle pourrait bénéficier des recherches en 

sentiment analysis. Car si une annonce publicitaire est d’autant plus efficace qu’elle apparaît 

au bon endroit au bon moment, elle pourrait l’être encore plus si elle s’adaptait au ressenti des 

consommateurs vis-à-vis d’un produit ou d’un service. C’est ce que propose par exemple la 

stratégie DASA (Dissatisfaction-oriented Advertising based on Sentiment Analysis) 27 , qui a 

pour but de détecter et de prendre en compte les points d’insatisfaction des consommateurs 

afin d’adapter encore mieux les annonces publicitaires à leurs cibles. 

35 L’infographie ci-dessous, du cabinet indien Beacon 28 , présente quelques domaines 

d’application du sentiment analysis.

Domaines d’application du sentiment analysis selon le cabinet Beacon 

Source : http://www.thebeaconservices.com/sentiment_analysis.php 

Les questions à se poser 



Connaître le type d’informations ou de phénomènes que l’on recherche 

36 L’un des prérequis essentiels avant tout lancement d’une étude de sentiment analysis est de 

savoir le type d’information ou de phénomènes que l’on recherche. Il est vain d’espérer 

que les résultats de la machine s’imposent d’eux-mêmes, sans avoir besoin d’être interprétés. 

À quel objectif répond la recherche d’opinions ? Selon les visées, les méthodes seront 

différentes : 

• Suivre l’évolution des opinions sur un domaine, sur une question, sur un produit/service, 

sur une marque, sur une personnalité. Parmi tous ces objets qui peuvent être suivis, 

l’échelle ou la complexité du domaine peut varier mais l’élément clé restera la notion 

d’évolution. Il sera donc nécessaire de mettre en place des outils de veille sur des 

bouquets de source définis a priori et suivis à intervalles réguliers, pour récupérer leurs 

données. Dans ce cas, malgré les biais inévitables dans la constitution des sources ou 

des mots clés, l’évolution émergera à partir de la ligne de temps. 

• Veiller à des alertes ponctuelles pour détecter des événements. La méthode peut être 

proche de la précédente mais il s’agit plutôt de construire les indices d’alerte qui vont 

permettre une réaction. Ce sont les éléments déclencheurs qui sont recherchés, soit pour 

être analysés soit pour être neutralisés. Mais dans ce cas, l’aspect agrégat et mesure 

globale n’est pas tant important que l’identification d’une source et d’un canal de 

propagation. 

• Explorer les réseaux de composition de l’opinion (à l’aide ou en vue de management 

de communautés) : dans ce cas, les verbatims sont moins importants que les canaux par 

lesquels ils circulent. Les approches de topologie du web permettent de cartographier 

les liens entre les sites ou blogs et les thématiques qui circulent entre ces sites ou blogs 

sont alors analysables en fonction de ces relations et non plus pour elles-mêmes. 

37 Ces trois points de vue permettent de distinguer sommairement les trois grandes visées de 

toute veille en opinion mining et sentiment analysis. Elle peut être centrée sur : 

• un agrégat d’opinions et son évolution sur un grand nombre de sources ; 

• un énoncé qui fait événement et dont on peut suivre la trace 29 ; 

• un milieu que l’on étudie en tant que tel et qui échange sur des thèmes qui lui sont en 

partie propres.

38 Pour chacune de ces approches, les outils à mettre en place seront différents. 

Définir la visée de sa recherche 



39 Un autre prérequis pour se lancer dans une analyse de la tonalité sur le web est de savoir 

pourquoi on cherche. On distingue au moins deux postures : observer pour comprendre ou 

observer pour agir. De plus en plus de prestataires en social media monitoring proposent des 

solutions « complètes » qui vont jusqu’à permettre aux clients de répondre en quasi-temps réel 

à un tweet qui ne leur conviendrait pas. Beaucoup de fonctionnalités mises en avant dans ces 

offres supposent que le client a pour but d’« engager la conversation » avec ses consommateurs 

ou de réagir aux attaques à sa réputation. 

40 Mais l’observation à visée de compréhension peut être un premier objectif et un objectif 

suffisant. On se retiendra alors de préqualifier les expressions recueillies (et le sentiment 

analysis pousse à les qualifier immédiatement) pour comprendre par exemple les règles 

d’expression propres à un domaine, propres aussi à un site ou à un média social. Une fois 

cette compréhension profonde acquise à partir d’études sur des échantillons restreints, il 

devient possible de mettre en place des indicateurs plus précis et automatisables en partie, 

mais pas avant. Introduire une visée opérationnelle dès le début du travail d’opinion mining 

modifie nécessairement les méthodes utilisées, les saillances retenues, les modes d’alerte, 

et donc le poids relatif des expressions relevées. Cela ne l’invalide pas mais cela oblige à 

distinguer une telle posture de connaissance stratégique par rapport à une observation à visée 

compréhensive. C’est pourquoi les outils à destination des chercheurs seront souvent différents 

de ceux proposés par les sociétés qui proposent des services opérationnels. 

Décider de la composition des ressources mobilisables : 

humains (lesquels ?) et machines (pour faire quelle tâche ?) 

41 Nous l’avons dit, on ne peut s’en remettre entièrement à la machine, ce qui se traduit par 

l’exigence d’avoir des analystes experts du domaine et ne pas s’en remettre au logiciel 

censé s’occuper de tout. Il est donc nécessaire de réaliser une étude de faisabilité et d’évaluer 

les moyens financiers nécessaires en tenant compte de cette contrainte. Si le client a besoin 

d’examiner un très grand nombre de données et qu’il estime devoir impérativement passer par 

un prestataire, il doit prévoir des analystes qui sauront interpréter les résultats. L’évaluation 

des prestations proposées devrait passer plus souvent par l’examen des qualifications des 

personnels qui réalisent le travail. Il est trompeur de prétendre qu’aucune interprétation n’est 

nécessaire ou qu’on peut la laisser au client final. Car toute la chaîne de production de 

données, même la plus automatisée, même celle qui produit les résultats les plus bruts ou 

les plus synthétisés, repose sur une succession d’interprétations, qui ne sont jamais des choix 

« purement techniques » ou d’optimisation (pour des raisons de coûts ou de délais) : chacune 

présuppose une certaine analyse implicite du domaine, de la question posée, du statut du 

matériau recueilli, etc. 

Qui pratique l’analyse de sentiment ? 

42 Parce qu’il existe beaucoup de domaines d’application du sentiment analysis, on trouve 

également beaucoup d’acteurs, et très variés, s’inscrivant dans ce secteur. Nous ne pouvons 

ici rendre compte de l’ensemble des acteurs du sentiment analysis. De nouveaux entrants 

apparaissent régulièrement dans ce domaine, leurs positionnements ne sont pas toujours 

identiques, et leur nombre évolue tous les jours. Certains acteurs disparaissent, d’autres 

ressurgissent sous de nouveaux noms, notamment après un rachat, comme ce fut le cas pour 

l’ex-Scoutlabs, racheté en 2010 par la société Lithium Technologies. 

43 Voyons plutôt quels types d’acteurs pratiquent l’analyse de sentiment. 

Les services internes des entreprises et des organismes 

44 La collecte et l’analyse des avis des consommateurs ne sont pas nouvelles et des services 

internes dans les entreprises et organismes publics s’occupaient déjà de sonder les opinions 

des consommateurs et citoyens, à l’aide des outils de CRM. Cependant, l’analyse du sentiment 

se fait encore de manière relativement artisanale chez ces acteurs : « à la main », avec outils de



bureautique classique. Un suivi de blogs connus par l’entreprise ou l’organisme peut également 

être mis en place. Les outils d’assistance à l’analyse (CAQDAS) sont rarement utilisés et 

encore plus rarement les solutions d’analyse automatique (outils de text mining spécialement 

configurés, solutions sur étagère). Ces services et ces entreprises ont souvent recours à un 

prestataire pour toute analyse plus ambitieuse. 

Les prestataires de services 

45 Les prestataires de services sont les cabinets de veille, les web agencies, les agences d’eréputation 

et de social media monitoring. Ces acteurs se sont multipliés au point de provoquer 

une véritable explosion de l’offre durant les années 2009-2010. Au 25 mai 2011, Camille 

Alloing recensait, sur le site caddE-réputation, 163 agences 30 dans le domaine de l’e-réputation 

au sens large. De son côté, l’agence Blueboat proposait à la même époque une carte des agences 

d’e-réputation en France 31 – justement réalisée à partir de la liste de Camille Alloing et revisitée 

en fonction de ses critères propres. 

Carte des agences d’e-réputation en France, par l’agence Blueboat 

Source : Carte tirée d’un billet de Justin Timmel pour le blog Blueboat : http://www.blueboat.fr/agences-e-reputationfrance 

46 123 agences prestataires en e-réputation étaient ainsi représentées et réparties en 9 catégories : 

• protection de la réputation/juridique ; 

• web agency ; 

• conseil, communication, influence, stratégie ; 

• relations publiques/presse ; 

• prestataires outils, solutions logicielles ; 

• pure players ; 

• SEO/SEM ; 

• veille, audit, analyse ; 

• marketing digital/communautaire, webmarketing. 

47 Outre leur nombre, c’est la diversité de ces acteurs qui frappe. Les différentes modalités 

de l’étude de la conversation en ligne (que nous allons détailler plus bas) sont prises en 

charge par des consultants indépendants, souvent spécialistes en intelligence économique, 

veille sectorielle ou en stratégie de communication, mais aussi par des agences web dont les 

métiers de départ peuvent être la création de site web, le référencement naturel ou le marketing 

digital.



48 D’autres agences se sont créées autour de la seule notion de réputation en ligne, l’e-réputation. 

Elles sont, en quelque sorte, les pure players du secteur. 

49 Enfin, on trouve également parmi ces acteurs les grandes agences historiques de publicité et de 

communication comme Publicis ou Havas, qui ont développé des branches de leurs activités 

spécialement dédiées à la dimension numérique. 

50 La diversité des secteurs d’origine de ces prestataires nous permet déjà d’imaginer que les 

offres de ces agences seront très différentes les unes des autres et qu’elles ne vont pas se réduire 

à du sentiment analysis. Cependant, ce dernier apparaît comme une brique nécessaire à une 

analyse fine des conversations sur le web pour tout suivi de réputation ou toute entreprise de 

social media monitoring. 

Les éditeurs d’outils logiciels ou de solutions en ligne 

pour l’analyse automatique 

51 Les éditeurs d’outils logiciels ou de solutions en ligne pour l’analyse automatique conçoivent 

et commercialisent des solutions capables de traiter de très gros volumes de données 

(catégorisation automatique, volumétrie, analyse de la tonalité, etc.). Leurs produits sont 

très souvent « prêts à l’emploi » et sont censés pouvoir s’adapter indistinctement à tous les 

types de contenus et de secteurs. Dans les faits, ils présentent des faiblesses du point de 

vue de leur adaptation à la spécificité des secteurs d’activité (d’où émane la demande). De 

manière générale, les éditeurs survalorisent les performances de leurs produits. Et les clients 

se sont souvent rendu compte au moment du bilan que les promesses vendues ne s’étaient 

pas réalisées. Enfin, les logiciels et solutions en ligne pour l’analyse automatique ne sont 

pas infaillibles. Dans certains cas, le défaut de robustesse est partiellement compensé par le 

recours à des stratégies de « retour de pertinence » (relevance feedback), qui bénéficient, à 

l’aide de systèmes apprenants, des corrections apportées par les experts du domaine. Seuls 

quelques prestataires sont en mesure de fournir les efforts financiers pour satisfaire aux 

coûts des investissements et aux exigences élevées en matière de stockage des données, de 

maintenance, de constitution des dictionnaires, de traitement des données et de constitution 

d’équipes d’experts qui viennent compléter le travail effectué par les machines. 

Certains laboratoires de recherche 

52 Ces laboratoires de recherche (universitaires ou autres) peuvent être rattachés à plusieurs 

disciplines mais le plus souvent en TAL (Traitement Automatique du Langage), c’est-à-dire 

au croisement de l’ingénierie informatique et des sciences du langage. 

53 Ces laboratoires cherchent à améliorer leurs méthodes et algorithmes qu’ils testent, notamment 

dans le cadre de « défis ». Ces défis sont en fait de grandes campagnes d’évaluation qui 

permettent aux laboratoires de confronter leurs résultats. À cette occasion, ces laboratoires 

se retrouvent souvent en concurrence ou en partenariat avec les éditeurs de solutions et/ 

ou prestataires mentionnés plus haut. C’est ainsi que la société Celi-France, spécialisée 

en extraction d’information et traitement automatique du langage a participé en 2007 à la 

campagne d’évaluation DEFT en présentant un travail sur la classification d’opinions par 

méthodes symbolique, statistique et hybride 32 . 

Encadré 1 : campagnes d’évaluation 

Il existe plusieurs campagnes d’évaluation dans le domaine de la fouille de textes. Ainsi 

de l’atelier d’évaluation DEFT 33 (DÉfi Fouille de Textes), actuellement organisé par le 

Laboratoire Informatique pour la Mécanique et les Sciences de l’Ingénieur (LIMSI) 34 , qui 

permet à différentes équipes de confronter leurs méthodes sur un même corpus pendant des 

conférences scientifiques telles que TALN 35 (Traitement Automatique des Langages Naturels), 

événement annuel organisé par l’ATALA - Association pour le Traitement Automatique des 

Langues. Si DEFT concerne le domaine général de la fouille de textes, les éditions de 2007 

et 2009 étaient plus particulièrement consacrées à des problématiques de sentiment analysis 

(classification de textes d’opinion 36 et analyse multilingue d’opinion 37 ).



À l’étranger, autre campagne d’évaluation dans le domaine de la recherche d’information 

(Information Retrieval), TREC 38 (Text REtrieval Conference), soutenue par le National 

Institute of Standards and Technology et l’Advanced Research and Development Activity 

Center du Département de la Défense des États-Unis, a proposé en 2006 Blog Track 39 , avec 

pour objectif l’étude des textes d’opinion dans un corpus issu de la blogosphère. 

54 De manière générale, les laboratoires de recherche travaillent sur des corpus fermés et dédiés 

à un sujet (et non sur des flux comme c’est le cas pour l’analyse des opinions sur le web). 

Les papiers produits présentent en général des propositions d’amélioration de features pour 

l’apprentissage machine. 

Le marché actuel 

Une offre foisonnante 

55 Depuis quelques années, on assiste à une augmentation du nombre d’acteurs sur ce marché. 

Comme nous l’avons indiqué précédemment, les cabinets et agences de veille, de management 

de la réputation en ligne et de social media monitoring, mais aussi les éditeurs de logiciels 

ou les outils en ligne se sont multipliés au point de provoquer une sur-offre sur un secteur 

dont les frontières se brouillent toujours un peu plus. Le domaine de l’analyse d’opinion, 

plus couramment appelée dans ces offres « l’écoute de la conversation des internautes », 

se caractérise donc par des frontières floues, allant du présumé service complet de social 

media monitoring à « l’analyse de sentiment » sur un seul réseau social, en passant par 

le « management de l’e-réputation » d’une marque ou d’une personne (personal branding). 

Inévitablement, une certaine confusion règne dans un domaine au vocabulaire non stabilisé. 

Veille, analyse d’opinion, e-réputation, dans tous les cas il s’agit de détecter et d’analyser les 

opinions présentes sur les réseaux sociaux et le web, en utilisant des techniques d’extraction 

d’information et en essayant de fournir aux clients des indicateurs de leur présence, de leur 

image, de celle de leurs concurrents, pour éventuellement proposer des stratégies de contreattaque. 

56 Quelles prestations les acteurs du secteur proposent-ils en effet ? Passons en revue les 

termes employés pour décrire leurs offres sur leurs sites web : e-réputation, veille marketing, 

veille digitale, référencement, community management, communication interactive, veille 

en intelligence économique, buzz tracking, brand monitoring, marketing communautaire, 

web marketing, marketing digital, sentiment analysis, social analytics, relation blogueurs, 

e-influence, sentiment monitoring, veille image, engagement dans la conversation web, 

réputation digitale, online sentiment, mesure de la visibilité, RP 2.0, suivi de notoriété, buzz 

monitoring, identité numérique, etc. La liste est longue et il n’est pas toujours facile de voir 

où commence et où finit l’offre : simple mesure de la visibilité, décompte des citations d’un 

nom de marque sur les blogs, analyse des opinions exprimées au sein d’un bouquet de sites 

sur une thématique donnée, possibilité de réagir en quasi-temps réel à un commentaire de 

consommateur ? 

57 Sous l’effet de la concurrence, les offres semblent tendre peu à peu à se ressembler et 

à se rapprocher vers une sorte de modèle « 360 » allant parfois de la création d’un site 

pour une marque, à la campagne de communication, en passant par son référencement et 

en terminant par l’évaluation de son image. Les acteurs proposant des plateformes ou suites 

logicielles semblent intégrer au fur et à mesure toujours plus de fonctionnalités autour de leur 

noyau de savoir-faire premier, parfois en s’alliant avec d’autres. En témoignent par exemple 

l’alliance entre Lexis Nexis (fourniture d’informations à usage professionnel et solutions 

de veille et d’analyse des médias) et Augure (entreprise de réputation en management), le 

rachat de Scoutlabs, éditeur de logiciel en social media monitoring, par Lithium Technologies, 

spécialiste en applications en gestion de la relation client 40 , ou encore celui de Backtype 

(suivi et analyse des conversations sociales) par le service de micro-blogging Twitter 41 . Et ces 

rapprochements ne sont pas des cas isolés sur le marché de l’e-réputation !



58 Enfin, la tarification des offres disponibles sur le marché va de la gratuité au service payant. 

À côté des solutions gratuites qui permettent de suivre un aspect particulier de la conversation 

web comme par exemple : 

• Samepoint (reputation management search engine) ; 

• SocialMention (real-time social media search & analysis) ; 

• BoardTracker (forum discussion search) ; 

• Twilert (Twitter alerts) ; 

• Comment (suivi de commentaires), etc. 

59 Les solutions payantes proposent très souvent des offres intégrées et packagées (comprenant 

ou non du sentiment analysis). Elles sont en général proposées par abonnement. Dans ce 

cas, le prix peut varier en fonction du nombre d’utilisateurs futurs de la solution, du nombre 

de requêtes autorisées, du type de fonctionnalités auxquelles on souscrit, etc. Pour aider les 

clients potentiels à s’y retrouver, et à ne pas choisir une formule sous- ou surdimensionnée, 

les prestataires précisent souvent à titre indicatif à qui s’adresse telle ou telle formule. 

Tarification Radian 6 (pour l’Amérique du Nord) – janvier 2012 

Source : http://www.radian6.com/what-we-sell/radian6-pricing/

Tarification Ubervu – août 2011 

Source : http://www.ubervu.com/pricing 


Chapitre 1. Historique et état du marché 17

Tarification Ubervu – janvier 2012 



Source : https://www.ubervu.com/pricing. Le marché du social media monitoring évoluant très rapidement, les offres 

et tarifs évoluent également très vite. 

60 Le marché regroupant les offres en e-réputation, en social media monitoring, en veille, et en 

sentiment analysis est donc composé d’acteurs très différents, qui définissent leur métier de 

manières très diverses, en proposant des gammes de prix très étendues et en s’adressant à 

des cibles très diverses elles aussi. Dans le cas des marques et grosses entreprises qui se 

soucient de leur image en ligne, les offres peuvent même être taillées sur mesure pour les 

différentes directions de ces sociétés. Certains prestataires et agences construisent leur discours 

commercial en expliquant que telle ou telle de leurs solutions sera particulièrement utile à la 

direction marketing et stratégique, ou bien à la direction de la communication, ou encore à 

la direction des études marketing, sans oublier la direction des achats, le service client ou la 

direction générale elle-même 42 . 

61 D’autres offres visent les TPE et les PME exclusivement. 

62 D’autres offres encore sont adressées à des secteurs particuliers comme les professionnels 

du tourisme ou les secteurs sensibles que sont par exemple le secteur pharmaceutique ou celui 

de l’énergie. 

Les fonctionnalités proposées 

63 Pour comprendre les offres disponibles, il faut donc les décrypter, entrer dans le détail 

des fonctionnalités proposées, voire les tester quand cela est possible, des versions de 

démonstration étant souvent disponibles en ligne. Dans certains cas comme les services 

gratuits en ligne, le test peut être immédiat (voir plus bas les outils dédiés au sentiment analysis 

sur Twitter). 

64 Pour les autres, il faut donc s’attarder sur les présentations vidéo, documents et indications 

disponibles sur les sites web et, le cas échéant, demander un test gratuit. De manière générale, 

les offres packagées payantes et s’adressant aux marques et grandes entreprises – qu’il s’agisse 

de logiciels ou de plateformes clé en main – comprennent : 

• le sourcing (sur le web, le « web profond », les sites d’actualités, ou sur des bases de 

données fermées comme les bases de brevets) ; 

• la collecte (automatisée) des entités mises sous surveillance ;



• l’archivage des données ; 

• leur traitement ; 

• l’analyse des données ; 

• la livraison des résultats sous des formats différents (tableau de bord partageable, 

newsletters, reporting, etc.). 

65 De gros moyens financiers sont nécessaires pour les investissements de développement, de 

stockage et de maintenance. Certains prestataires proposent même des offres particulières à des 

secteurs à partir de bases de données spécialisées par domaine, d’outils dédiés (dictionnaires 

métiers, etc.). Seuls certains d’entre eux sont capables de fournir un tel service en raison 

du temps de travail très important nécessaire pour constituer ces bases ou ces dictionnaires 

spécialisés. 

66 Entrons plus avant dans le détail des fonctionnalités de ces offres packagées. 

67 On peut débuter un sourcing de plusieurs manières (voir le chapitre 3, « Le sourcing »). Celuici 

peut faire suite à une analyse de la demande faite directement via un échange avec le client. 

Il peut également être réalisé via un formulaire à remplir pour définir le besoin. Un corpus-test 

peut être mis en place pour tester sa pertinence. La rédaction d’une liste de mots clés à mettre 

a priori sous surveillance, et qui sera complétée au fur et à mesure, est également un moyen 

assez répandu de débuter un sourcing. Quoi qu’il en soit, une fois la demande circonscrite, il 

faut identifier les sources. Là encore, plusieurs méthodes peuvent être proposées. Les sources 

peuvent être identifiées via des moteurs, méta-moteurs, annuaires et portails. Très souvent, 

les principaux réseaux sociaux et sites du web social (bookmarking, micro-blogging, etc.) 

font d’emblée partie des sources mises sous surveillance, parfois au détriment de sources du 

web « 1.0 » pourtant tout aussi pertinentes. La programmation d’alertes en cas d’apparition 

de nouvelles sources sur un thème donné est une fonctionnalité parfois proposée. Et il est en 

général toujours possible de déclarer des mots clés supplémentaires à surveiller. Un travail 

d’élimination du bruit (désambiguïsation) et d’élimination du silence (synonymes, fautes 

d’orthographe courantes) peut venir compléter de manière plus ou moins efficace le sourcing, 

en fonction des moyens alloués à cette tâche par le prestataire. Enfin, une fois le périmètre du 

sourcing défini, tout un travail de qualification (avec parfois attribution d’un indice de fiabilité 

ou de pertinence des sources), de catégorisation, voire de cartographie des sources, est mis 

en œuvre. 

68 La collecte (voir le chapitre 4, « Constituer et traiter les corpus de travail avant l’analyse 

de tonalité »), en raison de la masse de données à crawler (moissonner), est une opération 

automatisée qu’il faut néanmoins paramétrer. Quels types de paramètres peuvent donc être 

pris en compte ? 

• Le choix du ou des bouquets de sources à crawler dans le cas où de tels bouquets ont été 

définis. Le client peut par exemple demander une mise sous surveillance de sites qu’il 

a l’habitude de consulter. 

• Le choix du type de sources à crawler : réseaux sociaux, blogs, sites de presse, etc. 

• La granularité et la régularité du crawl (qui peut aller jusqu’à une collecte en quasitemps 

réel). 

• Des requêtes peuvent également être construites à partir de mots-clés ou de groupes de 

mots-clés à surveiller. 

69 L’archivage et le traitement des données récupérées via le crawl (voir les chapitres 4, et 5, 

« Détecter les tonalités ») sont souvent des opérations sur lesquelles le client n’a pas la main. 

Pour le prestataire, il s’agit essentiellement de construire des bases de données d’archivage 

où classer des documents nettoyés (suppression des bandeaux publicitaires, reformatage, etc.) 

et étiquetés, afin de pouvoir les retrouver facilement dans la base en fonction de catégories. 

La catégorisation peut se faire automatiquement, ou au moins semi-automatiquement – une 

rectification manuelle pouvant être nécessaire car les techniques de classement automatisées 

ne sont pas infaillibles. 

70 Concernant l’analyse des données, de nombreuses features sont proposées aux clients. En voici 

quelques exemples :



• volumétrie : nombre d’occurrences d’un mot-clé, nombre de citations sur les réseaux 

sociaux et les blogs, nombre d’« amis » sur les réseaux sociaux, nombre de « Like » 

Facebook, etc. ; 

• mots fréquents (i.e. les plus souvent associés à un mot-clé ou à une thématique) ; 

• analyse de la tonalité (sentiment analysis) ; 

• suivi dans le temps de la volumétrie, des mots fréquents, de l’analyse de la tonalité ; 

• distribution des résultats en fonction des différents types de sources, pour chacune des 

sources, en fonction de leurs catégories thématiques, en fonction de la langue ; 

• évolution comparée des résultats suivant le type de sources, suivant la requête, suivant 

la catégorie thématique des sources, 

• entités nommées et expressions significatives associées ; 

• co-occurrences de termes (clusterisation) ; 

• mise en évidence de corrélations. 

71 La livraison des résultats peut s’effectuer de différentes manières. L’analyse des données en 

provenance des médias sociaux est souvent rendue accessible via des tableaux de bord en ligne. 

Le client peut même souvent accéder directement aux verbatims par un simple clic, répondre 

en quasi-temps réel à des commentaires de clients, etc. Cette dernière feature est devenue 

très en vogue avec l’impératif de l’« engagement dans la conversation » avec les internautes 

prôné par plusieurs prestataires et gourous du e-marketing. Plus traditionnels, des rapports de 

veille personnalisés et rédigés par des experts, souvent spécialisés par secteur, ainsi que des 

newsletters et alertes, font partie des options de diffusion des résultats. 

72 Pour chacune de ces fonctionnalités, l’utilisateur peut avoir plus ou moins la main sur 

le logiciel/la plate-forme et son paramétrage. Il peut, selon les cas, affiner ses requêtes, 

ajouter une source à mettre sous surveillance, etc. Concernant la feature particulière que 

représente le sentiment analysis, la plupart des prestataires se targuent de fournir des services 

de recueil et d’analyse automatiques des opinions sur le web. Mais la grande majorité des 

solutions proposées se limitent en fait, en termes de sentiment analysis, à un classement qui 

répartit les opinions en trois grandes catégories : positif, négatif et neutre. Cette dernière 

catégorie tend à regrouper tous les verbatims dont la polarité est soit effectivement neutre, 

soit, et surtout, trop difficile à classer (alors que ce sont deux choses très différentes 43 !). 

Ces difficultés tiennent largement au fait que la polarité est encore trop souvent jugée à 

l’aune de listes de termes identifiés a priori comme laudatifs ou péjoratifs, liste composée à 

partir de dictionnaires internationaux (General Inquirer, SentiWordNet). Nous y reviendrons 

plus tard, mais rappelons pour l’instant que la polarité d’une opinion est une affaire plus 

complexe que la simple identification de la polarité d’un terme présent dans une expression. 

Le contexte d’énonciation, l’origine du locuteur ou encore l’inscription dans un dispositif 

communicationnel particulier sont autant de critères d’évaluation de l’opinion qui doivent être 

pris en compte. Si la plupart des prestataires disent fournir des solutions automatisées, il reste 

que la grande majorité des prestations pointues d’analyse du sentiment restent supervisées par 

des cellules d’experts (justement en raison des difficultés citées plus haut qui réclament une 

expertise humaine). Le « tout automatique » constitue plus un argument marketing qu’une 

réalité et l’on peut parler à plus juste titre « d’analyse du sentiment assistée par ordinateur », 

comme on le fait pour la traduction lorsqu’on admet les limites de la supposée traduction 

automatique. 

Notes 

1 W. Stern, 1902, « Zur Psychologie der Aussage. Experimentelle Untersuchungen über 

Erinnerungstreue », Zeitschrift für die gesamte Strafrechtswissenschaft, vol. XXII. 

2 G.-W. Allport et L. J. Postman, 1945, « The Basic Psychology of Rumor », in Transactions of the New 

York Academy of Sciences, série II, vol. 8. 

3 E. Morin, La Rumeur d’Orléans, Seuil, 1969. 

4 J.-N. Kapferer, Rumeur, le plus vieux média du monde, Seuil, 1987. 

5 D. Boullier, 2010, La Ville-événement. Foules et publics urbains, Paris, PUF.



6 B. Latour, 1993, « Le “topofil” de Boa Vista ou la référence scientifique », La clef de Berlin et autres 

leçons d’un amateur de science, Paris, La Découverte. 

7 H. Garfinkel, 1967, Studies in Ethnomethodology, Englewood Cliffs, Prentice Hall. 

8 Cf. M. H. Goldhaber, 1992, « The Attention Society », Release 1.0, n° 3, p. 1-20 et D. Boullier, 2009, 

« Les industries de l’attention : fidélisation, alerte ou immersion », Réseaux, n o 154, p. 231-246. 

9 G. A. Akerlof, 1970, « The Market for “Lemons”: Quality Uncertainty and the Market Mechanism », 

The Quarterly Journal of Economics, MIT Press, vol. 84, n° 3, p. 488-500, [en ligne] 

[URL : http://www.jstor.org/stable/1879431]. 

10 E. L. Eisenstein, 1991, La Révolution de l’imprimé dans l’Europe des premiers temps modernes, Paris, 

La Découverte. 

11 Voir cette étude récente menée à Cornell University : M. Ott et al., 2011, « Finding Deceptive 

Opinion Spam by any Stretch of the Imagination », Proceedings of the 49 th Annual Meeting of the 

Association for Computational Linguistics, Portland, Oregon, 19-24 juin 2011, [en ligne] [URL : http:// 

www.cs.cornell.edu/~myleott/op_spamACL2011.pdf]. 

12 Pour une bonne illustration de ce point, lire l’article « Fake Twitter accounts used to promote tar 

sands pipeline », [en ligne] [URL : http://www.guardian.co.uk/environment/2011/aug/05/fake-twittertar-sands-pipeline]. 

13 http://proxem.wordpress.com/2011/10/07/la-societe-generale-objet-d%e2%80%99unemanipulation-sur-twitter/ 

14 B. Pang, L. Lee, 2008, « Opinion Mining and Sentiment Analysis », Foundations and Trends in 

Information Retrieval, vol. 2, n o 1-2, p. 1-135, [en ligne] [URL : http://www.cs.cornell.edu/home/llee/ 

omsa/omsa-published.pdf]. DOI : 10.1561/1500000001. 

15 D. Boullier, 1984, « Autres outils, autres communications. À propos de Telem - Nantes », Télématique 

- Promenade dans les usages, M. Marchand et C. Ancelin éd., Paris, La Documentation Française, 

p. 71-93. 

16 Michel de Certeau, Luce Giard, 1983, « L’ordinaire de la communication », Réseaux, 

vol. 1, n o 3, p. 3-26, [en ligne] [URL : http://www.persee.fr/web/revues/home/prescript/article/ 

reso_0751-7971_1983_num_1_3_1092]. 

17 Cf. le communiqué de presse de Médiamétrie/NetRatings, L’Audience de l’Internet en France, juin 

2011. 

18 http://www.fevad.com/espace-presse/7eme-barometre-sur-les-comportements-d-achats-desinternautes 

19 S. Huang et al., 2010, « Promote Product Reviews of High Quality on E-commerce Sites », Pacific 

Asia Journal of the Association for Information Systems, vol. 2, n° 3, art. 5, [en ligne] [http:// 

aisel.aisnet.org/pajais/vol2/iss3/5]. 

20 Pour une illustration de la « Voix du Client chez 

Auchan », cf. http://proxem.wordpress.com/2012/01/11/interview-de-jerome-desreumaux-directeur-dela-relation-clients-auchan/ 

21 G. Mishne., N. Glance., 2006, « Predicting Movie Sales from Blogger Sentiment », proceedings of 

AAAI-CAAW-06, the Spring Symposium on Computational Approaches to Analyzing Weblogs, [en ligne] 

[URL : http://www.aaai.org/Papers/Symposia/Spring/2006/SS-06-03/SS06-03-030.pdf]. 

22 M. Généreux, T. Poibeau, K. Moshe, 2011, « Sentiment Analysis Using Automatically Labelled 

Financial News Items », Affective Computing and Sentiment Analysis: Metaphor, Ontology, Affect 

and Terminology, K. Ahmad éd., chap. 9, p. 111–126, [en ligne] [URL : http://www.clul.ul.pt/files/ 

michel_genereux/EMOTI.pdf]. 

23 M. Généreux, « Système d’analyse de la polarité de dépêches financières », TALN 2011, 

Montpellier, 27 juin – 1 er juillet 2011, [en ligne] [URL : http://www.lirmm.fr/~lopez/RECITAL/DEMOS/ 

DEMO_Genereux_UnivLisboa.pdf]. 

24 H. Saggion, A. Funk, 2009, « Extracting Opinions and Facts for Business Intelligence », Revue des 

Nouvelles Technologies de l’Information (RNTI), n o E-17, p. 119-146, [en ligne] [URL : http://gate.ac.uk/ 

sale/rnti-09/final-version/Saggion-Funks-OM-09.pdf]. 

25 M. Thomas, B. Pang, L. Lee, 2006, « Get out the Vote: Determining Support or Opposition from 

Congressional Floor-Debate Transcripts », Proceedings of EMNLP 2006, p. 327–335, [en ligne] [URL : 

http://www.cs.cornell.edu/people/pabo/papers/emnlp06_convote.pdf]. 

26 N. Kwon, S. W. Shulman., E. Hovy, 2006, « Multidimensional Text Analysis for eRulemaking », 

Proceedings of the 2006 International Conference on Digital Government Research, p. 157-166, [en 

ligne] [URL : http://www.isi.edu/natural-language/people/hovy/papers/06dgo-eRule-textanalysis.pdf]. 

DOI : 10.1145/1146598.1146649.



27 K. Liu et al., 2008, « Incorporate Sentiment Analysis in Contextual Advertising », TROA2008- 

WWW2008, p. 1-8, [en ligne] [URL : http://research.yahoo.com/workshops/troa-2008/papers/ 

submission_4.pdf]. 

28 http://www.thebeaconservices.com/ 

29 http://memetracker.org/ 

30 http://caddereputation.over-blog.com/article-26988418.html 

31 http://www.blueboat.fr/agences-e-reputation-france 

32 S. Maurel, P. Curtoni et L. Dini, « Classification d’opinions par méthodes symbolique, statistique 

et hybride », Actes de DEFT 2007, p. 111-117, [en ligne] [URL : http://www.celi-france.com/IMG/pdf/ 

celi-france_deft07-2.pdf]. 

33 http://deft.limsi.fr/ 

34 http://www.limsi.fr/ 

35 http://www.atala.org/-Conference-TALN-RECITAL- 

36 http://deft07.limsi.fr/ 

37 http://deft09.limsi.fr/ 

38 http://trec.nist.gov/ 

39 I. Ounis et al., 2006, « Overview Of The Trec-2006 Blog Track », The Fifteenth Text REtrieval 

Conference (TREC 2006) Proceedings, p. 17-31, [en ligne] [URL : http://trec.nist.gov/pubs/trec15/ 

papers/BLOG06.OVERVIEW.pdf]. 

40 http://techcrunch.com/2010/05/06/lithium-technologies-picks-up-scout-labs-for-20-million/ 

41 http://blog.backtype.com/2011/07/backtype-has-been-acquired-by-twitter/ 

42 Voir par exemple la plaquette de présentation des Solutions de veille et d’analyse de l’information 

de LexisNexis Analytics : http://www.lexisnexis.fr/pdf/pdf_brochures/Plaquette_LN_Analytics- 

_11VM032.pdf. 

43 Ce qui revient au traitement analogue des refus de répondre, des « ne sait pas » dans les sondages. 

Pour citer cet article 

Référence électronique 

Dominique Boullier et Audrey Lohard, « Chapitre 1. Historique et état du marché », in Opinion mining 

et ‎Sentiment analysis (« Collection « Sciences Po │ médialab » », n o 1) , 2012 [En ligne], mis en ligne 

le 19 mars 2012, consulté le 22 mars 2012. URL : http://press.openedition.org/204 

Droit d’auteur 

Licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Pas de Modification 

3.0 France

Chapitre 1. Historique et état du marché - Sciences Po Spire

Create successful ePaper yourself

Delete template?

Save as template?