artificielle dans les grandes entreprises
Gouvernance-IA-CIGREF-LEXING-2016
Gouvernance-IA-CIGREF-LEXING-2016
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Gouvernance de l'intelligence <strong>artificielle</strong> <strong>dans</strong> <strong>les</strong> <strong>grandes</strong> <strong>entreprises</strong><br />
Enjeux managériaux, juridiques et éthiques<br />
Machine Learning afin de filtrer <strong>les</strong> CV, prédire <strong>les</strong> employés susceptib<strong>les</strong> de partir, recommander des<br />
cours ou formations ou encore détecter des talents.<br />
Google s’appuie également sur le Knowledge Graph, initié par Freebase sur la base des données de<br />
Wikipédia. Il est progressivement alimenté par des centaines de millions de concepts regroupés en un<br />
énorme graphe. Chaque nœud du graphe est un concept interconnecté avec d’autres concepts.<br />
Chaque entreprise peut faire son Graph avec Wikidata. Les <strong>entreprises</strong> doivent investir <strong>dans</strong> des jeux<br />
de données de qualité afin qu’ils soient représentatifs des contenus. Cela permet l’amélioration d’un<br />
modèle. Cela demande un budget d’évaluation humaine comme avec le Mechanical Turk d’Amazon,<br />
application web de crowdsourcing qui vise à faire effectuer par des êtres humains contre<br />
rémunération, des tâches comme l’analyse ou de produire de l’information <strong>dans</strong> des domaines où<br />
l’intelligence <strong>artificielle</strong> est encore trop peu performante. Par ailleurs, <strong>les</strong> données vieillissent, il<br />
convient donc de mettre à jour <strong>les</strong> données et de surveiller <strong>les</strong> signaux.<br />
« Il y a toujours un risque avec le Machine Learning : c’est le sur-apprentissage. Certains<br />
modè<strong>les</strong> fonctionnent sur un jeu de données mais ne pourront être généralisés. Afin d’éviter<br />
cela, il faut s’inspirer de la théorie du rasoir d’Ockham. Lorsque plusieurs hypothèses se profilent, il<br />
vaut mieux choisir la plus simple (…). Une partie importante du travail de conception d'un système<br />
de Machine Learning est d'ajuster <strong>les</strong> paramètres de l'algorithme afin que le système apprenne au<br />
mieux des exemp<strong>les</strong> fournis, mais sans sur-apprendre. Par exemple, si je fournis à Google Photos<br />
plusieurs photos d'un ami assis sur un canapé, le système ne doit pas apprendre que le canapé fait<br />
partie de mon ami ».<br />
Aurélien Géron, Product Manager YouTube, Google France.<br />
Les perspectives du Machine Learning chez Google consistent à optimiser des systèmes existants en<br />
interne. Il apporte une amélioration du système mais le simplifie aussi. Sans le Machine Learning,<br />
certains projets seraient impossib<strong>les</strong> à réaliser. Il y a surtout un mouvement d’ouverture chez <strong>les</strong><br />
géants du web américains.<br />
Aurélien Géron, Product Manager Youtube chez Google France, recommande l’utilisation de<br />
TensorFlow, TensorFlow.org qui a des tutoriels de A à Z.<br />
TensorFlow est un framework de calcul généraliste. Il convient de détailler le calcul sous la forme<br />
d’un graphe et TensorFlow s’occupe de la distribution des tâches. Il est en Open Source. TensorFlow<br />
peut être utilisé via le langage Python, ou bien avec le langage C++ pour certains besoins très<br />
pointus."<br />
Deep MINIST est un 2e tutoriel. Le code est tout petit. Cela ressemble à du pseudocode. Pour la<br />
gestion du texte, il existe Vector Representations of Words. Il complète <strong>les</strong> phrases et fait <strong>les</strong> liens<br />
entre <strong>les</strong> mots. A terme, il y aura une compétition des plus grands de la Tech pour sortir des<br />
frameworks en Open Source.<br />
11<br />
Septembre 2016