Afin de valoriser le potentiel inexploité de la veille financière, j’ai interviewé Thomas Renault, docteur en Sciences de Gestion de l’Université Paris 1 Panthéon-Sorbonne et maître de conférences, au sujet de sa thèse de doctorat. Cette interview a été publiée dans le Livre Blanc sur l’état de l’art et les tendances du Market Intelligence réalisé en collaboration avec Digimind. Dans sa thèse "Three essays on the informational efficiency of financial markets through the use of Big Data Analytics" Thomas Renault a analysé des données publiées sur Internet et les réseaux sociaux afin d’améliorer notre compréhension du fonctionnement des marchés financiers. Voici comment il a procédé.
Quelles sources d’informations avez-vous exploité pour la veille financière ? Et pourquoi ?
Thomas Renault : J’ai beaucoup travaillé sur des données Twitter et StockTwits (équivalent de Twitter pour les marchés financiers). J’apprécie particulièrement les données StockTwits car, sur cette plateforme, les utilisateurs peuvent eux-mêmes indiquer le sentiment des messages qu’ils publient (positif ou négatif) ce qui permet de travailler sur de grandes bases de données de messages classifiés dans le cadre d’algorithme de machine learning supervisé.
Les données Twitter sont aussi intéressantes de par le volume impressionnant de messages publiés chaque jour. La présence des grands médias et de personnalités influentes différencie aussi Twitter de nombreux autres sites. Pour ces raisons, il est regrettable que les réseaux sociaux restent une source de données encore peu (ou mal) exploitée par les entreprises.
Avez-vous réalisé cette veille avec votre simple œil d’expert ? Ou l’avez-vous automatisée ? Si oui, pourquoi et comment ?
Thomas Renault : La collecte de données est automatisée dans tous mes travaux. J’utilise des scripts en Python pour récupérer les données (web scrapping ou utilisation des API) et en général une base de données MongoDB pour stocker les données. Ensuite, j’utilise aussi Python pour le machine learning (scikit-learn) ou pour l’analyse textuelle (nltk). Idem pour les calculs et modèles (pandas, numpy). Pour les réseaux, j’utilise Gephi.
Avez-vous réussi à créer des modèles pour détecter et interpréter des signaux faibles ? Êtes-vous parvenu à faire du prédictif ? Comment ?
Thomas Renault : Absolument. Dans un de mes travaux, je montre ainsi que le sentiment des messages publiés sur le réseau social StockTwits permet de prévoir l’évolution des marchés financiers US avec des données intra-journalières. Dans un autre papier, je montre que le volume de messages publiés sur Twitter à propos de certaines petites entreprises américaines a aussi un pouvoir prédictif sur l’évolution des cours de ces actions la semaine suivante. Idem pour la quantification du discours de la Banque Centrale Européenne, qui contient de l’information permettant d’améliorer la prévision de la prochaine annonce de taux directeur par la Banque Centrale.
Quels types d’informations financières et économiques peuvent remonter grâce à la veille que vous avez effectuée ?
Thomas Renault : L’objectif est de créer de nouveaux indicateurs à partir de données non-structurées pouvant avoir un pouvoir prédictif. Ensuite, ces nouveaux indicateurs peuvent être utilisés dans n’importe quel modèle (taux de croissance, prix des actions, annonce de politique monétaire…).
Quelles tendances pouvons-nous interpréter ? Et quelles actions concrètes pourrions-nous envisager (pour les entreprises ou autre) ?
Thomas Renault : Pour une entreprise, il semble intéressant de mettre en place un système d’alerte automatique lors d’un volume anormal de message sur un sujet donné (ou lors d’une forte variation du sentiment) afin de pouvoir ensuite mettre en place des actions si nécessaire. Pour suivre les tendances, il semble aussi intéressant de mettre en place des systèmes de catégorisation automatique (non-supervisée) des sujets (avec par exemple un algorithme type Latent Dirichlet Allocation) afin de suivre l’évolution des sujets. Enfin, l’identification des influenceurs via la théorie des réseaux peut permettre d’un point de vue marketing d’identifier les meilleurs relais.
Pour aller plus loin
- Quel futur pour l’analyse prédictive ?
- De l'User-centered Design au Design Thinking : comment impliquer l'utilisateur dans la création du produit ?
Consultant Principal chez Orange Consulting, je suis en charge de l'offre d'écoute web et de veille stratégique. Ma mission principale est d’accompagner les entreprises à faire de l’information un levier stratégique. Mes missions et ma veille quotidienne m'ont permis d'élargir mes compétences dans des domaines tels que la Gouvernance de la donnée, l’Intelligence Artificielle et l’Innovation via les start-up.