Big Data Paris : que retenir du Salon 2020 ?

Big Data Paris 2020

Je viens de participer les 14 et 15 Septembre derniers au Salon Big Data Paris. Le Salon avait été décalé à Septembre et regroupé avec le Salon de l’Intelligence Artificielle. Mais comme on pouvait s’y attendre, malgré tout, cette édition a vu relativement peu de visiteurs. En tout cas nettement moins que la précédente édition. Et le choix des larges allées du Parc des Expositions (Porte de Versailles), a certes permis de respecter les distances de sécurité sanitaire… Mais il a aussi accentué encore un peu le sentiment de désertification. Quoiqu’il en soit, les échanges ont été intéressants et pour le coup, il y avait sans doute plus de personnes motivées (et moins de touristes!) que les précédentes années!

Ainsi , certaines tendances me semblent intéressantes. Comme toujours (enfin souvent…), pour faire succinct, je vais me concentrer sur 3 tendances!

La NLP arrive en force chez Big Data Paris

On en parlait depuis plusieurs années, et cette fois, on arrive (enfin ?) dans le domaine de l’Augmented Analytics. L’un des points les plus visibles c’est la promotion de fonctionnalités de type Natural Language Processing (NLP).

Il s’agit en clair d’interpréter le langage naturel de l’utilisateur.

Si certaines solutions se présentent comme des « plugins » qu’on vient intégrer avec des outils existants pour valoriser et interpréter la donnée disponible (par rapport à un CRM), d’autres y voient une nouvelle IHM (Interface Homme Machine).

Dépasser le Chatbot

Ainsi, plusieurs acteurs positionnent leur solution comme un « collègue virtuel » avec lequel par exemple on peut interagir via un réseau social (Microsoft Teams ou encore Google Chat). On utilise alors le langage naturel pour interagir avec l’application et l’information qu’elle détient. Cela peut être en tapant du texte (c’est l’exemple du chatbot) mais également en parlant ou en utilisant plusieurs « canaux » ou media.

Certes, le chatbot correspond déjà en partie à cette idée. Mais en général, on y prépare les réponses à l’avance. Ou alors, on dispose d’un système qui va apprendre et ajuster les réponses possibles. Au final, on est sur des règles assez simples et pré-paramètrées. Cette prédétermination peut se faire par mot-clé (ex. j’ai tapé une phrase contenant « inscription » et le chatbot renvoie un lien vers la FAQ « Procédure d’inscription »). L’autre mode de détermination de la réponse, c’est l’arbre de décision, dans lequel l’utilisateur va aller choisir progressivement des options pour affiner la réponse.

Dans les solutions présentées sur le salon, on trouve plutôt des technologies permettant de constituer dynamiquement les réponses en utilisant la data et sans connaître à l’avance les questions et les réponses.

… pour faciliter l’accès au Big Data

L’avantage de ces techniques, c’est qu’elles permettent de mieux exploiter les données et de vulgariser/généraliser leur utilisation. Dans certains cas, on peut même se dire qu’on réduit le nombre de licences de type Business Intelligence via une interface simplifiée. On fait donc d’une pierre deux coups : meilleur service et moins de coûts.

Parmi les solutions présentes, on trouve askr.ai qui se qualifie comme un chat avec la donnée et Myrtea, l’assistant virtuel qui recommande des actions. Je m’attendais à ce que Golem soit plus visible car leur solution, et leur CEO, font régulièrement parler d’eux. Ils étaient bien présents mais relativement discrets. En tout cas vous trouverez de nombreuses autres solutions autour de l’IA et du NLP dans la liste des exposants du Salon Big Data Paris.

Data Science et Automatisation

C’est un autre point qui ressort de cette édition de « Big Data Paris ». Comme toujours, beaucoup de solutions autour de la Data Science et de l’Intelligence Artificielle. Mais cette fois, c’est surtout l’automatisation et la simplification des projets de Data Science qui ont été mises en avant.

Des projets Big Data qui arrivent difficilement en production…

Ainsi, à travers les solutions, les conférences et témoignages, on voit bien que la promesse de la data science n’est pas toujours délivrée… Ainsi plusieurs projets s’avèrent compliqués à mettre en oeuvre. Les périmètres ou la valeur métier ne sont pas toujours clairs. De nombreux projets Big Data sont ainsi lancés avec une approche exploratoire. C’est bien, mais… On ne peut pas non plus s’attendre à de la magie. On peut se dire « je vais injecter des données dans un outil et on verra bien ce qu’il en ressort »… Mais en général, la réponse est souvent « Pas grand chose ! ».

Du coup, plusieurs acteurs se positionnent sur l’industrialisation des projets Data Science et l’automatisation des tâches des datascientists. Cela couvre des aspects de « préparation de données » qui sont souvent fastidieuses et peuvent être facilitées via des outils. C’est le cas de sociétés comme Talend, Alteryx ou encore Forepaas.

Mais cela couvre aussi l’industrialisation de la chaîne de traitement jusqu’au déploiement en production des projets de type IA. C’est le positionnement traditionnel d’une société comme Dataiku dont le stand a encore une fois fait le plein !

Au-delà de cela, certaines solutions visent désormais à automatiser les tâches d’expertise « poussée » comme la création de modèles de machine Learning. C’est la promesse de certaines sociétés comme DataRobot (qui n’était pas présent à Big Data Paris) ou SmartPredict (qui eux y étaient !).

… malgré les profils « experts »

J’avoue être assez content de voir émerger ce type d’outils qui ont tendance à vulgariser certains concepts ou domaines d’expertise.

Pourquoi ? Parce qu’il y a plusieurs années, j’avais été interviewé (et légèrement censuré 😉 !) sur la question des profils recherchés en Big Data et notamment ceux de Data Scientists.

J’avais « prédit » qu’on aurait de moins en moins besoin de cette expertise et qu’elle se perdrait au profit de profils polyvalents et adaptables. L’exemple que j’avais pris (et qui n’apparaît pas dans l’article) est celui des pool de dactylos… Au fur et à mesure du développement d’une technologie, le recours à des experts décroît. Certes il en reste et ils doivent être de plus en plus pointus, mais le gros du travail est progressivement fait par la machine, par l’outil…

Cela semble maintenant se vérifier dans le domaine du Big Data et de l’IA.

Big Data, IA et… organiser tout ça!

La nécessité d’organiser la data et le projet est un autre point qui ressort de cette édition et notamment des conférences.

Les entreprises utilisatrices ainsi que les « solution providers » ont fait de nombreux retours d’expérience. La plupart montre qu’on peut difficilement réussir un projet « data » si on ne l’organise pas correctement. C’est particulièrement vrai dans les grandes entreprises et les grands groupes.

Organiser son projet, cela veut dire être clair et pragmatique sur les objectifs à atteindre. Prévoir des debriefing et intégrer les projets Data dans une démarche d’amélioration continue.

Mais quand on parle de données, cela veut aussi dire collecter, nettoyer et surtout référencer la donnée. Comme souvent, si on n’est pas « carré » sur les sources qu’on exploite, on ne sait très vite plus de quoi on parle !

Ainsi, plus l’organisation est grande, plus le sujet de la Data Governance devient indispensable. Cela peut sembler idiot, mais si tout le monde ne définit pas un client de la même façon, on va avoir du mal à se comprendre! Plusieurs sociétés, présentes à cette édition 2020 du Salon Big Data Paris, en ont parlé. De mémoire, Société Générale, Suez ou encore Avis ont notamment insisté sur ces points.

C’est en général un prérequis à la constitution d’offres ou de projets plus complets.


Les sujets qui m’intéressent le plus sont Data, Organisation et Temps Réel !

N’hésitez pas à me faire un retour sur cet article ou à me contacter sur LinkedIn pour partager nos actualités!

Andrea

Partager sur twitter
Partager sur linkedin

Vous aimerez aussi ...

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Recevez nos articles

La protection des données nous tient à cœur. Vous pouvez vous désinscrire de ce type de communications à tout moment. Pour plus d'informations, consultez notre politique de confidentialité.

Livre blanc

les problématiques du manager dans un livre blanc
La protection des données nous tient à cœur. Vous pouvez vous désinscrire de ce type de communications à tout moment. Pour plus d'informations, consultez notre politique de confidentialité.

Partagez nos articles

Partager sur linkedin
Partager sur twitter
Partager sur email

Rechercher

une organisation rayonnante

Nous utilisons des cookies pour vous garantir la meilleure expérience sur notre site. Si vous continuez à utiliser ce dernier, nous considérerons que vous acceptez l’utilisation des cookies. Voir notre Politique de confidentialité.