Dataspace vs datalake
Contrairement à un datalake qui recopie des données dans un silo unique, un dataspace est un environnement où différentes sources de données peuvent être organisées et interconnectées, les données restent sous le contrôle de leur propriétaire. Le Dataspace permet de sécuriser, gérer et analyser les données de manière cohérente, même si elles proviennent de systèmes hétérogènes.
Les échanges de données sont tracés et sécurisé entre les acteurs grâce à un environnement numérique de confiance.
1. Quel intérêt commun pour son écosystème ?
Le premier prérequis d’un projet dataspace est que l’ensemble des acteurs d’un secteur d’activité (groupes privés, entités publiques, start-ups, PME, instituts de recherche, etc.) aient une vision et des intérêts communs. Effacement énergétique dans l’industrie, valorisation des données d'Observation de la Terre dans le spatial, ou encore compréhension des audiences dans les médias : les bénéfices communs encouragent la collaboration, y compris entre concurrents, et permettent de dépasser la peur de perdre la maîtrise de ses données.
Gaia-X, initiative européenne dont Orange est l’un des 22 fondateurs, a pour objectif de renforcer la confiance autour des dataspaces en fédérant des écosystèmes cloud interopérables. Les données y sont partagées au sein d’environnements numériques sécurisés, les utilisateurs conservant le contrôle de l’accès et de l’utilisation de leurs datas. L’ambition est de créer des communs numériques qui doivent renforcer, à terme, chaque secteur d’activité.
« Pour s’investir dans un projet dataspace, les entreprises doivent avoir des problématiques communes : lutte contre changement climatique, concurrence d’autres continents, etc. »
Antoine Maisonneuve - Responsable du développement des nouveaux Produits, Orange Business
2. Les cas d’usages sectoriels sont-ils identifiés ?
À chaque secteur ses cas d’usages ! Dans la filière agricole, le partage de données permet, par exemple, d’assurer la traçabilité alimentaire et de mutualiser les bonnes pratiques de culture ou d’élevage. C’est en partant de ces besoins qu’Orange Business a participé au développement de la plateforme Agdatahub, en développant un système d’identité numérique décentralisée, basé sur une infrastructure blockchain et hébergé sur un cloud public sécurisé. Grâce à Agdatahub, les exploitants agricoles peuvent lier leur identité à celle de leur exploitation afin de garantir la fiabilité, la sécurité et la traçabilité des échanges de données auxquels ils ont consenti.
« Le développement d’Agdatahub a été impulsé par la sphère publique mais aussi par de grands acteurs de la filière agricole européenne. Cela représente quelques 2 000 entités participantes et 390 000 exploitants agricoles rien qu’en France ! De cette volonté de reprendre le contrôle des données agricoles découle plusieurs cas d’usage, par exemple la meilleure traçabilité des produits qui intéresse aussi d’autres filières comme la grande distribution. »
Alain Berry - Directeur des Projets dataspaces & du Business Développement du domaine Spatial, Orange Business
3. Les données de toutes les organisations sont-elles standardisées ?
Une fois que l’on sait quelles données échanger et quel « business model » adopter, reste à adopter un langage commun. En effet, tous les systèmes générant de la data ne sont pas interopérables, tandis que les typologies de données, leur organisation ou leur langue de traitement restent elles aussi hétérogènes. Une raison supplémentaire pour développer des programmes européens subventionnant des projets dataspace qui incluent un travail d’harmonisation des données. Les outils de data exchange, à l’image de ceux proposés par Orange Business, rendent possible la création de ces catalogues communs.
« Dans un dataspace, tout le monde doit parler la même langue. Ainsi, en parallèle d’Agdatahub, un travail a été effectué par le mode agricole pour standardiser et d’harmoniser ses données dans des catalogues communs. »
Antoine Maisonneuve
4. Quelle gouvernance adopter pour le dataspace ?
Un projet de dataspace pérenne repose sur un environnement numérique de confiance, c’est-à-dire l’alliance d’acteurs variés et l’implication de partenaires techniques qui assurent sa fiabilité. Des initiatives telles que Gaia-X réunissent à la fois des fournisseurs de services cloud et un large panel d’utilisateurs : nous y développons des dataspaces aux côtés de Dawex, l’AFP, France Télévisions et Prometheus-X.
« La gouvernance de ces projets passe souvent par une entité tierce indépendante, dotée d’une forte compétence technique et à même de mettre en place et de piloter techniquement le dataspace. En tant que leader du secteur, Orange Business doit à la fois veiller aux normes, aux cas d’usages et à la sécurisation des données. »
Alain Berry
5. Qui pourra accéder aux données ?
Les dataspaces européens répondent à un enjeu de souveraineté des données pour éviter à la fois les fuites entre concurrents et la captation de l’information. Les pilotes du dataspace ont donc pour mission d’apporter des services suffisamment sécurisés assurant l'identification des utilisateurs, l’obtention de leur consentement pour partager ces données, garantir l’intégrité de ces dernières, leur sécurisation et leur traçabilité. S’assurer du contrôle de chacun sur ses propres données, c’est faire en sorte que le bénéfice du partage soit égal entre les participants.
« Le dataspace matérialise un marché entre ceux qui possèdent la donnée et ceux qui en ont besoin. Il faut que le partage et la création de valeur qui en résulte soient équitables. C’est de cette manière que le projet profite à tous, y compris dans un cadre concurrentiel. »
Antoine Maisonneuve