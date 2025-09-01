Le « Legal Data Space » est le premier projet d’espace numérique souverain en Europe dédié au partage des données juridiques publiques et privées, accessibles selon des conditions strictement encadrées et un moteur d’innovation au service de la filière juridique qui garantit la sécurité, la confidentialité et la conformité des données. Deux de ses fondateurs, Martin Bussy, consultant pour les avocats et juristes et spécialiste de la transition digitale, et Thomas Saint-Aubin, juriste numérique et serial entrepreneur de la legal tech, nous en disent plus sur la genèse et ses ambitions. Entretien.

Actu-Juridique : Comment est née l’idée du Legal Data Space ?

Martin Bussy : Venant du monde de la legal tech, j’avais déjà une expérience entrepreneuriale au service des avocats. Depuis 2019, je travaille à une thèse en économie sur l’innovation sur le marché du droit. Ces expériences combinées m’ont fait réaliser qu’il faudrait rendre interopérables nos différentes solutions car, du point de vue du client, il n’est pas pratique d’avoir un outil pour chaque usage. Il faut créer de la transversalité, au minimum sur les fonctionnalités et, idéalement, sur les données. Thomas (Saint-Aubin, NDLR) est venu me voir en septembre dernier. Nous avons remis sur le tapis la notion de Data Space mutualisé. Nous avons commencé à phosphorer et aller chercher à la source les experts du Data Space, Arno Pons et Olivier Dion, via Digital New Deal, un think tank consacré à cette question, qui venaient de sortir un rapport important : IA générative, s’unir ou subir. Donc c’est aussi dans cette veine que les choses ont été pensées.

Thomas Saint-Aubin : Le Legal Data Space, c’est en effet l’histoire de deux trajectoires qui se rencontrent. J’ai toujours navigué entre les legal tech et le droit du numérique. Côté droit du numérique, j’avais commencé avec la loi Lemaire et le lancement de l’association PrivacyTech, qui a abouti à un rapport A new gouvernance, remis à l’Assemblée nationale en 2019, où apparaît l’idée de reprendre le contrôle des données. La démarche a abouti au Data Governance Act, prolongée par des financements publics pour créer des Datas Space. À ce jour, plus de 60 ont été créés. La rencontre avec les legal tech a enfin donné naissance au premier Legal Data Space en Europe.

AJ : Le droit est-il absolument déterminant pour la souveraineté numérique ?

Thomas Saint-Aubin : Un Data Space, qu’est-ce que c’est finalement ? C’est un espace souverain de données. Aujourd’hui, il n’y a pas d’espace qui permette d’accéder à la donnée juridique publique et privée à échelle européenne. Cette donnée aujourd’hui est largement captée par des acteurs extraterritoriaux, sur toutes les chaînes de valeur de la data et de l’IA. On est cybercolonisés de tous les côtés. La donnée juridique est stratégique, notamment dans un contexte de guerre économique. Comme le dit souvent Bercy, il y a au moins trois grands thèmes dans lesquels il faut rester souverain : la santé, la finance et le secteur juridique. Le cadre dans lequel se crée le Data Space, c’est la confidentialité par défaut. Quand on parle des données publiques, elles sont ouvertes, on peut les utiliser. Parfois c’est bien de trouver des données qui ont déjà été enrichies pour l’IA par des acteurs de la legal tech. Concernant les données privées, il faut absolument en avoir le contrôle. Donc on a pensé by design une solution qui intègre la confidentialité, justement pour créer ce cadre. Le Legal Data Space est un intermédiaire de données qui est régulé au sens de l’ARCEP, l’Autorité de régulation des communications électroniques, des postes et de la distribution de la presse, qui est un tiers de confiance et qui permet le partage entre les fournisseurs de données et ceux qui exploitent ces données, qui sont parfois les mêmes acteurs. Cela a fédéré rapidement tout notre écosystème, des directions juridiques aux avocats, du monde universitaire aux legal tech. Nous approchons des 200 partenaires.

Martin Bussy : Sur la partie opérationnelle, nous avons démarré en novembre dernier. Nous avons fait une présentation du projet début mars. En juillet, on a eu un nouveau grand rendez-vous avec nos partenaires pour leur présenter le proof of concept et la structure juridique. Au mois de septembre, nous serons parfaitement prêts pour commercialiser les premiers usages, agents IA, avec une structure juridique opérationnelle. Nous avons aussi un grand nombre de partenaires qui sont prêts également sur des fonctions transverses (marketing, juridique, etc.) et sur des fonctions métier (études produit, travail sur les données, etc.). Un de nos partenaires importants, Droit.org, est une association spécialisée sur l’information juridique, dont la mission importante est de prendre en charge la gouvernance du projet et d’administrer les biens communs numériques, comme la normologie des données juridiques ou les ontologies juridiques, qui permettent de faire modéliser la connaissance juridique par les contributeurs de la communauté, une condition importante à l’adaptation de l’IA juridique aux spécificités du droit écrit. Car, je le rappelle, il n’y a pas de bonne IA, il n’y a que de bonnes datas. Il faut donc à la fois que cette data soit bonne mais qu’elle soit aussi extrêmement bien sémantisée pour être consommable par la machine.

AJ : Quels sont les enjeux liés de la souveraineté ?

Thomas Saint-Aubin : Il y a des enjeux géostratégiques qui sont liés à la prééminence du droit de tradition romano-civiliste ou common law dans le code. Aujourd’hui, clairement, dans les grands modèles multimodaux (LMM), on est à 90 % d’entraînement sur du droit anglo-saxon, donc forcément l’influence croissante du droit des affaires et des valeurs du monde anglo-saxon se traduisent dans le monde du droit. En France, on souligne des travaux comme ceux de la Cour de cassation : il existe des enjeux d’aller chercher des pays et des innovateurs de l’IA pour traduire, adapter des modèles sur notre droit, et pourquoi pas fédérer ces travaux faits sur notre droit, par exemple on a tous fine-tuné (amélioré les résultats en machine learning) sur Mistral. Dans le cadre du Legal Data Space, cela nous intéresse de leur demander quels fichiers ils peuvent partager, à leurs conditions. Il n’y a que comme ça que l’on y arrivera.

Il y a un deuxième enjeu, plus économique, sur le marché du droit. Si demain le token (qui traduit la consommation des données par une IA générative) devient la matière première, le carburant de l’IA juridique, et si l’IA juridique devient le premier outil qui prépare les juristes, il est important de ne pas laisser ce legal token entre les mains d’acteurs extraterritoriaux. Il faut aussi que nous, les Européens, soyons capables de traiter notre droit dans la data, qu’on soit capable de fournir ce carburant aux agents IA qui vont être utilisés demain par les comptables, les avocats, les notaires, les directions juridiques, etc. Nous pensons qu’il est possible de capter 10 % de ce marché-là, même si nous savons que des acteurs comme Harvey ou Legal Copilot vont prendre le gros du marché. Il faut rentrer en résistance et cela ne peut se faire que dans une démarche collective et écosystémique pour proposer une alternative.

Enfin, le troisième enjeu : il faut faire en sorte que cette régulation se renouvelle. Les débats sont nombreux. On dit communément que les Américains dérégulent et que les Européens régulent. Avec le think thank, Digital New Deal, nous avons contribué à un rapport intitulé : IA is law, nous pensons que nous devons repenser la manière de réguler, de poser des règles. Le Legal Data Space est une occasion de poser un droit by design, un data contract management ; en gros : comment les juristes vont peser dans le monde de la donnée en devenant les architectes de la souveraineté numérique.Respect des affaires, secret fiscal, données protégées : les juristes sont face à des enjeux importants. Souvent ils ont tendance à mettre ces données dans un datalake (lac de données, NDLR) SharePoint afin de nourrir Copilot (IA développée par Microsoft, NDLR). C’est une voie facile et rapide mais qui peut soulever des difficultés… Pourtant, on parle de données très stratégiques pour l’Europe (contentieux, corporate, contrats, etc.) Il nous semble très important d’avoir une alternative.

Martin Bussy : Il faut aussi voir que l’usage n’est plus seulement économique. Aujourd’hui, les avocats se servent tous de ChatGPT, édité par Open AI, alors que cela soulève des difficultés tant sur le plan réglementaire que déontologique. Pourtant, ils s’en servent car le gain de temps et le bénéfice sont tellement importants que c’est irrésistible. Nous dressons un constat pragmatique : tant qu’il n’y a pas de solution comme une infrastructure qui permette de respecter la conformité et en même temps d’avoir les bénéfices de l’IA, on aura beau parler de souveraineté, cela ne fera bouger personne. Petit à petit, c’est ainsi que l’analyse va être réalisée sur de la common law. Une fois que ces acteurs auront notre droit entre les mains, il risque de changer, de s’américaniser, avec le risque que ce ne soit plus un droit continental. Est-ce qu’on veut changer insidieusement de civilisation ? Cette question peut sembler très politique mais, à mes yeux, les professionnels du droit sont les garants du droit français et, in fine, l’expression de la démocratie française. Enfin, le droit est lui-même garant de l’économie de marché. Le libéralisme ne fonctionne que parce que les résolutions de conflits et les règles de fonctionnement sont régies par le droit. Si l’on ne contrôle plus le droit, on ne contrôle plus l’économie. Or certains acteurs, comme Google, comme Meta, affichent des intentions politiques. Tout ceci crée un marché de la donnée : ce n’est pas un gros mot. L’enjeu du Legal Data Space est là : derrière, il n’y a que de la contractualisation. On ne peut pas se servir d’une donnée si, en amont, il n’y a pas un accord des deux parties et un périmètre d’autorisation qui est donné. Celui qui partage sa donnée limite ce périmètre. On peut même dissocier les cas : pour les universitaires, des données gratuites, pour un concurrent, refuser de partager ses données ou les vendre. Il faut que cette donnée ait une valeur, mais qu’elle soit encadrée et monétisée.

AJ : Quelle est la plus-value pour les acteurs du droit à avoir recours au Legal Data Space ?

Martin Bussy : En utilisant le Legal Data Space, les agents IA peuvent utiliser de l’open data, des données privées, celles de mes clients s’ils sont d’accord, de partenaires, etc. C’est un mélange de données aux sources différentes, donc il n’y a pas de meilleure data.

Thomas Saint-Aubin : Nous ne sommes ni fournisseurs, ni exploitants des données, nous respectons le principe de séparation des pouvoirs numériques fixé par le Digital Markets Act (DGA). Nous jouons un rôle que personne n’a aujourd’hui au sein de la filière juridique. Si demain, au sein du Legal Data Space, nous ne comptabilisons pas tous les éditeurs dans les fournisseurs de données, ce sera dommage mais nous continuerons d’avancer avec ceux qui sont là. L’essentiel est que les gens qui vont entrer dans cet espace souverain en respectent les règles. L’innovation est de garder le contrôle. Nous avons l’ambition que l’IA juridique soit la plus respectueuse possible et qu’elle montre l’exemple aux autres IA. Comment faire ? En respectant la séparation des pouvoirs numériques, en étant un intermédiaire de données pour alimenter les juristes qui créent des agents IA. Tout le monde a besoin d’un intermédiaire qui se base sur une standardisation juridique du partage des données et la standardisation technique pour que l’agent IA puisse exploiter et comprendre le droit romain civiliste, ce qui nécessite de se mettre d’accord sur sa définition (loi, décret, jurisprudence, etc.). En somme, il faut une surcouche. Cette démarche est collective. On est presque militants dans cette démarche, et nous souhaitons être vraiment inclusifs. Et si, demain, un acteur non européen veut venir, il pourra, mais en respectant les règles fixées par la gouvernance du Data Space.

Martin Bussy : Plus de 80 % des données sont inaccessibles aujourd’hui, elles sont dans les systèmes fermés de telle entreprise ou cabinet, sans parler des données qui ne sont même pas digitalisées. Les données qui nourrissent aujourd’hui les IA sont infiniment petites et sont loin d’être les plus pertinentes et les plus intéressantes. Le Legal Data Space permettra d’atteindre ces données et sans avoir à les déplacer. Cela confère une valeur infiniment précieuse aux agents IA qui en émergent. Pour ça, on espère que des éditeurs finiront par nous rejoindre.

Thomas Saint-Aubin : Au niveau tech, c’est la première fois qu’on part d’aussi haut, car l’Europe a puissamment financé (plusieurs milliards d’euros d’investissement) les Data Space, avec les briques Gaia-X ou Simpl notamment. Ce que nous faisons, c’est beaucoup d’assemblage, en adaptant des communs open source aux besoins des acteurs du droit et en allant chercher dans l’écosystème des choses qui nous manquent et existent déjà. Le Legal Data Space rassemble beaucoup de technologies pour créer des agents IA mais notre cœur de métier, c’est vraiment le partage contrôlé des données.

AJ : Quel est votre modèle économique ?

Martin Bussy : Nous nous appuyons sur énormément de code open source et de modules fonctionnels qui existent déjà car ils ont été financés par la collectivité, en l’occurrence l’Europe. Nous travaillons avec des experts expérimentés sur les Data Space, des partenaires qui apportent des moyens humains, de la technologie et de l’argent. Ainsi le financement initial va s’amorcer, et nous répondons collectivement à des appels à projets menés par BPI France et par la Commission européenne, où nous allons pleinement prendre notre place. Et bien sûr, nous développons une offre commerciale de partage de données avec des clients, des business partenaires, des legal tech, extrêmement intéressés, vu les enjeux géopolitiques, les questions d’intelligence économique et la position des États-Unis, dont on peut se demander s’ils sont alliés ou ennemis.

AJ : Avez-vous aussi l’idée de rééquilibrer les forces en présence ?

Martin Bussy : Data is the new oil. Au XXe siècle, celui qui contrôlait le pétrole était le maître du monde. Au XXIe siècle, c’est celui qui contrôle la donnée ! Ce qu’on propose, c’est de décentraliser, en répartissant le pouvoir entre tous les acteurs.

Thomas Saint-Aubin : Il existe 60 Data Space, dont un récent sur le nucléaire, donc nous ne sommes pas les premiers à l’expérimenter. Mais en ce qui nous concerne, il y a une attente de réinventer le droit. Le Legal Data Space a déjà cette fonction d’avoir une approche souveraine, de fournir de l’IA pour les juristes par les juristes. Certes, il est dur de lever des millions d’euros de fonds, mais c’est un commun, une mission d’intérêt général. On ne peut pas le faire comme avec un produit classique : je le crée, je cherche des fonds, je le revends. Ce n’est pas pareil. Il faut trouver et réinventer ce modèle et le rendre accessible au plus grand nombre. Il y a 10 ans, l’État a ouvert ses données, des entreprises les ont utilisées et exploitées, mais ce chantier n’a pas fait avancer collectivement et le droit n’est pas devenu plus accessible. Il s’agit de créer un bien commun à modèle économique, qui transcende la dichotomie public/privé et professionnels du droit/start-up legaltech. Via un système de tokenisation des actifs numériques, nous avons mis en place un système de valeurs entre tous les acteurs du droit et de la tech.

En termes de responsabilité sociétale des entreprises, au-delà du B2B, il y a une volonté de participer pleinement à l’accès au droit. Je crois que, nous, juristes, depuis 1804, avons progressivement confisqué le droit. Demain, nous devrons aussi prendre nos responsabilités pour partager les données vers des agents IA dédiés au plus démunis, via les assistantes sociales, les médiateurs numériques ou bien sûr le réseau judiciaire de proximité, en accès non payant, en collaborant main dans la main avec le service public, en prolongement de notre mission.

Martin Bussy : Aux États-Unis se déroulent régulièrement des procès antitrust, qui vont certainement arriver à des résultats, car ces monopoles sont destructeurs pour l’innovation. Les économistes l’ont bien montré : quand on est en monopole dans l’innovation et qu’on gagne des milliards par mois, on a tendance à racheter des start-up innovantes pour les tuer, afin d’éviter qu’elles puissent concurrencer son modèle. En opposition, notre modèle est décentralisé, il entend donner les moyens à tout un chacun de pouvoir innover. Les Américains captent tout pour quelques actionnaires. Dans notre modèle économique, la valeur créée est plus importante mais elle est beaucoup plus diffuse, donc elle est moins visible, tout simplement.