La nécessaire requalification juridique des données et informations génétiques

Publié le 06/05/2019

docteur ès sciences

L’identification des personnes a revêtu une importance particulière depuis de très nombreuses années.

Bien que les méthodes et approches aient beaucoup évolué avec le développement des connaissances et des techniques de génétique moléculaire, la variabilité génétique humaine reste un problème très complexe.

Pour bien en appréhender les aspects indispensables à leur approche juridique, il est nécessaire de faire un bref point sur ce que l’on sait aujourd’hui des bases génétiques de la diversité phénotypique individuelle et des différences structurales des génomes qui peuvent constituer des outils essentiels de distinction, de reconnaissance et de filiation.

Notre analyse révélera une convergence dangereuse des applications criminalistiques et généalogiques de la génétique moléculaire.

L’analyse des fondements physiques du soi génétique nous plonge dans des questionnements relatifs aux origines de la vie et nous invite à prendre conscience de la nature extraordinaire de l’ADN, qui ne doit manifestement pas, selon nous, être qualifié comme un produit du corps, mais comme l’essence même de la vie cellulaire.

C’est l’Homme qui est le produit de l’ADN.

Les données génétiques, caractéristiques physiques de l’ADN contenues dans notre génome, constituent le plan de construction spécifique des membres de l’espèce homo sapiens. Interprétées par les machineries cellulaires spécialisées, les données génétiques livrent alors les informations génétiques qui permettent l’élaboration des caractéristiques anthropologiques propres à l’Homme.

Ces précisions prennent une importance juridique considérable, car il n’est guère possible, à leur lumière, de ranger l’ADN, les données génétiques et les informations que leur exploitation peut livrer, selon la classification classique des objets de droit à laquelle ces éléments sont actuellement soumis.

I – La variabilité génomique et l’identité génétique en criminalistique

A – Les premières bases de données génétiques

La publication de la première séquence totale de l’ADN humain en 20011 a déclenché une véritable révolution scientifique et socioculturelle. Elle a ouvert la voie à une comparaison fine des génomes humains individuels, dans les conditions normales et pathologiques, et a fourni des bases solides pour l’utilisation de la génétique moléculaire dans l’identification individuelle des personnes.

Le respect du « cahier des charges » que l’ADN contient est assuré par les 25 000 gènes contenus dans 1,5 % de l’ADN humain. La plus grande partie du génome est constituée d’ADN extragénique auquel on attribue aujourd’hui des rôles essentiels dans des processus régulateurs de l’expression génique.

Des milliers de courtes répétitions en tandem (Short Tandem Repeats, STR) également dénommées « microsatellites » ont été identifiées dans l’ADN humain, où elles comptent pour environ 3 % de la totalité du génome. Il en existe très probablement des centaines de milliers réparties dans tout le génome, distantes d’environ 10 000 nucléotides.

Elles sont responsables d’un polymorphisme moléculaire qui est un des fondements de l’identité génétique individuelle.

Leur organisation, leur longueur et leur nombre, qui sont variables, fournissent la base d’empreintes génétiques révélées par des analyses moléculaires dont l’utilité judiciaire fut établie pour la première fois en 1985 par Jeffreys, Wilson et Thein2.

Le FBI a tiré parti de cette méthode pour développer un logiciel intégré (Combined DNA Index System, CODIS) et un système d’indexation nationale (National DNA Index System, NDIS) afin de lutter contre la criminalité, mais aussi pour l’identification d’individus inconnus ou disparus.

Les calculs indiquent que la probabilité de rencontrer une coïncidence fortuite de profils, établis avec le panel des sondes STR disponibles, est extrêmement faible, et que lorsqu’une correspondance est établie pour l’ensemble des marqueurs de référence, elle doit pouvoir être retenue comme significative. À l’opposé, toute divergence d’un profil par rapport à celui auquel il est comparé doit être considérée comme facteur possible d’exclusion absolu.

Ces travaux permirent la constitution des premières bases de données génétiques3 aux États-Unis en 1990 et en Grande-Bretagne dès 1995, avant de faire une apparition plus tardive en France4.

Les échantillons collectés sur les sites de crimes sont comparés avec ceux de coupables dont le profil est conservé dans ces bases5.

Dans un arrêt du 4 décembre 20086, la CEDH décida que la conservation des données génétiques après un acquittement ou une décision de classement sans suite, constituait une violation du respect de la vie privée.

La puissance de discrimination, la robustesse, la fiabilité et l’efficacité de la technologie ont été largement reconnues, en particulier pour ses applications criminalistiques, où son implémentation a permis l’arrestation de criminels tandis que les techniques classiques d’identification avaient échoué.

Nous citerons à cet égard, le rôle essentiel joué depuis 1992 par The Innocence Project7 dont la persévérance admirable fut couronnée par la libération, à ce jour, de 364 américains condamnés injustement à des peines de prison très lourdes, dont 20 peines capitales.

B – Contamination des échantillons et mauvaise conduite scientifique : l’infaillibilité contestée des tests ADN

Les méthodologies et les pratiques suivies par les laboratoires participant au typage des ADN furent strictement standardisées afin de répondre aux tests d’admissibilité légale de preuves scientifiques dont les résultats conditionnent la reconnaissance et la prise en compte des résultats génétiques par les instances judiciaires.

Malgré cela, la fiabilité de la méthode est encore contestée dans des cas où les quantités d’échantillon analysées sont faibles ou quand la qualité de l’ADN est médiocre.

Ces aspects et les modifications apportées pour accroître la pertinence des résultats obtenus ont été discutés par ailleurs8.

En tout état de cause, il appartient donc aux experts d’être prudents avant de présenter leurs conclusions aux instances judiciaires.

Deux questions fondamentales, auxquelles des réponses objectivement étayées par les analyses d’ADN doivent permettre de répondre, concernent i) l’origine des traces et la certitude que les empreintes génétiques analysées proviennent bien du suspect, et ii) la force de la corrélation établie entre le profil ADN du suspect et la base de données lorsque les quantités d’ADN prélevées sont infinitésimales.

Alors que l’âge d’or de l’ADN juridique prenait son essor, la réalité judiciaire révéla ses limites face à l’absence d’un consensus scientifique suffisant vis-à-vis de nouvelles techniques performantes et à la pollution des conclusions expérimentales par des mauvaises pratiques humaines.

Les faiblesses générées par une très grande sensibilité des méthodes et la remise en question de l’authenticité des traces furent au centre de l’affaire Hoey9, suspecté d’être impliqué dans l’attentat terroriste de Omagh en Irlande.

À cette occasion furent pointées les carences d’un système d’investigation qui ne fournissait pas toutes les garanties requises, ainsi que les allégations mensongères d’un officier de police et d’un détective inspecteur en chef qui prétendaient tous deux avoir porté des gants, alors que les photographies prises sur le site les montraient mains nues.

Plusieurs autres exemples de négligence et de manque de rigueur dans la manipulation des échantillons, ou de mauvaise conduite et fraudes scientifiques, ont assombri quelque peu l’image d’infaillibilité d’une technique fortement encouragée par l’Académie des Sciences, de Biotechnologie et de Médecine américaine, qui déclarait en 1996 : « la technologie de profilage d’ADN et les méthodes utilisées pour estimer les fréquences statistiques avaient progressé et atteint un point où la fiabilité et la validité des résultats obtenus avec de l’ADN correctement prélevé et analysé ne devrait pas être mise en doute ».

La méthodologie suivie pour l’analyse des échantillons contenant de très faibles quantités d’ADN fut finalement reconnue tout à fait adaptée, en dépit des difficultés inhérentes à sa mise en œuvre, et les conditions de sa bonne application furent très strictement définies.

C – Évolution de l’usage des bases génétiques : les recherches en parentèle

Les analyses génétiques avaient démontré leur grande utilité criminalistique lorsqu’un chevauchement total était obtenu avec des profils d’amplification des STR établis avec l’ADN d’un suspect et ceux d’individus ayant commis des infractions justifiant leur fichage dans des banques de données.

Dans les cas où une correspondance seulement partielle était obtenue, la possibilité fut envisagée que l’auteur du crime puisse être familialement apparenté à l’individu initialement suspecté, puisque les STR utilisés dans l’établissement des profils sont transmis héréditairement des parents aux enfants.

Ainsi, pour la première fois au Pays de Galles en 2002, une recherche familiale, aussi qualifiée d’investigation en parentèle, conduisit à l’identification d’un criminel à partir de l’ADN de son fils10.

L’analyse des profils d’ADN franchissait un cap conceptuel très important.

L’outil utilisé jusqu’alors pour établir la confirmation ou l’infirmation de culpabilité devenait un outil d’investigation.

Un résumé des principales critiques concernant l’intégration des profils d’individus innocents dans les bases de données génétiques fut présenté au cours d’une table ronde organisée par le National Institute of Justice en 201111 : « En premier lieu, on se doit de prendre en compte les profondes implications judiciaires relatives à l’utilisation d’une technologie qui a pour effet de mettre sous surveillance génétique des individus principalement définis par la race et la classe. Deuxièmement, en ciblant les membres innocents d’une famille pour effectuer une surveillance génétique, la recherche familiale discrédite la justification originale avancée pour l’utilisation des banques de données d’ADN et dévalue les principes fondamentaux essentiels à notre démocratie. Et troisièmement, les recherches familiales accentuent les craintes relatives aux abus futurs liés à l’utilisation des banques de données d’ADN, car elles constituent un précédent ouvrant la voie à l’exploitation des échantillons biologiques dans le but d’obtenir des informations complémentaires aux profils d’ADN stockés dans la base de données ».

Avec la loi du 3 juin 2016 relative à la lutte contre le crime organisé et le terrorisme, l’article 706-56-1-1 du Code de procédure pénale a consacré, en France, la mise en œuvre de recherches en parentèle.

La nouvelle dimension attribuée à l’analyse des profils génétiques, étendue aux membres non fichés de la famille d’un individu suspecté d’avoir commis un crime, en élargissait le champ d’application juridique.

Si elle permit de faire progresser significativement des enquêtes concernant des affaires non résolues, cette approche a déclenché un questionnement vif concernant les limites éthiquement acceptables de l’extension des bases de données. Les nouvelles orientations, nées de l’application des technologies de séquençage total du génome à la criminalistique, posent également des problèmes critiques concernant le respect et la protection de la vie privée individuelle.

II – La variabilité génomique et l’identité génétique en généalogie

A – L’intimité moléculaire

Les progrès effectués dans le domaine du séquençage de l’ADN, en particulier le développement des techniques de next generation sequencing (NGS)12, ont permis d’identifier un polymorphisme touchant localement un seul nucléotide toutes les 100 ou 300 paires de bases. Ces sites polymorphiques ont été dénommés SNP pour Single Nucléotide Polymorphism en anglais. On estime à plus de 10 millions le nombre de SNP par génome. Ces différences, qui ne modifient pas la longueur de l’ADN, sont responsables d’environ 90 % de la variabilité génétique humaine.

De très nombreux SNP ont été associés à un risque plus élevé de développer des sensibilités médicamenteuses, à des particularités physico-chimiques de certains tissus et à des troubles métaboliques. Les techniques de détection ayant évolué rapidement, il est maintenant établi que plusieurs milliers de SNPs (130 398 au 7 avril 2019) sont associés à l’expression de traits humains, physiques et comportementaux ainsi qu’à des pathologies diverses. Les études d’association pan génomique (GWAS, pour genome wide association studies, en anglais) utilisées identifient des variations génétiques communes à une cohorte d’individus qui partagent une même particularité phénotypique.

Les corrélations établies sont informatives mais pas absolues.

Les SNP sont des données génétiques transmises selon les lois de l’hérédité. La combinaison des SNPs propres à chaque individu contribue donc à son identité génétique. Par conséquent, l’identification et la comparaison des SNPs de deux individus permettent d’établir leur degré de parenté, leur filiation.

La puissance des techniques de NGS a été illustrée par l’analyse que le laboratoire allemand Eurofins Forensics a effectuée dans le cadre d’une recherche de paternité impliquant l’un de deux jumeaux dans une affaire de viols.

L’analyse différentielle du génome de deux frères jumeaux, dont les profils ADN ont été établis par le CODIS sur la base des 13 STR classiques, donnait une correspondance parfaite avec les échantillons d’ADN prélevés sur les lieux d’un des viols, mais ne permettait pas d’identifier lequel des deux était coupable. Le séquençage total de l’ADN provenant de leur sperme indiqua que les jumeaux pouvaient être différenciés par la présence de 5 SNPs qui leur étaient propres. L’analyse du génome de l’enfant révéla qu’il possédait les 5 mutations d’un des deux frères, à qui la paternité pouvait être attribuée13.

La transmission héréditaire des centaines de milliers de SNPs contenus dans notre génome fournit les bases d’une analyse généalogique au niveau moléculaire dont la précision n’avait pas encore été égalée.

Tout comme on parle de biologie moléculaire ou de génétique moléculaire on parlera de généalogie moléculaire, improprement qualifiée de généalogie génétique14.

L’exploitation des données individuelles à partir des SNP est devenue un outil de choix pour les compagnies de génotypage qui proposent à leurs consommateurs d’effectuer des recherches généalogiques fines permettant d’identifier leurs origines ethniques et de retrouver des parents lointains15.

Plus le nombre des SNPs analysés est grand et représentatif d’une vaste collection d’ethnies, plus la filiation sera précise et informative.

L’engouement du public vis-à-vis de leurs origines, contribue à la collecte et à la conservation d’une quantité considérable de données génétiques, générées par le flot impressionnant d’analyses génomiques effectuées à des fins généalogiques.

Nous examinerons successivement les problèmes posés par la constitution de bases de données génétiques dont la gestion reste opaque, et par l’utilisation criminalistique de plus en plus importante et inquiétante des données collectées sur les sites de généalogie, avant de conclure sur les questions connexes que posent la protection des données génétiques et la protection des informations qu’elles peuvent livrer.

B – La généalogie moléculaire et les tests ADN

Les techniques employées par les compagnies de génotypage sont fondées sur l’utilisation d’algorithmes qui comparent les séquences de 600 à 700 000 SNPs dans des génomes de référence et dans celles du consommateur.

Plus le nombre de SNPs identiques est grand, plus elles sont apparentées.

La quantité d’informations obtenues et leur précision dépendent directement de la composition et de la qualité des bases de références utilisées.

Par exemple, la compagnie de génotypage américaine 23andMe utilise une base d’ADN de référence provenant de 10 000 individus.

Face à l’explosion du marché des tests de généalogie, force est de constater que « le génie génétique est sorti de la lampe, et n’y retournera pas16 ».

Au début du mois de janvier 2019 un total de 26 millions de personnes auraient déjà eu recours à un test de généalogie moléculaire. Les trois premiers leaders sont AncestryDNA avec 14 millions d’unités, 23andMe avec 9 millions et MyHeritage avec 2,5 millions.

La quantité de kits commandés pour la seule année 2018 était équivalente aux ventes cumulées des 10 dernières années. On peut prévoir qu’environ 100 millions de génomes auront été analysés d’ici à 2020.

Comme nous l’avions souligné en 201517, le retard que la France accuse est essentiellement attribuable à l’encadrement juridique très strict de tous les types de tests génétiques par les articles 16-10 et 16-11 du Code civil.

Les conséquences de l’interdit génétique imposé depuis 25 ans à nos concitoyens sont lourdes, puisqu’on évalue à 100 000 le nombre de français, « hors la loi », qui ont envoyé leur ADN à une entreprise de génotypage étrangère.

Quelle emprise la France aura-t-elle sur cette hémorragie de données et sur un marché des tests génétiques qui se profile à 22 milliards de dollars pour 2020 ?

L’accumulation de données génétiques, considérées comme données personnelles sensibles par les textes réglementaires, pose des problèmes très graves relatifs à la sécurité des données stockées et au devenir de ces données qui sont soit revendues, soit fournies dans le cadre de collaborations, à des compagnies pharmaceutiques qui vont les exploiter.

Le risque encouru, à l’échelle individuelle, par la violation d’une masse de données encryptées peut paraître aujourd’hui insignifiant. Mais qu’en sera-t-il lorsque les outils de compilation et d’analyse de data permettront effectivement d’identifier les individus au travers des données génétiques qui les caractérisent ? Qu’adviendra-t-il dans quelques dizaines d’années des masses de données accumulées par des compagnies de génotypage qui auront été soumises à plusieurs opérations de rachat-fusion ? Quelles garanties aura-t-on vis-à-vis des règles internes propres à chaque compagnie aujourd’hui ?

C – L’utilisation criminalistique des données généalogiques : atteintes potentielles au respect de la vie privée

L’arrestation aux États-Unis de Joseph James DeAngelo en 2018, a ouvert la boite de pandore. Elle fut permise sur la base d’une recherche en parentèle effectuée sur la plate-forme open source de généalogie (GEDmatch).

La plate-forme GEDmatch met à la disposition des internautes un outil open source utilisable par ceux qui ont déjà fait procéder à une recherche généalogique, et, qui, ayant obtenu des données brutes résultant du génotypage de leur génome, souhaitent utiliser les algorithmes mis à leur disposition pour procéder à des comparaisons de séquences génomiques dans le but d’identifier des parents éloignés.

C’est sur cette base que les investigations menées par le FBI pendant plus de 7 années, établirent une correspondance partielle entre l’ADN prélevé sur les lieux de crimes non résolus et celui de deux personnes, à partir desquelles un total de 25 arbres généalogiques remontant aux années 1800 furent construits. Le filtrage d’un groupe de 1 000 personnes, effectué sur la base de l’âge, du sexe et de la géolocalisation des individus, réduisit significativement le nombre de candidats possibles et conduisit à une série réduite d’ADN potentiellement intéressants dont celui de Joseph James DeAngelo, un ancien membre de la police. La correspondance qui fut établie entre son profil établi à partir de l’ADN des traces qu’il avait laissées à l’extérieur de sa maison et celui relevé sur la scène d’un crime commis 40 ans auparavant permirent son arrestation.

Ces investigations, considérées comme un tour de force par les policiers et vécues comme un énorme soulagement pour les familles des victimes, déclenchèrent une série de vives réactions et de questionnements concernant les aspects juridiques relatifs à la violation du droit au respect de la vie privée des individus n’ayant commis aucune infraction.

Légalement, cette démarche n’est pas répréhensible puisqu’elle n’a violé aucun droit du prévenu.

Selon nous, les deux types majeurs de problèmes soulevés par cette affaire concernent, d’une part, l’accessibilité des données génétiques contenues dans les bases détenues par les fournisseurs de service généalogique et d’autre part la visibilité attribuée, de fait, à des données qualifiées de confidentielles, par ceux qui les déposent sur un site public.

Dans sa page d’accueil GEDmatch indique que « le site fournit aux chercheurs et généalogistes amateurs ou professionnels des outils d’analyses génétiques et généalogiques ». Il est spécifié que « l’utilisateur devra télécharger sur le site les données de son ADN et/ou les données de type GEDCOM s’y rapportant pour pouvoir utiliser les outils proposés ».

L’utilisateur doit donc comprendre d’emblée qu’il va fournir à la communauté utilisant ce site une quantité importante de données confidentielles le concernant.

Celui qui effectue le téléchargement de ses séquences assume une très grande responsabilité. Il n’expose pas seulement son patrimoine génétique mais également celui des membres de la très grande famille, qui, au cours des générations passées, ont transmis les fondations de ce patrimoine et celui de ceux qui dans les générations futures en hériteront.

Au moment de l’affaire DeAngelo, les défenseurs de la vie privée individuelle n’avaient pas manqué de soulever les dangers que représentait la communication aux forces de police des données génétiques contenues dans les bases de sites publics de génotypage et de manifester leurs craintes vis-à-vis d’une généralisation future de ce type d’approche.

Très rapidement, avec l’aide de la compagnie Parabon spécialisée dans ce type d’analyse, le FBI identifia 22 coupables de crimes commis entre 1979 et 2016, n’ayant pas été résolus et qui avaient été classés sans suite.

Plus récemment, une autre étape dans l’utilisation criminalistique des données génétiques d’individus innocents, a été franchie par FamilyTreeDNA, une des plus grandes compagnies de génotypage américaine qui a entrepris de collaborer avec le FBI.

Dans cette collaboration, le profil génétique d’un ADN collecté sur le lieu d’un crime peut être comparé avec ceux des consommateurs (plus d’1 million à ce jour) contenus dans la base de FamilyTreeDNA. L’identification de parents lointains permet alors de dresser des arbres généalogiques qui conduisent à des suspects.

Cette approche ouvrait la porte à une nouvelle voie d’identification de criminels ayant échappé aux méthodes classiques d’investigation18. Jusqu’alors, le FBI n’avait accès qu’à des bases publiques ou libres.

Bien que les forces de police n’aient pas un accès direct aux données conservées sur la base de FamilyTreeDNA et ne puissent pas consulter librement les fichiers privés, les défenseurs des droits de l’Homme ont immédiatement fait ressortir que cette situation créait un précédent dangereux, ouvrant la voie à des investigations enfreignant les principes fondamentaux du respect de la vie privée et de l’intimité la plus profonde des individus.

FamilyTreeDNA est la seule compagnie privée connue collaborant avec le FBI. Elle permet aux internautes de télécharger les données brutes qu’ils ont obtenues d’autres compagnies ayant analysé leur ADN, afin qu’ils puissent les comparer avec toutes les autres données disponibles sur sa base.

Au même titre que GEDmatch, FamilyTreeDNA est une source extraordinaire de données auxquelles ses utilisateurs enregistrés peuvent accéder.

En 2019, après que la collaboration entre FamilyTreeDNA et le FBI qui durait depuis quelques années a été révélée par la presse19, le fondateur de la compagnie publia une mise au point dans laquelle il précisait que le FBI pouvait créer des « comptes clients » répondant aux standards requis par FamilyTreeDNA et avoir ainsi accès aux données partagées par tous les utilisateurs du site.

En revanche, une recherche nécessitant des informations supplémentaires nécessite une assignation ou un mandat de perquisition, sans lesquels le FBI n’a accès à aucune donnée qui ne soit pas en libre accès.

Enfin, selon lui, les consommateurs de FamilyTreeDNA ont la possibilité de signer un « opt out »20, procédure qui interdit l’établissement d’une quelconque correspondance entre leurs données et celles de comptes créés par les forces de police. Ces dernières sont libellées comme provenant d’un individu décédé ou vivant ayant perpétré un homicide ou une agression sexuelle.

Une généalogiste judiciaire considère que les nouvelles conditions d’utilisation publiées par FamilyTreeDNA et les articles de loi auxquelles la compagnie se réfère, sont une porte grande ouverte des bases de données aux investigations que les forces de police peuvent conduire pour tout type de délit commis en n’importe quelle circonstance sans qu’une personne ait subi un quelconque dommage21.

En réaction à la polémique naissante, plusieurs compagnies compétitrices de FamilyTreeDNA ont immédiatement prévenu leurs clients qu’elles ne collaboreraient pas avec les forces de police, comme elles le stipulaient déjà dans les conditions d’utilisations publiées sur leur site web.

III – La protection des données génétiques et des informations qu’elles peuvent livrer

On remarque que la frontière dressée entre les utilisations criminalistiques et généalogiques des données génétiques est en train de s’estomper.

Les questions éthiques posées par cette évolution concernent le respect de la vie privée, et, au premier chef, la protection des données génétiques et des informations que leur traitement peut livrer.

Il est à cet égard très important de bien distinguer les notions de donnée et d’information génétique.

On constate aujourd’hui un glissement de plus en plus marqué vers l’utilisation interchangeable des termes « donnée » et « information » qui peut être lourde de conséquences lorsqu’elle se rencontre dans des textes juridiques abordant des problèmes génétiques.

Les deux termes se rapportent à des concepts fondamentalement distincts. La donnée n’est pas une information.

Par exemple on désignera par « donnée » tout caractère, nombre, mot, son, signe, à l’état isolé ou dans un groupe, qui lorsqu’il est isolé d’un contexte ne signifie que peu ou rien pour l’humain. Comme la pierre servant à bâtir des édifices très différents les uns des autres, les données peuvent être polysémiques.

En sciences, la donnée est un élément brut tiré d’une observation expérimentale.

Remises dans un contexte particulier et soumises à un processus d’interprétation pouvant être plus ou moins complexe, les données peuvent alors devenir informatives et prendre un sens que tout humain aura la capacité de comprendre, intégrer, exploiter.

Les données génétiques sont les paramètres obtenus lors des analyses qualitatives et quantitatives du matériel génomique.

Par exemple, l’ordre des nucléotides dans une molécule d’ADN n’est pas informatif en tant que tel. La comparaison des séquences nucléotidiques établies à partir d’échantillons différents permet d’établir un relevé cartographique de la distribution des bases. À ce stade, aucune conclusion ne peut être tirée en ce qui concerne la fonctionnalité des différentes mutations polymorphiques.

Les différents types de paramètres physiques et biochimiques enregistrés lors des analyses d’ADN, sont des données brutes qui ne sont pas compréhensibles en tant que telles. Elles ont besoin d’être interprétées.

L’association établie entre une donnée génétique et un phénotype donné constitue une information génétique, en ce qu’elle représente la manifestation, la signature, d’un état physique particulier codé par un génotype spécifique.

Les traits phénotypiques caractéristiques de l’être humain sont l’information perçue, exprimée à partir des données génétiques contenues dans le génome.

Les textes réglementaires se sont intéressés aux caractéristiques génétiques en tant qu’information, confusion omettant l’importance des données sur lesquelles elle est bâtie.

Le vide juridique qui en résulte touche non seulement les tests à visée généalogique, mais également les tests à orientation médicale qui sont proposés en libre accès.

La distinction qui doit être faite entre données et information a des conséquences très importantes, car on ne doit pas protéger de la même manière les données génétiques d’un individu, qui ne changent pas au cours de sa vie, et les informations qu’on peut en tirer et qui vont, elles, dépendre de l’essor des nouvelles biotechnologies.

La situation pourrait ainsi se décliner suivant le fameux vers de Rosemonde Gérard « aujourd’hui plus qu’hier et bien moins que demain22 ».

En confondant les concepts de donnée et d’information, les textes normatifs n’abordent pas les problèmes concernant la collecte, l’exploitation et la conservation des données du soi génétique en tant que caractéristiques physiques contenues dans les supports de l’hérédité.

Seule une requalification juridique des concepts de données et informations génétiques permettra d’appréhender, avec la rigueur requise, les aspects relatifs à la protection spécifique qui doit leur être affectée.

Le « droit au respect de l’information génétique individuelle et de ses supports physiques » pourrait ainsi devenir une branche spécifique du droit civil français.

Notes de bas de pages

1.
Venter J. C. et a., Science (2001) 291 : 1304-1351 ; Lander E. S et a., Nature (2001) 409 : 860 : 921. La séquence totale du génome humain fut terminée en 2003 et publiée en 2004. Nature (2004) 431 : 931-945.
2.
Jeffreys A. J., Wilson V., et Thein S. L., Nature (1985) 316 :76-79.
3.
La notion de « base de données » (database en anglais) s’applique à un ensemble de profils ADN, alors qu’une « banque de données » (databank en anglais) contient une collection d’échantillons.
4.
Le fichier national automatisé des empreintes génétiques (FNAEG) fut créé en 1998.
5.
En France, le CPC, art. R. 53-20 en fixe les modalités. La durée maximale de conservation est fixée à 40 ans par CPC, art. R. 53-14.
6.
CEDH, 4 déc. 2008, nos 30562/04 et 30566/04, S. et Marper c/ Royaume-Uni.
7.
https://www.innocenceproject.org/about/.
8.
« Dossier. La preuve génétique », AJ pénal 2018, p. 59.
9.
Hoey, R. v [2007] NICC 49.
10.
Martin N., « Dead man named as triple murderer after DNA tests », 7 juin 2002, The Telegraph.
11.
Mercer S., fragment de sa présentation orale au NIJ Conference Panel (June 2011), intitulée « Familial DNA Searching: Issues and Answers, National Institute of justice » : « First, the profound racial justice implications of using a technology that has the effect of putting under genetic surveillance individuals primarily defined by race and class. Second, by targeting innocent family members for genetic surveillance, familial searching undermines the original justification for DNA databanks and devalues fundamental principles central to our democracy. And third, familial searching amplifies the concern about future abuses of DNA databanks because it sets the precedent for mining of the biological samples for additional information that are linked to the DNA profile stored in the databank ». V. https://nij.gov/multimedia/pages/audio-nijconf2011-familial-searching-transcript.aspx.
12.
Aussi appelé séquençage à haut débit (High Throughput sequencing).
13.
Weber-Lehmann J. et a., Forensic Sci Int-Gen (2014) 9 : 42 – 46.
14.
La généalogie est une science qui a pour objet le dénombrement des ancêtres et des descendants. C’est l’étude de l’origine et de la filiation d’une personne ou d’une famille. Employé comme adjectif, le mot génétique se rapporte aux gènes. On parle d’empreintes génétiques, de carte génétique, de maladies génétiques, de code génétique. La science qui se rapporte à l’hérédité est la génétique.
15.
L’approche repose sur l’emploi de micropuces biologiques sur lesquelles sont greffées les séquences de SNPs permettant l’amplification des séquences complémentaires d’intérêt.
16.
Adapté de Antonio Regalado.
17.
Perbal B., « Pour une liberté surveillée des tests génétiques », LPA 9 sept. 2015, p. 10.
18.
Une dizaine de cas ont été analysés en coopération avec le FBI jusqu’à présent. V. Gearty R., « DNA, genetic genealogy made 2018 the year of the cold case: “Biggest crime-fighting breakthrough in decades” », 19 déc. 2018, FoxNews.
19.
Hernandez S., « Using DNA databases to find your distant relatives? So is the FBI », 31 janv. 2019, BuzzFeedNews.
20.
Opt out : renonciation automatique en Europe, manuelle aux USA.
21.
Russell J. D., « Opening the DNA floodgates », 1er févr. 2019, The Legal Genealogist.
22.
Gerard R., « L’éternelle chanson », 1923, p. 312-315.

Référence : LPA 06 Mai. 2019, n° 144f4, p.15

Référence : AJU52499

Plan

Partager cet article