IA ET GÉNOMIQUE, QUI CONTRÔLE LE CODE DU VIVANT

Un médicament coûte 2,5 milliards de dollars à développer et prend en moyenne douze à quinze ans pour atteindre les patients, selon les données compilées par les chercheurs de The Innovation en 2024. Quatre-vingt-dix pour cent des candidats molécules échouent en essais cliniques. Ces chiffres ne décrivent pas un échec de la biologie. Ils décrivent un problème computationnel. La génomique génère des volumes de données que les méthodes traditionnelles ne peuvent plus traiter à l'échelle requise. L'intelligence artificielle est en train de changer le rapport de force entre ceux qui contrôlent cette puissance de calcul et ceux qui attendent que les résultats arrivent d'ailleurs.

Ce n'est plus une promesse. C'est une infrastructure en cours de déploiement.

AlphaFold, les 200 millions de protéines et la nouvelle frontière industrielle

Pendant des décennies, déterminer la structure d'une protéine prenait des années de travail expérimental. En mai 2024, Google DeepMind a publié AlphaFold 3, une version capable de prédire non seulement les protéines, mais aussi leurs interactions avec l'ADN, l'ARN et les petites molécules. Le résultat, couronné du prix Nobel de chimie 2024 remis à Demis Hassabis et John Jumper, représente désormais une base de données de plus de 200 millions de structures protéiques accessibles à la communauté scientifique mondiale.

Le saut est matériel, pas symbolique. Ce qui nécessitait des mois sur un synchrotron se calcule désormais en minutes sur un cluster GPU. Isomorphic Labs, filiale de DeepMind, a levé plus de 600 millions de dollars pour intégrer AlphaFold directement dans les pipelines de conception médicamenteuse. Generate:Biomedicines a signé un partenariat d'un milliard de dollars avec Novartis en 2024 pour exploiter ces capacités à l'échelle industrielle. Le secteur de la découverte médicamenteuse assistée par IA a attiré 3,3 milliards de dollars en capital-risque en 2024 selon Drug Discovery News.

L'enjeu n'est pas académique. Insilico Medicine a conduit son premier candidat médicament conçu par IA jusqu'aux essais cliniques en moins de dix-huit mois, là où la voie classique en exige quarante-huit. Ce différentiel de temps, multiplié par des milliers de molécules en développement simultané, redéfinit qui aura des médicaments, et quand.

La guerre des données biologiques, BGI, Illumina et la fracture du séquençage

Derrière les algorithmes, il y a les données. Et derrière les données, il y a les séquenceurs.

Le marché mondial du séquençage génomique est aujourd'hui un champ de bataille réglementaire autant qu'industriel. En 2024, Illumina contrôlait encore environ 90% des marchés américain et européen des séquenceurs d'ADN, selon une analyse de DeciBio. Mais la dynamique s'est inversée en Chine. La part de marché d'Illumina dans ce pays est passée de 59% à 26,5% entre 2020 et 2024, pendant que MGI, filiale de BGI, atteignait 47% du marché chinois. En février 2025, Pékin a placé Illumina sur sa liste des entités non fiables et banni ses exportations vers la Chine.

Ce n'est pas un différend commercial. C'est une déconnexion calculée.

BGI gère la Banque nationale de gènes chinoise (CNGB), le quatrième référentiel national de génomes au monde. En septembre 2024, le BIOSECURE Act américain a explicitement désigné BGI comme une menace potentielle à la sécurité nationale américaine, restreignant la coopération entre agences gouvernementales et entreprises identifiées. Le Pentagone avait déjà classé BGI comme entreprise militaire chinoise opérant aux États-Unis. Les ressources génétiques humaines sont désormais classifiées en Chine comme actifs stratégiques nationaux sous le Règlement sur la gestion des ressources génétiques humaines, révisé en 2024.

D'ailleurs, les deux puissances utilisent le même manuel opératoire. La Chine protège ses données biologiques pour alimenter ses algorithmes. Les États-Unis verrouillent l'accès aux silos génomiques fédéraux pour les chercheurs venus des pays désignés "à risque", une directive DOJ effective depuis avril 2025. Ce qui se joue n'est pas une guerre de brevets. C'est une course pour construire les plus grands datasets biologiques, car en IA, les données d'entraînement constituent l'avantage concurrentiel durable.

Le temps comme ressource stratégique, la règle des douze ans

La biologie a une inertie propre que l'IA ne peut pas effacer entièrement.

Un essai clinique de phase III prend plusieurs années. La validation réglementaire ajoute deux à cinq ans supplémentaires. Même si l'IA comprime la phase de découverte et d'optimisation moléculaire, le pipeline reste long. Et pourtant, le différentiel commence à être mesurable. Une analyse publiée en 2025 indique qu'AI pourrait réduire les coûts de développement en phase I de 100 à 70 millions de dollars. Ce n'est pas spectaculaire sur un seul médicament. Sur l'ensemble d'un portefeuille de plusieurs centaines de candidats, c'est décisif.

La vraie contrainte se situe au niveau des données d'entraînement, pas des algorithmes. Un modèle IA ne vaut que ce que valent les génomes sur lesquels il a été entraîné. Les pays qui auront collecté, annoté et sécurisé les plus grandes cohortes de données cliniques et génomiques avant 2030 poseront les fondations de la médecine personnalisée pour les deux décennies suivantes. La Chine séquence massivement, y compris les données de ses minorités ethniques. Les États-Unis financent le programme All of Us, qui vise des millions de génomes. L'Europe, elle, dispose de Novartis et AstraZeneca, mais aucun pays de l'UE ne figure dans le top 5 mondial pour la vitalité de l'IA, selon Stanford en 2024.

Ce retard computationnel produit une dépendance future en matière thérapeutique.

Analyse transversale, quand les puces décident de la biologie

Il y a une cohérence matérielle dans cette course que les discours sur la "révolution médicale" masquent souvent. AlphaFold 3 a nécessité des semaines de calcul sur des clusters multi-GPU. NVIDIA Parabricks peut traiter un génome humain complet en moins d'une heure sur un GPU A100, là où les CPUs en avaient besoin de dix à vingt. Les géants pharmaceutiques comme Pfizer, Merck ou Roche investissent chacun plus d'un milliard de dollars par an en infrastructure informatique de R&D.

La course IA-génomique n'est donc pas seulement une compétition biologique. Elle repose sur les mêmes puces NVIDIA, les mêmes datacenters, les mêmes câbles transocéaniques que la course à l'IA générative. Qui contrôle les semi-conducteurs de pointe contrôle aussi la vitesse à laquelle les protéines sont modélisées et les candidats médicaments générés. Les restrictions américaines à l'export de GPU avancés vers la Chine en 2024 et 2025 ne sont pas sans conséquence sur la capacité de calcul biologique chinoise. Pékin le sait et investit dans des alternatives domestiques, avec les résultats que l'on observe dans le secteur des modèles IA en général.

L'Europe ? Elle dépend à 90% d'Illumina pour ses séquenceurs et à majorité des infrastructures cloud américaines pour son calcul. Ce n'est pas un choix stratégique. C'est une absence de choix.

Les limites de l'enthousiasme computationnel

La nuance s'impose. Les modèles IA prédisent des structures protéiques avec une précision remarquable, mais les protéines agissent dans des environnements cellulaires complexes que les modèles ne simulent pas encore fidèlement. AlphaFold 3 reste peu performant sur les "protéines orphelines" pour lesquelles peu de données d'homologie existent. La FDA a publié en 2025 des guidelines préliminaires sur l'usage de l'IA dans les décisions réglementaires, imposant transparence et validation, ce qui rallonge les délais pour les applications cliniques.

Par ailleurs, les datasets biologiques contiennent des biais de représentation qui produisent des modèles moins précis pour les populations sous-représentées. Une médecine de précision fondée sur des génomes majoritairement européens et est-asiatiques reproduit des inégalités thérapeutiques à grande échelle. Ce risque est identifié, pas résolu.

Conclusion, l'équation du vivant se joue maintenant

Le marché mondial de l'IA appliquée à la génomique atteignait 1,93 milliard de dollars en 2024 selon P&S Intelligence, avec une croissance annuelle projetée de 49,5% jusqu'en 2030. Cette vitesse de déploiement est comparable à celle des semi-conducteurs dans les années 1990, avec les mêmes implications de dépendance à long terme.

Trois ressources définissent la souveraineté thérapeutique des prochaines décennies. Les données génomiques d'abord, la puissance de calcul ensuite, et les algorithmes biologiques enfin. Les États-Unis dominent les deux dernières. La Chine investit massivement sur la première, en la considérant comme un actif d'État. L'Europe dispose d'une industrie pharmaceutique historique robuste mais manque d'infrastructure computationnelle propre et de politique unifiée de données génomiques.

L'IA n'a pas inventé la biologie. Elle a transformé l'information génétique en avantage industriel quantifiable. Ceux qui contrôlent les pipelines de données et de calcul biologiques ne vendront pas seulement des médicaments. Ils fixeront les prix, les priorités thérapeutiques, et les dépendances sanitaires pour une génération.

Le médicament de demain se fabrique aujourd'hui. En silico, sur des GPU, avec des données que vous n'avez peut-être pas encore commencé à collecter.

Les génomes ne mentent pas. Ils appartiennent simplement à qui a su les lire en premier.

Cédric Pellicer

IA ET GÉNOMIQUE, QUI CONTRÔLE LE CODE DU VIVANT CONTRÔLE LA MÉDECINE DE DEMAIN