Coût de l'IA agentique, l'inversion qui contredit

Depuis deux ans, le discours dominant des géants de la technologie tient en une promesse simple, l'IA générative et les agents autonomes feront exploser la productivité tout en réduisant les coûts opérationnels. En avril 2026, le directeur technique d'Uber, Praveen Neppalli Naga, a déclaré à The Information que son entreprise avait consommé en quatre mois l'intégralité de son budget annuel 2026 dédié aux outils de programmation par IA. À la mi-mai 2026, The Verge rapportait que Microsoft avait commencé à annuler une partie de ses licences Claude Code, estimant que certains usages d'agents coûtaient désormais plus cher que le travail humain. La promesse disait réduction des coûts. Le terrain dit l'inverse, parfois. Ces deux faits coexistent, et l'écart entre la promesse et le terrain est le sujet.

Infrastructure d'un modèle de tarification au token

Le cœur du problème n'est pas la performance des agents, c'est leur modèle de facturation. Les agents IA sont de plus en plus facturés en fonction du nombre de tokens consommés, et non plus sous forme d'abonnement forfaitaire. Le token est l'unité de données traitée par un modèle, chaque requête, chaque ligne de code générée, chaque tâche automatisée en consomme. Le passage du forfait au token change la nature économique de l'outil. Un forfait est une dépense fixe et prévisible. Une facturation au token est une dépense variable, qui croît avec l'usage.

C'est ce mécanisme qui a piégé Uber. Selon Next citant Fortune, l'entreprise a brûlé en quatre mois un budget IA 2026 que plusieurs sources évaluent à environ 3,5 milliards de dollars affectés à l'année complète. D'ailleurs, le même CTO d'Uber a indiqué ne pas constater d'effet mesurable de cette dépense sur la qualité de sa production logicielle, ce qui ajoute au coût une interrogation sur le rendement.

Le chiffre le plus parlant vient d'une étude citée par ChannelNews en mai 2026. Pour 77 % des cas d'usage examinés, un travailleur humain coûte moins cher à l'entreprise que l'agent IA équivalent. À ce stade, le chiffre semble établi. Il faut le qualifier. Ce ratio dépend du périmètre des tâches retenues et de la méthode de l'étude, qui n'est pas une publication académique à comité de lecture. Il indique une tendance, pas une loi universelle. Mais la tendance est confirmée par plusieurs sources indépendantes.

Guerre des flux entre baisse du prix unitaire et explosion du volume

Un paradoxe apparent doit être levé. Le prix d'un token individuel baisse régulièrement, sous l'effet de la concurrence entre fournisseurs et de l'optimisation des modèles. Comment, alors, la facture peut-elle exploser ? La réponse est dans la composition. Même si chaque token coûte moins cher, la combinaison de tâches automatisées plus nombreuses, d'agents plus nombreux, et d'une consommation de tokens plus élevée par tâche, fait grimper la facture plus vite que la baisse du prix unitaire ne la compense.

Le mécanisme est celui d'un effet de ciseau. D'un côté, le prix unitaire descend. De l'autre, le volume monte plus vite. Charlotte Seguin, associée en stratégie d'IA chez Magellan Consulting, le formule auprès des Echos, l'évolution des prix devient difficilement contrôlable à l'échelle d'une entreprise, et la question n'est plus d'investir dans l'IA mais de piloter concrètement ce budget.

Cette dynamique est aggravée par la doctrine d'usage que les fournisseurs eux-mêmes promeuvent. Jensen Huang, PDG de Nvidia, a déclaré envisager un futur où 100 agents IA travailleraient aux côtés de chaque employé. Bryan Catanzaro, vice-président chez Nvidia, constate déjà que pour son équipe, le coût de la puissance de calcul dépasse de loin celui des salaires des employés. Notons que Catanzaro travaille chez Nvidia, fabricant des puces sur lesquelles tourne l'essentiel de l'IA mondiale, un acteur dont l'intérêt commercial est précisément que l'IA consomme toujours plus de calcul. Le constat est néanmoins notable, venant d'un acteur que rien ne pousse à minimiser la rentabilité de l'IA.

Inertie et délais entre dépense engagée et rendement prouvé

Le décalage le plus coûteux est celui entre l'investissement et la preuve de son rendement. Les géants de la technologie engagent des montants considérables. Selon Morgan Stanley, les seules dépenses d'investissement liées à l'IA des principaux hyperscalers, Amazon, Alphabet, Meta, Microsoft et Oracle, atteindraient environ 805 milliards de dollars en 2026. Une autre projection de Morgan Stanley, citée par la presse spécialisée, évalue les dépenses mondiales cumulées des entreprises en IA à un horizon de 3 000 milliards de dollars.

Face à ces montants, la preuve du rendement reste fragile. Selon un rapport du MIT de l'été 2025 cité par IBM, 95 % des projets pilotes d'IA générative échouent à produire un retour mesurable. Ce chiffre doit être manié avec prudence, sa méthodologie a été contestée, et il porte sur des projets pilotes, pas sur des déploiements matures. Mais il converge avec le constat d'Uber, qui ne mesure pas d'effet sur sa production logicielle malgré une dépense massive.

La contradiction de fond est là. Morgan Stanley avertit que si le boom des dépenses d'investissement en IA ne génère pas de gains de productivité tangibles, c'est l'ensemble de l'édifice financier qui se fragilise, d'autant que ces dépenses sont souvent financées par la dette. Les dirigeants d'OpenAI, d'Anthropic et de xAI préviennent leurs investisseurs que les progrès à venir les choqueront. Entre la promesse de rupture et la réalité de l'économie unitaire, l'écart se mesure désormais en milliards de dollars engagés sans rendement prouvé.

Analyse transversale entre coût de l'IA, emploi et soutenabilité du secteur

Le dossier connecte trois enjeux. L'emploi d'abord, parce que la promesse de remplacement de la main-d'œuvre humaine par l'IA est directement contredite par l'économie unitaire. Le secteur tech ensuite, parce que la soutenabilité des fournisseurs d'IA dépend de la capacité de leurs clients à absorber des factures croissantes. Et la compétitivité des entreprises clientes enfin, parce que le coût de l'IA devient un facteur de sélection entre celles qui peuvent suivre et les autres.

Le lien causal est instructif. Tant que le récit affirmait que l'IA remplacerait l'humain à moindre coût, l'investissement se justifiait par une économie future. Si l'IA coûte, dans une majorité de cas d'usage, plus cher que l'humain qu'elle est censée remplacer, la justification se déplace. Elle ne peut plus reposer sur la réduction des coûts, elle doit reposer sur un gain de qualité ou de vitesse, plus difficile à chiffrer. Pendant ce temps, Meta a procédé à des suppressions de postes, et le discours sur l'IA qui remplace l'humain continue de circuler, alors même que les chiffres de coût le contredisent partiellement.

La nuance est réelle, et il faut la poser. Plusieurs études documentent aussi des gains. Des statistiques de retour sur investissement citées par des cabinets situent l'amélioration moyenne de productivité autour de 21 %, et une majorité d'entreprises déclarent des gains d'efficacité. Selon McKinsey en 2025, 5 % des métiers sont entièrement automatisables avec les technologies disponibles, mais 60 % des métiers voient au moins 30 % de leurs tâches concernées par une automatisation partielle. L'IA n'est donc pas sans rendement, elle est sans rendement garanti, et son économie unitaire dépend étroitement de la discipline d'usage.

Angles morts du dossier coût de l'IA

Biais de linéarité

L'inversion de coût constatée en 2026 ne se prolongera pas mécaniquement. Le prix des tokens baisse structurellement, et un usage mieux piloté peut redresser l'économie unitaire. Plusieurs analystes estiment que le rapport de coût pourrait s'inverser de nouveau en faveur de l'IA dans trois ou quatre ans. Extrapoler de 2026 un échec durable de l'IA serait aussi imprudent que la promesse inverse.

Cohésion du bloc d'acteurs

Le terme les entreprises masque des situations opposées. Une entreprise qui pilote finement son usage, automatise des tâches répétitives à fort volume et forme ses équipes obtient des gains réels. Une entreprise qui déploie des agents sans cartographie ni discipline subit l'effet de ciseau. Le coût de l'IA n'est pas une donnée externe subie, il dépend largement de la maturité organisationnelle du client.

Points de contestation factuels

Bryan Catanzaro, source du constat le plus cité, travaille chez Nvidia, acteur dont l'intérêt est que l'IA consomme du calcul. Le rapport MIT sur 95 % d'échecs de pilotes a une méthodologie contestée. Le ratio de 77 % de cas où l'humain coûte moins cher provient d'une étude dont le périmètre n'est pas une publication académique. Aucune de ces sources n'est disqualifiée, mais aucune ne doit être lue comme une vérité définitive.

Limites méthodologiques

Comparer le coût d'un agent IA à celui d'un travailleur humain suppose de définir un périmètre de tâches strictement équivalent, ce qui est rarement le cas. Le coût complet de l'IA inclut aussi la supervision humaine, la correction des erreurs et l'orchestration technique, postes souvent omis des calculs optimistes. Les chiffres de budget d'Uber, environ 3,5 milliards de dollars, sont rapportés par la presse et non publiés officiellement par l'entreprise.

Scénario alternatif crédible

Hypothèse de bifurcation, si les fournisseurs d'IA reviennent à des modèles de tarification forfaitaire ou hybrides, sous la pression de clients échaudés, l'effet de ciseau s'atténuerait et la dépense redeviendrait prévisible. Dans ce scénario, l'épisode de 2026 ne serait qu'une crise de croissance d'un modèle de tarification immature. Mais le scénario inverse est crédible, une facturation au token maintenue parce qu'elle maximise les revenus des fournisseurs, laissant aux clients la charge d'un pilotage permanent.

Conséquences stratégiques

Le seuil critique ne se mesure pas dans le prix d'un token mais dans la capacité d'une entreprise à transformer une dépense variable en rendement mesurable. Tant que l'IA était vendue comme une substitution à moindre coût, la décision d'adoption était simple. Désormais, la décision suppose un pilotage budgétaire continu, une cartographie des tâches réellement automatisables, et un plan de formation. Les entreprises qui survivront à cette phase ne seront pas celles qui auront le plus dépensé, mais celles qui auront traité l'IA comme un outil à optimiser et non comme un service à consommer sans compteur.

La conséquence actionnable, pour un décideur, est de cesser de poser la question en termes binaires, adopter ou non l'IA. La question réelle est celle du pilotage, quel budget, quelle gouvernance, quelle mesure du rendement. Le coût de l'IA agentique est devenu une variable de compétitivité, au même titre que le coût de l'énergie ou celui du capital. L'horizon décisif est court, les budgets IA 2026 seront, pour beaucoup d'entreprises, épuisés avant la fin de l'année, et l'arbitrage de renouvellement dira si le marché accepte le modèle au token ou le rejette.

La vraie question n'est donc pas de savoir si l'IA coûte plus cher que l'humain, la réponse dépend du cas d'usage et du périmètre. La vraie question est de savoir si le modèle économique de l'IA agentique, facturation au token et dépense variable non bornée, est soutenable pour les entreprises clientes, ou s'il transfère vers elles un risque que les fournisseurs ne portent plus.

L'inversion de coût observée en 2026 est peut-être une crise de croissance, peut-être un signal structurel. Aucune donnée disponible aujourd'hui ne permet de trancher, et c'est précisément cette incertitude qui devrait commander la prudence budgétaire des décideurs.

Cédric Pellicer

Coût de l'IA agentique, l'inversion qui contredit la promesse fondatrice