Context engineering done right : pourquoi ce paradigme post-RAG exige un corpus propre
Anthropic, Glean, LangChain, Pinecone, LlamaIndex ont posé la grammaire du context engineering. Tous travaillent en aval du corpus. Et personne ne le dit.
Le 19 mai 2026, VentureBeat a publié une enquête au titre franc : « Context architecture is replacing RAG as agentic AI pushes enterprise retrieval to its limits » (VentureBeat, 19 mai 2026). L’enquête s’appuie sur le VB Pulse RAG Infrastructure Market Tracker Q1 2026, qui chiffre le basculement budgétaire : l’intention d’adoption de l’hybrid retrieval triple en un trimestre (10,3 % en janvier, 33,3 % en mars), et la part du budget consacrée à l’optimisation du retrieval passe de 19 % à 28,9 %, dépassant pour la première fois la part consacrée à l’évaluation. Une semaine plus tôt, Douwe Kiela — co-auteur du papier RAG fondateur de 2020 — reconnaissait dans The New Stack que le terme « RAG » avait été absorbé dans un terme plus large : context engineering (The New Stack, mai 2026). La conversation a basculé. Et avec elle, un présupposé que personne n’explicite : pour que le context engineering produise les gains promis, il faut que le corpus en amont soit propre. Cet article cadre ce présupposé, et propose le rôle que la couche K-AI joue dans une architecture post-RAG sérieuse.
Le moment où le mot a quitté Twitter pour la roadmap CIO
L’expression est née en juin 2025 dans un tweet d’Andrej Karpathy — « +1 for context engineering over prompt engineering », « the delicate art and science of filling the context window » (Karpathy, juin 2025). Elle est devenue discipline en septembre 2025, avec le post-pivot d’Anthropic Effective context engineering for AI agents, qui la définit comme « the set of strategies for curating and maintaining the optimal set of tokens during LLM inference » (Anthropic, 29 septembre 2025). Gartner l’a inscrite dans son glossaire en octobre 2025, en projetant qu’elle apparaîtra dans 80 % des outils AI d’ici 2028 (Gartner, 2025). En 2026, Glean a publié quatre billets dédiés (Glean, Shifting context engineering to the AI platform, Glean, The harness as the context manager) ; LangChain a fait du sujet sa thèse stratégique sur le podcast Sequoia Context Engineering Is the New AI Moat (Sequoia / Harrison Chase) ; LlamaIndex a déplacé la doctrine RAG vers le document agent (LlamaIndex, Files Are All You Need) ; Pinecone a lancé Nexus, un knowledge engine for agents avec citations per-field et résolution déterministe des conflits (Pinecone, 2026).
DataHub a publié en parallèle son State of Context Management Report 2026, fondé sur 250 responsables IT et data : 82 % jugent le prompt engineering seul insuffisant, 77 % le RAG seul insuffisant en production, 83 % considèrent qu’aucun agent ne sort en production sans plateforme de contexte, et 88 % ont déjà inscrit l’architecture de gestion du contexte dans leur stratégie IA (DataHub, 2026). L’angle est mainstream.
Ce que disent Anthropic, Glean, LangChain — et le présupposé qu’ils n’écrivent pas
Lisons-les côte à côte. Anthropic insiste sur le caractère fini de la fenêtre de contexte (« attention budget »), sur la dégradation de la précision avec la longueur (« context rot »), et sur la nécessité de fournir des high-signal tokens — c’est-à-dire des tokens dont la pertinence est dense au regard de la tâche. Glean déplace la responsabilité du context engineering depuis les engineers vers la plateforme AI, et fait du harness le gestionnaire de contexte pour les agents long-running. LangChain pose que la fiabilité des agents long-horizon vient de l’infrastructure et des feedback loops, pas du modèle. Pinecone formalise l’idée d’un knowledge engine déterministe au-dessus du vector store. LlamaIndex revalorise le document comme unité native du raisonnement agentique.
Le présupposé commun, que ni Anthropic, ni Glean, ni LangChain, ni Pinecone, ni LlamaIndex n’explicitent dans ces textes, est simple : les tokens fournis au modèle sont supposés provenir d’un corpus dont la qualité documentaire a déjà été établie. High-signal présuppose que les sources ne se contredisent pas entre elles. Just-in-time retrieval présuppose que la version récupérée à l’instant t est bien la source de vérité courante. Per-field citation présuppose qu’il existe une notion d’auteur, de date, de validation au niveau de chaque document. Ce présupposé n’est pas tenu par défaut dans les patrimoines documentaires des grands groupes — et c’est ce qui change tout en production.
Corpus rot → context rot → agent rot : la chaîne causale que personne ne nomme
Nous avons posé le terme corpus rot dans un article publié le 13 mai, en miroir du context rot documenté par Chroma (K-AI, 13 mai 2026). Le paradigme context engineering nous permet aujourd’hui de boucler la chaîne. Un corpus pollué — doublons divergents, politiques périmées non marquées, conflits inter-documents non hiérarchisés — produit, à chaque retrieval, des tokens dont la valeur informationnelle nette est négative : ils consomment de l’attention budget tout en augmentant la probabilité d’une réponse fausse. Le context rot théorique d’Anthropic est amplifié, en production enterprise, par un corpus rot préalable que personne ne mesure. Et en cascade, le context rot aggravé dégrade la fiabilité des agents long-horizon — ce qu’on pourrait appeler, par cohérence, agent rot : l’agent fonctionne, atteint des étapes, déclenche des outils, mais sur une base de connaissances incohérente avec elle-même.
Cette chaîne n’est pas une vue de l’esprit. L’audit indépendant AILuminate du 8 mai 2026 a passé en revue cinquante déploiements RAG en production et conclut que 100 % d’entre eux échouent face à un corpus contradictoire, et que 81 % fabriquent des citations dans le legal, parfois inexistantes (ragaboutit.com, 8 mai 2026). Cisco maintient son AI Readiness Index avec data comme l’un des six piliers organisationnels prérequis (Cisco AI Readiness Index). Cloudera et HBR Analytic Services mesurent, sur 230 organisations interrogées en octobre 2025, que 7 % seulement des entreprises décrivent leurs données comme completely ready for AI, et 27 % comme not very or not at all ready (Cloudera × HBR, 5 mars 2026). Optimiser un attention budget Anthropic-perfect sur ce substrat, c’est ajouter une couche d’ingénierie sophistiquée à un problème de qualité documentaire non résolu.
Cartographie : Pinecone Nexus, Glean harness, Squirro Context Graph — qui couvre l’amont ?
La question opérationnelle, pour un CTO ou un Head of Data qui prépare l’architecture cible d’un agent enterprise en 2026, est de savoir lequel des acteurs de la couche context fournit la couche amont. Réponse courte : aucun de manière frontale. Pinecone Nexus fournit la résolution déterministe des conflits au moment de la requête — c’est précieux, mais cela ne supprime pas les contradictions latentes dans le corpus, cela en arbitre une à la requête. Glean ADLC (Glean, 12 mai 2026) et le harness fournissent l’orchestration et le monitoring des agents — c’est précieux, mais cela suppose des connecteurs sur des sources dont la qualité documentaire est l’affaire du client. Squirro Context Graph (Squirro) propose une couche graph en lecture pour l’audit run-time — c’est précieux, mais le graph hérite des défauts du corpus source si l’audit documentaire n’a pas eu lieu. Hyland Enterprise Context Engine et Agent Mesh poussent le terrain IDP étendu, mais s’arrêtent au pré-traitement format — pas au diagnostic sémantique du fond.
Le diagnostic n’est pas une critique de ces acteurs : c’est une lecture honnête de la grille. Le paradigme context engineering s’est cristallisé autour de la gestion du contexte au point d’inférence. La fabrication d’un corpus context-engineering-ready est un travail distinct, sur lequel la conversation publique reste rare.
Les six qualités documentaires que le context engineering présume acquises
Le 15 mai, nous avons publié la méthode K-AI d’audit corpus en six axes : anomalies internes, conflits inter-documents, doublons divergents, obsolescence non marquée, traçabilité, fraîcheur par segment (K-AI, 15 mai 2026). À la lumière du paradigme context engineering, ces six axes ne sont pas accessoires : ils sont les conditions de fonctionnement du paradigme. Sans réconciliation des conflits inter-documents, le just-in-time retrieval d’Anthropic remonte des passages contradictoires que la compaction ne sait pas trancher. Sans marquage de l’obsolescence, le harness de Glean injecte dans la fenêtre une politique de 2019 et une politique de 2026 sans hiérarchie. Sans traçabilité (auteur, date, validation, source de vérité), le per-field citation de Pinecone Nexus pointe vers un document dont la légitimité métier n’est pas elle-même tracée. Sans déduplication sémantique des doublons divergents, le context rot d’Anthropic s’amorce dès la première seconde de retrieval. Sans fraîcheur par segment, le système signale un succès là où une zone du corpus a discrètement cessé d’être un sujet vivant.
Sur un premier diagnostic effectué sur un seul référentiel documentaire d’un client K-AI, nous avons typiquement détecté plus de 1 300 anomalies de cohérence — et il s’agissait d’un référentiel parmi des dizaines dans l’organisation. C’est l’ordre de grandeur que l’on ne voit pas dans les benchmarks publics.
Continuous context hygiene : pourquoi un audit one-shot ne suffit plus
Un corpus reste propre tant que rien ne change. Or, dans une grande organisation, quelque chose change tous les jours : une politique se réécrit, un manuel se périme, deux équipes documentent la même procédure différemment, un nouveau référentiel est ouvert sans gouvernance. La discipline Start Clean est nécessaire ; elle n’est jamais suffisante. L’observation que nous formalisons est simple : la couche d’amont du context engineering n’est pas un setup de projet, c’est un service continu. C’est ce que nous appelons Stay Clean — un monitoring sémantique qui détecte, dès leur apparition, les nouveaux conflits, les nouveaux doublons divergents, les glissements de fraîcheur. Sans cette discipline, le bénéfice d’un audit initial s’efface en deux trimestres, et l’agent context-engineered hérite à nouveau, sans le savoir, d’un corpus en dérive.
K-AI dans cette grille : la couche d’amont entre les sources et le harness
Notre architecture interne, le Neural Semantic Graph, dont nous avons posé la grille de comparaison avec les bases vectorielles le 22 mai (K-AI, 22 mai 2026), joue dans cette grille un rôle précis : pré-condition. Il ne remplace ni un harness Glean, ni un knowledge engine Pinecone, ni un graph Neo4j ou FalkorDB. Il prépare ce que ces couches consomment. Audit en six axes du corpus brut, déduplication sémantique des doublons divergents, marquage d’obsolescence, traçabilité auteur-date-validation-source-de-vérité, monitoring continu. À la sortie de cette couche, un référentiel SharePoint, Confluence, Drive ou Notion devient un substrat dont les tokens méritent un attention budget. Le 25 mai, dans notre article sur les frameworks AI Readiness, nous avons montré que le corpus n’est jamais un pillar autonome dans les cinq frameworks dominants (K-AI, 25 mai 2026). Le même angle mort se reproduit dans le paradigme context engineering, sous une autre forme : une couche d’amont supposée présente, mais que personne ne fournit. C’est précisément l’objet de la catégorie Document Knowledge Platform — qu’à notre connaissance, K-AI est aujourd’hui le seul à instruire frontalement en Europe.
Foire aux questions
Qu’est-ce qui distingue le context engineering du prompt engineering ?
Le prompt engineering optimise une requête unique adressée à un modèle. Le context engineering optimise l’ensemble des tokens présents dans la fenêtre de contexte à un moment donné : instructions système, exemples few-shot, outils disponibles, mémoire conversationnelle, documents récupérés, sorties intermédiaires d’agents. Anthropic définit la discipline comme « the set of strategies for curating and maintaining the optimal set of tokens during LLM inference ». La différence opérationnelle tient en une phrase : le prompt engineering pense la formulation, le context engineering pense la composition.
Le context engineering remplace-t-il le RAG ?
Non, il l’englobe. Le RAG reste une technique de retrieval. Le context engineering est le cadre plus large qui décide quoi récupérer, quand le récupérer, comment le compacter, quoi maintenir dans la mémoire, quoi confier à des sous-agents. Douwe Kiela, co-auteur du papier RAG fondateur, a publiquement reconnu en mai 2026 que le terme RAG était tombé en désuétude au profit de cette catégorie plus large.
Pourquoi le context engineering exige-t-il un corpus propre ?
Parce que toutes ses stratégies — just-in-time retrieval, compaction, per-field citation, structured note-taking — présupposent que les tokens injectés dans la fenêtre proviennent de sources non contradictoires, datées, validées. Si le corpus contient des doublons divergents non hiérarchisés ou des politiques obsolètes non marquées, l’attention budget est dépensé sur des tokens contradictoires, et le context rot théorique d’Anthropic est amplifié par un corpus rot préalable que la couche d’inférence ne sait pas voir.
Quelle est la position d’Anthropic sur le context engineering ?
Anthropic a publié en septembre 2025 un texte de référence — Effective context engineering for AI agents — qui pose la discipline comme la progression naturelle du prompt engineering. Le texte décrit l’attention budget, le context rot, la nécessité de fournir des high-signal tokens, et propose des patterns concrets (compaction, just-in-time retrieval, structured note-taking, sub-agents). C’est le texte canonique de la discipline en 2026.
Comment articuler context engineering, RAG et Knowledge Graph ?
Le RAG fournit un canal de retrieval entre la fenêtre de contexte et un index — vectoriel, graph ou hybride. Le Knowledge Graph fournit la structure relationnelle qui rend les retrievals multi-hop fiables et désambigus. Le context engineering est le cadre qui orchestre ces canaux selon la tâche, le budget de tokens et le profil de l’agent. Les trois sont complémentaires. Notre grille de décision détaillée Knowledge Graph vs base vectorielle pour un RAG d’entreprise est publiée sur le blog.
Quel est le rapport entre context rot et qualité documentaire ?
Le context rot — terme documenté notamment par Chroma — désigne la dégradation de la précision d’un LLM à mesure que la fenêtre de contexte se remplit. Il s’agit d’une propriété intrinsèque de l’inférence. Notre observation, sous le terme corpus rot, est que la qualité documentaire du corpus source aggrave mécaniquement ce phénomène : un retrieval qui remonte des passages contradictoires sature l’attention budget avec des tokens dont la valeur informationnelle nette est négative. Réduire le context rot en aval suppose de réduire le corpus rot en amont.
Comment maintenir un corpus context-engineering-ready dans le temps ?
Un audit initial est nécessaire — six axes : anomalies internes, conflits inter-documents, doublons divergents, obsolescence non marquée, traçabilité, fraîcheur par segment. Il n’est jamais suffisant. Une politique se réécrit, une procédure se périme, un nouveau référentiel est ouvert sans gouvernance — la dette documentaire redevient invisible en deux trimestres si rien ne la surveille. La discipline opérationnelle s’appelle Stay Clean : un monitoring sémantique continu qui détecte, dès leur apparition, les nouveaux conflits, doublons divergents et glissements de fraîcheur.
Pour aller plus loin
Si vous préparez l’architecture cible d’un agent enterprise en 2026 et souhaitez objectiver l’état AI-Ready de votre corpus avant d’investir en harness, retrieval ou knowledge engine, écrivez-nous : contact@k-ai.ai. Nous instruisons des audits Start Clean ciblés sur un référentiel pilote, livrables sous quatre à six semaines.
Sources citées
- Andrej Karpathy, Tweet fondateur sur context engineering, juin 2025 — https://x.com/karpathy/status/1937902205765607626
- Anthropic Engineering, Effective context engineering for AI agents, 29 septembre 2025 — https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents
- Gartner, Context Engineering: Why It’s Replacing Prompt Engineering, 2025 — https://www.gartner.com/en/articles/context-engineering
- Cloudera × Harvard Business Review Analytic Services, Only 7 % of Enterprises Say Their Data Is Completely Ready for AI, 5 mars 2026 — https://www.cloudera.com/about/news-and-blogs/press-releases/2026-03-05-only-7-percent-of-enterprises-say-their-data-is-completely-ready-for-ai-according-to-new-report-from-cloudera-and-harvard-business-review-analytic-services-reveals.html
- Cisco, AI Readiness Index — https://www.cisco.com/c/m/en_us/solutions/ai/readiness-index.html
- Pinecone, Introducing Nexus — Knowledge Engine for Agents, 5 mai 2026 — https://www.pinecone.io/blog/knowledge-infrastructure-for-agents/
- Glean, Shifting context engineering to the AI platform, 27 janvier 2026 — https://www.glean.com/blog/context-for-ai
- Glean, The harness as the context manager, 20 mai 2026 — https://www.glean.com/blog/harness-context-manager
- Glean Press, Enterprise Agent Development Lifecycle, 12 mai 2026 — https://www.glean.com/press/glean-introduces-the-enterprise-agent-development-lifecycle-codifying-how-enterprises-build-govern-and-measure-ai-agents
- LangChain — Harrison Chase, Sequoia podcast Context Engineering Is the New AI Moat, 2026 — https://sequoiacap.com/podcast/context-engineering-our-way-to-long-horizon-agents-langchains-harrison-chase/
- LlamaIndex, Files Are All You Need, janvier 2026 — https://www.llamaindex.ai/blog/files-are-all-you-need
- Squirro, What is a Context Graph: Agentic AI Memory — https://squirro.com/squirro-blog/what-is-a-context-graph-agentic-ai-memory
- DataHub, State of Context Management Report 2026 (250 IT/data leaders) — https://datahub.com/news/datahub-releases-state-of-context-management-report/
- VentureBeat, Context architecture is replacing RAG as agentic AI pushes enterprise retrieval to its limits, 19 mai 2026 — https://venturebeat.com/data/context-architecture-is-replacing-rag-as-agentic-ai-pushes-enterprise-retrieval-to-its-limits
- The New Stack via ricmac.org, RAG isn’t dead, but context engineering is the new hotness, mai 2026 — https://ricmac.org/2026/01/27/rag-isnt-dead-but-context-engineering-is-the-new-hotness/
- ragaboutit.com, 7 Enterprise RAG Audit Failures You Should Know (signal AILuminate, source primaire non confirmée chez MLCommons), 8 mai 2026 — https://ragaboutit.com/7-enterprise-rag-audit-failures-you-should-know/
Sur le même sujet
- Vous croyez que votre RAG hallucine à cause de l’embedding ? Regardez votre corpus. (13 mai 2026) — origine du terme corpus rot.
- Auditer un corpus documentaire pour l’IA — la méthode K-AI en 6 axes (15 mai 2026) — méthode opérationnelle des six axes.
- Knowledge Graph vs base vectorielle pour un RAG d’entreprise (22 mai 2026) — grille KG-vs-vector et architecture Neural Semantic Graph.
- AI Readiness Assessment 2026 — le pillar « Corpus » que tous les frameworks oublient (25 mai 2026) — angle mort des frameworks AI Readiness.
K-AI accompagne déjà CMA CGM, Veolia, PwC, BNP Paribas, TotalEnergies et CEVA Logistics. Partenaires : AWS, Snowflake, Microsoft, Wavestone, Devoteam.
