Votre Confluence entraîne désormais l'IA d'Atlassian. Ce que le DSI doit décider avant le 17 août.

Atlassian active par défaut l'entraînement IA sur Confluence et Jira le 17 août. Le bon réflexe DSI : auditer l'état du corpus avant de cocher l'opt-out.

Le 16 avril 2026, Atlassian a commencé à déployer une politique de collecte de données que beaucoup de directions des systèmes d’information n’avaient pas anticipée. À partir du 17 août 2026, les contenus Confluence et les données Jira de l’ensemble des clients cloud de l’éditeur seront utilisés par défaut pour entraîner Rovo, l’assistant IA d’Atlassian — et l’ensemble de sa famille de produits IA. La mesure concerne environ 300 000 organisations (Atlassian, Trust Center, avril 2026).

La plupart des articles publiés depuis traitent la question sous l’angle des paramètres : où cliquer, quels droits selon quel abonnement. Ce guide-là existe et il est utile. Mais il y a une question en amont que j’entends rarement dans les directions informatiques, et qui me semble plus structurante : dans quel état se trouve réellement votre corpus Confluence ? Parce que la décision de laisser Atlassian l’utiliser — ou de l’en empêcher — mérite une réponse à cette question avant d’être traitée comme une case à cocher.

Ce qu’Atlassian collecte — et pour combien de temps

La politique distingue deux catégories de données, avec des règles d’opt-out différentes selon le tier (Groundy, 19 avril 2026 ; Atlassian Support).

Les métadonnées comprennent les scores de lisibilité, les classifications de tâches, les scores de similarité sémantique, les story points, les dates de fin de sprint et les valeurs SLA. Ce sont des signaux dérivés de votre contenu, pas le contenu lui-même. Leur caractère « dé-identifié » ne les rend pas neutres pour autant : des scores de similarité sémantique agrégés sur des centaines de tickets Jira peuvent révéler la structure d’un portefeuille produit ou d’une feuille de route. Pour un département de veille concurrentielle, ce n’est pas une donnée anodine.

Les données in-app comprennent les titres et corps des pages Confluence, les titres, descriptions et commentaires des items Jira, ainsi que les noms de statuts et de workflows personnalisés. C’est votre documentation opérationnelle, votre base de connaissance interne, vos processus formalisés.

La durée de rétention maximale est de sept ans. En cas d’opt-out, les données in-app sont supprimées sous trente jours, les métadonnées sous quatre-vingt-dix jours — mais les paramètres de modèle déjà entraînés à partir de votre contenu ne sont pas rétroactivement effacés.

La matrice des tiers : ce que votre abonnement vous permet de contrôler

Tout ne se vaut pas selon votre plan Atlassian (Atlassian Support, Data contribution settings) :

Plan	Opt-out métadonnées	Données in-app par défaut	Opt-out données in-app
Free	Non disponible	Activé	Disponible
Standard	Non disponible	Activé	Disponible
Premium	Non disponible	Désactivé	Disponible
Enterprise	Disponible	Désactivé	Disponible

Les clients Free et Standard sont dans la position la plus exposée : la collecte des métadonnées est obligatoire, et les données in-app sont activées par défaut. Le seul levier accessible est de désactiver la collecte in-app via admin.atlassian.com > Security > Data contribution — ce que nous recommandons de vérifier maintenant, indépendamment de la décision finale sur la politique.

Les clients Enterprise disposent de la maîtrise la plus complète : les deux catégories sont désactivées par défaut et les deux opt-outs sont disponibles. C’est la seule configuration où votre gouvernance documentaire reste entièrement entre vos mains.

Un point souvent mal compris : l’opt-out s’applique à l’organisation entière, pas à des utilisateurs individuels. Seul un administrateur avec accès à admin.atlassian.com peut modifier ces paramètres. Si vous gérez plusieurs organisations Atlassian, la démarche doit être répétée pour chacune.

La question que peu de DSI ont eu le temps de poser

Voici ce que l’essentiel de la couverture médiatique a omis de formuler : si vous décidez de laisser Atlassian entraîner ses modèles sur votre corpus Confluence, savez-vous dans quel état se trouve ce corpus ?

Cette question n’est pas rhétorique. Une étude publiée en juin 2026 par Sinequa auprès de 740 dirigeants d’entreprises entre un et vingt milliards de dollars de chiffre d’affaires indique que 38,4 % des organisations constatent que leurs données ne se mettent pas à jour dans leurs pipelines IA en production (Sinequa, « Beyond the Hype: The Reality of Enterprise Agentic AI in 2026 », 2 juin 2026). Lors des premiers diagnostics documentaires que nous menons chez K-AI sur les référentiels de nos clients, nous rencontrons régulièrement des anomalies semblables : pages obsolètes non archivées, doublons de processus aux versions divergentes, instructions contradictoires sur des sujets à fort enjeu opérationnel.

Contribuer un tel corpus à un modèle d’IA, c’est contribuer ses défauts autant que sa valeur. Un modèle entraîné sur des documents qui se contredisent n’apprend pas à trancher — il apprend à reproduire l’ambiguïté à l’échelle. Plus le corpus est large, plus les signaux contradictoires se renforcent mutuellement dans les paramètres du modèle.

La décision que les DSI et les DPO doivent prendre avant le 17 août n’est donc pas seulement une décision de paramétrage. C’est une décision de gouvernance documentaire, et elle mérite une évaluation préalable de l’actif que l’on s’apprête à partager.

Trois décisions à prendre avant le 17 août

1. Vérifier l’état du toggle dans les prochains jours

Quelle que soit votre décision finale, commencez par admin.atlassian.com > Security > Data contribution. L’interface de paramétrage a été déployée sur toutes les organisations depuis le 19 mai. Si vous êtes sur Free ou Standard, désactivez les données in-app par précaution pendant que vous évaluez la situation. Sur Premium, vérifiez que le toggle in-app est bien dans son état par défaut (désactivé). Sur Enterprise, vérifiez les deux.

2. Auditer l’état de votre corpus avant de décider

La politique Atlassian crée une occasion — peut-être la première qui ait généré une vraie urgence — d’évaluer l’état réel de la documentation interne. Quels espaces Confluence sont actifs, et quels espaces contiennent des informations obsolètes ou contradictoires ? Quels référentiels alimentent déjà vos assistants IA ou vos pilotes Copilot ? Sans cette cartographie, vous ne pouvez ni évaluer le risque de partage, ni prendre une décision de gouvernance fondée.

3. Distinguer l’outil KM de la couche DKP

La politique Atlassian n’est pas un incident isolé. Elle signale une tendance de fond : les éditeurs d’outils de Knowledge Management intègrent l’IA générative en natif et alimentent leurs modèles avec les données de leurs clients. GitHub a procédé de manière analogue avec Copilot (GitLab, « Atlassian will train on your data: Opt out with GitLab », 4 mai 2026). La question pour le DSI n’est plus seulement « quel outil de KM utilisons-nous ? » mais « quelle est notre stratégie de gouvernance documentaire dans un environnement où vos données peuvent alimenter des modèles sur lesquels vous n’avez pas de contrôle direct ? »

Rovo et la qualité documentaire — ce que les outils KM ne font pas

Rovo est un assistant IA dont la pertinence dépend directement de l’état du corpus Confluence qu’il interroge. C’est vrai pour tous les outils de ce type. Glean, qui a dépassé 300 millions de dollars d’ARR en mai 2026 avec l’argument central de la réduction des coûts de tokens IA via un « context graph » enterprise, est confronté à la même contrainte : un corpus non nettoyé coûte plus cher à interroger, produit plus d’erreurs factuelles et dégrade les performances de n’importe quel assistant IA posé dessus (TechCrunch, 28 mai 2026). Les outils d’Enterprise Search et de KM indexent — ils ne nettoient pas.

Ce n’est pas une critique de ces outils. C’est une description de leur périmètre, et c’est précisément le périmètre que la politique de collecte Atlassian rend visible malgré lui.

Chez K-AI, les données de nos clients ne servent jamais à entraîner de modèles tiers. « Start Clean, Stay Clean » s’applique aussi à la dimension souveraineté : les organisations qui travaillent avec une Document Knowledge Platform ne partagent pas leurs actifs documentaires avec les pipelines d’entraînement de leurs fournisseurs d’outils. La définition et les capacités distinctives d’une DKP sont détaillées dans un article récent si le sujet mérite d’être approfondi.

Foire aux questions

Qu’est-ce qu’Atlassian va collecter exactement dans Confluence et Jira à partir du 17 août 2026 ?

Atlassian collecte deux catégories. D’une part les métadonnées : scores de lisibilité, classifications de tâches, story points, dates de sprint, valeurs SLA, scores de similarité sémantique issus du Teamwork Graph. D’autre part les données in-app : titres et corps des pages Confluence, titres, descriptions et commentaires des items Jira, noms de statuts et de workflows personnalisés. Ces données sont dé-identifiées et agrégées avant utilisation en entraînement. La rétention maximale est de sept ans. En cas d’opt-out, les données in-app sont supprimées sous 30 jours, les métadonnées sous 90 jours. Source primaire : Atlassian Trust Center.

Comment évaluer si Confluence AI (Rovo) couvre mes besoins de Knowledge Management ou si j’ai besoin d’une DKP ?

Rovo et les outils KM similaires opèrent sur le corpus tel qu’il existe : ils indexent, cherchent et génèrent des réponses. Une Document Knowledge Platform opère en amont : elle audite la qualité du corpus, détecte les anomalies (doublons, contradictions, obsolescence, sujets manquants), nettoie et surveille en continu. Si votre besoin est d’interroger votre documentation existante, un outil KM peut suffire. Si votre besoin est de garantir que les réponses de vos assistants IA sont fiables, traçables et conformes, vous avez besoin d’une couche DKP en amont. Les deux ne s’excluent pas — ils ne se substituent pas.

Un DSI peut-il empêcher Atlassian d’utiliser ses données Confluence pour entraîner l’IA ?

Partiellement, selon le tier. Sur Free et Standard, les métadonnées sont collectées de manière non opt-outable ; seules les données in-app peuvent être désactivées. Sur Premium, les données in-app sont désactivées par défaut et les métadonnées ne peuvent pas être refusées. Sur Enterprise, les deux catégories peuvent être refusées et sont désactivées par défaut. Le paramètre se trouve dans admin.atlassian.com > Security > Data contribution. L’accès est réservé aux administrateurs de l’organisation.

Mes données Confluence sont-elles conformes au RGPD si Atlassian les utilise pour entraîner ses modèles ?

Atlassian affirme maintenir ses obligations RGPD dans le cadre de cette politique. Cependant, pour les organisations établies dans l’UE, le principe de limitation des finalités (Article 5(1)(b) RGPD) peut impliquer que l’utilisation des données à des fins d’entraînement constitue une finalité nouvelle nécessitant une analyse de compatibilité. Les organisations sous accord de traitement des données (DPA) avec Atlassian devraient faire valider par leur équipe juridique ou DPO si la nouvelle politique déclenche des obligations de re-notification avant le 17 août. Ce n’est pas une conclusion juridique — c’est une obligation d’analyse.

Quelle est la différence entre un outil de Knowledge Management comme Confluence et une Document Knowledge Platform (DKP) ?

Un outil KM comme Confluence, Notion ou SharePoint permet de créer, organiser et partager de la documentation. Une Document Knowledge Platform audite la qualité de cette documentation pour l’IA : elle détecte les conflits entre documents, les doublons divergents, les contenus obsolètes et les sujets manquants, puis surveille le corpus en continu pour le maintenir dans un état « AI-ready ». La DKP est une couche infrastructure en amont des outils KM. Elle ne les remplace pas ; elle conditionne leur fiabilité pour les usages IA. Pour une définition complète, voir notre article dédié à la DKP.

Pour aller plus loin

La politique Atlassian du 17 août crée une fenêtre décisionnelle courte. Si vous souhaitez évaluer l’état de votre corpus documentaire avant de prendre votre décision, notre équipe propose un diagnostic initial. Écrivez-nous à contact@k-ai.ai.

K-AI accompagne déjà CMA CGM, Veolia, PwC, BNP Paribas, TotalEnergies et CEVA Logistics. Partenaires : AWS, Snowflake, Microsoft, Wavestone, Devoteam.

Sources citées

Atlassian, « Data practices built for responsible AI » (Trust Center), avril 2026 — https://www.atlassian.com/trust/ai/data-contribution
Atlassian Support, « Data contribution settings », mai 2026 — https://support.atlassian.com/security-and-access-policies/docs/data-contribution-settings/
Groundy Editorial, « Atlassian Turned On AI Training Data Collection by Default: Here’s What to Disable », 19 avril 2026 — https://groundy.com/articles/atlassian-turned-on-ai-training-data-collection-by-default-heres-what-to-disable/
GitLab, « Atlassian will train on your data: Opt out with GitLab », 4 mai 2026 — https://about.gitlab.com/blog/atlassian-will-train-on-your-data-opt-out-with-gitlab/
Sinequa, « Beyond the Hype: The Reality of Enterprise Agentic AI in 2026 », 2 juin 2026 — https://www.sinequa.com/resources/blog/beyond-the-hype-the-reality-of-enterprise-agentic-ai-in-2026/
TechCrunch, « Glean’s top line crosses $300M as AI budget cutting becomes its major selling point », 28 mai 2026 — https://techcrunch.com/2026/05/28/gleans-top-line-crosses-300m-as-ai-budget-cutting-becomes-its-major-selling-point/