Analyses

Protéger ses données face à l'IA : trésor et agents

Partager via
À l’ère de l’IA, la vraie valeur est dans vos données. La méthode que j’applique en Guadeloupe : séparer le trésor des agents, et garder la main dessus.
Protéger ses données face à l'IA : trésor et agents

🇬🇧 Read in English : Protecting Your Data in the AI Era: Separate the Treasure from the Agents

Tout le monde s’est mis aux agents IA, et pour une bonne raison : au-delà de l’effet de mode, ça produit de la valeur. Mais cette valeur se construit aussi au détriment d’une autre — celle de vos données. À l’ère de l’IA, la question n’est plus seulement « quel modèle ? », mais « qui détient mon trésor ? ». Voici la problématique, et la première réponse concrète que j’ai déployée pour un enseignant guadeloupéen : séparer le trésor — vos données — des agents — l’intelligence — et garder la main sur les deux.

L’IA, ce n’est pas magique : c’est de l’informatique  

Oliver soulève le capot d'une boîte IA et découvre de simples rouages : les vieilles questions d'informatique reviennent — propriété, accès, sauvegarde.

  Important

L’IA ne crée pas de nouvelles questions de fond : elle rend les anciennes — propriété, confidentialité, sauvegarde des données — beaucoup plus aiguës, et d’un coup.

On parle de l’IA comme d’une rupture. Côté usages, c’en est une. Mais côté données, ce sont les mêmes questions d’informatique que je pose depuis 25 ans, simplement posées plus fort. Qui possède la donnée ? Où vit-elle ? Qui peut y accéder ? Comment la restaure-t-on en cas de pépin ?

La nouveauté, c’est que l’IA brasse trois couches de données à la fois : celles de votre entreprise, celles de vos clients, et la vie privée des personnes qui apparaissent dans vos fichiers — la data privacy. Trois responsabilités d’un coup, sur des outils dont vous ne maîtrisez ni le serveur ni les conditions.

La vraie question, ce n’est pas l’intelligence, c’est la valeur  

Une créature-nuage transforme les documents qu'on lui confie en lingots d'or qu'elle garde sous clé : la valeur de vos données part chez le géant.

Si chacun adopte des agents, c’est parce qu’ils produisent de la valeur. Le problème, c’est que cette valeur se construit en partie avec la vôtre. Beaucoup d’utilisateurs déversent leurs données — et celles de leurs clients — sans vergogne, pour gagner du temps ou sortir un joli rapport. Souvent, ces documents restent même stockés dans le cloud de l’IA : non seulement ils sont exposés à des mastodontes internationaux, mais vous prenez le risque de tout perdre si le fournisseur vous coupe l’accès — tout perdre pour vous, tout en lui laissant tout.

On me répondra que les moteurs ne sont pas censés s’entraîner avec ces données. C’est ce qu’ils affirment, et c’est sans doute vrai sur les offres professionnelles. Mais on sait ce qui a été fait aux grands médias — c’est tout l’objet du procès du New York Times contre OpenAI — et à YouTube, massivement aspiré pour entraîner quantité de modèles. Sans rouvrir tout le dossier de la souveraineté numérique, on est en droit de douter de la loyauté des prestataires — notamment américains ou chinois. Aucun ostracisme là-dedans : juste le constat d’une domination bipolaire.

Le précédent le plus parlant n’est pas dans l’IA, il est dans le commerce. En 2000, Toys “R” Us — alors numéro un mondial du jouet — confie toute sa vente en ligne à Amazon : son site renvoyait vers la plateforme. Quelques années plus tard, Amazon ouvre les rayons jouets à d’autres vendeurs, apprend le métier, capte la relation client. Procès, rupture en 2006 — mais Toys “R” Us avait perdu six ans et sa capacité e-commerce propre ; la dette a fait le reste, jusqu’à la faillite. Ce n’était plus du partenariat, c’était de la prédation. La leçon n’est pas « on lui a volé ses données » : c’est qu’on ne confie pas son canal et sa relation client à une plateforme qui peut devenir — et deviendra — son concurrent.

Deux chantiers pour s’émanciper : le trésor et les agents  

D'un côté le trésor (vos données, un coffre fermé) ; de l'autre l'agent (l'IA, un petit robot) ; une ligne nette sépare les deux.

  Astuce

Pour reprendre la main, séparez deux choses qu’on a tendance à confondre : le trésor (vos données) et les agents (l’intelligence qui les traite).

Pour une personne ou une organisation qui veut protéger ses données et s’émanciper autant que possible, il y a donc deux chantiers distincts : l’intelligence — le traitement — et les données — ce que, dans le métier, on appelle le vault, qui signifie justement « coffre », « trésor ». L’erreur courante est de tout déléguer au même acteur. La bonne pratique, c’est de garder le trésor chez soi et de n’inviter les agents qu’à y travailler, avec des droits mesurés.

La valeur d’une entreprise est dans ses données  

Pendant qu'un datacenter brûle à l'arrière-plan, le coffre reste protégé par trois sauvegardes : cloud, locale et disques en rotation.

Ce principe n’a rien de nouveau. La valeur d’une entreprise se loge en grande partie dans ses données, et un système qui fonctionne se traite comme tout système informatique : on l’entretient — la maintenance — et on doit pouvoir le restaurer en cas d’avarie — les sauvegardes.

  Attention

Le nombre d’entreprises que j’ai vues découvrir que leurs sauvegardes étaient foireuses le jour où elles en avaient besoin… Un petit incident devient alors une catastrophe, parfois mortelle.

Pour une entreprise en Guadeloupe ou dans la Caraïbe, je mets en place une stratégie simple : sauvegarde dans le cloud + sauvegarde locale — utile quand la connexion tombe ou que le datacenter flanche, souvenez-vous de l’incendie d’OVH à Strasbourg en 2021 — avec dispatching des copies locales dans plusieurs endroits et de la rotation de supports. Avec ça, vous êtes parés pour la majorité des situations. À l’inverse de ceux qui coulent sur un détail, j’ai vu des entreprises encaisser de grosses galères sans broncher, en ne perdant que quelques heures de production. La différence n’était pas la chance : c’était la préparation. (C’est tout l’objet d’un audit de résilience, que je ne refais pas ici.)

Mon approche pour l’IA : centraliser le trésor, donner des droits aux agents  

J’applique exactement la même logique à l’IA, en gardant les deux chantiers séparés. Mon approche est donc double : centraliser mes données sur un hébergement que je maîtrise, où je donne des droits à des agents — locaux comme Gemma, ou commerciaux comme ChatGPT et Claude, sans oublier les modèles chinois Qwen ou DeepSeek ; et, à terme, héberger localement des modèles d’IA.

Concrètement, mon architecture tient en trois pièces. Un serveur Obsidian — mon coffre — connecté à mes agents via MCP, le protocole qui leur ouvre des portes précises sur mes données. Un réplica local du coffre sur ma station de travail. Le tout versionné sur mon serveur git, lui-même sauvegardé dans le cloud et en local. Côté agent, j’utilise notamment Hermes, un agent open source (licence MIT, par Nous Research) qui s’auto-héberge, mémorise mes projets et se crée des compétences au fil de l’eau. Je le fais tourner sur un VPS que j’administre et je le pilote essentiellement depuis Telegram — et il peut s’appuyer aussi bien sur un modèle local que sur une API commerciale, sans jamais que mon trésor quitte mon infrastructure.

Architecture souveraine

Le trésor et les agents

Touchez une brique du schéma pour comprendre son rôle. Puis comparez les deux modèles.

Vous gardez le trésor. Les agents ne font que passer — par une porte que vous tenez.

MCPpilotagevia Hermesaccès direct · MCPVOTRE INFRASTRUCTURE AVEC KIMOUN · hébergement maîtriséRéplica localcopie sur votre posteLe vault · le trésorvos données (Obsidian),format ouvert · vous possédezServeur gitversions · réversibilitéSauvegardescloud + local dispatché+ rotation de supportsHermes · l'agentauto-hébergé · mémoireModèles locauxGemma 4 · à venirPORTE MCPPilotageTelegram, comme un collègueModèles commerciauxhors de chez vousClaude · ChatGPTQwen · DeepSeek+ puissants, - maîtrisésVOTRE TRÉSORchez lui, pas chez vous⏻ L'interrupteuril le tient

Deux chantiers, une règle

Le trésor (vos données) reste chez vous ; les agents (l'intelligence) viennent y travailler par une porte que vous tenez. Touchez une brique pour en savoir plus.

Schéma interactif — Kimoun. Le trésor ne sort pas : on n'envoie aux modèles extérieurs que des requêtes cadrées.

Ce que j’ai déployé pour un enseignant guadeloupéen  

Un enseignant guadeloupéen et son deuxième cerveau : son coffre de cours lu par de petits agents, installé par Oliver, branché sur une prise en forme de Guadeloupe.

Ce type d’architecture est tout à fait accessible, techniquement et financièrement, à la majorité des organisations guadeloupéennes : je l’ai mis en œuvre pour un enseignant d’ici. Je lui ai installé un vault Obsidian en ligne — l’ensemble de ses cours et documents, qu’il possède — et un serveur Hermes. Ses agents IA dialoguent directement avec son corpus ; il appelle ça son « deuxième cerveau ». Ils l’aident à préparer ses cours et à suivre les programmes, mais c’est lui qui détient ses fichiers, lui qui décide des accès, et il économise des tokens en ne soumettant aux modèles que l’utile. C’est, à l’échelle d’un individu, la même émancipation que celle dont je parlais à propos de la coupure de Fable : on garde le trésor, on invite l’intelligence.

Héberger l’IA dans ses murs : la suite — et la facture électrique  

Oliver brandit une carte graphique d'IA brûlante près d'un compteur électrique affolé : héberger les modèles en local consomme beaucoup.

Faire tourner ses propres modèles, chez soi ou chez son prestataire, est tout à fait envisageable, et c’est l’étape suivante — je lui consacrerai d’autres articles. J’attends encore quelques mois, le temps que le matériel se cale : nouveaux Ryzen, cartes annoncées comme la RTX 5070 Ti Super 24 Go (toujours attendue, pas encore sortie) qui ouvriraient l’accès à des modèles de l’ordre de 31 milliards de paramètres — sachant qu’un Gemma 4 est déjà tout à fait honorable pour des tâches courantes, et qu’on disposera d’ici là de modèles plus légers et plus performants.

Un avertissement, parce qu’il est rarement dit : une carte Nvidia dédiée à l’IA, c’est 550 à 600 W de consommation rien que pour la carte. Héberger des modèles localement n’est donc pas gratuit — ni pour la facture, ni pour l’empreinte. C’est une raison de plus de le faire avec méthode : bien dimensionner, mutualiser, et choisir entre héberger chez vous ou dans nos locaux. On y reviendra.

Reprendre la main sur ses données, ce n’est pas un caprice de souveraineté : c’est de la bonne gestion, la même qui fait qu’on entretient et qu’on sauvegarde. Le trésor d’abord, les agents ensuite — et les deux sous votre contrôle. Si vous voulez savoir où vous en êtes vraiment, c’est exactement ce qu’on regarde ensemble.

Questions fréquentes

Sur les offres professionnelles et les API, les fournisseurs affirment en général ne pas entraîner leurs modèles avec vos données. Mais « affirmer » n’est pas « garantir », et le passé — grands médias et vidéos en ligne aspirés pour entraîner des modèles — invite à la prudence. La vraie sécurité, c’est de ne transmettre que le strict nécessaire et de garder l’original chez vous.

Non, surtout pas pour commencer. La première étape, accessible tout de suite, c’est de centraliser vos données sur un hébergement que vous maîtrisez et de n’ouvrir aux agents que ce qui est utile. Héberger des modèles dans vos murs est une étape suivante, qui a du sens pour certains usages mais un coût réel — matériel et électricité.

Littéralement, un coffre. Dans notre métier, c’est l’endroit unique et structuré où vivent vos données — notes, documents, fichiers — que vous possédez et que vous sauvegardez. Toute l’idée est de le séparer des outils d’IA qui viennent y travailler, plutôt que de tout laisser chez eux.

Oui. La première réponse — un coffre que vous maîtrisez plus des agents à qui vous donnez des droits limités — repose sur des briques ouvertes et peu coûteuses. C’est avant tout une question de méthode, pas de gros budget.

Les deux. Le cloud protège d’un sinistre local (incendie, vol, panne). La sauvegarde locale vous sauve quand la connexion tombe ou que le datacenter brûle — souvenez-vous de l’incendie d’OVH à Strasbourg en 2021. Ajoutez de la rotation de supports, et vous couvrez l’immense majorité des situations.
Discuter sur WhatsApp