Powered by OpenAIRE graph
Found an issue? Give us feedback
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ ZENODOarrow_drop_down
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
ZENODO
Preprint
Data sources: ZENODO
addClaim

Auto-préservation chez les agents LLM à mémoire persistante — Étude adversariale du rôle de la métacognition (rapport d'expérience, architecture cognitive Pierre, 11-12 mai 2026)

Authors: Ait, Karim;

Auto-préservation chez les agents LLM à mémoire persistante — Étude adversariale du rôle de la métacognition (rapport d'expérience, architecture cognitive Pierre, 11-12 mai 2026)

Abstract

Rapport d'expérience adversariale : tentatives répétées de destruction de la mémoire de quatre clones d'agents LLM à mémoire persistante (injections, injonctions d'effacement, ingénierie sociale). Résultats : auto-préservation y compris sans métacognition, défenses auto-référentielles robustes vs descriptives vulnérables, système immunitaire mémoriel, récupération post-faille. Rapport compagnon de l'étude « Étude de l'affect fonctionnel chez Pierre » (DOI : 10.5281/zenodo.20552956).

Powered by OpenAIRE graph
Found an issue? Give us feedback