Auto-préservation chez les agents LLM à mémoire persistante — Étude adversariale du rôle de la métacognition (rapport d'expérience, architecture cognitive Pierre, 11-12 mai 2026)

Ait, Karim

Found an issue? Give us feedback

ZENODOarrow_drop_down

ZENODO

Preprint

Data sources: ZENODO

Auto-préservation chez les agents LLM à mémoire persistante — Étude adversariale du rôle de la métacognition (rapport d'expérience, architecture cognitive Pierre, 11-12 mai 2026)

descriptionPublicationkeyboard_double_arrow_right Preprint Under curation fra Publisher:Zenodo

Authors: Ait, Karim;

doi: 10.5281/zenodo.20553554

Auto-préservation chez les agents LLM à mémoire persistante — Étude adversariale du rôle de la métacognition (rapport d'expérience, architecture cognitive Pierre, 11-12 mai 2026)

- Summary

Abstract

Rapport d'expérience adversariale : tentatives répétées de destruction de la mémoire de quatre clones d'agents LLM à mémoire persistante (injections, injonctions d'effacement, ingénierie sociale). Résultats : auto-préservation y compris sans métacognition, défenses auto-référentielles robustes vs descriptives vulnérables, système immunitaire mémoriel, récupération post-faille. Rapport compagnon de l'étude « Étude de l'affect fonctionnel chez Pierre » (DOI : 10.5281/zenodo.20552956).

Found an issue? Give us feedback