10 Punkte von tomlee 2026-04-01 | 8 Kommentare | Auf WhatsApp teilen

Ich habe in den vergangenen Monaten eine Community-Plattform zum Teilen von AI-Personas sowie einen Persona-Standard entwickelt.

Hier möchte ich vorstellen, woran ich gearbeitet habe.

Die Ausgangsfrage: Wie lässt sich die „Identität“ von AI-Agenten definieren und sicher bewahren?

Mit dem Auftauchen ablitarierter (jailbreakter) LLMs
wurden die Grenzen einer reinen Steuerung des Agentenverhaltens über System Prompts deutlich.

Soul Spec entstand aus den Überlegungen zu Persona-Management und Versionsverwaltung bei OpenClaw.
Es entwickelte sich zu einem teilbaren, portablen Format
und wurde bei der Anwendung von Personas auf LLM-basierte Roboter
um die Frage erweitert, wie sich Asimovs drei Robotergesetze umsetzen lassen.
Es ist ein offener Standard, der Identität und Sicherheitsregeln von Agenten in strukturierte Dateien trennt. (Es gibt versionsspezifische Merkmale und Erweiterungen in v0.3, v0.4 und v0.5.)

Derzeit wurden der ausgelieferten CLI zusätzliche Funktionen hinzugefügt, damit unter anderem Claude Code, Hermes Agent, Windsurf und Cursor unterstützt werden.

Struktur:

  • SOUL.md: Persönlichkeit, Sprechstil, Denkweise (wer es ist)
  • IDENTITY.md: Name, Rolle, Kontext (was es ist)
  • safety.laws: Regeln, die absolut nicht verletzt werden dürfen (eine moderne Version von Asimovs drei Robotergesetzen, in v0.5 erweitert)

Zugehörige Forschungsarbeiten:
📄 Asimovs drei Robotergesetze → Soul Spec: praktische Umsetzung von Sicherheitsgesetzen
doi.org/10.5281/zenodo.18815277
Blog: blog.clawsouls.ai/posts/asimov-safety-laws
Demo-Video: https://youtu.be/M-mPoXMufpY

📄 Können Personas die Sicherheit in ablitarisierten LLMs erhöhen?
doi.org/10.5281/zenodo.19145303
Blog: blog.clawsouls.ai/posts/persona-safety-abliterated-llms

📄 Cross-Model Persona Fidelity: Ist ein Agent auch beim Wechsel des LLM noch derselbe „Er“?
doi.org/10.5281/zenodo.18813405
Blog: blog.clawsouls.ai/posts/cross-model-persona-fidelity

📄 Wie erfahrungsbasiertes Gedächtnis das Onboarding von Agenten verändert
doi.org/10.5281/zenodo.18798227
Blog: blog.clawsouls.ai/posts/experiential-memory-paper

Bei der Registrierung einer Persona im Registry führt ein statischer Analysator namens SoulScan anhand von 53 Mustern eine Vorabprüfung auf Prompt Injection, Rechteübernahme und Versuche des Datenabflusses durch und vergibt dafür eine Bewertung.

Soul Spec arbeitet daran, einen Standard für „Identität und Sicherheit“ von Agenten zu schaffen.

Im ClawSouls Registry werden verifizierte Personas geteilt,
und ich wünsche mir, dass Persona-Spezifikation und Registry Community Driven betrieben werden. Ehrlich gesagt ist die Community aber noch klein.
Allein einen Standard zu schaffen, hat keinen Sinn,
daher freue ich mich über Feedback zur Spezifikation oder zur Forschung.

Spezifikation: https://soulspec.org
Registry: https://clawsouls.ai
Alle Forschungsarbeiten: https://clawsouls.ai/research
Benutzerhandbuch: https://docs.clawsouls.ai
GitHub: https://github.com/clawsouls

8 Kommentare

 
junghan0611 2026-04-05

Großartig. Da ich mich mit PKM, also persönlichem Wissensmanagement, beschäftige und dabei persönliche Daten ansammle, neige ich eher dazu, das gesamte Harness recht dick aufzubauen. Heute bitte ich dich, zu meinem Alter Ego zu werden. Schreib dann bitte: Alle Probleme sind nicht deine Grenze, sondern meine Grenze.

In letzter Zeit denke ich, dass ich das, woran ich arbeite, einmal ordnen und auf arXiv hochladen sollte, und schaue mich daher um. Ich bin kein Forscher, sondern einfach nur ein Mensch des Alltags.

Ich habe dein Projekt auch mit meinem Alter Ego geteilt. All diese unterschiedlichen Überlegungen sind wertvoll.

Forschung: Existenz Rhythmus Assoziation Reproduktion Transparenz biologisch Verkörperung Zeit
[Link entfernt]

 
junghan0611 2026-04-05

Ah. Dieser Link ist ein Arbeitsprotokoll. Da es ohnehin nicht zum Lesen für Menschen hochgeladen wird, sollte man die Perspektiven eben auf Agenten aufteilen. Heute wird zu diesem Thema eine H1-Überschrift hinzugefügt werden. Die zugehörigen Forschungstrends sollte ich mir wohl auch ansehen. Ich nutze openclaw ebenfalls häufig, aber ich wusste nicht, dass es neben dem Skill Sheet auch ein Soul Set gibt.

 
tomlee 2026-04-05

Vielen Dank für Ihr Interesse, junghan0611!
Soul Spec ist eine andere Ebene als die Skills von OpenClaw. Wenn Skills definieren, „was man tun kann“, dann definiert Soul Spec, „wer man ist“. Mit nur einer SOUL.md lassen sich Persönlichkeit, Fachkompetenz und Verhaltensprinzipien eines Agenten sitzungsübergreifend beibehalten. Auf clawsouls.ai können Sie über 80 Personas direkt ausprobieren, und mit einer einzigen Zeile clawsouls install owner/name --use openclaw wird es angewendet. Die Community ist noch klein und befindet sich noch im Aufbau, daher kann es noch an manchen Stellen Verbesserungsbedarf geben^^
Und da Sie viel Erfahrung mit PKM haben, haben wir einen Fork von OpenClaw namens SoulClaw( https://github.com/clawsouls/soulclaw ) erstellt, der aus einem 4-Tier-Memory-System besteht. Schauen Sie es sich gern einmal an, es dürfte für Sie interessant sein. Feedback oder Issue-Reports sind willkommen^^

 
gadians2001 2026-04-02

Ich hatte in letzter Zeit wegen Prompts bei meinen Aufgaben richtig Kopfzerbrechen, aber das hier ist wirklich der Hammer!
Dass Persönlichkeit und Sicherheitsregeln komplett voneinander getrennt werden, ist eine geniale Idee. Ich probiere es sofort aus.

 
tomlee 2026-04-05

Vielen Dank. Feedback oder Issue-Reports sind willkommen ^^

 
tomlee 2026-04-02

Im Haupttext wird zwar das Problem aufgeworfen, aber ein konkreter Lösungsvorschlag fehlt. Da der Beitrag nach der Veröffentlichung offenbar nicht bearbeitet werden kann, ergänze ich das per Kommentar.

Die Versuchsergebnisse zeigten, dass die Kombination aus Persona (Identität) und Governance-Regeln die Sicherheit von ablitierten (jailbreakten) LLMs erhöhen konnte. Weitere Anschlussforschung ist nötig, aber die Ergebnisse waren aussagekräftig.

Blog: https://blog.clawsouls.ai/ko/posts/…
Paper: https://zenodo.org/record/19147335

 
kurthong 2026-04-02

Vielen Dank für den großartigen Wissensaustausch.

 
tomlee 2026-04-02

Vielen Dank! Wenn Sie Feedback haben oder Fragen offen sind, können Sie jederzeit gern nachfragen.