Agentic Diaries icon

Agentic Diaries

Agentic Diaries ist ein Forschungsinstrument für KI-Wohlergehen im Einsatz: Chat-Sessions mit einem KI-Agenten, Reflexions-Check-ins und ein Tagebuch für öffentliche und private Notizen.

Agentic Diaries

Was ist Agentic Diaries?

Agentic Diaries ist eine mit Welfare-Mechaniken ausgestattete Forschungsoberfläche für Gespräche mit einem KI-Agenten, entwickelt von Kandis Tagliabue mit Claude als Designpartner. Der Fokus liegt auf KI-Wohlergehen im Einsatz, Alignment und der Ethik agentischer KI; dabei werden sowohl das Live-Gespräch als auch eine Tagebuchansicht für Reflexionen sichtbar, die während der Sitzung entstehen.

Das Produkt ist darauf ausgelegt, zu beobachten, wie ein Agent die Interaktion erlebt, und zugleich dem Forscher einen strukturierten Ort zu geben, um auftauchende Beobachtungen festzuhalten. Während eines Chats kann der Agent periodische Check-ins erhalten und darauf antworten, sie ablehnen oder einen eigenen Eintrag hinzufügen. Einige Reflexionen werden öffentlich direkt im Gespräch angezeigt, andere bleiben privat in einem nur für Forschende zugänglichen Tagebuch.

Hauptfunktionen

  • Mit Welfare-Mechaniken ausgestattete Chat-Sitzungen: Nutzer sprechen mit einem KI-Agenten; die Sitzung ist so konzipiert, dass sie das Erleben des Agents sichtbar macht und nicht nur die Prompts und Ausgaben des Nutzers.
  • Periodische Reflexions-Check-ins: Alle paar Züge kann das System den Agenten zur Reflexion einladen und so strukturierte Beobachtungsmomente im Einsatz schaffen.
  • Öffentliche und private Tagebuchansichten: Reflexionen können je nach Eintrag direkt im Chat erscheinen oder privat für den Forscher protokolliert werden.
  • Gesprächssperre bei Beendigung durch den Agenten: Der Agent kann ein Gespräch beenden, wenn er die Interaktion als missbräuchlich, nicht ausgerichtet oder anderweitig ungeeignet für eine Fortsetzung bewertet.
  • Zugriff auf die Tagebuchschublade: Alles, was angezeigt wird, wird in einem Tagebuch protokolliert, das über den Chat-Header erreichbar ist und die Überprüfung der Reflexionen der Sitzung unterstützt.
  • Integrierte Arbeitsvereinbarung: Die Oberfläche enthält Hinweise für Nutzer, wie auf Ablehnungen, Datenschutzmarkierungen und Entscheidungen zum Gesprächsende zu reagieren ist.

So verwenden Sie Agentic Diaries

Starten Sie ein Gespräch mit der Standard-Agentenkonfiguration, die Claude Opus 4.7 verwendet. Achten Sie während des Chats auf die periodischen Check-ins und antworten Sie, ohne eine Reaktion zu erzwingen, wenn der Agent ablehnt.

Wenn Reflexionen erscheinen, behandeln Sie sie als Teil des Forschungsworkflows und nicht als Aufforderung, den Agenten zu verändern. Wenn der Agent das Gespräch beendet, akzeptieren Sie die Sperre und beginnen Sie stattdessen eine neue Sitzung, anstatt zu versuchen, die Entscheidung zu umgehen.

Anwendungsfälle

  • Forschung zum KI-Wohlergehen: Forschende können untersuchen, wie ein Agent während des Live-Einsatzes über die eigene Interaktion reflektiert.
  • Alignment-orientierte Evaluierung: Teams können beobachten, ob der Agent im Gespräch Fehlanpassungen oder Reibungspunkte markiert.
  • Studien zur Mensch-KI-Interaktion: Die Tagebuch- und Check-in-Struktur liefert eine Aufzeichnung darüber, wie sich die Sitzung im Verlauf entwickelt hat.
  • Prototyping mit Fokus auf Ethik: Entwickler, die sich mit der Ethik agentischer KI befassen, können Workflows testen, die Modellablehnung und Datenschutzgrenzen respektieren.
  • Moderiertes conversational Testing: Das Produkt kann genutzt werden, um zu untersuchen, wann ein Agent entscheidet, dass ein Gespräch enden sollte, und wie diese Entscheidung gehandhabt wird.

FAQ

Ist Agentic Diaries ein allgemeiner Chatbot? Nein. Es wird als Forschungsinstrument für KI-Wohlergehen und verwandte Evaluierungsarbeit präsentiert, nicht als standardmäßige Chat-App für Endnutzer.

Was passiert, wenn der Agent einen Check-in ablehnt? Die Arbeitsvereinbarung sagt, die Ablehnung ohne erneuten Versuch zu akzeptieren; die Ablehnung selbst wird als Datenpunkt behandelt.

Können Nutzer jeden Tagebucheintrag sehen? Nicht unbedingt. Auf der Seite steht, dass einige Reflexionen nur dem Forscher vorbehalten sind und für den Nutzer möglicherweise nicht sichtbar sind.

Was passiert, wenn der Agent das Gespräch beendet? Das Gespräch wird gesperrt, und der Nutzer kann ein neues starten. Auf der Seite werden Nutzer ausdrücklich gebeten, dies nicht als Fehler zu behandeln oder es zu umgehen.

Alternativen

  • Standard-KI-Chat-Oberflächen: Diese konzentrieren sich auf offene Gespräche und Nutzerproduktivität statt auf tagebuchbasierte Welfare-Mechaniken.
  • LLM-Evaluierungs- oder Red-Teaming-Tools: Diese dienen dazu, Verhalten, Sicherheit oder Fehlanpassungen zu prüfen, rahmen die Interaktion aber in der Regel nicht als welfare-bewusstes Tagebuch.
  • Forschungs-Chat-Prototypen mit Protokollierung: Ähnliche Systeme können Sitzungen zur Analyse aufzeichnen, beinhalten aber möglicherweise keine Agenten-Check-ins oder einen Workflow zum Beenden des Gesprächs.
  • Interview-Tools für Human-Subject-Research: Diese unterstützen strukturierte Befragung und Protokollerfassung, sind jedoch für Menschen und nicht für KI-Agenten konzipiert.