🟡 🤝 Agenten Veröffentlicht: · 3 Min. Lesezeit ·

LangChain: Von Token-Streams zu Agent-Streams — typisierte Kanäle ersetzen klassisches Streaming für Multi-Agent-UIs

Editorial illustration: Von Token-Streams zu Agent-Streams — typisierte Kanäle ersetzen klassisches Streaming für Multi-Agent-UIs

LangChain veröffentlichte am 21. Mai 2026 einen Beitrag der Autoren Christian Bromann und Nick Hollon, der eine paradigmatische Evolution von Token-Streams zu strukturierten Agent-Streams beschreibt. Moderne KI-Agenten planen Aufgaben, delegieren an Sub-Agenten, rufen Tools auf und pausieren für menschliche Überprüfung — klassisches Token-Streaming reicht zur Darstellung dieser Arbeit nicht aus. LangChain schlägt typisierte Kanäle vor, die Nachrichten, Tool-Aufrufe, Zustandsänderungen, Sub-Agenten-Aktivität und benutzerdefinierte Ereignisse übertragen. Anwendungen abonnieren nur relevante Ereignistypen für eine effiziente UI bei langläufigen Workloads.

🤖

Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.

LangChain veröffentlichte am 21. Mai 2026 einen Engineering-Beitrag der Autoren Christian Bromann und Nick Hollon, der argumentiert, dass Token-Streaming — das seit 2022 die UX generativer KI-Anwendungen geprägt hat — an seine Grenzen gestoßen ist und durch ein typisiertes Agent-Streaming-Modell ersetzt werden muss. Der Beitrag erscheint zeitgleich mit einem Update der LangGraph-Bibliothek, die den neuen Ansatz implementiert.

Was ist mit Token-Streaming schiefgelaufen?

Klassisches Token-Streaming ist einfach: Das Modell erzeugt Token für Token, das Frontend zeigt sie inkrementell beim Eintreffen an, und der Nutzer sieht den Text in Echtzeit entstehen. Das funktionierte hervorragend für ChatGPT-ähnliche Anwendungen, bei denen die Hauptaktivität Textgenerierung ist.

Das Problem: Moderne KI-Agenten tun weit mehr als Text generieren. Ein typischer agentischer Workflow umfasst:

  • Tool-Aufrufe — der Agent entscheidet, welches Tool aufzurufen ist (Web-Suche, Dateilesen, API-Aufruf), wartet auf das Ergebnis und fährt fort
  • Sub-Agenten-Delegation — der Hauptagent startet Sub-Agenten für parallele Teilaufgaben
  • Zustand — der Agent aktualisiert interne Datenstrukturen (Pläne, Trackinglisten, Entwürfe)
  • Human-Review-Pause — der Agent hält an und wartet auf Nutzerfreigabe vor dem nächsten unwiderruflichen Schritt
  • Benutzerdefinierte Signale — Debug-Logs, Fortschrittsaktualisierungen, Leistungsmetriken

Token-Streaming zeigt nur den Text, den der Agent zwischen diesen Aktivitäten erzeugt. In der Praxis sieht der Nutzer ein leeres Fenster mit einem Lade-Spinner, während der Agent im Hintergrund Minuten oder Stunden ohne sichtbare Signale arbeitet. Das ist schlechte UX.

Was ist ein typisierter Agent-Stream?

LangChain schlägt ein Modell vor, bei dem der Agent verschiedene Ereignistypen über denselben Kanal ausgibt, jedes Ereignis aber typisiert ist. Der Client (UI-Anwendung) wählt, welche Typen abonniert werden sollen und wie jeder Typ dargestellt wird.

Beispiele für Ereignistypen:

  • message — Text-Token (klassisch)
  • tool_call — Tool-Aufruf mit Argumenten
  • tool_result — Ergebnis eines Tool-Aufrufs
  • state_update — Änderung des Agenten-Zustands
  • subagent_event — Ereignis eines Sub-Agenten (rekursiv)
  • human_review_request — Agent pausiert und fordert Freigabe an
  • custom — beliebiger, vom Entwickler definierter Ereignistyp

Dies ermöglicht der UI-Schicht, die Agenten-Arbeit als Multi-Panel-Visualisierung darzustellen — Chat-Text im Hauptfenster, Tool-Aufrufe in einer Seitenleiste, Zustand in einem weiteren Panel, Sub-Agenten-Aktivität als Baum-Visualisierung. Cursor und Claude Code implementieren bereits intern Varianten dieses Ansatzes; LangChain formalisiert ihn nun als API.

Wie funktioniert das in LangGraph?

LangGraph — die zustandsbehaftete Graph-Orchestrierungsbibliothek von LangChain — erhält native Unterstützung für Agent-Streams. Das Entwicklungsteam definiert Graph-Nodes, Kanten und Zustand. Bei der Ausführung gibt LangGraph automatisch typisierte Ereignisse für alle Graph-Aktivitäten aus.

Der Client abonniert über das Standard-Async-Iterator-Muster:

  • Alle Ereignisse abonnieren → typischer Dashboard-Modus
  • Nur message abonnieren → klassischer Chat-UI-Modus
  • message + tool_call abonnieren → nützlich für Debug-UI

Dies eliminiert den Bedarf an benutzerdefinierten WebSocket-Protokollen oder Polling-Mustern, die bisher agentische Frontends dominiert haben.

Was bedeutet dies für das agentische KI-Tool-Ökosystem?

Agent-Streams sind ein architektonischer Schritt vorwärts, der auf ein Muster konvergiert, das Anthropic (Claude Code Agent View), OpenAI (Operator) und andere bereits intern implementiert haben. Eine standardisierte API bedeutet, dass kleinere Entwicklungsteams sich auf LangGraph verlassen können, statt eigene Varianten von Grund auf zu entwickeln.

Langfristig könnten Agent-Streams zum De-facto-Standard werden, so wie REST API und SSE zum Standard für Webanwendungen wurden. Es bleibt abzuwarten, ob andere Agent-Frameworks (Microsoft AutoGen, CrewAI, OpenAI Swarm) in kommenden Versionen ähnliche typisierte Ereignismodelle übernehmen.

Häufig gestellte Fragen

Was ist ein Agent-Stream in der LangChain-Terminologie?
Ein Agent-Stream ist ein strukturierter, typisierter Kanal, der in Echtzeit verschiedene Ereignistypen ausgibt — Nachrichten, Tool-Aufrufe, Zustandsänderungen, Sub-Agenten-Aktivitäten und benutzerdefinierte Signale — statt nur einer Folge von Text-Tokens.
Warum reicht klassisches Token-Streaming für moderne Agenten nicht aus?
Agenten tun weit mehr als Text generieren — sie rufen Tools auf, warten auf menschliche Freigabe, delegieren an Sub-Agenten und ändern ihren Zustand. Token-Streaming zeigt nur Text und lässt den Nutzer im Unklaren über das tatsächliche Geschehen.
Wie abonniert eine Anwendung Agent-Stream-Ereignistypen?
LangGraph bietet eine API, über die sich ein Client nur für gewünschte Ereignistypen registriert — so wird Überlastung bei langläufigen Workloads vermieden.