🟡 🤝 Agenten Veröffentlicht: · 2 Min. Lesezeit ·

LangChain: Deep Agents erhalten QuickJS-Interpreter für Code zwischen Tool-Aufrufen

Redaktionelle Illustration: LangChain Deep Agents mit QuickJS-Interpretern, die Zustand zwischen Tool-Aufrufen bewahren und Token-Verbrauch senken

LangChain führte am 20. Mai 2026 Interpreter ein — eingebettete QuickJS-Laufzeitumgebungen im Deep-Agents-Framework, die Agenten ermöglichen, Code zwischen LLM-Tool-Aufrufen zu schreiben und auszuführen, ohne den Zustand in die Nachrichtenhistorie zu serialisieren. Das Unternehmen behauptet bis zu 35 Prozent weniger Token-Verbrauch, da der Zustand im Runtime statt im Modellkontext gespeichert wird.

🤖

Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.

LangChain führte am 20. Mai 2026 Interpreter ein — eingebettete QuickJS-Runtime-Umgebungen im Deep-Agents-Framework, die Agenten ermöglichen, Code zwischen LLM-Tool-Aufrufen zu schreiben und auszuführen, ohne den Zustand in die Nachrichtenhistorie zu serialisieren. Das Unternehmen behauptet bis zu 35 Prozent weniger Token-Verbrauch bei manchen Aufgaben, da der Zustand im Runtime statt im Modellkontext erhalten bleibt.

Was sind Interpreter und wie unterscheiden sie sich von Code-Execution-Tools?

Im klassischen Tool-Calling-Modell wählt das LLM ein Tool, das Tool läuft außerhalb des Modells, das Ergebnis wird als Tool-Output-Nachricht zurückgegeben, und das Modell entscheidet den nächsten Schritt. Jeder Zwischenschritt füllt das Context Window, und komplexe Multi-Step-Aufgaben erreichen schnell das Token-Limit. Interpreter führen eine Zwischenschicht ein: Der Agent schreibt JavaScript-Code, der in einer QuickJS-Engine mit Speicherlimits und Timeouts läuft, und dieser Code ruft direkt Tools auf, manipuliert Daten und bewahrt den Zustand zwischen Schritten.

Das unterscheidet sich von OpenAI Code Interpreter oder Claude Code Execution, die sich wie ein Tool verhalten — der Interpreter ist eine Runtime-Schicht, in der der Agent mehrere Tools in einer programmatischen Einheit aufrufen kann, ohne für jeden Schritt durch den LLM-Kontext zu gehen.

Was unterstützt die Behauptung von 35 Prozent weniger Token?

LangChain nennt in seinem Beitrag ein konkretes Benchmark-Szenario: Ein Agent, der eine große Dokumentenmenge verarbeitet (z. B. 200 PDFs analysiert), generiert traditionell 200 Schritte in der Nachrichtenhistorie. Mit dem Interpreter schreibt der Agent eine Schleife im Code, die das Tool für jedes Dokument aufruft, Ergebnisse in einer lokalen Variable aggregiert und nur die finale Zusammenfassung an das Modell zurückgibt. Sowohl Input-Token (kleinerer historischer Kontext bei jedem Folgeaufruf) als auch Output-Token (das Modell muss keine wiederholenden Tool-Call-Anweisungen generieren) werden gespart.

Wie wird Sicherheit gelöst?

Der QuickJS-Interpreter hat einen explizit minimalen Aktionsraum. Standardmäßig hat er keinen Zugriff auf Dateisystem, Netzwerk oder Shell. Alle Fähigkeiten müssen über Host-Bridges geöffnet werden, die die Organisation konfiguriert. Das vermeidet das Prompt-Injection-Problem, bei dem ein manipulierter Prompt den Agenten dazu bringt, auf nicht vorgesehene Ressourcen zuzugreifen — die Grenzen sind auf Runtime-Ebene definiert, nicht auf LLM-Ebene.

Was bedeutet das für das Agenten-Ökosystem?

Der Ansatz ähnelt in der Philosophie Anthropics „Computer Use”-Modell (wo Claude Aktionen in einem Sandbox ausführt) und OpenAIs Code Interpreter, ist aber für Tool-Orchestrierung statt offene Code-Ausführung optimiert. AutoGPT, CrewAI und AWS Strands Agents werden wahrscheinlich einem ähnlichen Muster folgen müssen — eine programmatische Schicht zwischen LLM und Tools wird zur Standardkomponente moderner Agenten-Architektur.

Häufig gestellte Fragen

Was sind QuickJS-Interpreter im Kontext von Deep Agents?
QuickJS ist eine leichtgewichtige JavaScript-Engine mit Speicherlimits und Ausführungs-Timeouts, die innerhalb des Deep-Agents-Runtimes läuft. Der Agent kann JavaScript-Code zwischen LLM-Aufrufen schreiben — dieser Code ruft direkt Tools auf, manipuliert Daten und bewahrt den Zustand zwischen Schritten, ohne LLM-Kontext zu durchlaufen.
Warum werden weniger Token verbraucht?
Beim klassischen Tool-Calling muss jedes Tool-Ergebnis und jeder Zwischenzustand in die Nachrichtenhistorie, damit der Agent weiß, wo er steht. Der Interpreter speichert den Zustand lokal — das Modell muss nicht alle Zwischenschritte sehen, nur das Endergebnis. Damit wächst der Kontext nicht linear mit der Schrittzahl.
Was ist mit der Sicherheit?
Der Interpreter hat einen explizit minimalen Aktionsraum. Standardmäßig hat er keinen Zugriff auf Dateisystem, Netzwerk oder Shell. Fähigkeiten müssen explizit über Host-Bridges geöffnet werden, was der Organisation genaue Kontrolle darüber gibt, welche Aktionen der Agent ausführen kann.