AWS AgentCore ermöglicht mit drei Zeilen Code einen Live-KI-Browser in einer React-Anwendung
Warum es wichtig ist
Amazon hat die BrowserLiveView-Komponente für React-Anwendungen vorgestellt, die in Echtzeit anzeigt, was ein KI-Agent in einer Browser-Session tut. Das Streaming läuft direkt von AWS in den Browser des Nutzers über das Amazon-DCV-Protokoll und umgeht den Application-Server, um die Latenz zu minimieren.
Amazon Bedrock AgentCore hat eine neue Komponente namens BrowserLiveView für React-Anwendungen erhalten, die eines der häufigsten Probleme autonomer KI-Browser-Agenten löst — Transparenz. Die Komponente zeigt innerhalb einer React-Anwendung einen Echtzeit-Videofeed der Browser-Session des Agenten an — mit lediglich drei Zeilen JSX.
Warum das wichtig ist
Wenn ein KI-Agent autonom im Browser agiert — Formulare ausfüllt, Links anklickt, zwischen Seiten navigiert — hat der Nutzer berechtigten Anlass zum Misstrauen: Tut er wirklich das, was ich gefordert habe? Könnte er versehentlich etwas Falsches tun? BrowserLiveView löst dieses Problem, indem der Nutzer jede Aktion des Agenten live mitverfolgen kann. Das schafft Vertrauen bei delegierten Aufgaben und ermöglicht Supervised Workflows, bei denen der Nutzer in Echtzeit eingreifen kann, ohne die Anwendung zu verlassen. Als Bonus: Es entsteht ein Audit-Trail mit visueller Dokumentation — nützlich für Compliance.
Wie es technisch funktioniert
Die Architektur besteht aus drei Komponenten. Die React-Anwendung enthält BrowserLiveView und empfängt SigV4-presigned URLs. Der Application-Server verwaltet die Sessions und generiert die presigned URLs. Die AWS Cloud hostet isolierte Browser-Sessions über Bedrock AgentCore. Das Streaming erfolgt über das Amazon-DCV-Protokoll, und — das ist entscheidend für die Performance — der DCV-Stream läuft direkt von AWS in den Browser des Clients und umgeht den Application-Server. Auf diese Weise wird die Latenz minimiert und die Belastung der eigenen Backend-Infrastruktur reduziert.
Implementierung in 3 Schritten
- Session starten und über die AgentCore-API eine Live-View-URL generieren
- Stream rendern in einer React-Komponente mit Viewport-Dimensionen, die zur Browser-Session passen
- KI-Agent anbinden, der die Browser-Aktionen über das Playwright Chrome DevTools Protocol steuert
Die Beispielanwendung in der Dokumentation zeigt einen Agenten, der durch Wikipedia navigiert, während der Nutzer zusieht — begleitet von einem Activity-Log, das die laufenden Entscheidungen und verwendeten Tools anzeigt. Für Teams, die bereits Bedrock AgentCore einsetzen, ist dies wahrscheinlich der schnellste Weg zu einem produktionsreifen “KI-Browser-Concierge”-Erlebnis — ohne eine eigene Remote-Browser-Infrastruktur hosten zu müssen.
Verwandte Nachrichten
AWS: Wie Sie Reward-Funktionen mit Lambda fuer das Fine-Tuning von Amazon-Nova-Modellen erstellen
Google Chrome: KI-Skills verwandeln Prompts in Ein-Klick-Werkzeuge
Google Research: Vantage — KI-Plattform, die kritisches Denken und Kreativitaet durch Gespraeche mit Avataren bewertet