🟢 🏥 实践应用 2026年4月10日星期五 · 1 分钟阅读
AWS AgentCore用三行代码在React应用中实现实时AI浏览器
为什么重要
Amazon推出了用于React应用的BrowserLiveView组件,可实时显示AI智能体在浏览器会话中所做的操作。流媒体通过Amazon DCV协议直接从AWS传输到用户浏览器,绕过应用服务器以最小化延迟。
Amazon Bedrock AgentCore获得了一个新组件BrowserLiveView,用于React应用,解决了自主AI浏览器智能体最常见的问题之一——透明度。该组件在React应用内显示智能体浏览器会话的实时视频流,只需三行JSX代码。
为什么这很重要
当AI智能体在浏览器中自主工作时——填写表单、点击链接、在页面之间导航——用户有理由怀疑:它在做我要求的事吗?会不会不小心做错事?BrowserLiveView通过让用户实时看到智能体的每一个操作来解决这个问题。这为委托任务建立了信任,并支持受监督的工作流,用户可以在不离开应用的情况下实时干预。额外好处:它创建了带有视觉文档的审计跟踪——对合规性很有用。
技术上如何工作
架构有三个组件。React应用包含BrowserLiveView并接收SigV4预签名的URL。应用服务器管理会话并生成预签名URL。AWS云通过Bedrock AgentCore托管隔离的浏览器会话。流媒体通过Amazon DCV协议进行——这对性能很重要——DCV流直接从AWS传输到浏览器客户端,绕过应用服务器。这样可以最小化延迟并减少自有后端基础设施的负载。
3步实施
- 启动会话并通过AgentCore API生成Live View URL
- 渲染流到React组件中,使用与浏览器会话匹配的视口尺寸
- 连接AI智能体,通过Playwright Chrome DevTools Protocol管理浏览器操作
文档中的示例应用程序演示了一个智能体在用户观看时浏览Wikipedia,还有一个活动日志显示正在进行的决策和工具。对于已经使用Bedrock AgentCore的团队来说,这可能是实现生产就绪的”AI浏览器助手”体验的最快途径——无需自行托管远程浏览器基础设施。
🤖 本文由人工智能基于一手来源生成。