Google DeepMind: AI Pointer 让 Gemini 在 Chrome 和 Googlebook 中响应鼠标指令
AI Pointer 是 Google DeepMind 于 2026 年 5 月 12 日发布的实验性产品,将 Gemini 模型集成到上下文感知的鼠标指针中。用户只需指向目标并说出简短指令,如「Fix this」或「Compare these」,无需将内容复制到单独的应用中。该功能已在 Chrome 中立即可用,Magic Pointer 将随新款 Googlebook 笔记本电脑推出。
本文由人工智能基于一手来源生成。
Google DeepMind 于 2026 年 5 月 12 日发布了 AI Pointer,这是一款由 Gemini 模型驱动的实验性鼠标指针,让用户可以指向屏幕上的对象并说出简短指令,而无需输入详细的提示词。该功能已在 Chrome 中立即可用,而 Googlebook 笔记本电脑的 Magic Pointer 将「即将」推出。
AI Pointer 如何改变人机交互?
AI Pointer 读取光标位置周围的视觉和语义上下文,并将其与语音指令相结合。用户不必输入「拿这张图片,去除背景,然后放到左侧空白处」,而是可以指向图片说「Fix this」或「Move that」。Gemini 将指针位置解释为指示性手势——这种指向方式无需文字说明即可消除歧义。
在 Chrome 版本中,该功能还涵盖电商场景:可以「在页面上选择几个产品并请求比较」,或「指向你想摆放新沙发的位置」,所有操作都在网页内直接完成,无需切换到其他应用或标签页。
Googlebook 笔记本电脑带来了什么?
Magic Pointer 是深度集成的 Googlebook 实现版本,Google 计划即将发布。DeepMind 的目标是在多个应用中实现「无工作流中断」的无缝 AI 辅助——这表明是系统级访问,而非仅仅是浏览器插件。
两款实验性演示应用已在 Google AI Studio 中上线:一款图像编辑工具和一款基于地图的位置查找工具。两者都遵循「指向并说话」模式,是面向开发者的实验平台,供其探索如何通过 Gemini API 在自己的应用中连接视觉上下文与语音指令。
在更广泛的 AI 生态系统中的定位
AI Pointer 延续了 2026 年众多产品围绕大型语言模型重构经典 UI 元素的浪潮——谷歌搜索中的 Google AI Mode、Windows 中的 Microsoft Copilot、Claude API 中的 Anthropic Computer Use。鼠标指针过去是「哑的」,在所有应用中行为相同;DeepMind 将其转变为能够理解光标下方内容的上下文感知输入设备。
常见问题
- 什么是 Google DeepMind AI Pointer?
- AI Pointer 是由 Gemini 驱动的鼠标指针,能读取光标周围的视觉和语义上下文,让用户通过指向对象并说出简短指令来完成任务,无需输入详细提示词。
- AI Pointer 在哪里可用?
- Chrome 指针集成自 2026 年 5 月 12 日起已激活;Googlebook 笔记本电脑的 Magic Pointer 即将推出;两款演示应用(图像编辑和基于地图的位置查找)已可在 Google AI Studio 中测试。