GitHub Copilot VisionとBrowser Tools:1日に2つのGA機能が追加
GitHubはCopilotの2つの機能をGA(一般提供)に昇格した。チャットプロンプトに画像やPDFを添付できるVisionと、VS Code内のエージェントに実際のブラウザ制御を与えるBrowser Toolsだ。どちらも管理者操作不要で全プランで利用可能になった。
この記事はAIにより一次情報源から生成されました。
GitHubは2026年7月1日に1日でCopilotの2つの重要な機能をGA(一般提供)に昇格した。BusinessとEnterpriseプランで特別なポリシー設定が必要だったVisionと、エージェントに初めて実際の動作するブラウザの制御を与えるVS Code内のBrowser Toolsだ。どちらも管理者操作なしで全ユーザーに利用可能になった。
Copilot Visionは今何ができるか?
Copilot Visionは視覚的な素材をチャットプロンプトに添付することで、Copilotがコードとともにデジタルコンテンツやドキュメントのコンテンツを推論できるようにする。サポートされているフォーマットはJPEG、PNG、GIF、WebP、およびPDFドキュメントだ。
VS Codeでは、ファイルを3つの方法で添付できる。貼り付け(ペースト)、ドラッグアンドドロップ、またはファイルを右クリック。github.comではチャットインターフェースで直接添付でき、Copilot CLIはターミナルでのファイルパスの指定をサポートする。
実用的なユースケースとしては、実装についての会話とともにデザインモックアップを分析する、エラーのスクリーンショットを診断する、アーキテクチャ図を推論する、PDF形式の技術文書を処理する——すべてツールを切り替えることなく、1つのCopilotとの会話の中で行えることが挙げられる。
Visionはask、plan、agentのすべての動作モードで利用可能だ。
提供状況:管理者操作不要で全プラン対応
GAリリースの重要な変更はデフォルトの利用可能性だ。以前、BusinessとEnterpriseプランのユーザーはVision機能にアクセスするために「Editor Preview Features」ポリシーを有効にする必要があった。2026年7月1日からその要件はなくなった。
VisionはFree、Pro、Pro+、Business、Enterpriseを含む全プランでデフォルト有効——管理者アクションは一切不要だ。これにより、プレビュー機能の承認手続きのためにアクティベーションを遅らせていた組織の管理上の障壁が取り除かれる。
BusinessとEnterpriseユーザーへの唯一の特記事項:添付された画像とPDFはサービス提供のために約24時間保持される。
ブラウザツール:VS CodeからブラウザをコントロールするBrowser Tools
Vision GAと並行して、GitHubはVS Code内のBrowser ToolsもGAに昇格した——Copilotエージェントにシミュレートされた環境ではなく、実際の動作するブラウザの直接制御を初めて与える機能だ。
エージェントはBrowser Toolsを通じて以下のアクションを実行できる。
- ナビゲーション — URLを開いてページを移動
- インタラクション — クリック、入力、ホバー、ドラッグアンドドロップ、ダイアログ操作
- 読み取り — ページコンテンツとDOM要素属性の取得
- 診断 — コンソールエラーとJavaScript例外のキャプチャ
- スクリーンショット — ページの現在の状態を撮影
並列エージェントは互いに独立した、ユーザー自身のブラウザのアクティビティから分離した隔離されたブラウザセッションを同時に保持できる。
プライバシーと細かな権限設定
GitHubはユーザーのプライバシーを明示的な優先事項としてBrowser Toolsを設計した。開いているタブはプライベートのまま——ユーザーのアクションなしに読み取ることはできない。ユーザーは「Share with Agent」オプションでエージェントに明示的にタブを共有する必要がある。
カメラ、マイク、位置情報へのアクセスやクリップボードの読み取りといったセンシティブな権限については、インストール時や起動時に一度だけでなく、使用するたびに明示的な承認を求める。つまり、エージェントは個々の操作ごとにアクティブなユーザーの同意なしにこれらのリソースにアクセスできない。
Enterprise向け管理者機能
Enterprise組織向けに、Browser Toolsには細かな制御が付属する。
- 組織レベルでBrowser Toolsを有効・無効にする**
workbench.browser.enableChatToolsトグル** - エージェントがナビゲートできるドメインを制限して外部コンテンツへの不正アクセスを防ぐドメインフィルター
これらの制御により、組織はBrowser Toolsを制御された環境で使用できる——例えばアクセスを内部開発サーバーやテスト環境ドメインのみに制限しながら、機能を完全に無効にすることなく使用できる。
1日に2つのGA発表
VisionとBrowser Toolsが同日にGAとなったのは偶然ではない。どちらの機能もCopilotのリーチをテキストとコード以外に拡張する——Visionは視覚的な素材やドキュメントへ、Browser Toolsは開発中または本番の実際のウェブアプリケーションの状態へと。
Copilotへの初のオープンウェイトモデルとしてのKimi K2.7 Codeの追加や、2026年7月30日までのGitHub Modelsプラットフォーム廃止の発表と合わせて、この日付はGitHubのAI戦略の重要な転換点となっている。独立したプラットフォームは減り、追加設定なしで誰もがアクセスできる1つのツールに統合された機能が増えている。
よくある質問
- Copilot Visionは添付された画像やPDFで何ができるか?
- Copilotは添付されたファイルの視覚的コンテンツとコードを合わせて推論できる。デザインモックアップ、図表、エラーのスクリーンショット、技術文書をコードについての会話のコンテキストで分析できる。
- GitHub CopilotのBrowser Toolsとは何で何のために使われるか?
- Browser Toolsを使うとCopilotエージェントが実際のブラウザを操作できる。ナビゲーション、クリック、入力、コンテンツ読み取り、コンソールエラーのキャプチャ、スクリーンショットが可能だ。並列エージェントはユーザーのアクティビティから分離した独立したセッションを保持する。
- Vision機能を有効にするために管理者は何かする必要があるか?
- いいえ。VisionはGA時点でBusinessとEnterpriseを含む全プランでデフォルトで有効になっており、管理者の設定は不要だ。以前の「Editor Preview Features」ポリシーの要件はなくなった。