GitHub Copilot Vision과 브라우저 도구: 하루 만에 두 가지 GA 기능 출시
GitHub이 두 가지 Copilot 기능의 GA를 선언했습니다. 채팅 프롬프트에 이미지와 PDF를 첨부할 수 있는 Vision, 그리고 VS Code의 에이전트에게 실제 브라우저 제어권을 부여하는 브라우저 도구입니다. 두 기능 모두 관리자 조치 없이 모든 플랜에서 사용 가능합니다.
이 기사는 AI가 1차 출처를 기반으로 생성했습니다.
GitHub이 2026년 7월 1일 하루 만에 두 가지 중요한 Copilot 기능의 GA를 선언했습니다. Business와 Enterprise 플랜에서 특별 정책 구성이 필요했던 Vision, 그리고 에이전트에게 처음으로 실제 살아있는 브라우저 제어권을 부여하는 VS Code의 브라우저 도구입니다. 두 기능 모두 관리자 조치 없이 모든 사용자에게 제공됩니다.
Copilot Vision은 이제 무엇을 할 수 있는가?
Copilot Vision은 Copilot이 이미지와 문서의 내용을 코드와 함께 추론할 수 있도록 채팅 프롬프트에 시각 자료를 첨부할 수 있게 합니다. 지원 형식은 JPEG, PNG, GIF, WebP, 그리고 PDF 문서입니다.
VS Code에서 파일은 세 가지 방법으로 첨부할 수 있습니다. 붙여넣기, 드래그 앤 드롭, 또는 파일에서 마우스 오른쪽 클릭. github.com에서는 채팅 인터페이스에서 직접 첨부가 가능하고, Copilot CLI는 터미널에서 파일 경로를 지정하는 것을 지원합니다.
실제 사용 사례로는 구현에 관한 대화와 함께 디자인 목업 분석, 오류 스크린샷 진단, 아키텍처 다이어그램 추론, PDF 형식의 기술 문서 처리 등이 있습니다. 이 모든 것을 도구 간 전환 없이 Copilot과의 단일 대화에서 수행할 수 있습니다.
Vision은 질문, 계획, 에이전트 모드 등 모든 작동 모드에서 사용 가능합니다.
가용성: 관리자 조치 없이 모든 플랜
GA 발표의 핵심 변경사항은 기본 가용성입니다. 이전에는 Business와 Enterprise 플랜 사용자가 Vision 기능에 접근하기 위해 「Editor Preview Features」 정책을 활성화해야 했습니다. 2026년 7월 1일부터 이 조건이 더 이상 존재하지 않습니다.
Vision은 Free, Pro, Pro+, Business, Enterprise 등 모든 플랜에서 기본적으로 활성화되어 있으며 관리자 조치가 필요하지 않습니다. 이는 미리보기 기능 승인 절차로 인해 활성화를 미뤄온 조직의 관리 장벽을 제거합니다.
Business와 Enterprise 사용자에 대한 한 가지 특수 사항: 첨부된 이미지와 PDF는 서비스 제공을 위해 약 24시간 동안 보관됩니다.
브라우저 도구: VS Code에서 브라우저 제어
Vision GA와 함께 GitHub은 VS Code 내 브라우저 도구의 GA도 선언했습니다. Copilot 에이전트에게 시뮬레이션된 환경이 아닌 실제 살아있는 브라우저에 대한 직접 제어권을 처음으로 부여하는 기능입니다.
에이전트는 브라우저 도구를 통해 다음 작업을 수행할 수 있습니다.
- 탐색 — URL 열기 및 페이지 이동
- 상호 작용 — 클릭, 타이핑, 호버, 드래그 앤 드롭, 다이얼로그 관리
- 읽기 — 페이지 내용 및 DOM 요소 속성 가져오기
- 진단 — 콘솔 오류 및 JavaScript 예외 캡처
- 스크린샷 — 현재 페이지 상태 캡처
병렬 에이전트들이 동시에 격리된 브라우저 세션을 유지할 수 있으며, 서로 독립적이고 사용자 자신의 브라우저 활동과도 분리됩니다.
개인 정보 보호와 세부적인 권한
GitHub은 사용자 개인 정보를 명시적 우선순위로 삼아 브라우저 도구를 설계했습니다. 열린 탭은 비공개로 유지됩니다. 사용자의 조치 없이 읽을 수 없습니다. 사용자는 「Share with Agent」 옵션을 통해 에이전트와 탭을 명시적으로 공유해야 합니다.
카메라, 마이크, 위치, 클립보드 읽기 같은 민감한 권한에 대해서는 설치나 에이전트 시작 시 한 번이 아니라 매 사용 시마다 명시적 승인을 요청합니다. 이는 에이전트가 각 개별 작업에 대한 사용자의 적극적 동의 없이는 해당 리소스에 접근할 수 없음을 의미합니다.
Enterprise를 위한 관리자 기능
Enterprise 조직을 위해 브라우저 도구는 세부적인 제어 기능을 제공합니다.
- 조직 수준에서 브라우저 도구 활성화 또는 비활성화를 위한
workbench.browser.enableChatTools토글 - 에이전트가 탐색할 수 있는 도메인을 제한하여 외부 콘텐츠에 대한 무단 접근을 방지하는 도메인 필터
이러한 제어 기능을 통해 조직은 기능을 완전히 비활성화하지 않고도 통제된 환경에서 브라우저 도구를 사용할 수 있습니다. 예를 들어 내부 개발 서버나 테스트 환경 도메인으로만 제한할 수 있습니다.
하루 만에 두 가지 GA 발표
Vision과 브라우저 도구의 동시 GA는 우연이 아닙니다. 두 기능 모두 텍스트와 코드를 넘어 Copilot의 영역을 확장합니다. Vision은 시각 자료와 문서로, 브라우저 도구는 개발 또는 프로덕션 중인 웹 애플리케이션의 실제 상태로.
Copilot 최초의 오픈 웨이트 모델로 Kimi K2.7 Code가 동시에 등장하고 2026년 7월 30일까지 GitHub Models 플랫폼의 종료 발표가 함께 이루어지면서, 이 날짜는 GitHub의 AI 전략에서 중요한 전환점이 됩니다. 별도의 플랫폼은 줄이고, 추가 구성 없이 모두가 접근 가능한 단일 도구 내로 기능을 통합합니다.
자주 묻는 질문
- Copilot Vision은 첨부된 이미지와 PDF로 무엇을 할 수 있나요?
- Copilot이 코드와 함께 첨부된 파일의 시각적 콘텐츠를 추론할 수 있습니다. 디자인 목업, 다이어그램, 오류 스크린샷, 또는 기술 문서를 코드 대화의 맥락에서 분석할 수 있습니다.
- GitHub Copilot의 브라우저 도구는 무엇이며 어떤 용도로 사용하나요?
- 브라우저 도구는 Copilot 에이전트가 실제 브라우저를 제어할 수 있게 합니다. 탐색, 클릭, 타이핑, 콘텐츠 읽기, 콘솔 오류 캡처, 스크린샷 등이 가능합니다. 병렬 에이전트들은 사용자 활동과 분리된 독립적 세션을 유지합니다.
- 관리자가 Vision 기능을 활성화하기 위해 무언가를 해야 하나요?
- 아닙니다. Vision은 GA부터 Business와 Enterprise를 포함한 모든 플랜에서 기본적으로 활성화되어 있으며 관리자 구성이 필요하지 않습니다. 이전에 필요했던 「Editor Preview Features」 정책 조건이 더 이상 적용되지 않습니다.