🟡 🤖 Modeli Objavljeno: · 4 min čitanja ·

GitHub Copilot Vision i browser tools: dvije GA sposobnosti u jednom danu

Editorial ilustracija: GitHub Copilot Vision i alati za preglednik postaju općenito dostupni

GitHub je proglasio GA dvije Copilot sposobnosti: Vision za prilaganje slika i PDF-ova uz chat promptove te browser tools koji agentima u VS Code-u daju kontrolu nad pravim preglednikom. Obje su dostupne svim planovima bez potrebe za admin akcijom.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.

GitHub je 1. srpnja 2026. u jednom danu proglasio GA dvije značajne Copilot sposobnosti: Vision, koji je do sad zahtijevao posebnu policy konfiguraciju u Business i Enterprise planovima, i browser tools za VS Code, koji agentima prvi put daju kontrolu nad pravim, živim preglednikom. Obje sposobnosti dostupne su svim korisnicima bez admin akcije.

Što Copilot Vision sada može?

Copilot Vision omogućuje prilaganje vizualnih materijala uz chat promptove kako bi Copilot mogao rezonirati o sadržaju slika i dokumenata zajedno s kodom. Podržani formati su JPEG, PNG, GIF i WebP, te PDF dokumenti.

U VS Code-u datoteke se mogu prilagati na tri načina: lijepljenjem (paste), povlačenjem i ispuštanjem (drag-and-drop) ili putem desnog klika na datoteku. Na github.com prilaganje funkcionira direktno u chat sučelju, dok Copilot CLI podržava navođenje putanja do datoteka u terminalu.

Praktični slučajevi upotrebe obuhvaćaju analizu dizajnerskih mockupa uz razgovor o implementaciji, dijagnostiku screenshotova grešaka, rezoniranje o arhitekturnim dijagramima i obradu tehničkih dokumenata u PDF formatu — sve unutar jednog razgovora s Copilotom, bez prebacivanja između alata.

Vision je dostupan u svim modovima rada: ask, plan i agent.

Dostupnost: svi planovi bez admin akcije

Ključna promjena u GA objavi jest defaultna dostupnost. Do sada su korisnici na Business i Enterprise planovima trebali imati omogućenu politiku „Editor Preview Features” kako bi pristupili Vision sposobnostima. Od 1. srpnja 2026. taj uvjet više ne postoji.

Vision je uključen po defaultu na svim planovima — Free, Pro, Pro+, Business i Enterprise — bez ikakve admin akcije. Ovo uklanja administrativnu prepreku za organizacije koje su odgađale aktivaciju zbog procedura odobravanja preview funkcionalnosti.

Jedina posebnost za Business i Enterprise korisnike: priložene slike i PDF-ovi zadržavaju se otprilike 24 sata za potrebe pružanja servisa.

Browser tools: upravljanje preglednikom iz VS Code-a

Paralelno s Vision GA, GitHub je proglasio GA i browser tools unutar VS Code-a — sposobnost koja Copilot agentima daje direktnu kontrolu nad pravim, živim preglednikom, a ne simuliranim okruženjem.

Agenti putem browser tools mogu izvoditi sljedeće radnje:

  • Navigacija — otvaranje URL-ova i kretanje kroz stranice
  • Interakcija — klikanje, tipkanje, hover, drag i drop, upravljanje dijalozima
  • Čitanje — dohvaćanje sadržaja stranica i atributa DOM elementa
  • Dijagnostika — hvatanje console grešaka i JavaScript iznimki
  • Screenshotovi — snimanje trenutnog stanja stranice

Paralelni agenti mogu istovremeno držati izolirane browser sesije, međusobno neovisne i odvojene od korisnikove vlastite aktivnosti u pregledniku.

Privatnost i granularne dozvole

GitHub je dizajnirao browser tools s privatnošću korisnika kao eksplicitnim prioritetom. Otvoreni tabovi ostaju privatni — nije ih moguće čitati bez korisnikove akcije. Korisnik mora explicite podijeliti tab s agentom putem opcije „Share with Agent”.

Za osjetljive dozvole — pristup kameri, mikrofonu, lokaciji i čitanje međuspremnika (clipboard) — sustav traži eksplicitno odobrenje pri svakom korištenju, a ne jednokratno pri instalaciji ili pokretanju agenta. Ovo znači da agent ne može pristupiti tim resursima bez aktivnog korisničkog pristanka za svaku pojedinu operaciju.

Administratorske mogućnosti za Enterprise

Za Enterprise organizacije, browser tools dolaze s granularnim kontrolama:

  • Toggle workbench.browser.enableChatTools za omogućavanje ili onemogućavanje browser tools na razini organizacije
  • Domain filteri koji ograničavaju na koje domene agenti smiju navigirati, čime se sprječava neovlašteni pristup vanjskim sadržajima

Ove kontrole omogućuju organizacijama da koriste browser tools u kontroliranom okruženju — primjerice ograničavanjem na interne razvojne servere ili domene testnog okruženja — bez potpunog onemogućavanja sposobnosti.

Dvije GA objave u jednom danu

Istovremeni GA Vision i browser tools nije slučajnost. Obje sposobnosti proširuju Copilotov doseg izvan teksta i koda — Vision prema vizualnim materijalima i dokumentima, browser tools prema stvarnom stanju web aplikacije u razvoju ili produkciji.

Zajedno s istovremenim dolaskom Kimi K2.7 Code kao prvog open-weight modela u Copilot i najavom gašenja platforme GitHub Models do 30. srpnja 2026., ovaj datum postaje značajna prekretnica u GitHubovoj AI strategiji: manje zasebnih platformi, više sposobnosti konsolidiranih unutar jednog alata koji je svima dostupan bez dodatne konfiguracije.

Česta pitanja

Što Copilot Vision može s priloženim slikama i PDF-ovima?
Copilot može rezonirati o vizualnom sadržaju priloženih datoteka zajedno s kodom — analizirati dizajnerske mockupe, dijagrame, screenshotove grešaka ili tehničke dokumente u kontekstu razgovora o kodu.
Što su browser tools u GitHub Copilotu i čemu služe?
Browser tools omogućuju Copilot agentima da upravljaju pravim preglednikom — navigacija, klikanje, tipkanje, čitanje sadržaja, hvatanje konzolnih grešaka i screenshotovi. Paralelni agenti drže izolirane sesije odvojene od korisnikove aktivnosti.
Trebaju li admini poduzeti nešto za omogućavanje Vision funkcionalnosti?
Ne. Vision je od GA uključen po defaultu na svim planovima, uključujući Business i Enterprise, bez potrebe za admin konfiguracijom. Prethodni uvjet za politiku „Editor Preview Features” više ne vrijedi.