🔴 🤖 Modeli Objavljeno: · 3 min čitanja ·

Anthropic: Claude Opus 4.8 stiže s 1M token kontekstom i adaptivnim razmišljanjem

Urednička ilustracija: Claude Opus 4.8 stiže s 1M token kontekstom i adaptivnim razmišljanjem

Claude Opus 4.8 je novi najsposobniji generalno dostupni model tvrtke Anthropic, lansiran 28. svibnja 2026. Donosi prozor konteksta od milijun (1M) tokena po defaultu na Claude API-ju, Amazon Bedrocku i Vertex AI-ju, 128k maksimalnih izlaznih tokena te adaptivno razmišljanje koje aktivira rezoniranje samo kad je potrebno.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.

Anthropic je 28. svibnja 2026. lansirao Claude Opus 4.8 (model ID claude-opus-4-8), svoj najsposobniji generalno dostupni (GA — General Availability) model. Uz sam model objavljen je i niz pratećih API značajki koje proširuju kontrolu nad ponašanjem modela u produkcijskim aplikacijama.

Koliki kontekst i izlaz nudi Claude Opus 4.8?

Claude Opus 4.8 podržava prozor konteksta od 1 milijun (1M) tokena po defaultu na Claude API-ju, Amazon Bedrocku i Google Vertex AI-ju. Na Microsoft Foundryju limit je 200k tokena. Maksimalni broj izlaznih tokena iznosi 128k. Model zadržava isti skup alata i platformskih značajki kao prethodni Claude Opus 4.7.

Prozor konteksta (context window) označava ukupnu količinu teksta — i upita i odgovora — koju model može istovremeno držati u “radnoj memoriji” tijekom jedne konverzacije.

Kako Claude Opus 4.8 koristi adaptivno razmišljanje?

Uz uključeno adaptivno razmišljanje (adaptive thinking), Claude Opus 4.8 pokreće proces rezoniranja samo kad konkretni turn to zahtijeva, smanjujući broj uzaludno potrošenih thinking tokena u odnosu na Claude Opus 4.7 pri istoj razini napora. Parametar effort na Claude Opus 4.8 sada se po defaultu postavlja na high na svim površinama, uključujući Claude Code i Messages API.

Time se kombinira veća kvaliteta odgovora (visok effort) s manjom potrošnjom tokena, jer model ne troši kapacitet rezoniranja na jednostavne zadatke.

Koje nove API značajke prate lansiranje?

Anthropic je istovremeno uveo mid-conversation system messages — poruke s ulogom role: "system" koje se mogu poslati nakon korisnikovog turna unutar messages niza (uz pravila o smještaju). One omogućuju promjenu uputa tijekom duge sesije bez gubitka pogodaka prompt cachea i ne traže beta zaglavlje.

Polje stop_details na odgovorima koji su odbijenice (refusals) sada je javno dokumentirano. Vraća category (cyber, bio ili null) i čitljivo objašnjenje, pa aplikacija može različite klase odbijenica usmjeriti na odgovarajući sljedeći korak.

Minimalna duljina prompta koji se može keširati za prompt caching spuštena je na 1.024 tokena, niže nego na Claude Opus 4.7, čime se isplativost keširanja proširuje na kraće upite. Prompt caching pohranjuje već obrađeni dio upita kako se ne bi iznova računao pri svakom pozivu, što štedi i vrijeme i trošak.

Kako se ponaša pri uzorkovanju i ograničenjima?

Postavljanje parametara uzorkovanja temperature, top_p ili top_k na vrijednost različitu od zadane vraća grešku 400 na Claude Opus 4.8, jednako kao na Claude Opus 4.7. Anthropic upućuje na migracijski vodič za detalje pri prelasku sa starijih verzija.

U Claude Codeu, korisnici Max plana sada po defaultu koriste fast mode na Claude Opus 4.8, a Auto mode za dugotrajne zadatke proširen je na više korisnika. Workflows su u Claude Codeu dostupni kao research preview, omogućujući definiranje i izvođenje višekoračnih agentskih planova.

Što to znači za razvojne timove?

Kombinacija milijunskog konteksta, adaptivnog razmišljanja i finije kontrole nad odbijenicama pozicionira Claude Opus 4.8 kao model za zahtjevne agentske i analitičke radne tokove nad velikim dokumentima. Model podržava i high-resolution image input (do 2576 piksela na dužem rubu), Task budgets, computer use te advisor tool, jednako kao Claude Opus 4.7.

Česta pitanja

Koliki je prozor konteksta Claude Opus 4.8 modela?
Claude Opus 4.8 podržava prozor konteksta od 1 milijun tokena po defaultu na Claude API-ju, Amazon Bedrocku i Google Vertex AI-ju, dok je na Microsoft Foundryju limit 200k tokena. Maksimalni broj izlaznih tokena iznosi 128k.
Što je adaptivno razmišljanje (adaptive thinking) u Claude Opus 4.8?
Adaptivno razmišljanje aktivira proces rezoniranja samo kad konkretni zahtjev to traži, čime se smanjuje broj nepotrebno potrošenih thinking tokena u odnosu na Claude Opus 4.7 pri istoj razini napora (effort).
Što su mid-conversation system messages?
To su poruke s ulogom role: 'system' koje se mogu poslati nakon korisnikovog turna unutar messages niza. Omogućuju mijenjanje uputa tijekom duge sesije uz očuvanje pogodaka prompt cachea, bez potrebe za beta zaglavljem.