Anthropic: Claude Opus 4.8 kommt mit 1M-Token-Kontext und adaptivem Denken
Claude Opus 4.8 ist Anthropics neues leistungsfähigstes allgemein verfügbares Modell, das am 28. Mai 2026 vorgestellt wurde. Es bringt standardmäßig ein Kontextfenster von einer Million (1M) Token auf der Claude API, Amazon Bedrock und Vertex AI, 128k maximale Ausgabe-Token sowie adaptives Denken, das das Schlussfolgern nur bei Bedarf aktiviert.
Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.
Am 28. Mai 2026 hat Anthropic Claude Opus 4.8 (Modell-ID claude-opus-4-8) vorgestellt, sein leistungsfähigstes allgemein verfügbares (GA — General Availability) Modell. Zusammen mit dem Modell selbst wurde eine Reihe begleitender API-Funktionen veröffentlicht, die die Kontrolle über das Verhalten des Modells in Produktionsanwendungen erweitern.
Wie viel Kontext und Ausgabe bietet Claude Opus 4.8?
Claude Opus 4.8 unterstützt standardmäßig ein Kontextfenster von 1 Million (1M) Token auf der Claude API, Amazon Bedrock und Google Vertex AI. Auf Microsoft Foundry liegt das Limit bei 200k Token. Die maximale Anzahl an Ausgabe-Token beträgt 128k. Das Modell behält denselben Satz an Tools und Plattformfunktionen wie das vorherige Claude Opus 4.7.
Das Kontextfenster bezeichnet die Gesamtmenge an Text — sowohl der Anfrage als auch der Antwort — die das Modell während einer einzigen Konversation gleichzeitig in seinem “Arbeitsgedächtnis” halten kann.
Wie nutzt Claude Opus 4.8 adaptives Denken?
Mit aktiviertem adaptivem Denken startet Claude Opus 4.8 den Schlussfolgerungsprozess nur dann, wenn ein konkreter Turn es erfordert, und reduziert so die Zahl nutzlos verbrauchter Thinking-Token gegenüber Claude Opus 4.7 bei gleichem Effort-Level. Der Parameter effort ist bei Claude Opus 4.8 nun standardmäßig auf high gesetzt, und zwar auf allen Oberflächen, einschließlich Claude Code und der Messages API.
So wird höhere Antwortqualität (hoher Effort) mit geringerem Token-Verbrauch kombiniert, da das Modell keine Schlussfolgerungskapazität für einfache Aufgaben aufwendet.
Welche neuen API-Funktionen begleiten den Launch?
Anthropic hat gleichzeitig Mid-Conversation System Messages eingeführt — Nachrichten mit der Rolle role: "system", die nach einem Nutzer-Turn innerhalb des messages-Arrays gesendet werden können (gemäß den Regeln zur Platzierung). Sie erlauben das Ändern von Anweisungen während einer langen Sitzung ohne Verlust von Prompt-Cache-Treffern und erfordern keinen Beta-Header.
Das Feld stop_details bei Antworten, die Ablehnungen (Refusals) sind, ist nun öffentlich dokumentiert. Es liefert eine category (cyber, bio oder null) und eine lesbare Erklärung, sodass eine Anwendung verschiedene Klassen von Ablehnungen an den passenden nächsten Schritt leiten kann.
Die Mindestlänge eines Prompts, der für Prompt Caching gecacht werden kann, wurde auf 1.024 Token gesenkt, niedriger als bei Claude Opus 4.7, wodurch die Wirtschaftlichkeit des Cachings auf kürzere Anfragen ausgeweitet wird. Prompt Caching speichert den bereits verarbeiteten Teil einer Anfrage, damit er nicht bei jedem Aufruf neu berechnet werden muss, was Zeit und Kosten spart.
Wie verhält es sich bei Sampling und Einschränkungen?
Das Setzen der Sampling-Parameter temperature, top_p oder top_k auf einen anderen als den Standardwert gibt bei Claude Opus 4.8 einen Fehler 400 zurück, genau wie bei Claude Opus 4.7. Anthropic verweist auf den Migrationsleitfaden für Details beim Wechsel von älteren Versionen.
In Claude Code nutzen Max-Plan-Nutzer nun standardmäßig den Fast Mode auf Claude Opus 4.8, und der Auto-Modus für langlaufende Aufgaben wurde auf mehr Nutzer ausgeweitet. Workflows sind in Claude Code als Research Preview verfügbar und ermöglichen das Definieren und Ausführen mehrstufiger agentischer Pläne.
Was bedeutet das für Entwicklungsteams?
Die Kombination aus Millionen-Token-Kontext, adaptivem Denken und feinerer Kontrolle über Ablehnungen positioniert Claude Opus 4.8 als Modell für anspruchsvolle agentische und analytische Workflows über große Dokumente. Das Modell unterstützt zudem High-Resolution Image Input (bis zu 2576 Pixel an der längeren Kante), Task Budgets, Computer Use und das Advisor Tool, genau wie Claude Opus 4.7.
Häufig gestellte Fragen
- Wie groß ist das Kontextfenster von Claude Opus 4.8?
- Claude Opus 4.8 unterstützt standardmäßig ein Kontextfenster von 1 Million Token auf der Claude API, Amazon Bedrock und Google Vertex AI, während das Limit auf Microsoft Foundry 200k Token beträgt. Die maximale Anzahl an Ausgabe-Token liegt bei 128k.
- Was ist adaptives Denken in Claude Opus 4.8?
- Adaptives Denken aktiviert den Schlussfolgerungsprozess nur dann, wenn eine konkrete Anfrage es erfordert, und reduziert so die Zahl unnötig verbrauchter Thinking-Token gegenüber Claude Opus 4.7 bei gleichem Effort-Level.
- Was sind Mid-Conversation System Messages?
- Das sind Nachrichten mit der Rolle role: 'system', die nach einem Nutzer-Turn innerhalb des messages-Arrays gesendet werden können. Sie erlauben das Ändern von Anweisungen während einer langen Sitzung unter Erhalt der Prompt-Cache-Treffer, ohne Beta-Header.
Quellen
Verwandte Nachrichten
arXiv:2606.19808: SEVRA spart durch selektive Verifikation bis zu 91 Prozent der Tokens beim Modell-Reasoning
arXiv:2606.20333: SoftSkill komprimiert Skill-Dokumente in 32 latente Tokens und steigert LiveMath um 42,1 Punkte
arXiv:2606.19327: Rubrik-konditionierte Selbstdestillation übertrifft GRPO beim Reasoning-Training