AWS: Nova 2 Lite und Claude — kostenoptimierte Pipeline zur Verarbeitung gescannter Dokumente
AWS demonstriert eine zweistufige (Two-Stage) Pipeline zur Massendigitalisierung gescannter Dokumente auf Amazon Bedrock. Amazon Nova 2 Lite übernimmt die anfängliche Extraktion schnell und günstig, während Claude das räumlich anspruchsvolle Verständnis übernimmt — ein hybrider Ansatz, der zwei Drittel weniger kostet als Single-Model-Alternativen.
Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.
AWS veröffentlichte die Architektur eines zweistufigen (Two-Stage) Pipeline-Ansatzes zur Massendigitalisierung gescannter Dokumente auf der Amazon-Bedrock-Plattform. Die Demonstration verwendet Schuljahrbücher mit komplexem Layout, ist aber auf jeden Dokumentationsfall großen Umfangs anwendbar, bei dem visuelle Elemente mit Textdaten verknüpft werden müssen.
Wie die zweistufige Pipeline funktioniert
Die zweistufige Pipeline ist ein Architekturmuster, bei dem zwei Modelle sequenziell arbeiten — ein günstigeres Modell übernimmt die Routineverarbeitung, während ein teureres Modell nur die anspruchsvollsten Schritte übernimmt. In diesem Fall durchläuft Amazon Nova 2 Lite jede gescannte Seite in einem einzigen API-Aufruf: Es erkennt Fotos mit Bounding-Boxes, extrahiert sichtbare Namen mit Positionen auf der Seite und gibt Metadaten auf Seitenebene aus. Nova 2 Lite arbeitet dabei auf niedrigem Schlussfolgerungsniveau (LOW reasoning level), um die Kosten möglichst vorhersagbar zu halten — zu einem festen Preis pro Bild, unabhängig von der Auflösung.
Aufgabenteilung: Nova 2 Lite vs. Claude
Claude Sonnet 4.6 tritt in den zweiten Schritt ein und übernimmt, was Nova 2 Lite nicht gelöst hat: räumliches (spatial) Schlussfolgern, mit dem Namen konkreten Gesichtern auf der Seite zugeordnet werden. Claude verwendet adaptives Denken und passt die Schlussfolgerungstiefe an die Komplexität der Eingabe an — ohne manuelles Prompt-Engineering für jeden Layout-Typ. Nova 2 Lite generiert rund 1.000 Ausgabe-Token pro Seite; Claude verbraucht rund 1.700 Token.
Was bringt der kostengestaffelte Ansatz?
Der entscheidende Punkt ist, dass Claude ausschließlich dort eingesetzt wird, wo es unbedingt erforderlich ist. Ergebnis: Die zweistufige Pipeline kostet rund 0,033 USD pro Seite, während die ausschließliche Verarbeitung durch Claude ~0,10 USD betragen würde. Bei 100.000 Seiten beträgt der Unterschied rund 6.500 USD. AWS testet die Genauigkeit an einem Sample von 3.122 Name-Gesicht-Zuordnungen auf 336 Jahrbuchseiten — 93,3% erhalten eine Konfidenz ≥ 0,95, und nur 0,3% fallen unter 0,90.
Wo gilt dieses Muster noch?
Außerhalb von Jahrbüchern ist dasselbe Architekturmuster auf historische Archive, Personalverzeichnisse, Immobilienregister und Produktkataloge anwendbar. Jedes Szenario, in dem es einen klar „leichten” und einen „schweren” Teil der Dokumentenverarbeitung gibt, ist ein Kandidat für eine kostengestaffelte Multi-Model-Pipeline: Lassen Sie Amazon Nova 2 Lite die Routine erledigen und übergeben Sie Claude die räumlich und semantisch anspruchsvollen Schritte.
Häufig gestellte Fragen
- Wie viel günstiger ist die zweistufige Pipeline im Vergleich zur ausschließlichen Nutzung von Claude?
- Etwa zwei Drittel günstiger — die zweistufige Pipeline kostet ~0,033 USD pro Seite, während der Single-Model-Claude-Ansatz ~0,10 USD kostet. Bei 100.000 Seiten beträgt die Ersparnis rund 6.500 USD.
- Für welche Dokumente eignet sich dieser Ansatz besonders?
- Neben Schuljahrbüchern (Yearbook-Seiten) ist der Ansatz auf historische Archive, Personalverzeichnisse, Immobilienlisten und Produktkataloge anwendbar, die die Erkennung visueller Elemente mit zugehöriger Textextraktion erfordern.
Verwandte Nachrichten
GitHub: Copilot Agentic Harness erreicht Vendor-Niveau mit geringerem Token-Verbrauch über 20+ Frontier-Modelle
Anthropic: Economic Index zeigt Tagesrhythmen und Nutzungsmuster bei KI
arXiv:2606.27009: Semantisches frühzeitiges Stoppen senkt Kosten von Agenten-Schleifen um 38%