AWS: Nova 2 Lite i Claude — cost-optimizirani pipeline za obradu skeniranih dokumenata
AWS demonstrira dvostepeni (two-stage) pipeline za masovnu digitalizaciju skeniranih dokumenata na Amazon Bedrocku. Amazon Nova 2 Lite obavlja inicijalnu ekstrakciju brzo i jeftino, a Claude preuzima prostorno zahtjevno razumijevanje — hibridni pristup koji košta dvije trećine manje od single-model alternativa.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
AWS je objavio arhitekturu dvostepenog (two-stage) pipeline pristupa za masovnu digitalizaciju skeniranih dokumenata na platformi Amazon Bedrock. Demonstracija koristi školske godišnjake s kompleksnim layoutom, ali je primjenjiva na svaki dokumentacijski scenarij velikog obujma u kojem se vizualni elementi moraju povezati s tekstualnim podacima.
Kako radi dvostepeni pipeline
Dvostepeni pipeline je arhitekturni obrazac u kojemu dva modela rade sekvencijalno — jeftiniji model obavlja rutinsku obradu, a skuplji model preuzima samo najzahtjevnije korake. U ovom slučaju Amazon Nova 2 Lite prolazi kroz svaku skeniranu stranicu u jednom API pozivu: detektira fotografije s bounding boxevima, ekstrahira vidljiva imena s pozicijama na stranici i emitira metapodatke na razini stranice. Nova 2 Lite pritom radi na niskoj razini zaključivanja (LOW reasoning level) kako bi trošak bio što predvidljiviji — uz fiksnu cijenu po slici, neovisno o rezoluciji.
Podjela posla: Nova 2 Lite vs Claude
Claude Sonnet 4.6 ulazi u drugi korak i preuzima ono što Nova 2 Lite nije riješila: prostorno (spatial) zaključivanje kojim se imena pridružuju konkretnim licima na stranici. Claude koristi adaptivno razmišljanje i prilagođava dubinu zaključivanja prema složenosti unosa — bez potrebe za ručnim prompt engineeringom za svaki tip layouta. Nova 2 Lite generira oko 1.000 izlaznih tokena po stranici; Claude troši oko 1.700 tokena.
Što donosi cost-tiered pristup troškovima?
Cijela poanta je u tome što se Claude koristi isključivo tamo gdje je neophodan. Rezultat: dvostepeni pipeline košta oko 0,033 USD po stranici, dok bi obrada isključivo Claudeom iznosila ~0,10 USD. Na 100.000 stranica razlika je oko 6.500 USD. AWS testira točnost na uzorku od 3.122 asocijacije ime-lice na 336 stranica godišnjaka — 93,3 % dobiva pouzdanost ≥ 0,95, a samo 0,3 % pada ispod 0,90.
Gdje još vrijedi ovaj obrazac?
Izvan godišnjaka, isti arhitekturni obrazac primjenjuje se na povijesne arhive, imenike osoblja, registre nekretnina i produkt-kataloge. Svaki scenarij u kojemu postoji jasan “laki” i “teški” dio obrade dokumenta kandidat je za cost-tiered multi-model pipeline: neka Amazon Nova 2 Lite radi rutinu, a Claudeu prepustite prostorno i semantički zahtjevne korake.
Česta pitanja
- Koliko je dvostepeni pipeline jeftiniji od korištenja samo Claudea?
- Otprilike dvije trećine jeftiniji — dvostepeni pipeline košta ~0,033 USD po stranici, dok single-model Claude pristup košta ~0,10 USD. Na 100.000 stranica ušteda iznosi oko 6.500 USD.
- Koji dokumenti su prikladan slučaj upotrebe ovog pristupa?
- Osim školskih godišnjaka (yearbook stranice), pristup je primjenjiv na povijesne arhive, imenike osoblja, popise nekretnina i kataloge proizvoda koji zahtijevaju detekciju vizualnih elemenata s pridruženom ekstrakcijom teksta.
Povezane vijesti
GitHub: Copilot agentic harness dostiže razinu vendor-harnessa uz manju potrošnju tokena kroz 20+ frontier modela
Anthropic: Economic Index otkriva ritmove i obrasce korištenja AI-ja kroz dan
arXiv:2606.27009: Semantičko rano zaustavljanje smanjuje trošak agentskih petlji za 38%