AWS:Nova 2 Lite与Claude——扫描文档批量处理的成本优化双阶段流水线
AWS在Amazon Bedrock上演示了扫描文档批量数字化的双阶段流水线方法。Amazon Nova 2 Lite快速廉价地完成初步提取,Claude接手需要空间理解的复杂步骤——这种混合方法比单模型方案节省约三分之二的成本。
本文由人工智能基于一手来源生成。
AWS发布了一种在Amazon Bedrock平台上批量数字化扫描文档的双阶段(two-stage)流水线架构。演示使用布局复杂的学校年鉴,但适用于任何需要将视觉元素与文本数据关联的大规模文档场景。
双阶段流水线如何工作
双阶段流水线是一种架构模式,两个模型顺序工作——较便宜的模型处理常规任务,较贵的模型仅接手最复杂的步骤。在本案例中,Amazon Nova 2 Lite在单次API调用中处理每张扫描页:以边界框检测照片、提取页面上可见姓名及其位置,并生成页面级元数据。Nova 2 Lite使用低推理级别(LOW reasoning level)以使成本可预测——无论分辨率如何,每张图片价格固定。
分工协作:Nova 2 Lite vs Claude
Claude Sonnet 4.6进入第二步,承担Nova 2 Lite未解决的任务:通过空间推理(spatial reasoning)将姓名与页面上的具体人脸匹配。Claude使用自适应思维,根据输入复杂度调整推理深度——无需为每种布局类型手动设计提示。Nova 2 Lite每页约生成1,000个输出token;Claude消耗约1,700个token。
分层成本方案带来什么?
关键在于Claude仅在必要时使用。结果:双阶段流水线每页约0.033美元,而单独使用Claude约为0.10美元。处理100,000页差异约为6,500美元。AWS在336页年鉴的3,122个姓名-人脸关联上测试准确率——93.3%达到置信度≥0.95,仅0.3%低于0.90。
这种模式还适用于哪些场景?
在年鉴之外,同样的架构模式适用于历史档案、员工名册、房产登记册和产品目录。任何存在明显「轻量」和「重量」处理部分的文档场景都是分层成本多模型流水线的候选:让Amazon Nova 2 Lite处理常规任务,将空间和语义复杂的步骤交给Claude。
常见问题
- 双阶段流水线比单独使用Claude便宜多少?
- 便宜约三分之二——双阶段流水线每页约0.033美元,而单模型Claude方案约0.10美元。处理100,000页可节省约6,500美元。
- 哪些文档适合这种处理方式?
- 除学校年鉴外,该方法还适用于历史档案、员工名册、房产清单和需要视觉元素检测与文本提取相结合的产品目录。