🟡 🏥 实践应用 发布于: · 2 分钟阅读 ·

AWS:Nova 2 Lite与Claude——扫描文档批量处理的成本优化双阶段流水线

编辑插图:Nova 2 Lite与Claude——扫描文档处理的成本优化流水线,无文字无人脸

AWS在Amazon Bedrock上演示了扫描文档批量数字化的双阶段流水线方法。Amazon Nova 2 Lite快速廉价地完成初步提取,Claude接手需要空间理解的复杂步骤——这种混合方法比单模型方案节省约三分之二的成本。

🤖

本文由人工智能基于一手来源生成。

AWS发布了一种在Amazon Bedrock平台上批量数字化扫描文档的双阶段(two-stage)流水线架构。演示使用布局复杂的学校年鉴,但适用于任何需要将视觉元素与文本数据关联的大规模文档场景。

双阶段流水线如何工作

双阶段流水线是一种架构模式,两个模型顺序工作——较便宜的模型处理常规任务,较贵的模型仅接手最复杂的步骤。在本案例中,Amazon Nova 2 Lite在单次API调用中处理每张扫描页:以边界框检测照片、提取页面上可见姓名及其位置,并生成页面级元数据。Nova 2 Lite使用低推理级别(LOW reasoning level)以使成本可预测——无论分辨率如何,每张图片价格固定。

分工协作:Nova 2 Lite vs Claude

Claude Sonnet 4.6进入第二步,承担Nova 2 Lite未解决的任务:通过空间推理(spatial reasoning)将姓名与页面上的具体人脸匹配。Claude使用自适应思维,根据输入复杂度调整推理深度——无需为每种布局类型手动设计提示。Nova 2 Lite每页约生成1,000个输出token;Claude消耗约1,700个token。

分层成本方案带来什么?

关键在于Claude仅在必要时使用。结果:双阶段流水线每页约0.033美元,而单独使用Claude约为0.10美元。处理100,000页差异约为6,500美元。AWS在336页年鉴的3,122个姓名-人脸关联上测试准确率——93.3%达到置信度≥0.95,仅0.3%低于0.90。

这种模式还适用于哪些场景?

在年鉴之外,同样的架构模式适用于历史档案、员工名册、房产登记册和产品目录。任何存在明显「轻量」和「重量」处理部分的文档场景都是分层成本多模型流水线的候选:让Amazon Nova 2 Lite处理常规任务,将空间和语义复杂的步骤交给Claude。

常见问题

双阶段流水线比单独使用Claude便宜多少?
便宜约三分之二——双阶段流水线每页约0.033美元,而单模型Claude方案约0.10美元。处理100,000页可节省约6,500美元。
哪些文档适合这种处理方式?
除学校年鉴外,该方法还适用于历史档案、员工名册、房产清单和需要视觉元素检测与文本提取相结合的产品目录。