AWS：Nova 2 Lite与Claude文档处理双阶段流水线

AWS在Amazon Bedrock上演示了扫描文档批量数字化的双阶段流水线方法。Amazon Nova 2 Lite快速廉价地完成初步提取，Claude接手需要空间理解的复杂步骤——这种混合方法比单模型方案节省约三分之二的成本。

AWS发布了一种在Amazon Bedrock平台上批量数字化扫描文档的双阶段（two-stage）流水线架构。演示使用布局复杂的学校年鉴，但适用于任何需要将视觉元素与文本数据关联的大规模文档场景。

双阶段流水线如何工作

双阶段流水线是一种架构模式，两个模型顺序工作——较便宜的模型处理常规任务，较贵的模型仅接手最复杂的步骤。在本案例中，Amazon Nova 2 Lite在单次API调用中处理每张扫描页：以边界框检测照片、提取页面上可见姓名及其位置，并生成页面级元数据。Nova 2 Lite使用低推理级别（LOW reasoning level）以使成本可预测——无论分辨率如何，每张图片价格固定。

分工协作：Nova 2 Lite vs Claude

Claude Sonnet 4.6进入第二步，承担Nova 2 Lite未解决的任务：通过空间推理（spatial reasoning）将姓名与页面上的具体人脸匹配。Claude使用自适应思维，根据输入复杂度调整推理深度——无需为每种布局类型手动设计提示。Nova 2 Lite每页约生成1,000个输出token；Claude消耗约1,700个token。

分层成本方案带来什么？

关键在于Claude仅在必要时使用。结果：双阶段流水线每页约0.033美元，而单独使用Claude约为0.10美元。处理100,000页差异约为6,500美元。AWS在336页年鉴的3,122个姓名-人脸关联上测试准确率——93.3%达到置信度≥0.95，仅0.3%低于0.90。

这种模式还适用于哪些场景？

在年鉴之外，同样的架构模式适用于历史档案、员工名册、房产登记册和产品目录。任何存在明显「轻量」和「重量」处理部分的文档场景都是分层成本多模型流水线的候选：让Amazon Nova 2 Lite处理常规任务，将空间和语义复杂的步骤交给Claude。

常见问题

双阶段流水线比单独使用Claude便宜多少？

便宜约三分之二——双阶段流水线每页约0.033美元，而单模型Claude方案约0.10美元。处理100,000页可节省约6,500美元。

哪些文档适合这种处理方式？

除学校年鉴外，该方法还适用于历史档案、员工名册、房产清单和需要视觉元素检测与文本提取相结合的产品目录。

AWS：Nova 2 Lite与Claude——扫描文档批量处理的成本优化双阶段流水线

双阶段流水线如何工作

分工协作：Nova 2 Lite vs Claude

分层成本方案带来什么？

这种模式还适用于哪些场景？

常见问题

来源

相关新闻