什么是卫星嵌入向量？

这是卫星图像的压缩数值表示——每个像素或区域被转换为一个包含128、384或768个数字的向量。在这些向量上执行分类或分割等任务，比在原始图像上处理快得多。

为什么60个像素能取得0.84的F1得分意义重大？

传统地景分割模型需要数千个标注样本才能达到类似的精度。OlmoEarth在大量卫星图像上预训练后，已「了解」森林、农田或城市区域的外观，因此只需少量人工标注像素便可针对具体任务产出生产可用的结果，大幅降低了入门门槛。

Allen人工智能研究所（AI2）于2026年4月23日发布了OlmoEarth Studio，这是一个配备自研嵌入向量模型的卫星图像分析平台。继OLMo语言模型、Tülu指令微调和Molmo多模态模型之后，AI2持续扩展其开源战略。

OlmoEarth是一个将卫星图像转换为嵌入向量的预训练模型——这些紧凑的向量浓缩了视觉与地理空间信息。AI2以三种规模发布：Nano（128维）、Tiny（384维）和Base（768维）。

规模的选择是精度与速度的权衡。Nano适合快速处理大面积区域及在受限硬件上运行，Base在精细任务上提供最佳精度，Tiny则是覆盖大多数实际场景的折中方案。三种模型均为开源，符合AI2的使命。

该发布中的主要技术数据是：模型仅使用60个标注像素进行微调，即可在地景分割上实现F1得分0.84。F1是精确率与召回率的调和平均值——0.84在大多数地理分析任务中被认为具有生产可用性。

传统深度分割方法需要数千乃至数万个标注样本。OlmoEarth在大量卫星图像上进行了预训练，已「知道」森林、农田或城市区域的外观，因此只需少量样本便可将其引导至具体任务。

Studio支持三种主要操作：为任意区域生成嵌入向量、检测两个时间点之间的变化，以及通过PCA可视化向研究人员展示数据中的聚类结构。

应用范围涵盖亚马逊雨林砍伐监测、面向保险公司的作物产量预测、洪水和地震灾后损失评估以及城市扩展规划。关键优势在于无需重新训练大型模型即可进行下游分析——研究人员只需处理嵌入向量即可。