Allen AI:OlmoEarthエンベディングがわずか60ピクセルでF1スコア0.84の地景セグメンテーションを実現
なぜ重要か
Allen Institute for AIがOlmoEarth Studioを発表しました。衛星画像エンベディング用に3サイズのモデル(Nano、Tiny、Base)を提供しています。わずか60個のラベル付きピクセルで地景セグメンテーションのF1スコア0.84を達成し、変化検出とPCA可視化もサポートしています。
Allen Institute for AI(AI2)は2026年4月23日、独自のエンベディングモデルを備えた衛星画像分析プラットフォーム「OlmoEarth Studio」を発表しました。OLMo言語モデル、Tülu命令チューニング、Molmoマルチモーダルモデルに続き、AI2はオープンソース戦略をさらに拡大しています。
OlmoEarthとは何か、AI2戦略にどう位置づけられるか?
OlmoEarthは衛星画像をエンベディング——視覚情報と地理空間情報を集約したコンパクトなベクトル——に変換する事前学習済みモデルです。AI2はNano(128次元)、Tiny(384次元)、Base(768次元)の3サイズで公開しています。
サイズの選択は精度と速度のトレードオフです。Nanoは広域処理や限られたハードウェアでの実行に適しており、Baseは詳細なタスクで最高の精度を発揮し、Tinyはほとんどの実用ケースをカバーする中間的な選択肢です。3つのモデルはすべてオープンソースで、AI2のミッションに沿っています。
60ピクセルで革命的な結果が得られる理由
今回の発表における主要な技術的成果は、わずか60個のラベル付きピクセルでファインチューニングした場合に地景セグメンテーションでF1スコア0.84を達成したことです。F1は精度と再現率の調和平均であり、0.84はほとんどの地理分析で本番環境に適した値とされています。
従来の深層セグメンテーション手法は、同等の精度に達するために数千から数万のラベル付きサンプルを必要とします。OlmoEarthは大量の衛星画像で事前学習されており、森林・農地・都市部の外観を「知っている」ため、少数のサンプルで特定タスクに誘導するだけで済みます。
具体的な活用事例は?
Studioは3つの主要操作をサポートしています。任意の地域のエンベディング生成、2つの時点間の変化検出、そして研究者にデータのクラスター構造を示すPCA可視化です。
応用範囲はアマゾンの森林伐採監視、保険会社向けの作物収量予測、洪水・地震後の被害評価、都市成長計画など多岐にわたります。大型モデルを再学習することなく下流分析が可能な点が主な利点であり、研究者はエンベディングベクトルのみを扱うことができます。
この記事はAIにより一次情報源から生成されました。