🤖 24 AI
🟢 📦 Open Source Freitag, 24. April 2026 · 2 Min. Lesezeit

Allen AI: OlmoEarth-Embeddings ermöglichen Landschaftssegmentierung mit nur 60 Pixeln und einem F1-Wert von 0,84

Editorial illustration: Open-Source-Tool — open-source

Warum es wichtig ist

Allen Institute for AI hat OlmoEarth Studio mit drei Modellgrößen (Nano, Tiny, Base) für Satelliten-Embeddings veröffentlicht. Die Modelle erzielen einen F1-Wert von 0,84 für die Landschaftssegmentierung mit nur 60 markierten Pixeln und unterstützen Änderungserkennung und PCA-Visualisierung.

Allen Institute for AI (AI2) hat am 23. April 2026 OlmoEarth Studio vorgestellt — eine Plattform mit eigenen Embedding-Modellen zur Analyse von Satellitenbildern. Neben seinen OLMo-Sprachmodellen, Tülu-Instruction-Tuning und Molmo-Multimodal-Modellen erweitert AI2 seine Open-Source-Strategie weiter.

Was ist OlmoEarth und wie fügt es sich in die AI2-Strategie ein?

OlmoEarth ist ein vortrainiertes Modell, das Satellitenbilder in Embeddings umwandelt — kompakte Vektoren, die visuelle und geospatiale Informationen zusammenfassen. AI2 veröffentlicht es in drei Größen: Nano mit 128 Dimensionen, Tiny mit 384 Dimensionen und Base mit 768 Dimensionen.

Die Wahl der Größe ist ein Kompromiss zwischen Genauigkeit und Geschwindigkeit. Nano eignet sich für die schnelle Verarbeitung großer Gebiete auf eingeschränkter Hardware, Base liefert die beste Genauigkeit für detaillierte Aufgaben, und Tiny deckt für die meisten praktischen Anwendungsfälle die goldene Mitte ab. Alle drei Modelle sind Open-Source, entsprechend der Mission von AI2.

Warum ist das 60-Pixel-Ergebnis bahnbrechend?

Die wichtigste technische Kennzahl aus der Veröffentlichung ist ein F1-Wert von 0,84 für die Landschaftssegmentierung, wenn das Modell mit nur 60 markierten Pixeln feinabgestimmt wurde. F1 ist das harmonische Mittel aus Präzision und Trefferquote — ein Wert von 0,84 gilt für die meisten geografischen Analysen als produktionsreif.

Klassische Ansätze der tiefen Segmentierung erfordern Tausende bis Zehntausende von markierten Beispielen. OlmoEarth wurde auf einem riesigen Datensatz von Satellitenaufnahmen vortrainiert und „weiß” bereits, wie Wälder, Felder oder Stadtgebiete aussehen — es reicht ein kleines Beispielset, um das Modell auf eine spezifische Aufgabe auszurichten.

Was sind konkrete Anwendungsfälle?

Studio unterstützt drei Hauptoperationen: Embeddings für eine beliebige Region generieren, Änderungen zwischen zwei Zeitpunkten erkennen und PCA-Visualisierung, die dem Forscher die Clusterstrukturen in den Daten zeigt.

Anwendungen umfassen die Überwachung der Entwaldung im Amazonasgebiet, die Vorhersage von Ernteerträgen für Versicherungsunternehmen, die Schadensbewertung nach Überschwemmungen und Erdbeben sowie die Planung des Stadtwachstums. Der entscheidende Vorteil liegt in der Möglichkeit zur nachgelagerten Analyse ohne erneutes Training des großen Modells — Forscher arbeiten ausschließlich mit Embedding-Vektoren.

🤖

Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.