Allen AI: OlmoEarth embeddings omogućuju segmentaciju krajobraza s tek 60 piksela i F1 rezultatom 0,84
Zašto je bitno
Allen Institute for AI lansirao je OlmoEarth Studio s tri veličine modela (Nano, Tiny, Base) za satelitske embeddings. Modeli postižu F1 rezultat 0,84 za segmentaciju krajobraza s tek 60 označenih piksela te podržavaju detekciju promjena i PCA vizualizaciju.
Allen Institute for AI (AI2) lansirao je 23. travnja 2026. OlmoEarth Studio, platformu s vlastitim embeddings modelima za analizu satelitskih slika. Uz OLMo jezične modele, Tülu instrukcijsko učenje i Molmo multimodalne modele, AI2 nastavlja proširivati svoju open-source strategiju.
Što je OlmoEarth i kako se uklapa u AI2 strategiju?
OlmoEarth je pretrenirani model koji satelitske slike pretvara u embeddings - kompaktne vektore koji sažimaju vizualne i geoprostorne informacije. AI2 ga objavljuje u tri veličine: Nano sa 128 dimenzija, Tiny sa 384 dimenzija i Base sa 768 dimenzija.
Izbor veličine je trade-off točnosti i brzine. Nano je brz za obradu velikih područja i pokretanje na ograničenom hardveru, Base daje najbolju točnost za detaljne zadatke, Tiny je sredina koja pokriva većinu praktičnih slučajeva. Sva tri modela su open-source, u skladu s AI2 misijom.
Zašto je rezultat s 60 piksela revolucionaran?
Glavni tehnički podatak iz objave je F1 rezultat od 0,84 za segmentaciju krajobraza kada je model finetuniran s tek 60 označenih piksela. F1 je harmonijska sredina preciznosti i odziva - vrijednost 0,84 smatra se produkcijski korisnom za većinu zemljopisnih analiza.
Klasični pristupi duboke segmentacije traže tisuće do desetke tisuća označenih primjera. OlmoEarth predtrenirani na ogromnom skupu satelitskih snimaka već “zna” kako izgleda šuma, polje ili urbano područje, pa ga je dovoljno usmjeriti s malim skupom primjera za konkretan zadatak.
Koje su konkretne primjene?
Studio podržava tri glavne operacije: generiranje embeddings za proizvoljnu regiju, detekciju promjena između dviju vremenskih točaka, te PCA vizualizaciju koja istraživaču pokazuje klaster strukture u podacima.
Primjene pokrivaju praćenje krčenja šuma u Amazoniji, predviđanje prinosa žitarica za osiguravateljske kompanije, procjenu štete nakon poplava i potresa te planiranje urbanog rasta. Ključna prednost je mogućnost downstream analize bez ponovnog treniranja velikog modela - istraživač radi samo s embeddings vektorima.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Povezane vijesti
Google DeepMind Decoupled DiLoCo: 20× manja mrežna propusnost za AI trening kroz geografski razdvojene datacentre
Apple na ICLR 2026 predstavlja ParaRNN: paralelno treniranje nelinearnih RNN-ova uz 665× ubrzanje
Linux Foundation objavio RGAF vodič s 35 open-source alata za odgovoran AI