Evaluacija
Evaluacija AI sustava
Disciplina mjerenja sposobnosti, sigurnosti i usklađenosti AI modela kombinacijom benchmarkova, ljudske procjene i red teaminga prije i nakon objave.
Evaluacija AI sustava (AI evaluation) je disciplina sustavnog mjerenja sposobnosti, sigurnosti i usklađenosti AI modela. Cilj joj je objektivno utvrditi što model može, gdje griješi i koliko je rizičan — prije i nakon objave.
Evaluacija kombinira nekoliko metoda. Standardizirani benchmarkovi boduju znanje i vještine na fiksnom skupu zadataka. Ljudska procjena (A/B usporedbe, ocjenjivanje odgovora) hvata kvalitetu koju automatski testovi ne vide. Crveni tim napadačkim metodama traži jailbreakove i zlouporabe, a sve se češće mjere i halucinacije, sikofantija te sklonost obmani. Holistički okviri poput HELM-a uz točnost prate i pristranost, robusnost i toksičnost.
Evaluacija je 2025.–2026. postala središnja za upravljanje AI sigurnošću i usklađenošću. Laboratoriji uz svaki frontier model objavljuju “system cards” s rezultatima, OpenAI i Anthropic proveli su uzajamne safety evaluacije, a EU AI Act i državni AI instituti čine je regulatornom obvezom. Ključni izazov ostaje zasićenje i kontaminacija testova: visok rezultat ne jamči pouzdanost u praksi.