ArXiv GUI-SD: Erstes On-Policy-Self-Distillation-Framework für GUI-Grounding übertrifft GRPO auf sechs Benchmarks in Genauigkeit und Trainingseffizienz
Yan Zhang, Daiqing Wu und Huawen Shen präsentierten GUI-SD — das erste On-Policy-Self-Distillation-Framework (OPSD) speziell für GUI-Grounding, die Fähigkeit von KI-Agenten, natürlichsprachliche Anweisungen auf visuelle Koordinaten von Interface-Elementen abzubilden. Das System nutzt privilegierten visuellen Kontext (Bounding Box und Gaussian Soft Mask) und Entropy-gesteuerte Destillation. Auf sechs repräsentativen GUI-Grounding-Benchmarks übertrifft GUI-SD durchgehend GRPO-basierte RL-Methoden.