Wie entwickelt das AC/DC-Framework gleichzeitig Modelle und Aufgaben weiter?

Durch Open-Endedness-Prinzipien — Modelle entstehen durch Merging verschiedener Gewichte, während Aufgaben als synthetische Daten generiert werden, die Modelle in neue Nischen drängen. Beide Prozesse sind in einem einzigen Lauf miteinander verbunden, ohne manuelle Eingriffe.

Warum übertreffen Modelle Benchmarks, ohne dafür zu optimieren?

Anstatt gegen feste Benchmarks trainiert zu werden, konkurrieren Modelle untereinander auf synthetischen Aufgaben. Das Ergebnis ist eine Population von Experten, die natürlich einen breiteren Fähigkeitsraum abdeckt, wobei einzelne Nischen auf Standardtests stark abschneiden, ohne direkt darauf abzuzielen.

ArXiv AC/DC: automatische Entdeckung spezialisierter LLMs durch Koevolution von Modellen und Aufgaben

Ein Team aus Autoren — Andrew Dai, Boris Meinardus, Ciaran Regan, Yingtao Tian und Yujin Tang — hat ein neues Framework namens AC/DC unter dem vollständigen Namen “Discovering Novel LLM Experts via Task-Capability Coevolution” veröffentlicht. Das Paper wurde auf der ICLR 2026 angenommen und stellt einen neuen Ansatz zur LLM-Entwicklung dar, der den klassischen Ansatz separater Trainingsläufe vollständig aufgibt.

Das Problem, das es löst

Traditionell muss ein Team, das die Fähigkeiten eines LLM erweitern möchte, für jede neue Domäne einen neuen separaten Trainingslauf starten. Möchten Sie einen medizinischen Experten? Separater Lauf. Rechtliches Modell? Noch einer. Finanziell? Ein dritter. Jeder erfordert Hyperparameter, Daten, Evaluierung, Regressionstests.

AC/DC eliminiert diese manuelle Gruppe von Eingriffen. Die Autoren behaupten, dass „Open-Endedness — durch Koevolution von Modellen und Aufgaben — Modelle mit immer neuartigen Fähigkeiten in einem einzigen Lauf entdecken kann”.

Wie das Framework funktioniert

AC/DC entwickelt gleichzeitig zwei Komponenten weiter:

Modelle — durch Model-Merging-Techniken. Anstatt ein einzelnes Modell von Grund auf zu trainieren, werden mehrere bestehende Modelle zusammengeführt (durch verschiedene Gewichtskombinationen) und die resultierende Population wird getestet.

Aufgaben — durch synthetische Datengenerierung. Jede Aufgabe entwickelt sich selbst weiter — neue, komplexere, nuanciertere Variationen alter Aufgaben werden generiert, und die gesamte Aufgabenpopulation drängt Modelle in neue Nischen.

Der Schlüssel ist, dass die beiden Prozesse miteinander verbunden sind. Modelle konkurrieren auf synthetischen Aufgaben. Aufgaben passen sich so an, dass manche Modelle dort erfolgreich sind, wo andere scheitern. Und so weiter, ohne Ende — ohne manuelle Eingriffe.

Ergebnisse

Die Autoren berichten mehrere bedeutsame Erkenntnisse:

Entdeckte Populationen demonstrieren breitere Expertise-Abdeckung als manuell kuratierte Modelle
Modelle übertreffen größere Pendants bei geringerem GPU-Speicher
Kontinuierliche Innovation sowohl im Aufgabendesign als auch in den Modellfähigkeiten gezeigt
Verbesserte Leistung in Multi-Agent Best-of-N-Auswahlszenarien

Es ist wichtig zu beachten, was nicht in den Ergebnissen enthalten ist — es gibt keine Behauptungen über Dominanz bei spezifischen Benchmarks. Die Autoren zielen explizit nicht auf SOTA ab. Stattdessen zeigen sie, dass die AC/DC-Modellpopulation eine reichere funktionale Vielfalt aufweist.

Neues Entwicklungsparadigma

Die Autoren positionieren AC/DC als „ein grundlegend neues Paradigma der LLM-Entwicklung”. Anstatt des Zyklus:

Anwendungsfall identifizieren
Daten kuratieren
Training starten
Evaluieren
Iterieren

Ergibt sich:

Framework starten
Es Nischen selbst entdecken lassen

Das ist eine mutige Positionierung. Es bleibt die Frage, wie robust das in der Praxis für Enterprise ist — Open-Endedness klingt romantisch, aber Produktionsteams brauchen typischerweise Vorhersagbarkeit.

ICLR-2026-Kontext

AC/DC ist eines von mehreren Papieren aus dem Jahr 2026, die aus derselben Forschungstradition stammen — Forschung zur automatischen Entdeckung von KI-Fähigkeiten durch Evolution. Eine verwandte Forschungslinie verbindet sich mit früheren „Novelty Search”-Ansätzen aus dem evolutionären Rechnen, adaptiert für KI.

Die Autoren nennen keine spezifischen Unternehmen oder Enterprise-Deployments, was signalisiert, dass dies in erster Linie ein Forschungspapier in einer Pre-Produktionsphase ist. Dennoch ist das Framework faszinierend, weil es den Weg zu KI-Systemen öffnet, die den Raum möglicher Expertise selbst erkunden — ohne dass Ingenieure im Voraus definieren müssen, was sie erhalten möchten.

Für diejenigen, die langfristige KI-Entwicklungstrends verfolgen, ist AC/DC ein bedeutsamer Datenpunkt. Für aktuelle Produktionssysteme — fast sicher nicht direkt anwendbar, aber es stellt eine Richtung dar, in die sich das Feld in den nächsten Jahren bewegen könnte.