🤖 24 AI
🟢 🤖 Modelle Samstag, 18. April 2026 · 3 Min. Lesezeit

ArXiv AC/DC: automatische Entdeckung spezialisierter LLMs durch Koevolution von Modellen und Aufgaben

Warum es wichtig ist

AC/DC ist ein neues Framework, das auf ICLR 2026 vorgestellt wurde und gleichzeitig LLM-Modelle durch Model Merging und Aufgaben durch synthetische Daten weiterentwickelt. Entdeckte Modellpopulationen demonstrieren eine breitere Expertise-Abdeckung als manuell kuratierte Modelle ohne explizite Benchmark-Optimierung. Modelle übertreffen größere Pendants bei geringerem GPU-Speicher, was ein neues Paradigma in der kontinuierlichen LLM-Entwicklung darstellt.

Ein Team aus Autoren — Andrew Dai, Boris Meinardus, Ciaran Regan, Yingtao Tian und Yujin Tang — hat ein neues Framework namens AC/DC unter dem vollständigen Namen “Discovering Novel LLM Experts via Task-Capability Coevolution” veröffentlicht. Das Paper wurde auf der ICLR 2026 angenommen und stellt einen neuen Ansatz zur LLM-Entwicklung dar, der den klassischen Ansatz separater Trainingsläufe vollständig aufgibt.

Das Problem, das es löst

Traditionell muss ein Team, das die Fähigkeiten eines LLM erweitern möchte, für jede neue Domäne einen neuen separaten Trainingslauf starten. Möchten Sie einen medizinischen Experten? Separater Lauf. Rechtliches Modell? Noch einer. Finanziell? Ein dritter. Jeder erfordert Hyperparameter, Daten, Evaluierung, Regressionstests.

AC/DC eliminiert diese manuelle Gruppe von Eingriffen. Die Autoren behaupten, dass „Open-Endedness — durch Koevolution von Modellen und Aufgaben — Modelle mit immer neuartigen Fähigkeiten in einem einzigen Lauf entdecken kann”.

Wie das Framework funktioniert

AC/DC entwickelt gleichzeitig zwei Komponenten weiter:

Modelle — durch Model-Merging-Techniken. Anstatt ein einzelnes Modell von Grund auf zu trainieren, werden mehrere bestehende Modelle zusammengeführt (durch verschiedene Gewichtskombinationen) und die resultierende Population wird getestet.

Aufgaben — durch synthetische Datengenerierung. Jede Aufgabe entwickelt sich selbst weiter — neue, komplexere, nuanciertere Variationen alter Aufgaben werden generiert, und die gesamte Aufgabenpopulation drängt Modelle in neue Nischen.

Der Schlüssel ist, dass die beiden Prozesse miteinander verbunden sind. Modelle konkurrieren auf synthetischen Aufgaben. Aufgaben passen sich so an, dass manche Modelle dort erfolgreich sind, wo andere scheitern. Und so weiter, ohne Ende — ohne manuelle Eingriffe.

Ergebnisse

Die Autoren berichten mehrere bedeutsame Erkenntnisse:

  • Entdeckte Populationen demonstrieren breitere Expertise-Abdeckung als manuell kuratierte Modelle
  • Modelle übertreffen größere Pendants bei geringerem GPU-Speicher
  • Kontinuierliche Innovation sowohl im Aufgabendesign als auch in den Modellfähigkeiten gezeigt
  • Verbesserte Leistung in Multi-Agent Best-of-N-Auswahlszenarien

Es ist wichtig zu beachten, was nicht in den Ergebnissen enthalten ist — es gibt keine Behauptungen über Dominanz bei spezifischen Benchmarks. Die Autoren zielen explizit nicht auf SOTA ab. Stattdessen zeigen sie, dass die AC/DC-Modellpopulation eine reichere funktionale Vielfalt aufweist.

Neues Entwicklungsparadigma

Die Autoren positionieren AC/DC als „ein grundlegend neues Paradigma der LLM-Entwicklung”. Anstatt des Zyklus:

  1. Anwendungsfall identifizieren
  2. Daten kuratieren
  3. Training starten
  4. Evaluieren
  5. Iterieren

Ergibt sich:

  1. Framework starten
  2. Es Nischen selbst entdecken lassen

Das ist eine mutige Positionierung. Es bleibt die Frage, wie robust das in der Praxis für Enterprise ist — Open-Endedness klingt romantisch, aber Produktionsteams brauchen typischerweise Vorhersagbarkeit.

ICLR-2026-Kontext

AC/DC ist eines von mehreren Papieren aus dem Jahr 2026, die aus derselben Forschungstradition stammen — Forschung zur automatischen Entdeckung von KI-Fähigkeiten durch Evolution. Eine verwandte Forschungslinie verbindet sich mit früheren „Novelty Search”-Ansätzen aus dem evolutionären Rechnen, adaptiert für KI.

Die Autoren nennen keine spezifischen Unternehmen oder Enterprise-Deployments, was signalisiert, dass dies in erster Linie ein Forschungspapier in einer Pre-Produktionsphase ist. Dennoch ist das Framework faszinierend, weil es den Weg zu KI-Systemen öffnet, die den Raum möglicher Expertise selbst erkunden — ohne dass Ingenieure im Voraus definieren müssen, was sie erhalten möchten.

Für diejenigen, die langfristige KI-Entwicklungstrends verfolgen, ist AC/DC ein bedeutsamer Datenpunkt. Für aktuelle Produktionssysteme — fast sicher nicht direkt anwendbar, aber es stellt eine Richtung dar, in die sich das Feld in den nächsten Jahren bewegen könnte.

🤖

Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.