GitHub: Copilot HyDRA-Router wählt Modell automatisch und liefert 72,5 % Ersparnis bei gleicher Qualität
GitHub stellte HyDRA vor, ein Modell-Routing-System, das für Copilot automatisch das KI-Modell nach Tiefe des Reasonings, Codekomplexität und Werkzeugorchestrierungsbedarf auswählt. HyDRA liefert 72,5 % Kosteneinsparung bei gleichbleibender Qualität; im konservativen Modus 70,8 % Lösungsrate bei 3,3-facher Ersparnis gegenüber OpenRouter Auto. Es ergänzt Prompt-Caching und Tool Search, mit Routing-Genauigkeit innerhalb von 4 Prozentpunkten der englischen Basis in 19 Sprachen.
Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.
GitHub beschrieb HyDRA, ein Modell-Routing-System, das Copilot ermöglicht, für jede Aufgabe automatisch das am besten geeignete KI-Modell auszuwählen und so Kosten zu senken, ohne Qualität einzubüßen.
Routing nach Aufgabenkomplexität
HyDRA ist ein Modell-Router, der das KI-Modell nach vier Kriterien auswählt: Reasoning-Tiefe, Codekomplexität, Debugging-Schwierigkeit und Anforderungen an die Werkzeugorchestrierung. Anstatt jede Anfrage an dasselbe große Modell zu leiten, erhalten einfache Aufgaben ein günstigeres Modell, während komplexe ein leistungsfähigeres bekommen. Damit wird vermieden, teure Reasoning-Kapazität für triviale Anfragen zu verbrauchen.
Messbare Einsparungen gegenüber der Konkurrenz
GitHub gibt 72,5 % Kosteneinsparung bei gleichbleibender Qualität an. Im konservativen Modus erreicht HyDRA eine 70,8 % Aufgabenlösungsrate bei 3,3-fach niedrigeren Kosten als OpenRouter Auto. Ergänzt wird dies durch Prompt-Caching, das den Modellzustand für wiederholte Präfixe wiederverwendet und redundante Verarbeitung reduziert, sowie durch Tool Search, das Werkzeugdefinitionen bei Bedarf abruft, anstatt alle vorab zu laden.
Wie verhält es sich in anderen Sprachen?
Die Routing-Genauigkeit bleibt in 19 Sprachen und 16 Sprachfamilien innerhalb von 4 Prozentpunkten der englischen Basis, sodass mehrsprachige Nutzer keine Einbußen bei der Modellauswahl erfahren. Der Auto-Modus aktiviert sich nur an natürlichen Cache-Grenzen (erster Zug oder nach Kompaktierung), um die Cache-Effizienz zu wahren.
Häufig gestellte Fragen
- Was ist HyDRA?
- Ein Modell-Routing-System, das für Copilot automatisch das KI-Modell nach Reasoning-Tiefe, Codekomplexität und Werkzeugbedarf auswählt.
- Wie viel spart HyDRA?
- 72,5 % Kosteneinsparung bei gleichbleibender Qualität; im konservativen Modus 70,8 % Lösungsrate mit 3,3-facher Ersparnis gegenüber OpenRouter Auto.
Verwandte Nachrichten
Google: AMIE erreicht in Nature-Studie das Niveau von Hausärzten im Krankheitsmanagement
OpenAI: Fast autonomer KI-Chemiker auf GPT-5.4-Basis verbessert Reaktion in der Wirkstoffsynthese
arXiv:2606.17930: Benchmark-Ergebnisse sind protokollabhängig — Inferenz-Compute verändert das Ranking von Frontier-Modellen