Cliff-Token: Wie ein Token das LLM scheitern lässt

Cliff-Token sind einzelne Token im LLM-Ausgabestrom, an denen die Wahrscheinlichkeit erfolgreichen mathematischen Schlussfolgerns abrupt sinkt. Forscher entwickelten eine Erkennungsmethode und zeigten: Das Entfernen des ersten Cliff-Tokens bringt die Genauigkeit nahezu auf ein perfektes Niveau; Cliff-DPO-Training liefert +6,6 Prozentpunkte.

Was sind Cliff-Token?

Ein Cliff-Token — wörtlich ein Klippen-Token — ist ein einzelner Token in der Chain-of-Thought-Ausgabe eines Sprachmodells (einer Reihe von Zwischenschritten, die das Modell zur Aufgabenlösung verwendet), an dem die Wahrscheinlichkeit eines erfolgreichen korrekten Ergebnisses abrupt sinkt. Die Forscher Jaeyong Ko, Pilsung Kang und Yukyung Lee haben diese kritischen Punkte durch statistische Analyse identifiziert: mittels eines Zweistichproben-z-Tests, der den Anteil korrekter Antworten vor und nach jedem einzelnen Token in der Sequenz vergleicht.

Warum ist ein einzelner Token so entscheidend?

Die Studie umfasste 7 Modelle und 3 mathematische Benchmarks — GSM1K, MATH500 und AIME 2025. Die Ergebnisse sind überraschend: Das Entfernen nur des ersten Cliff-Tokens und erneutes Sampling bringt pass@64 (den Anteil korrekter Antworten in 64 Versuchen) auf 1,0, verglichen mit ursprünglichen 0,71–1,00 je nach Modell. Der Unterschied ist nicht vernachlässigbar — es ist der Wechsel von unsicherem Schlussfolgern in eine vollständig zuverlässige Zone.

Taxonomie und Anwendung

Die Autoren unterscheiden drei Typen von Cliff-Token: deterministische (der Fehler ist unvermeidlich), unsichere (das Modell zögert) und zufällig-verfehlte (sampled-off). Wichtigste Erkenntnis: Die Optimierung auf unsichere und zufällig-verfehlte Cliff-Token verbessert das Schlussfolgern, während deterministische nicht auf Training reagieren. Darauf basiert Cliff-DPO — eine Methode des präferenziellen Trainings, die +6,6 Prozentpunkte Genauigkeit auf dem GSM8K-Datensatz erzielt, eine konkrete Verbesserung ohne Architekturänderung.

Häufig gestellte Fragen

Was ist ein Cliff-Token und warum ist er wichtig?

Ein Cliff-Token ist ein einzelner Token in der Chain-of-Thought-Ausgabe eines Modells, an dem die Wahrscheinlichkeit eines korrekten Abschlusses abrupt sinkt — wie ein Klippenrand. Die Identifizierung dieser Punkte legt präzise Fehlermechanismen im mathematischen Schlussfolgern offen.

Wie verbessert Cliff-DPO die Modellgenauigkeit?

Cliff-DPO ist eine Methode des präferenziellen Optimierens, die das Modell auf Beispielen mit und ohne Cliff-Token trainiert; das Ergebnis ist eine Genauigkeitsverbesserung von bis zu +6,6 Prozentpunkten auf dem GSM8K-Datensatz.

arXiv:2606.25524: Cliff-Token — einzelne Token, die mathematisches Schlussfolgern zum Scheitern bringen

Was sind Cliff-Token?

Warum ist ein einzelner Token so entscheidend?

Taxonomie und Anwendung

Häufig gestellte Fragen

Quellen

Verwandte Nachrichten