arXiv:2605.06635: LLM-Agenten zitieren, aber verifizieren nicht — Links 94 %+ gültig, Genauigkeit nur 39–77 %
Neue Forschung testete 14 LLM-Modelle in Deep-Research-Aufgaben und deckte eine große Lücke auf: Links sind in 94 %+ der Fälle gültig, aber die faktische Genauigkeit der Zitate beträgt nur 39–77 %. Der Kernbefund: Die Zitiergenauigkeit sinkt um 42 %, wenn die Zahl der Tools von 2 auf 150 steigt — was die Annahme widerlegt, dass mehr Abrufe bessere Qualität bedeuten.