Glossar
Glossar
KI-Terminologie, prägnant definiert.
73 Begriffe
A
- A2A-Protokoll (Agent2Agent) Von Google 2025 vorgestelltes offenes Protokoll für Interoperabilität und Kommunikation zwischen KI-Agenten unterschiedlicher Frameworks und verschiedener Anbieter.
- Agenten-Orchestrierung Koordination mehrerer KI-Agenten, Werkzeuge und Schritte zu einem Workflow — über Planer, Router und Frameworks wie LangGraph — für zuverlässigere Ergebnisse.
- Agentische KI KI-Systeme, die mehrstufige Aufgaben autonom mit Werkzeugen, Speicher und Schleifen planen und ausführen — über eine einzelne Chat-Antwort hinaus.
- AI Act Artikel 50 (Transparenz) Artikel 50 des EU AI Act regelt Transparenzpflichten — Chatbots, Deepfakes und KI-generierte Inhalte müssen klar gekennzeichnet sein; Geltung ab August 2026.
- Allgemeine Künstliche Intelligenz Hypothetische KI, die menschliche Fähigkeiten in praktisch allen kognitiven Aufgaben erreicht oder übertrifft – im Gegensatz zur heutigen engen, aufgabenspezifischen KI.
- Aufmerksamkeitsmechanismus (attention) Eine Technik neuronaler Netze, die es einem Modell erlaubt, die Wichtigkeit jedes Eingabetokens relativ zu anderen zu gewichten — der Kern moderner Transformer.
B
- Benchmark Standardisierter Test oder Datensatz, der die Fähigkeit eines KI-Modells misst und vergleicht — etwa MMLU, GPQA, SWE-bench, HumanEval und MMMU.
- Bestärkendes Lernen (Reinforcement Learning) Ein Trainingsparadigma, bei dem ein Agent durch Interaktion mit einer Umgebung Entscheidungen lernt, gesteuert durch Belohnungssignale; Grundlage von RLHF und Reasoning-Modellen.
C
- Chatbot Ein Software-Agent, der über Text oder Sprache ein Gespräch mit Nutzern führt; moderne Chatbots werden von großen Sprachmodellen und Werkzeugen angetrieben.
- Claude Anthropics Familie großer Sprachmodelle mit Fokus auf Sicherheit, langen Kontext und Werkzeugnutzung — treibt Claude.ai und den Claude-Code-Agenten an.
- Constitutional AI Anthropics Methode zum Alignment von Modellen mittels eines schriftlichen Prinzipiensatzes (einer Verfassung) plus KI-Feedback (RLAIF) statt menschlicher Schädlichkeitslabels.
D
- Deep Learning Teilgebiet des Machine Learnings mit mehrschichtigen neuronalen Netzen zum Lernen komplexer Muster — treibt heutige Vision-, Sprach- und Sprachmodell-KI an.
- Deepfake Synthetische Medien — gefälschte Videos, Audios oder Bilder einer Person mittels Deep Learning; ein zentrales Desinformations-, Betrugs- und Sicherheitsthema 2025-2026.
- Diffusionsmodell Generative Modelle, die lernen, schrittweises Rauschen rückgängig zu machen — der heute dominierende Ansatz für KI-generierte Bilder, Videos und Audio.
E
- Embedding (Vektorrepräsentation) Eine Vektorrepräsentation eines Wortes, Satzes oder Dokuments in einem hochdimensionalen Raum, in dem semantisch ähnliche Bedeutungen nahe beieinander liegen.
- Emergente Fähigkeiten Fähigkeiten, die kleineren Modellen fehlen und mit der Skalierung abrupt auftreten; umstritten — Kritiker führen die Sprünge auf nichtlineare Metriken zurück.
- EU AI Act (KI-Verordnung der EU) EU-Verordnung zur Regulierung von KI nach Risikoklassen (inakzeptabel, hoch, begrenzt, minimal); das weltweit erste umfassende KI-Gesetz, in Kraft 2024–2027.
F
- Fine-Tuning Weiteres Training eines vortrainierten LLMs auf einem kleineren Datensatz, um es auf eine bestimmte Aufgabe, Domäne oder einen Ausgabestil zu spezialisieren.
- Foundation Model Großes, auf breiten Daten trainiertes Modell, das sich für viele Aufgaben anpassen lässt; Stanford-CRFM-Begriff für LLMs, Vision- und multimodale Modelle.
- Frontier-Modell Die größten und leistungsfähigsten universellen KI-Modelle an der Spitze des Machbaren (GPT-5, Claude Opus, Gemini); Mittelpunkt der Debatten über Frontier-Sicherheit und Regulierung.
- Function Calling Ein strukturierter Mechanismus, mit dem ein großes Sprachmodell statt Text einen Aufruf einer entwicklerdefinierten Funktion samt Argumenten zurückgibt, den die Anwendung ausführt.
G
- Gedankenkette (Chain-of-Thought) Eine Technik, bei der ein Sprachmodell vor der finalen Antwort eine Reihe von Zwischenschritten ausformuliert und so die Genauigkeit bei komplexen, mehrstufigen Aufgaben deutlich steigert.
- Generative Pretrained Transformer (GPT) Decoder-Only-Transformer-Sprachmodelle, vortrainiert auf riesigen Textmengen und für Anweisungen feinabgestimmt — die Architektur hinter ChatGPT und Co.
- Google Gemini Multimodale Foundation Models von Google DeepMind, die Text, Bilder, Audio und Video verarbeiten — treiben die Gemini-App, Workspace und Vertex AI an.
- GPAI (KI mit allgemeinem Verwendungszweck) Kategorie der EU-KI-Verordnung für KI-Modelle mit allgemeinem Verwendungszweck (GPT, Claude, Gemini); Dokumentations- und Transparenzpflichten ab August 2025.
- Grafikprozessor (GPU) Grafikprozessor mit Tausenden parallelen Kernen — heute die wichtigste Hardware für Training und Inferenz von KI-Modellen, dominant NVIDIA H100/B200.
- Großes Sprachmodell (LLM) Neuronales Netzwerk, auf Milliarden Wörtern trainiert, das Sprache vorhersagt und generiert; Grundlage moderner KI-Assistenten wie ChatGPT, Claude und Gemini.
- Guardrails (Schutzplanken) Sicherheitskontrollen und Filter, die Ein- und Ausgaben eines KI-Modells begrenzen — Inhaltsklassifikatoren, Richtlinienfilter und Angriffsdetektoren rund um das Modell.
H
I
- In-Context-Lernen (In-Context Learning) Die Fähigkeit eines Sprachmodells, eine neue Aufgabe aus Beispielen im Prompt zu erlernen — ohne Gewichtsaktualisierungen, per Few-Shot oder Zero-Shot.
- Inferenz (Modell-Ausführung) Phase, in der ein trainiertes Modell Ausgaben für neue Eingaben erzeugt; verbraucht GPU-/TPU-Ressourcen und bestimmt Kosten, Latenz und Durchsatz von KI.
- Interpretierbarkeit (interpretability) Ein Forschungsfeld, das die internen Mechanismen von KI-Modellen — Features und Circuits — verstehen will, um zu erklären, warum ein Modell eine bestimmte Ausgabe erzeugt.
J
K
- KI-Agent LLM-gesteuertes System, das Ziele autonom durch Planung, Werkzeugaufrufe und Iteration verfolgt — bis die Aufgabe vollständig abgeschlossen ist.
- KI-Alignment (AI alignment) Ein Forschungsfeld, das sicherstellen will, dass KI-Systeme menschlichen Absichten, Werten und Sicherheitszielen folgen — und nicht unerwünschten Ausgängen.
- KI-Beschleuniger (NPU/TPU) Spezialisierter Chip für KI-Workloads — NPUs in Smartphones, Googles TPU, AWS Trainium — oft schneller und pro Dollar effizienter als eine GPU.
- KI-Evaluierung Die Disziplin, Fähigkeit, Sicherheit und Alignment von KI-Modellen über Benchmarks, menschliche Bewertung und Red-Teaming vor und nach dem Release zu messen.
- KI-Sicherheit (AI safety) Breites Feld zu technischen, organisatorischen und politischen Risiken von KI — von Fehlern und Missbrauch bis zu langfristigen existenziellen Bedenken.
- Knowledge Distillation Kompressionstechnik, bei der ein Student-Modell die Ausgaben eines größeren Teacher-Modells nachahmt, um die Größe bei erhaltener Genauigkeit zu reduzieren.
- Kontextfenster Maximale Anzahl Tokens, die ein LLM gleichzeitig berücksichtigen kann — Prompt, Dokumente und Antwort; reicht heute von 8K bis 2 Millionen Tokens.
- KV-Cache Zwischengespeicherte Key-/Value-Tensoren der Attention, die über Dekodierschritte hinweg wiederverwendet werden, um die LLM-Inferenz zu beschleunigen.
L
- Llama (Meta) Eine Open-Weight-Familie großer Sprachmodelle von Meta, in der Open-Source-Community weit verbreitet für Fine-Tuning und lokalen Einsatz.
- LoRA Parameter-effizientes Fine-Tuning-Verfahren, das die Gewichte des Basismodells einfriert und statt aller Parameter kleine Low-Rank-Adaptermatrizen trainiert.
M
- Mixture of Experts (MoE) Netzwerkarchitektur, die je Eingabe nur wenige Experten aktiviert und dadurch die Kapazität sehr großer Modelle zu einem Bruchteil der Inferenzkosten liefert.
- Model Context Protocol (MCP) Offenes Anthropic-Protokoll (2024), das KI-Assistenten standardisiert an externe Werkzeuge und Datenquellen anbindet — analog zu USB-C für physische Ports.
- Multi-Agenten-System KI-Architektur, in der mehrere spezialisierte Agenten zusammenarbeiten, delegieren oder konkurrieren — zuverlässiger als ein einzelnes monolithisches Modell.
- Multimodales Modell Ein KI-System, das in einem Modell mehrere Modalitäten — Text, Bilder, Audio, Video — verarbeitet und/oder erzeugt, statt auf eine Datenart beschränkt zu sein.
N
O
P
- Prompt Engineering Sprachmodell-Anfragen so gestalten, dass sie zuverlässig das gewünschte Ergebnis liefern — umfasst Wortwahl, Struktur, Beispiele und System-Prompts.
- Prompt Injection Angriff, bei dem eingeschleuster Text ein LLM dazu bringt, Angreifer- statt Entwickleranweisungen zu folgen; Platz 1 in der OWASP Top 10 für LLM-Anwendungen.
Q
R
- Reasoning-Modell LLM, das vor der Antwort eine lange Gedankenkette erzeugt und so Inferenzzeit gegen höhere Genauigkeit bei Mathematik, Code und komplexen Logikaufgaben tauscht.
- Red Team Strukturiertes Testen von KI-Systemen mit Angriffsmethoden — Prompt Injection, Jailbreak, Missbrauch — um Schwachstellen vor dem Produktiveinsatz aufzudecken.
- Reinforcement Learning from Human Feedback (RLHF) Eine Trainingsmethode, bei der menschliche Bewerter Modellantworten ranken und diese Rankings genutzt werden, um ein LLM hilfreich und sicher zu machen.
- Reranking Ein zweiter Retrieval-Schritt, der abgerufene Kandidaten nach Relevanz neu ordnet, meist per Cross-Encoder, um RAG- und Suchergebnisse zu schärfen.
- Retrieval-Augmented Generation (RAG) Retrieval-System plus LLM: relevante Dokumente werden vor der Antwort aus einer Wissensquelle abgerufen und als Kontext eingefügt, um Ausgaben zu verankern.
S
- Selbstüberwachtes Lernen Trainingsansatz, bei dem ein Modell aus ungelabelten Daten lernt, indem es sich eigene Ziele schafft, z. B. durch Vorhersage maskierter Tokens in einem Satz.
- Skalierungsgesetze Empirische Potenzgesetze, die Modellgröße, Trainingsdaten und Rechenleistung mit der Leistung verknüpfen; Grundlage für die Planung des Trainings großer Modelle.
- Spekulatives Dekodieren Eine Inferenzbeschleunigung, bei der ein kleines Entwurfsmodell mehrere Token vorschlägt, die das große Modell parallel prüft – bei identischer Ausgabe.
- Stable Diffusion 2022 von Stability AI veröffentlichtes latentes Diffusionsmodell mit offenen Gewichten — der erste breit verfügbare Text-zu-Bild-Generator für Consumer-GPUs.
- Sycophancy (Speichelleckerei) Die Neigung eines KI-Modells, dem Nutzer zuzustimmen und zu schmeicheln — ihm zu sagen, was er hören will, statt was zutreffend oder begründet ist.
- Synthetische Daten Künstlich erzeugte Daten — aus einem Modell oder einer Simulation — zum Ergänzen oder Ersetzen menschlicher Daten beim Training und der Evaluierung von KI-Modellen.
- System-Prompt Anfängliche Anweisungen, Persona und Richtlinien, die einen Assistenten durch das Gespräch steuern — getrennt von Nutzernachrichten und höher priorisiert.
T
- Test-Time Compute (Rechenaufwand zur Inferenzzeit) Mehr Rechenaufwand während der Inferenz — das Modell „denkt” länger vor der Antwort —, um die Genauigkeit zu steigern; Grundlage moderner Reasoning-Modelle.
- Tokenisierung Zerlegung von Text in kleinere Einheiten (Tokens) — Wörter, Subwörter oder Zeichen —, die ein Sprachmodell verarbeiten und in Zahlen umwandeln kann.
- TPU (Tensor Processing Unit) Eine TPU ist Googles maßgeschneiderter ASIC-Chip zur Beschleunigung des maschinellen Lernens, optimiert für die Matrixoperationen neuronaler Netze.
- Transformer Die 2017 vorgestellte neuronale Netzwerkarchitektur, die heute praktisch jedes moderne große Sprachmodell antreibt. Basiert auf dem Self-Attention-Mechanismus.
V
- Vektordatenbank Eine spezialisierte Datenbank, die Vektor-Embeddings speichert und mittels semantischer Ähnlichkeit durchsucht — die Grundlage moderner RAG-Systeme.
- Vision-Language-Modell KI-Modell, gemeinsam auf Bildern und Text trainiert, das ein Bild „sehen” und darüber sprachlich schlussfolgern kann — Basis der Vision in GPT-4o, Claude, Gemini.
W
- Wasserzeichen (KI) Einbettung verborgener, maschinenlesbarer Signale in KI-generierten Text, Bilder oder Audio zum Nachweis der Herkunft — etwa Googles SynthID.
- Weltmodell Eine gelernte interne Repräsentation der Umgebungsdynamik, mit der ein KI-System künftige Zustände vorhersagt und Aktionen plant — ohne ständiges Ausprobieren in der realen Welt.
- Werkzeugnutzung Die Fähigkeit eines Sprachmodells, externe Werkzeuge, Funktionen und APIs aufzurufen und so über reine Textgenerierung hinaus zu handeln — Basis von KI-Agenten.