Glossar: die wichtigsten KI-Begriffe

Von LLM, Token und RAG über Agent und MCP bis zur EU-KI-Verordnung — die wichtigsten KI-Begriffe in einfachen Worten erklärt, ohne Fachchinesisch.

Ein Nachschlagewerk für die Begriffe, die in fast jedem KI-Gespräch fallen — vom Vertriebstermin bis zur IT-Runde. Bewusst knapp und alltagsnah: Jeder Eintrag sagt nicht nur, was es ist, sondern warum es dich betrifft.

Die Bausteine

LLM (Large Language Model) – Ein Sprachmodell, das auf riesigen Textmengen trainiert wurde und daraus Sprache fortsetzt. Es „versteht” nichts im menschlichen Sinn — es sagt das jeweils wahrscheinlichste nächste Wort vorher. Diese Mechanik erklärt zugleich die Stärke und die Schwäche (siehe Halluzination).

Token – Die kleinste Texteinheit, mit der ein Modell rechnet, grob ein halbes bis ganzes Wort. Preise und Limits werden meist in Tokens gemessen, nicht in Zeichen.

Kontextfenster (Context Window) – Wie viel Text das Modell auf einmal „sehen” kann: deine Frage, die mitgelieferten Dokumente und die Antwort zusammen. Ist es voll, fällt Älteres hinten raus. Deshalb kannst du nicht einfach 500 Seiten reinkippen und erwarten, dass alles berücksichtigt wird.

Embedding (Vektor) – Text in Zahlen übersetzt, sodass inhaltlich Ähnliches nah beieinanderliegt. Die Grundlage dafür, dass ein Archiv nach Bedeutung durchsucht werden kann und nicht nur nach exakten Stichwörtern.

Vektordatenbank – Der Speicher, in dem diese Zahlen-Repräsentationen liegen. Das technische Herz hinter einem „durchsuchbaren Archiv” (siehe RAG).

Multimodal – Ein Modell, das nicht nur Text versteht, sondern auch Bilder, PDFs oder Audio. Macht Dinge wie das Auslesen eines abfotografierten Belegs oder eine grobe Einschätzung aus einem Foto erst möglich.

Reasoning-Modell („Denken”) – Ein Modell, das vor der Antwort in Zwischenschritten nachdenkt, statt sofort loszuschreiben. Stärker bei mehrstufigen Aufgaben, dafür langsamer und teurer — nicht für jede Frage nötig.

Wie man mit Modellen arbeitet

Prompt – Die Anweisung, die du dem Modell gibst. Je klarer und konkreter, desto besser das Ergebnis.

System-Prompt – Die feste Grundanweisung im Hintergrund, die Rolle, Ton und Grenzen vorgibt — der „Charakter”, den ein Assistent bei jeder Anfrage mitbekommt.

Prompt Engineering – Das Handwerk, Prompts so zu formulieren, dass verlässlich brauchbare Ergebnisse herauskommen: mit Beispielen, klaren Regeln und einem festen Format.

Temperatur – Ein Regler zwischen „immer die naheliegendste Antwort” und „kreativer, aber unberechenbarer”. Für Fakten niedrig, für Ideen höher.

Fine-Tuning (Feinabstimmung) – Ein Modell mit eigenen Daten nachtrainieren, damit es einen Stil oder Spezialfälle besser trifft. Aufwendig — und für „das Modell soll mein Firmenwissen kennen” meist der falsche Weg. Dafür ist RAG gedacht.

RAG (Retrieval-Augmented Generation) – Das Modell bekommt zur Beantwortung gezielt deine eigenen Dokumente mitgeliefert, statt nur aus dem Training zu schöpfen. So antwortet es auf Basis deines Firmenwissens und kann die Quelle nennen. Der gängigste Weg, KI an eigenes Wissen zu hängen.

Was KI-Systeme tun

Chatbot – Beantwortet Fragen im Dialog. Reagiert, plant aber nicht selbst.

Assistent / Copilot – Unterstützt bei einer konkreten Aufgabe (Text, Code, Tabelle). Der Mensch bleibt am Steuer.

Agent (agentisch) – Ein KI-System, das nicht nur antwortet, sondern Schritte plant und Werkzeuge benutzt: eine Datenbank abfragen, eine E-Mail vorbereiten, einen Termin anlegen. Je mehr ein Agent selbst „tut”, desto wichtiger wird die Frage, wo ein Mensch freigibt.

MCP (Model Context Protocol) – Ein offener Standard, über den ein KI-System sauber an Werkzeuge und Datenquellen angebunden wird (Kalender, Postfach, Datenbank). Erspart für jede Anbindung die Extra-Bastelei und gewinnt gerade stark an Bedeutung.

API – Die Schnittstelle, über die deine Software direkt mit einem Modell spricht, ohne Chatfenster. So werden KI-Funktionen in eigene Abläufe und Programme eingebaut.

Training vs. Inferenz – Training ist das einmalige, teure Anlernen des Modells. Inferenz ist jede einzelne Nutzung danach — und damit der laufende Kostenfaktor im Betrieb.

Qualität, Risiko, Verantwortung

Halluzination – Wenn ein Modell etwas überzeugend, aber falsch behauptet: erfundene Quellen, Zahlen, Fakten. Der Hauptgrund, warum wichtige Ausgaben immer geprüft werden.

Bias (Verzerrung) – Ein Modell übernimmt die Vorurteile der Daten, aus denen es gelernt hat, und reicht sie weiter, oft unsichtbar. Besonders heikel, wo über Menschen entschieden wird, etwa bei Bewerbungen.

Guardrails (Leitplanken) – Festgelegte Regeln, was ein System tun und sagen darf und was nicht. Sorgen dafür, dass ein Assistent im Rahmen bleibt.

Mensch in der Schleife (Human in the Loop) – Das Prinzip, dass ein Mensch an der entscheidenden Stelle prüft und freigibt, statt die KI allein handeln zu lassen. Die wichtigste Sicherung in fast jedem sinnvollen Einsatz.

Personenbezogene Daten – Sobald Namen, Kunden- oder Gesundheitsdaten ins Spiel kommen, entscheidet der Datenschutz mit, welches Werkzeug überhaupt in Frage kommt. Das klärt man vor dem ersten Upload, nicht danach.

On-Premise / lokal vs. Cloud – Wo das Modell läuft: auf eigener oder europäischer Infrastruktur oder beim Anbieter. Entscheidend, sobald sensible Daten im Spiel sind.

Open-Source- / Open-Weight-Modelle – Modelle, die man selbst betreiben kann, statt sie nur über einen Anbieter zu mieten. Relevant für Datenhoheit und Kostenkontrolle, dafür mit eigenem Betriebsaufwand.

EU-KI-Verordnung (AI Act) – Das europäische Regelwerk für KI, das je nach Risiko des Einsatzes unterschiedliche Pflichten vorsieht. Manche Anwendungen — etwa das automatische Bewerten von Bewerbern — gelten als Hochrisiko und sind streng geregelt.

Hinweis

Diese Liste wächst mit. Wenn dir ein Begriff fehlt, ist das ein guter Kandidat für einen eigenen Grundlagen-Beitrag.