Chatbots, Codierungsassistenten, Zusammenfasser — fast jedes KI-Tool, das Sie kürzlich verwendet haben, wird von einem LLM angetrieben. Der Begriff ist überall im Jahr 2026, wird aber selten klar erklärt. Dieser Leitfaden beantwortet es einfach: was ein großes Sprachmodell ist, wie es tatsächlich funktioniert, wofür es wirklich gut ist und — genauso wichtig — was es nicht kann.
Was ein LLM ist
Ein LLM (großes Sprachmodell) ist ein neuronales Netzwerk, das auf enormen Mengen an Text trainiert wird, um menschliche Sprache zu verstehen und zu generieren. Seine Hauptaufgabe ist täuschend einfach: das nächste Token vorherzusagen (ein Wort oder Wortteil) basierend auf allem, was davor kommt. Wiederholen Sie das immer wieder und Sie erhalten kohärente Antworten, Aufsätze, Übersetzungen und Code.
„Groß“ bezieht sich sowohl auf die Trainingsdaten (ein Großteil des öffentlichen Webs und mehr) als auch auf die Parameter — oft Milliarden interner Werte, die speichern, was das Modell gelernt hat. ChatGPT, Claude, Gemini und Llama sind alle LLMs.
Wie es funktioniert
Fast jedes moderne LLM verwendet die Transformer-Architektur. Das Training erfolgt in Phasen:
- Vortraining — das Modell liest riesige Texte und lernt Muster, indem es wiederholt das nächste Token vorhersagt und sich korrigiert, wenn es falsch liegt. Hier bildet sich der Großteil seines Wissens.
- Feinabstimmung & RLHF — es wird dann mit kuratierten Beispielen und menschlichem Feedback verfeinert, um hilfreicher zu sein, Anweisungen zu befolgen und schädliche Ausgaben zu vermeiden.
Bei der Inferenz (wenn Sie es verwenden) geben Sie eine Eingabeaufforderung und es generiert eine Antwort ein Token nach dem anderen, jedes ausgewählt aus den Wahrscheinlichkeiten, die es gelernt hat. Entscheidend ist, dass es nicht nachschaut — es sagt plausiblen Text aus Mustern vorher.
Tokens und Parameter
- Tokens — die Einheit des Textes, die ein LLM liest und schreibt, ungefähr ein Wort oder Wortteil. Grenzen wie das Kontextfenster werden in Tokens gemessen.
- Parameter — die Milliarden interner Gewichte, die während des Trainings angepasst werden, um das zu speichern, was das Modell gelernt hat.
Mehr Parameter und Daten können mehr Fähigkeiten bedeuten, aber Architektur, Datenqualität und Feinabstimmung sind genauso wichtig wie die rohe Größe.
Was LLMs können und nicht können
Stark bei: Entwurf und Zusammenfassung, Beantwortung von Fragen, Übersetzung, Erklärung und Schreiben und Debuggen von Code.
Echte Grenzen:
- Halluzination — sie können falsche Dinge selbstbewusst behaupten. Sie sagen plausiblen Text vorher, was nicht dasselbe ist wie korrekt.
- Wissensgrenze — sie wissen nicht von Natur aus über aktuelle Ereignisse.
- Kein echtes Verständnis — keine Überzeugungen oder Verankerung, nur gelernte Muster.
- Voreingenommenheit — sie können Vorurteile in ihren Trainingsdaten widerspiegeln.
Die Lösung für Fakten und Aktualität besteht darin, ihnen echte Quellen zur Antwortzeit zu geben — genau das macht RAG (retrieval-augmented generation).
LLM vs KI
KI ist das breite Feld; ein LLM ist eine prominente Art von KI, die auf Sprache spezialisiert ist. Jedes LLM ist KI, aber Bildgeneratoren, Empfehlungsdienste und Spielagenten sind auch KI, die anders aufgebaut sind. „KI“ bedeutet heute oft einen LLM-Chatbot — aber die Begriffe sind nicht austauschbar.
Ausführen und Auswählen eines
Sie können offene LLMs privat auf Ihrem eigenen Rechner mit Ollama ausführen, und speziell für die Entwicklung sehen Sie unseren Leitfaden zu den besten Codierungs-LLMs. Die gleichen Grundlagen — Tokens, Parameter, Vorhersage des nächsten Tokens — gelten, unabhängig davon, ob das Modell in der Cloud oder auf Ihrem Laptop läuft.
Das Fazit
Ein LLM ist ein neuronales Netzwerk, das Sprache generiert, indem es das nächste Token vorhersagt, trainiert auf riesigen Texten und verfeinert mit menschlichem Feedback. Es ist bemerkenswert fähig in Sprache und Code und wirklich begrenzt durch Halluzination, eine Wissensgrenze und das Fehlen eines echten Verständnisses. Verwenden Sie es für das, wofür es gut ist, überprüfen Sie, was wichtig ist, und fügen Sie Abruf hinzu, wenn Sie aktuelle, fundierte Fakten benötigen.


