KI-Halluzination
Eine KI-Halluzination ist eine überzeugend formulierte, faktisch falsche oder frei erfundene Antwort eines Sprachmodells — strukturelle Folge davon, dass LLMs Wahrscheinlichkeiten über Token raten statt aus einer Faktenbasis zu antworten. Im Maklerkontext besonders riskant bei Marktdaten, Rechtsangaben, Energiekennwerten und Kontaktdaten. Gegenmittel: Grounding, RAG und „weiß ich nicht"-Toleranz.
Auch bekannt als: KI-Halluzination · Halluzination · AI Hallucination · LLM-Halluzination · KI-Lüge · falsche KI-Antwort · Modell-Erfindung · Konfabulation · Grounding · RAG · Retrieval-Augmented Generation · Embeddings
Eine KI-Halluzination ist eine Antwort, die ein Sprachmodell mit voller Überzeugung liefert — und die faktisch falsch oder erfunden ist. Der Begriff irritiert, weil er nahelegt, das Modell wisse dass es lügt; tatsächlich ist Halluzination eine strukturelle Eigenschaft der Funktionsweise: ein Sprachmodell rät den nächsten Token aufgrund von Wahrscheinlichkeiten — wenn ihm die Faktenbasis fehlt, rät es weiter, statt anzuhalten. Im Maklerkontext kann das von harmlos (Tippfehler im Stadtteilnamen) bis gefährlich reichen (erfundene Gerichtsurteile, fingierte Marktwerte, ausgedachte Telefonnummern).
Warum entstehen Halluzinationen überhaupt?
Sprachmodelle sind keine Datenbanken. Sie sind statistische Modelle über die Reihenfolge von Wörtern. Wenn das Modell gefragt wird „Wie hoch war der durchschnittliche Quadratmeterpreis in Köln-Lindenthal 2024?" und in seinen Trainingsdaten dazu nichts steht, hat es zwei Optionen: „Ich weiß es nicht" sagen — oder eine plausible Zahl wählen, die zu Kontext und Erwartungshaltung passt. Ohne explizite Anweisung wählt es typischerweise Option zwei. Das Ergebnis liest sich wie eine fundierte Antwort, ist aber eine gut formulierte Vermutung.
Wo Halluzinationen im Makleralltag wehtun
- Marktdaten und Vergleichswerte — „Wie hoch war der Durchschnittspreis im Q3 2024?" Antworten kommen, sind aber oft frei erfunden. Besonders gefährlich, wenn solche Zahlen in eine Akquise-Analyse oder Eigentümerpräsentation wandern.
- Rechtliche Grundlagen — Paragrafen, BGH-Aktenzeichen, Fristen werden geraten. „§ 656c BGB" kann zur „§ 656d BGB" werden, ein nicht existierendes Urteil wird mit Datum und AZ erfunden.
- Energieausweis-Werte — wer das PDF nur „zur Zusammenfassung" gibt und nicht zur strukturierten Extraktion, riskiert dass Endenergiewerte verschoben oder verwechselt werden.
- Kontaktdaten und Adressen — Telefonnummern, E-Mails, Postleitzahlen werden „plausibel ergänzt". Wenn der Echtdatensatz unvollständig ist, füllt das Modell auf — und liefert eine Nummer, die jemand anderem gehört.
- Akten-Zusammenfassungen — bei langen Korrespondenzen werden gelegentlich Aussagen erfunden, die so nie gemacht wurden, oder Termine zusammengelegt, die nichts miteinander zu tun haben.
Wie erkennt man eine Halluzination?
Halluzinationen klingen meistens überzeugend — das ist genau das Problem. Drei pragmatische Filter helfen: Erstens Plausibilitätscheck — passt die Antwort zu dem, was ich aus eigenem Wissen erwarte? Zweitens Quellen einfordern — explizit nach Belegen fragen („Welche Quelle hast Du dafür?"); wenn das Modell vage wird oder ausweicht, ist Vorsicht angesagt. Drittens Stichproben gegenprüfen — bei kritischen Zahlen oder Zitaten eine konkrete Aussage selbst nachschlagen; eine Halluzination hält dem nie stand.
Wie reduziert man Halluzinationen technisch?
Die zwei wirksamsten Ansätze sind Grounding und Retrieval-Augmented Generation (RAG). Beim Grounding bekommt das Modell mit der Frage zusammen die relevanten Daten mitgeliefert („Hier ist der Mietvertrag — bitte fasse die Hauptpunkte zusammen.") — dann arbeitet es an den Daten, nicht aus dem Gedächtnis. RAG ist die automatisierte Variante: bevor das Modell antwortet, holt ein Such-Schritt die passenden Datensätze aus der internen Wissensbasis (z. B. dem CRM) und fügt sie dem Prompt bei. Daneben senkt es das Risiko, wenn das Modell explizit angewiesen ist, „weiß ich nicht" zu sagen statt zu raten — moderne Modelle wie Claude oder GPT-4/5 setzen das zunehmend von sich aus.
Konkrete Prompts, die Halluzinationen reduzieren
Wer keine RAG-Pipeline bauen kann oder will, kommt mit klugen Prompts schon erstaunlich weit. Fünf Patterns, die im Maklerumfeld besonders gut wirken — direkt kopier- und anpassbar:
Belege jede konkrete Aussage mit einer Quelle (URL, PDF-Seitenzahl, CRM-Feld). Hast Du keine belegbare Quelle, schreibe „nicht belegt" statt zu schätzen.
Wenn Du Dir bei einer Aussage zu mehr als 20 % unsicher bist, antworte: „Das lässt sich aus den vorliegenden Daten nicht ableiten." Rate nicht.
Antworte in zwei Abschnitten: A) Was steht so in den Daten? B) Was leitest Du daraus ab? Markiere B explizit als „Schlussfolgerung".
Fasse die letzten 14 Tage zu diesem Kontakt zusammen — ausschließlich Ereignisse, die in Aktivitäten, E-Mails oder Notizen tatsächlich dokumentiert sind. Keine Vermutungen, keine erfundenen Details.
Liefere Vergleichswerte nur, wenn Du Quelle und Stand-Datum nennen kannst. Andernfalls schreibe: „Keine belegten Daten verfügbar, bitte über PriceHubble oder amtliche Statistik prüfen."
Eine Faustregel zum Auswendiglernen: „Quelle oder Schweigen." Was das Modell nicht belegen kann, soll es nicht behaupten. Das funktioniert nicht zu 100 Prozent — aber die Halluzinations-Quote sinkt nach unseren Erfahrungen deutlich, sobald solche Anweisungen Teil des Standard-Prompts sind.
So setzt propgen das um
propgen ist von Grund auf grounding-orientiert gebaut. Der KI-Assistent arbeitet überwiegend mit explizitem CRM-Kontext — also: Briefings, Zusammenfassungen, Notizen entstehen aus den Daten, die im CRM stehen, nicht aus dem Modell-Gedächtnis. Dokumente werden nicht „interpretiert", sondern strukturiert ausgelesen (siehe Dokumente automatisch auswerten): Energieausweis-Felder, Mietvertrags-Klauseln, Grundbuch-Daten werden mit Feld-Verankerung extrahiert, nicht frei zusammengefasst.
Für Markt- und Lagedaten — der Bereich, in dem Universal-LLMs am stärksten halluzinieren — arbeitet propgen mit explizit zitierten externen Quellen (Webrecherche mit Quellenangaben statt freie Antwort) und mit der PriceHubble-Integration für faktisch belastbare Immobilienbewertungen. Wo der Assistent CRM-Aktionen vorschlägt — Notiz, Aufgabe, Termin — landen sie als Entwurf, nicht als Direkt-Schreibvorgang: Du siehst, was er vorhat, bevor es gespeichert wird. Damit bleibt die Kontrolle bei Dir — und Halluzinationen werden auffällig, bevor sie in die Akte wandern.
In propgen verfügbar als
Verwandte Begriffe
- KI-ModellEin KI-Modell ist ein trainierter mathematischer Apparat, der aus einer Eingabe eine Vorhersage oder Generierung erzeugt. Im Makleralltag sind vor allem Sprachmodelle (LLMs wie Claude oder GPT), Vision-Modelle (Bilderkennung, Homestaging), Embedding-Modelle (Suchprofil-Matching) und Speech-Modelle (Sprachmemos) relevant. Ein modernes CRM arbeitet nicht mit einem Modell, sondern orchestriert mehrere — pro Aufgabe das passende.
- KI-AssistentEin KI-Assistent im CRM ist ein eingebauter Chat-Agent, der Fragen zum Maklerbestand beantwortet, Live-Recherchen durchführt, Texte generiert und operative Aufgaben anstößt — auf Basis der CRM-Daten.
- MCP (Model Context Protocol)MCP — Model Context Protocol — ist der von Anthropic im November 2024 vorgestellte offene Standard, mit dem KI-Modelle wie Claude oder ChatGPT mit externen Datenquellen und Werkzeugen sprechen. „USB-C für KI": eine Schnittstelle, beliebig viele KI-Frontends und Tools. Für ein Makler-CRM der Weg, die eigene Datenbasis als direkten Kontext für KI-Assistenten verfügbar zu machen.
- PromptEin Prompt ist die Anweisung, die ein KI-Modell vor seiner Antwort liest — bei Sprachmodellen ein Text, bei Bildmodellen eine Beschreibung. Modern aufgebaut aus System-Prompt (vom Anbieter, immer aktiv) und User-Prompt (was der Nutzer eintippt). Die Qualität jeder KI-Antwort hängt fast vollständig vom Prompt ab — Rolle, Kontext, Aufgabe und Format sind die vier Bausteine, die im Maklerumfeld den Unterschied machen.