Das Problem mit generischem RAG
Retrieval-Augmented Generation (RAG) ist zum Standard-Architekturmuster für die Verbindung von LLMs mit Enterprise-Wissensdatenbanken geworden. Das Prinzip ist einfach: Wenn ein Benutzer eine Frage stellt, durchläuft das System folgende Schritte:
- Abruf der relevantesten Passagen aus einer Vektordatenbank
- Anreicherung des LLM-Prompts mit diesen Passagen
- Generierung einer kontextualisierten Antwort
Dieses Muster funktioniert für generische Anwendungsfälle: technische Dokumentation, FAQ-Seiten, internes Wissensmanagement. Aber es versagt strukturell an einem kritischen Punkt: Markenkonsistenz.
Generisches RAG weiß nicht:
- Ob die abgerufene Passage mit Ihrem aktuellen Tone of Voice konsistent ist
- Ob die Umformulierung durch das LLM Ihre redaktionellen Vorgaben respektiert
- Ob die generierte Antwort Ihren rechtsgültig geprüften Kernbotschaften widerspricht
- Ob die Marke auf Französisch, Englisch und Deutsch konsistent wiedergegeben wird
Das Ergebnis: technisch korrekte, aber semantisch inkonsistente Antworten.
Ohne redaktionelle Leitplanken enthält 1 von 3 Antworten, die von generischem RAG generiert werden, eine Markeninkonsistenz (Tone of Voice, Positionierung oder Terminologie).
Was ist ein Brand RAG System?
Ein Brand RAG System ist eine proprietäre RAG-Pipeline – speziell für Marken-Governance architekturiert. Es ruft nicht nur ab und generiert: es kontrolliert, filtert und validiert jede Antwort, bevor sie den Benutzer erreicht.
5-Schichten-Architektur
Schicht 1 – BKB-Einspeisung
Die Pipeline wird ausschließlich durch Ihre Brand Knowledge Base gespeist. Kein unkontrolliertes Web-Crawling, keine heterogenen Datenbanken. Vektorisierte Chunks sind mit Marken-Metadaten versehen: Kritikalitätsstufe, Zielkanal, Gültigkeitsdatum, Rechtsstatus.
Schicht 2 – Hybrides Retrieval
Die Suche kombiniert zwei Ansätze:
- Vektorsuche: semantische Ähnlichkeit mit der Benutzerfrage
- Gewichtete Keyword-Suche: obligatorische Markenbegriffe (Ihre Produkte, deklarierte Wettbewerber, differenzierende Argumente)
Ein Re-Ranker bewertet Ergebnisse nach Relevanz und redaktioneller Compliance.
Schicht 3 – Kontextuelle Anreicherung
Der System-Prompt wird automatisch mit aktiven Kohärenzregeln aus Ihrer BKB angereichert: Tone of Voice, lexikalische Verbote, kanonische Formulierungen, rechtliche Einschränkungen. Das LLM kann diese Regeln nicht ignorieren – sie sind Teil des obligatorischen Kontexts.
Schicht 4 – Redaktionelle Leitplanken
Bevor die Antwort den Benutzer erreicht, durchläuft sie eine Reihe von Compliance-Filtern:
- Lexikalischer Filter: erkennt und blockiert verbotene Begriffe
- Kohärenzfilter: prüft, ob die Antwort nicht den BKB-Kernbotschaften widerspricht
- Rechtsfilter: blockiert Behauptungen, die nicht durch rechtliche Haftungsausschlüsse gedeckt sind
- Verweigerungsfilter: erkennt Anfragen außerhalb des Themenbereichs (Wettbewerber, sensible Themen)
Eine Post-Processing-Pipeline formuliert die Antwort bei Bedarf um, um Compliance zu garantieren, ohne den Kontext zu verlieren.
Schicht 5 – Kontinuierliche Bewertung
Jede generierte Antwort wird automatisch anhand proprietärer Metriken bewertet:
- Brand AI Coherence™ Score: Ist die Antwort der Markenidentität treu?
- Tonkonsistenz: Wird der Tone of Voice respektiert?
- Faktische Genauigkeit: Sind die zitierten Fakten in der BKB vorhanden?
- Leitplanken-Compliance: Wurden die Leitplanken korrekt angewendet?
Diese Metriken speisen ein kontinuierliches Dashboard und Verbesserungsschleifen.
Brand RAG System vs. Generisches RAG
| Kriterium | Generisches RAG (Open Source, SaaS) | Brand RAG System Voktix |
|---|---|---|
| Datenquelle | Web-Crawl, interne Datenbanken | Exklusive BKB, validierter Korpus |
| Retrieval | Einfach vektorbasiert | Hybrid + Brand-Re-Ranking |
| Redaktionelle Kontrolle | Keine | Lexikalische, Kohärenz-, Rechtsfilter |
| Prompt-Engineering | Festes Template | Dynamisch durch BKB-Regeln angereichert |
| Metriken | Precision, Recall | Brand AI Coherence™, Tonkonsistenz |
| Weiterentwicklung | Manuelle Iterationen | Automatisierte Schleife + kontinuierliches Monitoring |
Bereitstellungs-Roadmap
Phase 1 – Technisches Scoping: Identifikation der KI-Einspeisungspunkte, Latenzanforderungen, Compliance-Vorgaben.
Phase 2 – Pipeline-Design: Retrieval-Architektur, Auswahl des Embedding-Modells, BKB-konforme Chunking-Strategie.
Phase 3 – Integration und Leitplanken: Anbindung an Ihre Tools, Implementierung redaktioneller Filter, End-to-End-Tests.
Phase 4 – Produktion und Monitoring: Schrittweise Einführung, Kohärenz-Dashboards, kontinuierliche Verbesserungsschleife.