Zum Inhalt springen

Glossar

RAG (Retrieval-Augmented Generation)

RAG ist eine Technik, bei der ein KI-Modell vor dem Antworten gezielt relevante Dokumente aus einer Wissensdatenbank abruft. So entstehen aktuelle, quellenbasierte Antworten statt ausgedachter Informationen.

Retrieval-Augmented Generation (RAG) löst eines der größten Probleme reiner LLMs: Sie wissen nur, was im Training stand, nichts über Ihre internen Dokumente, aktuellen Preise oder jüngsten Änderungen. RAG kombiniert ein Sprachmodell mit einer Suche über Ihre eigenen Inhalte.

So funktioniert RAG

  1. Frage eingeht: z. B. “Was steht in unserem Wartungsvertrag mit Firma X?”
  2. Retrieval: per semantischer Suche mit Embeddings werden die relevantesten Dokument-Abschnitte gefunden
  3. Augmentation: diese Abschnitte werden dem LLM als Kontext mitgegeben
  4. Generation: das Modell antwortet auf Basis der echten Quelle, nicht aus dem Training

Typische Einsatzszenarien in KMU

  • Interner Chatbot für Handbücher, Verträge, Produktunterlagen
  • Kundensupport mit Zugriff auf aktuelle Dokumentation
  • Automatisierte Auswertung von Angeboten oder Protokollen

RAG vs. Fine-Tuning

RAG ist meist die bessere Wahl für unternehmensspezifisches Wissen: günstiger, flexibler und ohne Risiko, dass das Modell falsche Fakten “einbrennt”. Fine-Tuning eignet sich eher für Tonalität und Format, nicht für Faktenwissen.

technologie automatisierung wissensmanagement

KI strategisch in Ihrem Unternehmen einsetzen?

Im kostenlosen Erstgespräch analysieren wir gemeinsam Ihr Potenzial.

Kostenloses Erstgespräch buchen
Kostenloses Erstgespräch buchen