Glossar
Embedding
Ein Embedding ist eine numerische Darstellung von Text, die semantische Ähnlichkeit messbar macht. Die Grundlage dafür, dass KI-Systeme nicht nach Stichwörtern, sondern nach Bedeutung suchen können.
Embeddings wandeln Texte in Vektoren um, also Listen von Zahlen, die die Bedeutung eines Satzes oder Abschnitts im mathematischen Raum repräsentieren. Ähnliche Inhalte liegen dabei nah beieinander, unabhängig davon ob dieselben Wörter verwendet werden.
Warum das wichtig ist
Traditionelle Suche findet “Urlaub” nicht, wenn der Text “Jahresurlaub” sagt. Embedding-basierte Suche versteht, dass beides dasselbe meint. Das ist entscheidend für RAG-Systeme, die Ihre internen Dokumente durchsuchen sollen.
Praktisches Beispiel
Frage: “Wie beantrage ich freie Tage?” Gefundenes Dokument: “Urlaubsantrag - Formular HR-04”
Obwohl kein gemeinsames Schlüsselwort existiert, erkennt das Embedding-Modell die inhaltliche Nähe.
Technisch im Unternehmensumfeld
Für Microsoft-Kunden wird Embedding-basierte Suche typischerweise über Azure AI Search realisiert, kombiniert mit Azure OpenAI Service für die Generierung. Das Ergebnis: ein unternehmensinterner Chatbot, der Ihre Dokumente wirklich versteht.