Datensätze sind die Wissensbasis deines Assistenten. Nur Inhalte, die hier hinterlegt sind, kann der Chat später beantworten.
Schritt 1 — Datensatz -Übersicht öffnen
Gehe im oberen Menü auf „Datensatz“.
Hier siehst du alle vorhandenen Wissensdatenbanken.

Erklärung der Ansicht:
- Jede Kachel = ein Dataset
- Dateianzahl = wie viele Dokumente enthalten sind
- Datum = letzter Upload
- Label rechts = Besitzer / Ersteller
Schritt 2 — Neuen Datensatz erstellen
Oben rechts klickst du auf
„+ Wissensdatenbank erstellen“

Schritt 3 — Felder konfigurieren
Name
Der Name beschreibt den Inhalt des Datensatzes.
Best Practice
- „HR Richtlinien“
- „Technische Dokumentation“
- „Verträge 2024“
➡ klare Namen = bessere Übersicht bei mehreren Datenquellen
Embedding-Modell
Dieses Modell wandelt Dokumente in Vektoren um, damit der Chat Inhalte semantisch verstehen kann.
Empfehlung
→ Standardmodell verwenden, wenn kein Spezialfall vorliegt.
Analysetyp
Eingebaut
→ Standard-Analyse für fast alle Anwendungsfälle
Pipeline wählen
→ nur nutzen, wenn spezielle Verarbeitung notwendig ist (z. B. OCR-Pipeline, strukturierte Analyse)
Chunk-Methode
Bestimmt, wie Dokumente in Abschnitte zerlegt werden.
Warum wichtig:
LLMs arbeiten nicht mit ganzen Dokumenten, sondern mit Text-Chunks.
Empfehlung
→ Standardwert lassen, wenn keine speziellen Anforderungen bestehen
Schritt 4 — Datensatz speichern
Klicke „Speichern“
Danach erscheint dein Datensatz im Dashboard und du kannst Dateien hochladen.
Best Practices für Datensätze
- Inhalte thematisch trennen (z. B. Verträge ≠ Produktdokumentation)
- Keine unnötigen Dokumente mischen
- Pro Chat nur relevante Datensätze auswählen
👉 Das verbessert Trefferqualität drastisch.