Hilfe

RAGFlow Datensatz anlegen und konfigurieren

Datensätze sind die Wissensbasis deines Assistenten. Nur Inhalte, die hier hinterlegt sind, kann der Chat später beantworten.


Schritt 1 — Datensatz -Übersicht öffnen

Gehe im oberen Menü auf „Datensatz“.
Hier siehst du alle vorhandenen Wissensdatenbanken.

Erklärung der Ansicht:

  • Jede Kachel = ein Dataset
  • Dateianzahl = wie viele Dokumente enthalten sind
  • Datum = letzter Upload
  • Label rechts = Besitzer / Ersteller

Schritt 2 — Neuen Datensatz erstellen

Oben rechts klickst du auf
„+ Wissensdatenbank erstellen“


Schritt 3 — Felder konfigurieren

Name

Der Name beschreibt den Inhalt des Datensatzes.

Best Practice

  • „HR Richtlinien“
  • „Technische Dokumentation“
  • „Verträge 2024“

➡ klare Namen = bessere Übersicht bei mehreren Datenquellen


Embedding-Modell

Dieses Modell wandelt Dokumente in Vektoren um, damit der Chat Inhalte semantisch verstehen kann.

Empfehlung
→ Standardmodell verwenden, wenn kein Spezialfall vorliegt.


Analysetyp

Eingebaut
→ Standard-Analyse für fast alle Anwendungsfälle

Pipeline wählen
→ nur nutzen, wenn spezielle Verarbeitung notwendig ist (z. B. OCR-Pipeline, strukturierte Analyse)


Chunk-Methode

Bestimmt, wie Dokumente in Abschnitte zerlegt werden.

Warum wichtig:
LLMs arbeiten nicht mit ganzen Dokumenten, sondern mit Text-Chunks.

Empfehlung
→ Standardwert lassen, wenn keine speziellen Anforderungen bestehen


Schritt 4 — Datensatz speichern

Klicke „Speichern“

Danach erscheint dein Datensatz im Dashboard und du kannst Dateien hochladen.


Best Practices für Datensätze

  • Inhalte thematisch trennen (z. B. Verträge ≠ Produktdokumentation)
  • Keine unnötigen Dokumente mischen
  • Pro Chat nur relevante Datensätze auswählen

👉 Das verbessert Trefferqualität drastisch.