KIS:UI – Enterprise AI Chat. Komplett im eigenen Haus.

Sieh es in Aktion

Eine Oberfläche.
Der ganze KI-Workflow.

1 Chatten

Fragen, mit Quellen beantwortet

Agentischer Tool-Loop: durchsucht eure Wissensbasen, ruft Tools auf und erzeugt PDFs – jede Antwort mit nachvollziehbarer Quelle.

2 Wissen anbinden

10 Konnektoren, ein Index

Notion, Confluence, SharePoint, Drive, Slack, IMAP, Git & mehr – mit Background-Sync, Reranking und Knowledge-Graph in pgvector.

3 Automatisieren

Workflows im n8n-Stil

Trigger, KI-Knoten, Verzweigungen und Schleifen visuell verketten – mit Live-Run-Trace und Kosten-Tracking, auch für reguläre User.

4 Regieren

Governance & Audit

40+ Admin-Oberflächen, 200+ Audit-Actions, LDAP/AD, AES-256-GCM, Privacy-Shield-Policies und Kosten-Telemetrie – volle Kontrolle, nichts versteckt.

kisui.local

Fasse den Rahmenvertrag mit Lieferant Nord zusammen und erstelle ein PDF.

knowledge_base · 3 Quellen
Laufzeit bis 31.12., Kündigungsfrist 3 Monate. Preisgleitklausel in §4, Haftung in §9.
generate_pdf Zusammenfassung_Nord.pdf

Tippen, sprechen oder PDF ablegen …

Wissensgebiete · RAG

NotionOAuth · 1 240 Pages

ConfluenceCloud + Server

SharePoint · Google Drive · Slacksync

Git · RSS · Sitemap · IMAPpolling

Retrieval: Cross-Encoder-Rerank · Knowledge-Graph · Citations

Workflow-Builder

Trigger

Webhook

POST /run · Token

Quelle

KB-Query

Verträge · top-k 6

Agent

LLM-Agent

Llama 70B · Tools

Aktion

Chat-Reply

+ E-Mail-Send

Admin · Governance

200+Audit-Actions

40+Admin-Oberflächen

LDAP / ADSSO · Gruppen-Mapping

AES-256-GCMSecrets verschlüsselt

Jede mutierende Operation auditiert · Zod-validiert · CSP mit Nonce

Eine Plattform, alles drin

Nicht nur ein Chatfenster.
Ein komplettes KI-Betriebssystem.

Von der Modell-Orchestrierung über Wissen und Automatisierung bis zur Governance – KIS:UI bündelt, wofür andere fünf Tools brauchen.

Multi-Provider-LLM-Router

Ollama, vLLM, OpenAI, Anthropic und jedes OpenAI-kompatible Gateway (Groq, OpenRouter, Azure) hinter einem Router – mit Fallback-Kette, exponentiellem Retry und per-Provider-Rate-Limit. SSE-Streaming, Tool-Calls, Vision.

OllamavLLMOpenAIAnthropicGroq / AzureFailover

Memory-System

Globales + per-User-Memory mit Embedding-Retrieval beim Chat. DSGVO-Purge pro User, Audit-Trail für jede Operation.

Dokument-Copilot & Export

Multi-Dokument-Chat mit Vergleich & Aktionen, First-Class DocumentSpec-Komponenten, Vektor-Charts – Export als Word (.docx) und Premium-PDF mit eingebetteten Fonts.

Media: Bild · TTS · STT

DALL-E-Bildgenerierung, 6-Stimmen-TTS und Whisper-Transkription mit In-Browser-Voice-Recorder – alles inline im Chat.

MCP-Arbeitsbereich & Gateway

MCP-Werkzeuge als App-Modus direkt ausführen – Schema-Formular statt Prompt, Ergebnis-Karte, Werkzeug-Galerie mit Status. Plus deklarative External-APIs mit Zod-Schemas, verschlüsselten Credentials & Health-Probe.

Sharing, Public & Embed

Conversations per Link teilen (Passwort + Ablauf), Ordner & Gruppen-Channels, anonymer Public-Chat und ein einbettbares iFrame-Widget für externe Seiten.

Privacy Shield · PII-Maskierung NEU

Eine Maskierungsschicht sitzt an jedem Daten-Ausgang: erkennt Namen, IBAN, Steuer-IDs & Co. (Regex + Prüfsummen + optional lokales NER), ersetzt sie deterministisch durch Tokens wie [PERSON_1] – und demaskiert nur lokal. Vor jedem externen Modellaufruf zeigt ein Review, was gesendet wird. Das Mapping verlässt nie den Server.

Pre-LLMPre-ToolPre-RAGPolicy je Gruppe/KBfail-closed

Modell-Deployment ohne Klick

Geführter Cookbook-v2-Wizard rollt vLLM-Modelle auf den GPU-Host aus – Preflight-Gate, Live-Deploy-Polling, Rollback-Historie. Der vllm-runner-Sidecar startet Container, ohne dass die App je den Docker-Socket sieht.

Antwort-Verifikation

Eine Verifikations-Pipeline prüft jede Antwort: Code-Plausibilität, Evidenzklassen und Faithfulness/Citation-Check mit Konflikt-Erkennung – mit Qualitätsstatus und Repair-Loop für SQL/YAML/Shell/Code.

Modell-Arena & Fine-Tuning

Modelle im A/B-Vergleich mit ELO-Ranking, KI-Judge und Preis-Leistungs-Score. Aus Nutzer-Feedback (Thumbs) entstehen SFT/DPO-Datensätze als JSONL – LoRA-Training mit Vorher/Nachher-Benchmark-Gate.

Workflow-Builder

Automatisierung im n8n-Stil – mit KI-Knoten.

Visueller Knoten/Kanten-Graph: Trigger per Klick, Webhook, Cron oder als Chat-Skill. 18 Knotentypen verketten LLM-Agenten, Wissensabfragen, Web-Suche, HTTP, JSON-Transform, Code, Sub-Workflows und Schleifen – mit Versionierung, durabler Queue, Retry/Abort, Live-Run-Trace und Kosten-Tracking.

18 Knotentypen – Agent, KB-Query, Web-Search, MCP-Tool, HTTP (SSRF-sicher), Code, Switch, Set-Var, Delay, Conditional, Loop, Dokument, E-Mail
Durable & versioniert – Retry/Abort, Lifecycle-States, Vorlagen-Galerie & Debug-Timeline
Live-Run-Trace per SSE – Knoten grün/gelb/rot in Echtzeit, auch für reguläre User mit Quoten

Trigger

Webhook

POST /run · Token

Quelle

KB-Query

Verträge · top-k 6

Agent

LLM-Agent

Llama 70B · Tools

Aktion

Chat-Reply

+ E-Mail-Send

18 Knotentypen

Registry-Pattern · Kahn-Topology-Sort · durable Queue · Live-Trace via SSE

Manueller Trigger

Webhook

Cron-Zeitplan

Chat-Skill

LLM-Aufruf

Agent-Aufruf

KB-Query

Web-Suche

MCP-Tool

HTTP-Request

JSON-Transform

Code-Node

Set-Variable

Bedingung

Switch

Schleife · Delay

Dokument · E-Mail

Chat-Reply · Webhook-Response

SSRF-Block – HTTP-Request sperrt private, Link-Local- & Metadata-IPs (RFC 1918, 169.254/16)
jq-Subset statt eval – JSON-Transform läuft sandboxed, kein User-JS
Recursion-Guard – MAX_DEPTH = 3, Total-Step-Cap pro Run, 32-Byte-CSPRNG-Webhook-Token

NotionOAuth · 1 240 Pages

ConfluenceCloud + Server

SharePointMS Graph

Google Drive · Slack · IMAPsync

Git · RSS · Sitemappolling

Retrieval-Quality: Cross-Encoder-Rerank · Knowledge-Graph-Traversal · Multi-Hop · Cross-Lingual · Citations

Knowledge Bases · RAG

Euer gesamtes Wissen – befragbar, mit Quelle.

pgvector + LangChain, mandantenfähig, mit Versionierung pro Chunk. 10 Konnektoren ziehen Wissen aus Notion, Confluence, SharePoint, Google Drive, Slack, IMAP, Git, RSS und Sitemaps – mit Background-Sync, Reranking und Knowledge-Graph.

Antworten mit Quellenangabe statt Halluzination – EU-AI-Act-tauglich
Rollen-, User- & Gruppen-Permissions je KB, mit Ablaufdatum
Föderierte Cross-Tenant-Queries via signiertem KB-Passport

RAG-Pipeline · unter der Haube

Vom Rohdokument
zur belegten Antwort.

Sieben Stufen, gebaut auf LangChain.js und pgvector – jede Stufe einzeln konfigurierbar, mandantenfähig und background-synchronisiert über BullMQ.

Ingestion

10 Konnektoren + Upload, OCR für Scans. ingestion.ts orchestriert.

Chunking

LangChain Recursive-Splitter, konfigurierbare Größe & Overlap.

Embeddings

OpenAI- oder Ollama-Embeddings – Provider abstrahiert.

pgvector / Qdrant

Cosine-Similarity-Suche, Versionierung pro Chunk – Qdrant als optionaler Vektor-Store zuschaltbar.

Reranking

Cross-Encoder ordnet die wirklich relevanten Passagen nach oben.

Knowledge-Graph

Multi-Hop-Traversal verknüpft Fakten über Dokumente hinweg.

Antwort + Citations

Kontext-Injection in den Chat – jede Aussage mit Quelle.

Privacy Shield · PII-Maskierung

Echte Kundendaten nutzen.
Ohne Klartext-PII zu senden.

Eine Maskierungsschicht sitzt an jedem Daten-Ausgang – LLM-Call, Tool-Call, Embedding. Sie erkennt sensible Werte, ersetzt sie deterministisch durch reversible Tokens und demaskiert die Antwort ausschließlich lokal. Das Mapping verlässt nie den Server. Modellgestützte Erkennung läuft – wenn überhaupt – nur auf dem lokalen Runner, nie extern.

Live-Demo · tippe links – rechts siehst du, was das externe Modell wirklich bekommt

Was du eingibst · bleibt lokal

Was das externe Modell sieht

Reine Browser-Demo zur Veranschaulichung – im Produkt laufen Erkennung & Demaskierung serverseitig, das Token-Mapping verlässt nie eure Installation. Maskierung ist ein technischer Baustein, keine Compliance-Zusicherung.

Ein Baustein, kein Versprechen

Policy-gestützte Kontrolle vor jedem Provider-Call.

Detektoren ohne Python-Dienst – Regex + Prüfsummen (IBAN ISO 7064, Kreditkarte Luhn, Steuer-ID) in TypeScript, optional lokales NER als Ausbau
fail-closed – im Zweifel wird maskiert; der streaming-Demaskierer puffert Tokens, die über SSE-Chunks brechen
Policy-Kaskade Gruppe → Projekt/KB → globale Default-Policy, im Admin steuerbar
Privacy-Admin-Debug – maskierter Prompt + erkannte Entitäten pro Request einsehbar; Mapping AES-256-GCM-verschlüsselt auditiert
Hinter Feature-Flag – ausgeschaltet byte-identisches Verhalten (Rollback-sicher)

Hinweis: technische Maskierung ist ein Baustein für datenschutzfreundliche KI-Nutzung – keine harte Compliance-Zusicherung. Die finale Bewertung trifft eure Datenschutz-Abteilung.

Admin-Panel · 40+ Oberflächen

Volle Kontrolle. Keine magischen Env-Variablen.

Jede dunkle Geschäftslogik lebt im Admin-Bereich – sichtbar, versioniert, auditiert. Von Modell-Cookbook, Benchmark-Arena und Fine-Tuning bis Privacy-Shield, Monitoring und DSGVO.

Dashboard

Recharts-Timeseries, Kostenaufschlüsselung, Top-User/-Modelle, Provider-Health.

Users & LDAP

Autodiscovery, AD-Gruppen-Browser, Rollen-Mapping, Sync mit Deaktivierungs-Schutz.

Audit-Logs

Cursor-Pagination, Filter, JSON-Drawer, CSV/JSON-Export – 200+ Audit-Actions.

LLM-Provider

CRUD, AES-GCM-Key-Encryption, Connection-Test, Auto-Detect der Modelle.

Prompts & Skills

Append-only-Versionierung mit History, Skill-Config-Validator mit live Indikator.

Branding & Settings

Logo, Farben, Live-Preview – plus gruppierte System-Settings ohne Deploy.

Architektur · self-hosted

Ein Monolith.
Drei klare Schichten.

Kein separates Backend, kein Kubernetes-Zwang: Next.js 16 App-Router mit Route-Handlern, eine Postgres für Daten, Logs & Embeddings – per Docker-Compose in Stunden ausgerollt.

FrontendNext.js 16 · React 19 · Tailwind · shadcn/ui

Public-ChatGast, Token-Link

Enduser-Chatauthentifiziert

Admin-Panel40+ Oberflächen

Shared-ViewEmbed / iFrame

Backend-ServicesRoute-Handler · keine externe API-Schicht

AuthLDAP-Bind · Session · RBAC

LLM-RouterProvider-Abstraktion · Streaming · Fallback

RAG-EngineLangChain · pgvector / Qdrant · Rerank

WorkflowsExecutor · 18 Knoten · SSE-Trace

Auditjeder Event · Volltext · Retention

Privacy-ShieldPII-Maskierung · Policies

FilesUpload · OCR · S3

MediaImageGen · TTS · STT

MemoryFakten · Summaries

KnowledgeWissensgebiete · Rechte

CollabShare · Ordner · Gruppen

Data-Layeralles auf eurer Hardware

PostgreSQL 18+ pgvector · Daten · Logs · Embeddings

Qdrantoptionaler Vektor-Store für KB

Redis 7Cache · BullMQ-Queue

MinIOS3-API · Dateien

LDAP / ADIdentity-Provider

Eine Chat-Anfrage, Schritt für Schritt

jeder Request auditiert & gestreamt

Rate-Limit

Redis Token-Bucket pro IP & User.

Auth + RBAC

NextAuth-Session, Rollen-Gate pro Route.

CSRF + Zod

Jeder Input validiert, CSP-Nonce gesetzt.

LLM-Router

Modell-Routing mit Fallback-Kette.

SSE-Stream

Token-für-Token als text/event-stream.

Audit-Log

User, Model, Tokens, Latenz → Postgres.

Security by Design

Gebaut für Compliance-Abteilungen.

Jede mutierende Operation ist auditiert, jeder API-Input Zod-validiert, jeder Secret AES-256-GCM-verschlüsselt. CSP mit Nonce-Policies, kein unsafe-inline, kein any in der Codebase.

NextAuth v5 + LDAP-Bind über TLS/StartTLS, RBAC-Middleware auf Route-Ebene
Redis-Login-Rate-Limit, SSRF-Guards, HSTS, X-Frame-Options: DENY
Privacy Shield maskiert PII vor jedem externen Call · Tool-Calling Zod-validiert & Output-gefenced
4-Gate-Review pro Phase: Security · Code · Simplification · Doku · CVE-Gate in CI

Self-hosted Stack · Docker-Compose

Next.js 16React 19 · App Router

Postgres 18+ pgvector / Qdrant

Redis 7Sessions · BullMQ

MinIOS3-API

Ollama / vLLMGPU-Inferenz

LangChainRAG-Ingestion

LDAP / ADIdentity

Nginx + TLSReverse-Proxy

OWASP Top 10 — vollständig abgedeckt

Threat-Modeling pro Phase · 4-Gate-Review

A01

Broken Access Control

RBAC an jedem Endpoint, explizite Owner-Checks, keine IDOR.

A02

Cryptographic Failures

AES-256-GCM für Secrets, TLS in Transit, starke Session-Tokens.

A03

Injection

Prisma parametrisiert, keine Raw-SQL ohne Escaping, Zod-Validierung.

A04

Insecure Design

Threat-Modeling pro Phase, 4-Gate-Review vor jedem Merge.

A05

Security Misconfiguration

Keine Default-Credentials, env-basiert, Secure-Defaults in Compose.

A06

Vulnerable Components

npm audit in CI, Dependabot, committetes Lockfile.

A07

Auth Failures

Brute-Force-Schutz, Session-Invalidierung, keine Session-Fixation.

A08

Integrity Failures

Signierte Images, Lockfile, Supply-Chain-Audit.

A09

Logging Failures

Audit-Log ist Kern-Feature – nicht abschaltbar.

A10

SSRF

URL-Validierung bei Provider-Config, Deny-Listen für interne IPs.

Kriterium	KIS:UI · On-Premise	Public-Cloud-KI
Daten verlassen euer Netz	Nie	Standard
Modell-Wahl	Ollama · vLLM · eigene Gewichte (Cloud optional)	nur Anbieter-Modelle
Audit jeder Aktion	200+ Actions	begrenzt
PII-Maskierung vor Modellaufruf	Privacy Shield	selten
LDAP / AD-SSO	nativ	teils, Enterprise-Tier
DSGVO-Export & -Löschung pro User	eingebaut	eingeschränkt
Workflows & Automatisierung	integriert	Zusatzprodukt
Air-Gap-fähig	Ja	Nein
Kostenmodell	Lizenz + eigene Hardware	pro Token / pro Seat

Einführung

Produktiv in Wochen, nicht Monaten.

Wir installieren, binden an und schulen – ihr behaltet die Kontrolle. Ein typischer On-Premise-Rollout durch ki·spezial.

Woche 1

Setup & Installation

Docker-Compose auf eurer Hardware
Postgres, Redis, MinIO, Nginx/TLS
Health-Checks & Backups

Woche 2

Identity & Modelle

LDAP/AD-Bindung, Rollen-Mapping
Ollama/vLLM-Inferenz aufsetzen
LLM-Router & Fallback konfigurieren

Woche 3

Wissen & Workflows

Erste Konnektoren anbinden
Wissensgebiete & Berechtigungen
Erste Automatisierungen bauen

Woche 4

Rollout & Schulung

Branding & Prompt-Bibliothek
Admin- & Key-User-Schulung
Go-Live mit Monitoring

Technische Daten

Alles, was eure IT wissen will.

Stack

Frontend

Next.js 16 · React 19 · App Router · Tailwind · shadcn/ui

Backend

Next.js Route-Handler (kein separates Backend) · TypeScript strict, 0 any · ~460k LOC

Datenbank

PostgreSQL 18 + pgvector · optional Qdrant für KB · Prisma ORM · 109 Modelle · 61 Enums

Queue & Cache

Redis 7 · BullMQ-Worker

Objektspeicher

MinIO (S3-kompatibel)

KI & Modelle

LLM-Provider

Ollama · vLLM · OpenAI · Anthropic · jedes OpenAI-kompatible Gateway (Groq, OpenRouter, Azure)

Routing

Fallback-Kette · exponentielles Retry · per-Provider-Rate-Limit · SSE-Streaming · Tool-Calls · Vision

RAG

LangChain.js · pgvector / Qdrant · Hybrid (Dense + Sparse/BM25) · Cross-Encoder-Rerank · Knowledge-Graph · Faithfulness/Citation-Eval · 10 Konnektoren

Embeddings

OpenAI- oder Ollama-Embeddings (abstrahiert)

Modell-Deployment

Cookbook-v2-Wizard · LiteLLM-Gateway · vllm-runner-Sidecar (kein Docker-Socket in der App) · Rollback-Historie

Qualität

Antwort-Verifikation · Evidenzklassen · Modell-Arena (ELO) · Benchmark-Bibliothek · Fine-Tuning-Export (SFT/DPO, JSONL)

Medien

Bildgenerierung · 6-Stimmen-TTS · Whisper-STT · lokale STT/TTS-Endpunkte

Sicherheit & Auth

Authentifizierung

NextAuth v5 · LDAP/AD-Bind über TLS/StartTLS

Rollen

PUBLIC · USER · ADMIN · SUPERADMIN (RBAC pro Route)

Verschlüsselung

AES-256-GCM at Rest · TLS in Transit

Audit

200+ Audit-Actions · Volltext · Retention · CSV/JSON-Export

Privacy Shield

PII-Maskierung vor LLM-/Tool-/RAG-/Gateway-Call · deterministische Tokens · lokale Demaskierung · Policy je Gruppe/KB (Feature-Flag)

Compliance

OWASP Top 10 abgedeckt · DSGVO-Export/-Löschung · CSP mit Nonce · CVE-Gate & Dependabot in CI

Betrieb

Deployment

Docker Compose · kein Kubernetes-Zwang · On-Premise / Air-Gap

Automatisierung

Workflow-Builder · 18 Knotentypen · Versionierung · durable Queue · Retry/Abort · Cron/Webhook/Chat-Skill-Trigger

Administration

40+ Admin-Oberflächen · mandantenfähig · Gruppen & Kanäle · Health-Probes & Monitoring

Lizenz

On-Premise-Lizenz · Wartung & Support durch ki·spezial

Häufige Fragen

Was Entscheider zuerst fragen.

Welche Modelle laufen wirklich on-premise?

Jedes Open-Weight-Modell über Ollama oder vLLM – z. B. Llama 3, Mistral, Qwen oder eure feingetunten Gewichte. Cloud-Provider (OpenAI, Anthropic, Azure) lassen sich optional zuschalten, sind aber standardmäßig aus. Der LLM-Router mischt beides hinter einer Fallback-Kette.

Brauchen wir GPUs?

Für lokale Inferenz ja – vLLM oder Ollama auf einer oder mehreren GPUs. Kleinere Modelle und Embeddings laufen auch auf CPU. Wir dimensionieren die Hardware passend zu Nutzerzahl und gewünschter Modellgröße.

Wie lange dauert die Einführung?

Wochen, nicht Monate. KIS:UI kommt als Docker-Compose-Stack, wird On-Premise installiert, ans Active Directory gebunden und eure Modelle werden freigeschaltet – inklusive Anbindung der ersten Wissensquellen.

Wie aktuell bleibt das angebundene Wissen?

Die 10 Konnektoren synchronisieren im Hintergrund über BullMQ – OAuth-basiert (Notion, Confluence, SharePoint, Drive, Slack) oder per Polling (Git, RSS, Sitemap, IMAP). Neue und geänderte Dokumente werden re-indexiert, der Vektor-Index bleibt aktuell.

Ist es DSGVO- und EU-AI-Act-konform?

Darauf ist es ausgelegt: 100 % On-Premise, lückenloses Audit, DSGVO-Export und -Löschung pro Nutzer, AES-256-GCM für Secrets, RBAC und Antworten mit Quellenangabe statt Halluzination. Die finale Bewertung trifft eure Compliance-Abteilung – wir liefern die technischen Voraussetzungen.

Was macht der Privacy Shield genau?

Wenn ihr doch einmal ein externes Modell (oder Tool) nutzt, maskiert der Privacy Shield erkannte personenbezogene Daten – Namen, IBANs, Steuer-IDs, Kreditkarten u. a. – bevor der Call das Haus verlässt. Ersetzt wird deterministisch durch Tokens wie [PERSON_1]; demaskiert wird die Antwort nur lokal, das Mapping bleibt verschlüsselt auf dem Server. Erkennung per Regex + Prüfsummen, optional per lokalem NER – nie über einen externen Dienst. Das Feature ist Flag-gesteuert und standardmäßig aus; technische Maskierung ist ein Baustein, keine Compliance-Garantie.

Wie kommen neue Modelle auf die GPU?

Über den Cookbook-v2-Wizard: Modell auswählen, Preflight-Gate prüft die Konfiguration, der vllm-runner-Sidecar startet den vLLM-Container auf dem GPU-Host – mit Live-Deploy-Polling und Rollback-Historie. Die App selbst bekommt dabei nie Zugriff auf den Docker-Socket; nur der gehärtete Sidecar mit Image-Allowlist und Namens-Präfix-Scope darf Container starten.

Skaliert das über viele Nutzer?

Ja. Hintergrundlast läuft über BullMQ-Worker, der LLM-Router verteilt mit Fallback und Rate-Limits, und die Plattform ist mandantenfähig mit Gruppen, Kanälen und per-KB-Berechtigungen. Skaliert wird horizontal über zusätzliche Worker und Inferenz-Knoten.

Eine Oberfläche.Der ganze KI-Workflow.

Fragen, mit Quellen beantwortet

10 Konnektoren, ein Index

Workflows im n8n-Stil

Governance & Audit

Nicht nur ein Chatfenster.Ein komplettes KI-Betriebssystem.

Multi-Provider-LLM-Router

Memory-System

Dokument-Copilot & Export

Media: Bild · TTS · STT

MCP-Arbeitsbereich & Gateway

Sharing, Public & Embed

Privacy Shield · PII-Maskierung NEU

Modell-Deployment ohne Klick

Antwort-Verifikation

Modell-Arena & Fine-Tuning

Automatisierung im n8n-Stil – mit KI-Knoten.

18 Knotentypen

Euer gesamtes Wissen – befragbar, mit Quelle.

Vom Rohdokumentzur belegten Antwort.

Ingestion

Chunking

Embeddings

pgvector / Qdrant

Reranking

Knowledge-Graph

Antwort + Citations

Echte Kundendaten nutzen.Ohne Klartext-PII zu senden.

Policy-gestützte Kontrolle vor jedem Provider-Call.

Volle Kontrolle. Keine magischen Env-Variablen.

Dashboard

Users & LDAP

Audit-Logs

LLM-Provider

Prompts & Skills

Branding & Settings

Ein Monolith.Drei klare Schichten.

Eine Chat-Anfrage, Schritt für Schritt

Rate-Limit

Auth + RBAC

CSRF + Zod

LLM-Router

SSE-Stream

Audit-Log

Gebaut für Compliance-Abteilungen.

OWASP Top 10 — vollständig abgedeckt

Die gleiche KI.Ohne eure Daten herzugeben.

Produktiv in Wochen, nicht Monaten.

Setup & Installation

Identity & Modelle

Wissen & Workflows

Rollout & Schulung

Alles, was eure IT wissen will.

Was Entscheider zuerst fragen.

KI, die euch gehört.Auf eurer Hardware.

Eine Oberfläche.
Der ganze KI-Workflow.

Nicht nur ein Chatfenster.
Ein komplettes KI-Betriebssystem.

Vom Rohdokument
zur belegten Antwort.

Echte Kundendaten nutzen.
Ohne Klartext-PII zu senden.

Ein Monolith.
Drei klare Schichten.

Die gleiche KI.
Ohne eure Daten herzugeben.

KI, die euch gehört.
Auf eurer Hardware.