Alle Artikel
On-Premise 7. Juni 2026 10 Min. Lesezeit

OpenClaw / Hermes: Ihr eigener KI-Assistent – 100 % On-Premise

Der Unternehmensassistent, der mit Ihren Dokumenten spricht, E-Mails und Angebote entwirft und Daten auswertet – auf Ihrer eigenen Hardware, ohne dass ein einziges Byte in die Cloud wandert. DSGVO-konform, ohne laufende Token-Kosten, mit offenen Modellen. Die Produktseite zu OpenClaw / Hermes ansehen →

OpenClaw / Hermes · läuft lokal auf Ihrer Hardware
Fasse den Rahmenvertrag mit Lieferant Nord zusammen.
Laufzeit bis 31.12., Kündigungsfrist 3 Monate. Wichtig: Preisgleitklausel in §4 (max. 5 % p. a.) und Haftungsbegrenzung in §9. Automatische Verlängerung in §12. Quelle: Rahmenvertrag_Nord.pdf · §4, §9, §12
↑ Antwort aus Ihren eigenen Dokumenten – mit Quellenangabe, ohne Cloud

Die meisten KI-Assistenten haben für Unternehmen einen Haken: Sie laufen in der Cloud eines US-Anbieters. Jedes Dokument, jede Frage, jeder Kundenname wird hochgeladen, pro Token abgerechnet und liegt außerhalb Ihrer Kontrolle. Für viele Mittelständler – vom Maschinenbauer bis zur Kanzlei – ist das schlicht keine Option. Genau dafür gibt es OpenClaw / Hermes: einen vollwertigen KI-Assistenten, der zu 100 % auf Ihrer eigenen Hardware läuft.

OpenClaw und Hermes sind zwei Namen für dasselbe Produkt – Ihren persönlichen Unternehmensassistenten. Er kennt Ihre Dokumente, beantwortet Fragen mit Quellenangabe, entwirft E-Mails und Angebote und wertet Zahlen in Klartext aus. In diesem Artikel zeigen wir, was Hermes konkret übernimmt, warum On-Premise 2026 der entscheidende Unterschied ist und wie Sie in vier bis sechs Wochen produktiv starten.

Was ist OpenClaw / Hermes?

OpenClaw / Hermes ist der hauseigene On-Premise-KI-Assistent von ki·spezial. Im Kern ist es eine vertraute Chat-Oberfläche – so einfach wie ein Messenger – die aber nicht mit einem anonymen Modell aus der Cloud spricht, sondern mit einem Sprachmodell, das direkt auf Ihrer Infrastruktur läuft und Zugriff auf Ihr Unternehmenswissen hat.

Technisch verbindet Hermes drei Bausteine: ein lokal betriebenes Open-Weight-Modell (z. B. Llama, Mistral oder Qwen), eine RAG-Wissensbasis über Ihre Dokumente und – bei Bedarf – Werkzeug-Anbindungen über das Model Context Protocol (MCP) an ERP, CRM oder E-Mail. So wird aus einem generischen Chatbot ein Assistent, der Ihr Unternehmen wirklich kennt.

Ein Produkt, zwei Namen: „OpenClaw" und „Hermes" bezeichnen denselben Assistenten. Entscheidend ist, was dahintersteht: Ihr eigenes Modell, Ihre eigenen Daten, Ihre eigene Hardware – mit einer Oberfläche, die Ihr ganzes Team ohne Schulung bedienen kann.

Warum ein On-Premise-Assistent 2026?

Drei Gründe machen den On-Premise-Betrieb 2026 zum entscheidenden Kriterium:

Datenhoheit und DSGVO. Sobald ein Mitarbeiter einen Vertrag oder eine Personalakte in einen Cloud-Assistenten zieht, verlässt diese Information das Unternehmen. Mit Hermes bleibt jedes Byte im Haus – der Betrieb ist DSGVO-konform, ohne Auftragsverarbeitungsverträge mit US-Anbietern und ohne Grauzonen beim Drittlandtransfer.

Keine Token-Kosten, planbare Kosten. Cloud-Assistenten rechnen pro Token ab – je intensiver die Nutzung, desto höher die monatliche Rechnung. Hermes läuft auf einmalig angeschaffter Hardware: Die Nutzung ist unbegrenzt, die Kosten sind kalkulierbar. Gerade bei breiter Team-Nutzung amortisiert sich das schnell.

Unabhängigkeit statt Vendor-Lock-in. Offene Modelle bedeuten: Sie sind nicht an einen Anbieter, ein Preismodell oder eine Roadmap gebunden. Wird ein besseres Open-Weight-Modell veröffentlicht, tauschen Sie es aus – Ihre Daten und Oberfläche bleiben. Mehr dazu in unserem Vergleich On-Premise vs. Cloud-KI 2026.

8 Aufgaben, die OpenClaw / Hermes übernimmt

Hermes ist kein Spielzeug-Chatbot, sondern eine tägliche Arbeitslast über alle Abteilungen hinweg. Auf der Produktseite können Sie sich die wichtigsten Lösungen live anschauen – hier im Überblick:

Aufgabe Was Hermes tut
Dokumente verstehen Verträge, Handbücher und PDFs zusammenfassen – mit Verweis auf die genaue Quelle
Angebote & E-Mails Versandfertige Entwürfe in Sekunden – inkl. passender Preise und Rabattstufen
Daten auswerten Umsätze, KPIs und Soll-Ist-Vergleiche in Klartext statt Zahlenfriedhof
Firmenwissen finden Sofortige Antworten aus dem gesamten Wissen – ohne Suche in Ordnern
HR & Verwaltung Fragen zu Urlaub, Tarif und Richtlinien – mit Verweis auf die Betriebsvereinbarung
Technik & Service Service-Doku, Fehlercodes und Ersatzteile in Sekunden statt Handbuch-Blättern
Meetings & Protokolle Aus Notizen wird ein Protokoll mit klaren Aufgaben und Fristen
100 % On-Premise Alles läuft im Haus – DSGVO-konform, ohne Cloud, ohne Token-Kosten

Praxisbeispiel: Vertrieb entwirft Angebote in Sekunden
Ein Großhändler nutzt Hermes, um Angebots-Mails direkt aus Anfragen zu erzeugen. Auf die Eingabe „Entwirf ein Angebot für 200 Stück Artikel A-12 mit 5 % Mengenrabatt" zieht Hermes Stückpreis und Rabattstufe aus der hinterlegten Preisliste, rechnet den Nettobetrag und liefert eine versandfertige Mail – inklusive korrekter Anrede und Lieferzeit. Aus 15 Minuten Handarbeit werden 20 Sekunden.

Praxisbeispiel: Servicetechniker findet die Lösung im Feld
Bei einem Anlagenbauer fragen Techniker Hermes direkt nach Fehlercodes: „Was bedeutet Fehler E-204 an Anlage 3?" Statt im 400-seitigen Handbuch zu blättern, nennt Hermes die wahrscheinliche Ursache, den Lösungsschritt und die passende Seite im Servicehandbuch – in Sekunden, auch offline auf dem Tablet.

OpenClaw / Hermes vs. Cloud-Assistent

Der direkte Vergleich macht den Unterschied deutlich – besonders dort, wo es um sensible Daten und laufende Kosten geht:

Kriterium Cloud-Assistent OpenClaw / Hermes
Datenhaltung In der Anbieter-Cloud Im eigenen Haus
Laufende Kosten Pro Token / pro Nutzer 0 € Token-Kosten
DSGVO AVV & Drittlandthema Konform by Design
Modelle Fest beim Anbieter Offen, austauschbar
Zugriff auf Firmenwissen Nur per Upload Integriert (RAG)

Wer eine reine ChatGPT-Alternative sucht, findet in unserem Beitrag zur DSGVO-konformen ChatGPT-Alternative weitere Argumente. Der entscheidende Punkt bleibt: Ein Assistent, der Ihr Unternehmen kennt, muss Zugriff auf Ihr Wissen haben – und das geht sicher nur im eigenen Haus.

Wie Hermes technisch funktioniert

Hinter der einfachen Chat-Oberfläche steckt eine bewährte Architektur aus drei Schichten:

Das Sprachmodell – lokal und austauschbar

Hermes nutzt offene Open-Weight-Modelle, die vollständig auf Ihrer Hardware laufen. Sie wählen die passende Größe: ein effizientes Small Language Model (7–8B) läuft bereits auf einer einzelnen GPU, ein ausgewogenes Modell (~30B) bietet die beste Balance, ein Reasoning-Modell (70B+) meistert komplexe Analysen. Da nichts an einen Anbieter gebunden ist, droht kein Qualitäts- oder Preis-Lock-in.

Die Wissensbasis – RAG auf Ihren Dokumenten

Über Retrieval-Augmented Generation erhält Hermes Zugriff auf Ihre Dokumente: Sie werden in Abschnitte zerlegt, als Embeddings in einer lokalen Vektordatenbank indexiert und bei jeder Frage passend herangezogen. Das Ergebnis: Antworten mit Quellenangabe statt erfundener Aussagen. Wie das im Detail funktioniert, lesen Sie in unserem Beitrag RAG-Systeme 2026.

Die Werkzeuge – Anbindung über MCP

Soll Hermes nicht nur lesen, sondern handeln – etwa eine Bestellung im ERP anlegen oder einen Kundeneintrag im CRM abrufen –, kommt das Model Context Protocol ins Spiel. Über MCP greift der Assistent kontrolliert und mit Rechteprüfung auf Ihre Systeme zu, ohne dass Sie sich an einen proprietären Standard binden.

DSGVO, Rechte und Datenhoheit

Weil Hermes vollständig im Haus läuft, ist Datenschutz kein nachträgliches Add-on, sondern Teil der Architektur:

  • Keine Cloud-Übertragung: Dokumente und Anfragen verlassen das Unternehmen nicht – auf Wunsch sogar komplett air-gapped.
  • Rollen & Rechte: Nicht jeder sieht alles. Über Zugriffsrechte steuern Sie, welche Abteilung welche Wissensbasis befragen darf.
  • Nachvollziehbarkeit: Jede Antwort verweist auf die Quelle – wichtig für interne Prüfungen und die Anforderungen des EU AI Acts.
  • Audit-Logging: Anfragen und genutzte Quellen lassen sich protokollieren, ohne dass Inhalte das Haus verlassen.

Mehr zum sicheren Betrieb erfahren Sie auf unserer Seite zu On-Premise-KI und in der KI-Beratung.

In 4–6 Wochen produktiv

Der Einstieg ist bewusst pragmatisch gehalten:

  1. Live-Demo: Wir zeigen Hermes an Ihren eigenen Beispielen – kostenlos und unverbindlich.
  2. Proof-of-Concept: Ein erster Anwendungsfall (z. B. Dokumenten-Chat oder Angebots-Entwürfe) wird auf Ihrer Hardware aufgesetzt – typischerweise in 4 bis 6 Wochen.
  3. Konfiguration: Modellgröße, Datenquellen und Fähigkeiten werden gemeinsam mit Ihnen festgelegt – im Konfigurator auf der Produktseite können Sie das vorab durchspielen.
  4. Rollout: Nach erfolgreichem Pilot wird Hermes Abteilung für Abteilung freigeschaltet und in den Betrieb übernommen.

Sie müssen sich nicht zwischen Beratung, Infrastruktur und Betrieb entscheiden: Mit KI Full Stack Providing bekommen Sie alles aus einer Hand – ein Partner, ein Vertrag, volle DSGVO-Konformität.

Häufig gestellte Fragen zu OpenClaw / Hermes

Was ist der Unterschied zwischen OpenClaw / Hermes und ChatGPT?

ChatGPT läuft in der Cloud von OpenAI – jede Anfrage und jedes hochgeladene Dokument verlässt Ihr Unternehmen und wird pro Token abgerechnet. OpenClaw / Hermes ist Ihr eigener Assistent auf Ihrer eigenen Hardware: Er kennt Ihre Dokumente, E-Mails und Daten, antwortet mit Quellenangabe und es entstehen keine laufenden Token-Kosten. Kein Byte verlässt Ihr Haus, der Betrieb ist DSGVO-konform und Sie sind unabhängig von einem einzelnen US-Anbieter.

Läuft OpenClaw / Hermes wirklich komplett ohne Cloud?

Ja. OpenClaw / Hermes läuft vollständig auf Ihrer eigenen Hardware – im eigenen Serverraum oder in einem deutschen Rechenzentrum Ihrer Wahl. Sprachmodell, Vektordatenbank und Oberfläche werden lokal betrieben. Auf Wunsch ist sogar ein komplett air-gapped Betrieb ohne jede Internetverbindung möglich. Ihre Dokumente und Anfragen verlassen das Unternehmen zu keinem Zeitpunkt.

Welche Sprachmodelle nutzt OpenClaw / Hermes?

OpenClaw / Hermes setzt auf offene Open-Weight-Modelle wie Llama, Mistral oder Qwen, die lokal betrieben werden – kein Vendor-Lock-in. Je nach Hardware und Anforderung wählen Sie die passende Größe: vom effizienten Small Language Model (7–8B, läuft auf einer GPU) über ein ausgewogenes ~30B-Modell bis zum großen Reasoning-Modell mit 70B+ für komplexe Aufgaben. Die Modelle lassen sich jederzeit gegen neuere austauschen.

Was kostet OpenClaw / Hermes und wie schnell ist es einsatzbereit?

Die Live-Demo und ein erster Proof-of-Concept auf Ihren eigenen Beispielen sind kostenlos. Eine produktive On-Premise-Installation inklusive Hardware liegt je nach Umfang typischerweise zwischen 15.000 und 60.000 Euro einmalig – ohne laufende Token-Kosten. Ein erster Pilot ist in der Regel in 4 bis 6 Wochen produktiv, danach wird Hermes Schritt für Schritt für weitere Abteilungen freigeschaltet.

OpenClaw / Hermes live an Ihren Daten erleben

Wir zeigen Ihnen Hermes an Ihren eigenen Beispielen – On-Premise, DSGVO-konform, in 4–6 Wochen zum Pilot. Kostenlose Live-Demo, unverbindlich.