b'nerd GmbH b'nerd GmbH
de | en
Managed AI API Gateway · EU-gehostet · DSGVO-konform

Private AI für Ihr Unternehmen — gehostet in Europa

OpenAI-kompatible Endpoints, kuratierte Open-Source-Modelle und transparente Credit-Abrechnung. Pilotieren Sie mit Starter ab 490€ / Monat, skalieren Sie zu Business und Enterprise — ohne Daten an US-Anbieter zu senden.

Pilot-Programme verfügbar — sprechen Sie uns an.

Hosting
Deutschland & EU
Compliance
DSGVO-konform
API
OpenAI-kompatibel

Use Cases

Echte KI — in den Tools, die Sie bereits nutzen

Wir hosten nicht einfach Modelle — wir bringen KI direkt in Ihre bestehenden Plattformen, damit Ihre Daten dort bleiben, wo sie hingehören.

Nextcloud AI

Dokumenten-Zusammenfassungen, semantische Suche und KI-Chat über Ihre Dateien — direkt in dem Nextcloud, das Sie ohnehin betreiben.

GitLab AI

Code-Erklärungen, Merge-Request-Zusammenfassungen und ein privater Entwicklungs-Assistent — innerhalb Ihres GitLab, nicht in einer fremden Cloud.

Agentic Coding & IDE-Assistenten

Ein privater Endpunkt für Claude Code, Cursor, Continue und CLI-Agenten. Ihr Code bleibt in Ihrer Umgebung.

Plattform

Ihre private KI-Plattform — vollständig gemanaged

Gebaut für regulierte Umgebungen, in denen Datensouveränität und planbarer Betrieb wichtiger sind als Benchmarks.

Privacy-first

DSGVO-konform per Design. Keine Daten verlassen Ihre Umgebung, nichts wird an öffentliche KI-APIs weitergegeben.

EU- & Deutschland-Hosting

Betrieben in europäischen Rechenzentren. Wählbar zwischen Deutschland und anderen EU-Regionen — je nach Compliance-Anforderung.

OpenAI-kompatible API

Drop-in-kompatible Endpunkte. Bestehende Tools auf unsere Plattform umschwenken, ohne Integrationen umzubauen.

Moderne Open-Source-Modelle

Kuratierte, produktionsreife Open-Source-Modelle. Aktualisiert und betrieben von uns — kein Modell-Wildwuchs bei Ihnen.

High-Performance-Inference

Betrieben auf moderner KI-Infrastruktur mit H100-Klasse-Hardware, optimiert für reale Workloads — nicht für Benchmarks.

Transparente Nutzung

Klare Nutzungstransparenz und planbare Kostenstruktur. Keine Überraschungsrechnungen durch Token-Spitzen.

Drop-in kompatibel

OpenAI-kompatibel — Umstellung in 5 Zeilen

Gleiche SDKs, gleiche Endpoints. Tauschen Sie Base URL und API-Key — und Ihre bestehenden Tools laufen auf der Private-AI-Plattform.

Beispiel-Modellname; verfügbare Modelle nennen wir auf Anfrage.

Architektur

Gebaut für Kontrolle und Transparenz

Eine Plattform, in die Sie hineinwachsen — vom ersten Pilot bis zu produktiven KI-Funktionen in Ihren Tools.

1
Shared Infrastructure mit klarer Trennung
Workloads laufen auf gemeinsamer Plattform-Infrastruktur mit strikter Mandantentrennung und paketabhängiger Priorisierung. Keine überraschenden Modellwechsel, keine fremden Daten in Ihrer Inference.
2
Gehostet in Europa
Betrieben in EU- und deutschen Rechenzentren, unter europäischer Jurisdiktion. Datenresidenz ist ein Deployment-Entscheid, kein Kleingedrucktes.
3
Offene Architektur
Open-Source-Modelle, OpenAI-kompatible API und Standard-Integrationen — sodass Sie später wechseln, austauschen oder selbst betreiben können. Kein Vendor-Lock-in.
4
Vom Starter zur Enterprise
Pilot mit Starter, skalieren Sie zu Business für produktive Lasten, wechseln Sie zu Enterprise für Governance, Compliance und individuelle SLAs.

Managed AI API Gateway

Preise

Drei Pakete für jeden Workload. Token-Preise und Credit-System gelten einheitlich für alle Tiers.

Alle Preise zzgl. MwSt. Nur für Geschäftskunden.

Welches Paket passt zu Ihnen?

Starter

Für kleinere produktive Workloads, interne Assistenten, RAG-Prototypen und kontrollierte API-Nutzung.

Business

Für Team- und Unternehmens-Workloads mit höherem Durchsatz, stabilerer Nutzung und priorisierter Verarbeitung.

Enterprise

Für geschäftskritische KI-Workloads mit Governance, Compliance, Integration und individuellen Betriebsanforderungen.

Starter

Prototypen & kleinere produktive Workloads.

490€ / Monat

Pilot starten

Inkludiert

  • 20 Mio. Credits / Monat
  • Shared Best-Effort AI Infrastruktur
  • OpenAI-kompatible API
  • Standard Queue Priorität
  • Standard API Limits & Context
  • Basis Monitoring
  • DSGVO-konformes Hosting in der EU
  • Verfügbarkeit: bis 99,5%
  • E-Mail Support
AM BELIEBTESTEN

Business

Priorisierte Verarbeitung für Team-Workloads.

1490€ / Monat

Demo anfragen

Inkludiert

  • 50 Mio. Credits / Monat
  • Priorisierte Verarbeitung in der Shared Infrastruktur
  • Erweiterte API Limits
  • Höhere Requests / Token pro Minute
  • Erweiterte Context Limits
  • Voller Zugriff auf Premium-Modelle
  • Optionaler VPN-Zugang · SSO möglich
  • Monitoring & erweitertes Usage Reporting
  • Verfügbarkeit: bis 99,9%
  • E-Mail Support · Slack Connect / Teams optional

Enterprise

Geschäftskritisch · Compliance · Custom.

ab

2490€ / Monat

Beratung anfragen

Inkludiert

  • Individuelle Credit-Kontingente
  • Höchste Priorisierung in der Shared Infrastruktur
  • Individuelle API Limits & Concurrency
  • Erweiterte Context Limits
  • Voller Zugriff auf Premium-Modelle
  • Private Networking möglich
  • VPN / SSO Integration
  • Audit Logging & erweitertes Reporting
  • Eigene Modelle optional integrierbar
  • Individuelle SLA Vereinbarungen
  • Priority Support (E-Mail, Telefon, Slack Connect / Teams)

Token-Preise

Preise je 1 Mio. Tokens. Gelten einheitlich für alle Pakete.

Standard
Chatbots · RAG · Automationen
Inklusive Nutzung 1,90€
OnDemand 2,90€
Advanced
Coding Assistants · Agenten · komplexe Assistenten
Inklusive Nutzung 4,90€
OnDemand 6,90€
Premium
Reasoning · High-End KI · komplexe Analyse
Inklusive Nutzung 9,90€
OnDemand 14,90€

Credit-System

Die Plattform rechnet credit-basiert ab. Modell-Klassen verbrauchen unterschiedlich viele Credits pro Token.

  • Standard 1× Credits
  • Advanced 3× Credits
  • Premium 6× Credits
Beispiel
  • 10 Mio. Standard Tokens = 10 Mio. Credits
  • 2 Mio. Advanced Tokens = 6 Mio. Credits
  • 0,5 Mio. Premium Tokens = 3 Mio. Credits
Gesamtverbrauch: 19 Mio. Credits

Credit-Rechner

Schätzen Sie Ihren Verbrauch und sehen Sie sofort, was jedes Paket kosten würde — inkl. OnDemand-Überlauf.

Geschätzte Nutzung

Chatbots, RAG, Automationen

0

Coding, Agenten, Assistenten

0

Reasoning, High-End

0

Eingaben in Mio. Tokens pro Monat. Credit-Faktoren: Standard 1×, Advanced 3×, Premium 6×.

Pakete im Vergleich

Gesamtverbrauch

0

Starter

Business

Enterprise

Paket anfragen

Unverbindliche Schätzung. Über das inkludierte Kontingent hinaus gelten OnDemand-Preise (proportional über alle Modell-Klassen).

Laufzeit & Vorauszahlung

Längere Laufzeit oder Vorauszahlung erhöht das Credit-Kontingent — die Listenpreise bleiben identisch.

Monatlich

Standard
  • Standardpreise
  • Flexible Nutzung
  • Keine Mindestlaufzeit

12 Monate Commitment

+20% Credits
  • +20% zusätzliche Credits pro Monat
  • Stabile Preisgrundlage über 12 Monate

12 Monate Vorauszahlung

+30% Credits
  • +30% zusätzliche Credits pro Monat
  • Voraus bezahlt — eine Abrechnung pro Jahr

Fair Usage & Performance

Ein API-first managed Service: Sie konzentrieren sich auf die Integration, wir betreiben Infrastruktur und Modelle. Paketabhängige Limits sorgen für stabile Performance unter Last.

Requests pro Minute

Tier-abhängige RPM-Limits schützen die Plattform und stellen vorhersagbare Antwortzeiten sicher.

Token pro Minute

TPM-Limits skalieren mit dem Paket — Business und Enterprise haben deutlich höhere Durchsätze.

Context Limits

Maximale Context-Größe je Request, abhängig vom Paket und Modell.

Queue Priorisierung

Priorisierte Lanes für Business und Enterprise sorgen für stabilere Antwortzeiten unter Last.

Private AI — FAQs

Häufige Fragen zu Datenresidenz, Integrationen und Engagement-Modell.

Sie haben Fragen oder wünschen ein individuelles Angebot? Wir beraten Sie gerne.

Kontakt

Unsere Cloud Experten beraten Sie gerne und individuell.

Unser Büro

Sillemstraße 76A

20257 Hamburg, Deutschland

Mo - Fr: 09.00 - 18.00 Uhr

Telefon
+49 40 239 69 754 0
Email
hello@bnerd.com
Kontakt aufnehmen