Cloudera AI Inference Service

Fördern Sie die Entwicklung und den Einsatz von KI, und schützen Sie gleichzeitig alle Phasen des KI-Lebenszyklus.

Der Cloudera AI Inference Service basiert auf NVIDIA NIM-Microservices und bietet mit bis zu 36-mal schnellerer Inferenz auf NVIDIA-GPUs und fast 4-mal höherem CPU-Durchsatz eine marktführende Leistung. So optimiert er das KI-Management und die -Governance nahtlos in öffentlichen und privaten Clouds.

Ein Service für alle Anforderungen Ihres Unternehmens an KI-Inferenz

Bereitstellung mit einem Klick: Bringen Sie Ihr Modell schnell von der Entwicklung in die produktive Nutzung – unabhängig von der Umgebung.

Eine gesicherte Umgebung: Profitieren Sie von robuster, durchgängiger Sicherheit in allen Phasen Ihres KI-Lebenszyklus.

Eine Plattform: Verwalten Sie Ihre Modelle allesamt reibungslos auf einer einzigen Plattform, die all Ihre KI-Anforderungen erfüllt.

Unterstützung aus einer Hand: Erhalten Sie von Cloudera einheitlichen Support für sämtliche Fragen zu Hardware und Software.

Hauptmerkmale des Cloudera AI Inference Service

* Funktion demnächst verfügbar. Kontaktieren Sie uns gerne, wenn Sie weitere Informationen wünschen.

Bereitstellungsoptionen für AI Inference Service

Führen Sie Inferenz-Workloads lokal oder in der Cloud aus, ohne Kompromisse bei Leistung, Sicherheit oder Kontrolle einzugehen.

Cloudera in der Cloud

Multi-Cloud-Flexibilität: Bereitstellung in öffentlichen Clouds ohne Bindung an einen bestimmten Ökosystem-Anbieter.
Kürzere Amortisationszeit: Beginnen Sie mit dem Inferenzieren ohne Infrastruktureinrichtung – ideal für schnelle Experimente.
Elastische Skalierbarkeit: Bewältigen Sie unvorhersehbaren Datenverkehr mit automatischer Skalierung auf Null und GPU-optimierten Microservices.

Cloudera on Premises

Datensouveränität: Behalten Sie die volle Kontrolle. Sorgen Sie dafür, dass Ihre Modelle, Prompts und Assets vollständig hinter Ihrer Firewall geschützt sind.
Air-Gap-fähig: Konzipiert für regulierte Umgebungen wie von Behörden, Finanzdienstleistern und im Gesundheitswesen.
Vorhersehbare und niedrigere Gesamtbetriebskosten: Vermeiden Sie Überraschungen durch feste Preise und niedrigere Gesamtbetriebskosten im Vergleich zu tokenbasierten Cloud-APIs.

DEMO

Überzeugen Sie sich selbst davon, wie einfach die Modellbereitstellung sein kann

Erfahren Sie, wie einfach Sie mit den leistungsstarken Tools von Cloudera große Sprachmodelle bereitstellen können, um umfangreiche KI-Anwendungen effektiv zu verwalten.

Integration der Modellregistrierung:
Speichern, versionieren und verwalten Sie Modelle nahtlos über das zentrale Repository Cloudera AI Registry, und greifen Sie auf diese zu.

Einfache Konfiguration und Bereitstellung: Stellen Sie Modelle in Cloud-Umgebungen bereit, richten Sie Endpunkte ein, und passen Sie für höhere Effizienz die automatische Skalierung an.

Überwachung der Leistung:
Beheben Sie Fehler, und optimieren Sie die Leistung basierend auf wichtigen Metriken wie Latenz, Durchsatz, Ressourcenauslastung und Modellzustand.

Mit Cloudera AI Inference, das auf der KI-Expertise von NVIDIA beruht, können Sie das volle Potenzial von Daten in großem Maßstab ausschöpfen und sie mit Sicherheitsfunktionen auf Unternehmensniveau schützen. So sind Ihre Daten zuverlässig geschützt, und Sie können Workloads vor Ort oder in der Cloud ausführen, während Sie KI-Modelle effizient und mit der nötigen Flexibilität und Governance bereitstellen.

– Sanjeev Mohan, leitender Analyst, SanjMo

Erfahren Sie mehr

Webinar Skalieren generativer KI mit Cloudera und NVIDIA: Bereitstellen von LLMs mit AI Inference

News Cloudera stellt AI Inference Service mit eingebetteten NVIDIA NIM-Microservices vor, mit dem sich Entwicklung und Bereitstellung generativer KI beschleunigen lassen.

Whitepaper Unternehmens-KI mit Cloudera und NVIDIA beschleunigen

Gehen Sie den nächsten Schritt

Erkunden Sie die leistungsstarken Funktionen, und tauchen Sie mithilfe der Ressourcen und Anleitungen in die Details ein, damit Sie schnell loslegen können.

AI Inference Service – Produkttour

Gewinnen Sie einen Eindruck von Cloudera AI Inference Service in der Praxis.

Jetzt starten

AI Inference Service – Dokumentation

Hier finden Sie alles von Funktionsbeschreibungen bis hin zu hilfreichen Implementierungsleitfäden.

Dokumentation erkunden

Weitere Produkte erkunden

Cloudera AI

Beschleunigen Sie die datenbasierte Entscheidungsfindung von der Recherche bis zur Produktion mit einer sicheren, skalierbaren und offenen Plattform für Unternehmens-KI.

AI Studios

Erschließen Sie Workflows für private generative KI und agentische Workflows für jedes Qualifikationsniveau, mit der Geschwindigkeit von Low-Code- und der Kontrolle von Full-Code-Entwicklungen.

AI Assistants

Machen Sie sich die Leistungsfähigkeit von KI sicher und in großem Umfang in Ihrem Unternehmen zunutze, und sorgen Sie dafür, dass alle Erkenntnisse nachvollziehbar, erklärbar und vertrauenswürdig sind.

AMPs

Entdecken Sie das durchgängige Framework für umgehendes Erstellen, Bereitstellen und Überwachen von direkt einsatzbereiten ML-Anwendungen.

Cloudera AI Inference Service

Fördern Sie die Entwicklung und den Einsatz von KI, und schützen Sie gleichzeitig alle Phasen des KI-Lebenszyklus.

Ein Service für alle Anforderungen Ihres Unternehmens an KI-Inferenz

Hauptmerkmale des Cloudera AI Inference Service

Hybrid- und Multi-Cloud-Unterstützung

Detaillierte Daten- und Modell-Lineage

Sicherheit auf Unternehmensniveau

Inferenzfunktionen in Echtzeit

Hochverfügbarkeit und dynamische Skalierung

Flexible Integration

Unterstützung zahlreicher KI-Frameworks

Fortschrittliche Bereitstellungsmuster

Offene APIs

Betriebliche Überwachung