AI & Machine Learning · ML Engineers und Bot-Entwickler

Conversational AI Deployment: NLU-Modelle produktiv nutzen deployment

dauer 5 Wochen

verbleibende plätze 11

lesezeit 7 Minuten

jetzt anmelden

Programminhalte

Phase 1: NLU-Grundlagen

Intent Classification und Entity Recognition
RASA NLU Pipeline konfigurieren
Dialogflow CX für komplexe Konversationen
Training Data Management und Annotierung

Phase 2: Modell-Optimierung

Quantisierung: FP32 zu INT8 Konvertierung für schnellere Inferenz
Distillation: Kleinere Modelle von großen Teacher-Modellen trainieren
Pruning: Unwichtige Neuronen-Verbindungen entfernen

Phase 3: Produktiv-Deployment

RASA Server mit Docker containerisieren
REST API und Webhook-Integration
Intent-Caching mit Redis
Fallback-Handler für unbekannte Anfragen
Multi-Language Support implementieren

Phase 4: Testing und Monitoring

Cross-Validation für Intent-Klassifizierung
Confusion Matrix Analyse
A/B-Testing verschiedener Modellversionen
Intent-Confidence-Tracking in Produktion
User-Feedback-Loop für Modell-Verbesserung

Abschlussprojekt: Produktionsreifes NLU-System mit dokumentierter Performance-Analyse und Deployment-Strategie.

Ein NLU-Modell in Jupyter Notebook zu trainieren ist eine Sache. Es in einem produktiven Chatbot zu deployen, der auf fünf Plattformen gleichzeitig läuft, ohne dass die Inferenz-Zeit explodiert, ist etwas völlig anderes.

Dieser Kurs konzentriert sich auf die praktischen Aspekte beim Deployment von Conversational AI. Sie arbeiten mit RASA, Dialogflow und selbst trainierten Transformers.

Modell-Optimierung für Produktion

Ein BERT-Modell mit 340 Millionen Parametern braucht 800ms für eine Inferenz. Zu langsam für Chatbots, wo Nutzer nach 2 Sekunden abspringen.

Sie lernen Quantisierung, Knowledge Distillation und Model Pruning. Ein optimiertes Modell antwortet in 120ms bei nur 6 Prozent Genauigkeitsverlust.

Integration in Multi-Plattform-Systeme

Jede Messaging-Plattform sendet Nachrichten in eigenem Format. Sie bauen eine Abstraktionsschicht, die Text normalisiert, bevor er ins NLU-Modell geht.

Die praktischen Sessions umfassen das Deployen von RASA-Servern mit Docker, das Cachen häufiger Intents und das Implementieren von Fallback-Strategien.

Sie trainieren ein eigenes Intent-Classification-Modell und deployen es auf drei verschiedenen Plattformen gleichzeitig.

Versionierung ist kritisch. Sie lernen, wie Sie neue Modellversionen testen, bevor Sie sie für alle Nutzer ausrollen. A/B-Testing zeigt, welches Modell bessere Ergebnisse liefert.

Der Dozent Linus Obermüller hat NLU-Systeme für Kundenservice-Chatbots mit über einer Million monatlicher Interaktionen gebaut.

1.190 EUR

Einmalzahlung, GPU-Rechenzeit inkl.

Zugang zu GPU-Servern für Modell-Training enthalten. Alumni-Rabatt 15 Prozent.

veröffentlicht 2025-11

format ML Engineers und Bot-Entwickler

kategorie AI & Machine Learning

275 gefällt mir

Fragen zum Programm?

e-mail [email protected]

telefon +49 160 9977 1008

standort Potsdam