AI & Machine Learning · ML Engineers und Bot-Entwickler

Conversational AI Deployment: NLU-Modelle produktiv nutzen deployment

Programm-Bild
dauer 5 Wochen
verbleibende plätze 11
lesezeit 7 Minuten
jetzt anmelden

Programminhalte

Phase 1: NLU-Grundlagen

  • Intent Classification und Entity Recognition
  • RASA NLU Pipeline konfigurieren
  • Dialogflow CX für komplexe Konversationen
  • Training Data Management und Annotierung

Phase 2: Modell-Optimierung

Quantisierung
FP32 zu INT8 Konvertierung für schnellere Inferenz
Distillation
Kleinere Modelle von großen Teacher-Modellen trainieren
Pruning
Unwichtige Neuronen-Verbindungen entfernen

Phase 3: Produktiv-Deployment

  • RASA Server mit Docker containerisieren
  • REST API und Webhook-Integration
  • Intent-Caching mit Redis
  • Fallback-Handler für unbekannte Anfragen
  • Multi-Language Support implementieren

Phase 4: Testing und Monitoring

  • Cross-Validation für Intent-Klassifizierung
  • Confusion Matrix Analyse
  • A/B-Testing verschiedener Modellversionen
  • Intent-Confidence-Tracking in Produktion
  • User-Feedback-Loop für Modell-Verbesserung

Abschlussprojekt: Produktionsreifes NLU-System mit dokumentierter Performance-Analyse und Deployment-Strategie.

Ein NLU-Modell in Jupyter Notebook zu trainieren ist eine Sache. Es in einem produktiven Chatbot zu deployen, der auf fünf Plattformen gleichzeitig läuft, ohne dass die Inferenz-Zeit explodiert, ist etwas völlig anderes.

Dieser Kurs konzentriert sich auf die praktischen Aspekte beim Deployment von Conversational AI. Sie arbeiten mit RASA, Dialogflow und selbst trainierten Transformers.

Modell-Optimierung für Produktion

Ein BERT-Modell mit 340 Millionen Parametern braucht 800ms für eine Inferenz. Zu langsam für Chatbots, wo Nutzer nach 2 Sekunden abspringen.

Sie lernen Quantisierung, Knowledge Distillation und Model Pruning. Ein optimiertes Modell antwortet in 120ms bei nur 6 Prozent Genauigkeitsverlust.

Integration in Multi-Plattform-Systeme

Jede Messaging-Plattform sendet Nachrichten in eigenem Format. Sie bauen eine Abstraktionsschicht, die Text normalisiert, bevor er ins NLU-Modell geht.

Die praktischen Sessions umfassen das Deployen von RASA-Servern mit Docker, das Cachen häufiger Intents und das Implementieren von Fallback-Strategien.

Sie trainieren ein eigenes Intent-Classification-Modell und deployen es auf drei verschiedenen Plattformen gleichzeitig.

Versionierung ist kritisch. Sie lernen, wie Sie neue Modellversionen testen, bevor Sie sie für alle Nutzer ausrollen. A/B-Testing zeigt, welches Modell bessere Ergebnisse liefert.

Der Dozent Linus Obermüller hat NLU-Systeme für Kundenservice-Chatbots mit über einer Million monatlicher Interaktionen gebaut.

275 gefällt mir

Fragen zum Programm?

standort Potsdam