previous icon Zurück zum Blog
May 27, 2026
5 Minuten gelesen

Die Messlatte für Sprach-KI liegt höher, als man denkt. Hier erfahren Sie, was wir neu entwickelt haben, um diese Hürde zu nehmen

Die Kunden, die anrufen, sind keine zufällige Stichprobe Ihres Kundenstamms. Sie haben die FAQs durchgesehen. Sie haben eine Nachricht geschickt. Sie haben gewartet – oder es gar nicht erst versucht –, weil das, was sie sagen müssen, zu kompliziert, zu dringend oder zu wichtig ist, um es zu tippen. Wenn sie schließlich zum Telefon greifen, sind sie bereits etwas frustriert und fest entschlossen, eine Antwort zu erhalten. Die nächsten drei Minuten werden ihre Meinung über Ihr Unternehmen stärker prägen, als es jeder Chat jemals könnte. Das sind die Menschen, mit denen Sprach-KI spricht. Und die meisten Sprach-KI-Systeme sind nicht für diese Menschen konzipiert.

Rutger de Ruiter
Rutger de Ruiter,
Head of Product Engage

Warum die Sprachkommunikation der anspruchsvollste Kanal in der Kundenerfahrung ist

Die emotionale Belastung hat eine direkte technische Auswirkung. Eine Verzögerung von zwei Sekunden bei einer Chat-Antwort fällt nicht auf. Bei einem Telefonat ist dies der Moment, in dem sich der Anrufer fragt, ob die Verbindung abgebrochen ist. Ein generischer Warteton in einem Chat-Widget ist leicht nervig. Bei einem Telefonat, das sich endlos wiederholt, signalisiert es sofort, dass niemand wirklich über dieses Erlebnis nachgedacht hat. Eine falsche Antwort im Chat kann in der nächsten Nachricht korrigiert werden. Bei einem Telefonat ist es das Letzte, was der Anrufer hört, bevor er nach einem Menschen fragt.

Jede Anforderung, die auf anderen Kanälen nachsichtig behandelt wird, ist bei Sprachdiensten streng. Reaktionsgeschwindigkeit. Gesprächsführung. Was der Anrufer hört, während die KI nachdenkt. Wie Ihre Marke klingt. Ob die KI tatsächlich etwas tun kann oder nur Fragen beantwortet. Jeder einzelne Fehler reicht aus, um das Gespräch als gescheitert empfinden zu lassen und diesen wertvollen Anrufer direkt an einen Menschen oder, schlimmer noch, an einen Konkurrenten weiterzuleiten.

Die meisten Sprach-KI-Produkte behandeln dies als eine Liste von Funktionen. Wir haben es als Neugestaltung betrachtet.

Was wir in HALO Voice neu entwickelt haben

Eine neue Sprachverarbeitungs-Pipeline. Wir haben die Sprach-zu-Text- und Text-zu-Sprache-Funktionen von Grund auf neu entwickelt. Die Transkription ist schneller und genauer. Die Sprachausgabe ist flüssiger und konsistenter. Die Zeit bis zum ersten Wort war eine bewusste Priorität, denn die Verzögerung zwischen dem Ende des Satzes eines Anrufers und dem Beginn der Antwort der KI macht sich bei Sprachkommunikation auf eine Weise bemerkbar, wie es sonst nirgendwo der Fall ist.

Intelligente Sprechwechselerkennung. HALO Voice erkennt, wann ein Anrufer zu Ende gesprochen hat, und antwortet in natürlichen Zeitabständen. Kein Durcheinanderreden. Keine Pausen, in denen sich der Anrufer fragt, ob das System noch funktioniert. Das Gespräch verläuft wie ein echtes, denn die KI weiß, wann sie an der Reihe ist.

Kontextbezogene Fülltöne und das Audioverse. Während die KI Daten verarbeitet, wartet der Anrufer. Wir haben generische Verarbeitungsgeräusche durch kontextbezogene Füllphrasen ersetzt, die dem entsprechen, was der Agent gerade tut. Während einer Wissenssuche: „Lassen Sie mich mal sehen, was ich finden kann.“ Während der Tool-Ausführung: „Einen Moment bitte, ich habe es fast.“ Das Audioverse fügt subtile Umgebungsgeräusche hinzu, die eine echte Kundendienstumgebung nachahmen. Das ist der Unterschied zwischen dem Gefühl des Anrufers, jemanden erreicht zu haben, und dem Gefühl, etwas erreicht zu haben.

ElevenLabs und das Lexicon. Wir sind zu ElevenLabs als primärem Sprachdienstleister für HALO gewechselt und haben Azure TTS außer Betrieb genommen. Der Unterschied in Sachen Natürlichkeit und Ausdruckskraft ist erheblich. Sprachprofile sind pro Sprache und pro Umgebung konfigurierbar und können vor der Bereitstellung in der Vorschau angehört werden. Das Lexicon gibt Ihnen die genaue Kontrolle über die Aussprache: Verhindern Sie, dass ein Markenname übersetzt wird, legen Sie einen Alias für eine URL oder Abkürzung fest, buchstabieren Sie ein Akronym Buchstabe für Buchstabe. Kleine Details, die zusammen ein Erlebnis schaffen, das sich wie gestaltet und nicht wie generiert anhört.

Agenten-Tool-Integration. HALO Voice lässt sich nativ mit denselben Agenten, Tools und der Wissensdatenbank verbinden, die auch den Rest von HALO antreiben. Der Sprachagent führt echte Workflows aus: Buchungen, Abrufen von Kontoinformationen, Weiterleiten, Eskalieren. Er ruft nicht nur vorformulierte Antworten ab. Die Unterstützung von DTMF-Eingaben erweitert dies auf Anrufer, die präzise numerische Informationen eingeben müssen.

WhatsApp-Anrufe. Kunden möchten so anrufen, wie sie es möchten. Für einen wachsenden Anteil von ihnen bedeutet das WhatsApp, nicht die Wähltastatur. HALO Voice unterstützt beides. Ein WhatsApp-Anruf erreicht denselben Sprachagenten, mit derselben Sprachpipeline, derselben Turn-Erkennung, denselben Tools und demselben Kontext. Keine separate Einrichtung, keine Beeinträchtigung des Nutzererlebnisses, kein zweitklassiger Kanal. Ganz gleich, ob der Anrufer Ihre Nummer wählt oder auf die Anrufschaltfläche in einem bereits geöffneten WhatsApp-Chat tippt – das Gespräch verläuft auf dieselbe Weise.

Das Detail, das alles verändert

All dies macht HALO Voice zu einer besseren Sprach-KI. Doch es gibt eine Anforderung, die sich weder durch Sprachqualität noch durch Fülltöne allein lösen lässt: Der Anrufer sollte sich nicht wiederholen müssen.

Ein Anrufer, der bereits andere Kanäle ausprobiert hat, hat mit ziemlicher Sicherheit bereits Erfahrungen mit Ihrem Unternehmen gemacht. Eine WhatsApp-Nachricht, die letzte Woche gesendet wurde. Eine Bestellung, die gestern aufgegeben wurde. Eine Beschwerde, die heute Morgen eingegangen ist. Wenn die Sprach-KI nichts davon weiß, werden alle anderen Verbesserungen in dem Moment zunichte gemacht, in dem sie den Anrufer auffordert, von vorne zu beginnen.

Genau hier unterscheidet sich HALO von anderen Lösungen. HALO Voice ist kein eigenständiges Sprachprodukt. Es ist derselbe Agent, der Ihre WhatsApp-Nachrichten, Ihren Chat und Ihre Nachrichten bearbeitet und nun auch ans Telefon geht. Dieselbe Wissensdatenbank. Dieselben Tools. Dieselbe Kundendatenebene. Der in einem Kanal festgelegte Kontext ist automatisch in jedem anderen Kanal verfügbar – in beide Richtungen. Der Sprachagent weiß schon vor dem ersten Wort, mit wem er spricht, weil er bereits mit dieser Person gesprochen hat.

Das ist es, was ein Sprachautomatisierungsprojekt von einem echten CX-Vorteil unterscheidet. Nicht eine Sprach-KI, die isoliert betrachtet natürlich klingt. Sondern ein Agent, der den Kunden bereits kennt – egal, welchen Kanal dieser als Nächstes nutzt.

Der Kanal, den man richtig hinbekommen sollte

Die Telefonie wurde viel zu lange als veralteter Kanal betrachtet. Zu teuer, um sie zu skalieren, zu riskant, um sie zu automatisieren, zu komplex, um sie zu modernisieren. Das Ergebnis ist, dass die meisten Unternehmen massiv in alle anderen Kanäle investiert haben, während ihr emotional wichtigster Kontaktpunkt weiterhin auf einer Infrastruktur aus dem letzten Jahrzehnt läuft.

Die Kunden, die anrufen, sind bereits Ihre engagiertesten. Sie brauchten dringend Hilfe, um zum Telefon zu greifen. Wie dieser Anruf verläuft, prägt ihre Meinung über Ihr Unternehmen weitaus stärker als jede Chat-Interaktion. Die Technologie, um diese Anrufe gut zu bewältigen, existiert bereits. Die Frage ist, ob die dahinterstehende Plattform entsprechend ausgelegt ist.

Genau das ist HALO.

Möchten Sie sehen, wie das in Ihrer Umgebung funktioniert? Lesen Sie die vollständige Dokumentation in unserem Knowledge Center oder wenden Sie sich an unser Team.

War dieser Artikel interessant?
Teilen Sie ihn!
Tags
Rutger de Ruiter
Rutger de Ruiter,
Head of Product Engage
logo linkedin icon

Lassen Sie sich inspirieren

Ai governance
Apr 29, 2026 • AI

KI wird immer intelligenter und selbstständiger. Wie behält man die Kontrolle?

Immer mehr Unternehmen setzen KI-Agenten ein, deren Aufgaben weit über die Erstellung von Inhalten oder die Beantwortung einfacher Fragen hinausgehen. Sie bearbeiten Kundenanfragen, aktualisieren Systeme, lösen Arbeitsabläufe aus und wickeln sogar Transaktionen ab. Dies sorgt für Schnelligkeit, Effizienz und Entlastung von manuellen, sich wiederholenden Aufgaben. Doch sobald KI anfängt, Aufgaben zu übernehmen, anstatt nur zu assistieren, verschiebt sich etwas Grundlegendes. Man braucht mehr als nur clevere Technologie. Man braucht einen klaren Weg, um die Kontrolle darüber zu behalten, was sie tut, warum sie es tut und innerhalb welcher Grenzen sie agieren darf.

3 types of ai
Mar 25, 2026 • HALO

Neu in HALO: Analysen, die Ihnen zeigen, was Ihre KI tatsächlich tut

Kundendienstteams sind an präzise Analysen gewöhnt. Durchschnittliche Bearbeitungszeit, Lösung beim ersten Kontakt, CSAT-Werte – Zahlen, die klar, vergleichbar und leicht in Berichten darzustellen sind. KI-Agenten verändern diese Dynamik grundlegend.

Whatsapp voice introduction to HALO
Dec 03, 2025 • HALO

HALO führt WhatsApp Voice ein

Kunden kommunizieren zunehmend über Apps statt über herkömmliche Telefonanrufe. Aus diesem Grund führen wir heute eine wichtige Erweiterung von HALO ein: Voice Agents können nun eingehende Anrufe über WhatsApp automatisch bearbeiten. Außerdem blicken wir auf die Verbesserungen zurück, die wir in den letzten Monaten an HALO vorgenommen haben. Entwicklungen, die Sprache und Chat näher zusammenbringen und Unternehmen dabei helfen, schneller und konsistenter zu automatisieren.

3 types of AI
Oct 29, 2025 • AI

Die Kraft der KI entfesseln: Wie Generative, Agentic und Predictive AI das Kundenerlebnis verändern

Künstliche Intelligenz (KI) wird seit Jahrzehnten entwickelt, aber die Art und Weise, wie wir sie heute nutzen, hat sich dramatisch verändert. Mit dem Aufkommen von ChatGPT und anderen Anwendungen ist KI plötzlich für die breite Öffentlichkeit greifbar geworden. Während sie früher vor allem für spezifische, oft unsichtbare Anwendungen eingesetzt wurde (man denke an Betrugserkennung im Bankwesen oder vorausschauende Wartung in der Industrie), unterstützt sie heute aktiv die Erstellung von Inhalten, verbessert das Kundenerlebnis und rationalisiert Prozesse. Im Bereich Kundenerlebnis sind drei Formen der KI besonders relevant: generative, agentenbasierte und prädiktive KI. In diesem Artikel werden wir sie näher betrachten und erklären, wie man sie effektiv nutzen kann.

blog-picking-ai-platform
Sep 17, 2025 • AI

Die Entscheidung für die beste KI-Plattform: Vergleich von Funktionen, Kosten und Anwendungsfällen

KI-Plattformen spielen eine immer wichtigere Rolle dabei, wie Unternehmen ihren Kundenservice und ihr Marketing organisieren. Ganz gleich, ob Sie ein kleines Support-Team leiten, das eine große Anzahl von Anfragen bearbeitet, oder eine internationale Organisation verwalten, die täglich Tausende von Interaktionen verarbeitet – die Wahl der richtigen Plattform macht einen großen Unterschied. Aber welche KI-Plattformen gibt es überhaupt? Wie funktionieren sie und in welchen Situationen spielen sie ihre Stärken besonders aus? In diesem Artikel vergleichen wir sechs weit verbreitete KI-Plattformen: HALO, N8N, Neople, Intercom, Zendesk und Salesforce. Wir untersuchen ihre Stärken und Schwächen und zeigen, welche Art von Organisation am meisten von jeder einzelnen profitiert.

blog-ai-for-the-future
Aug 20, 2025 • AI

So wählen Sie die richtige KI-Plattform für Ihr Unternehmen aus: Ein strategischer Leitfaden

Sind Ihre Tools für die Kundenkommunikation mit den sich schnell ändernden Erwartungen von heute Schritt halten? In einer Welt, in der nahtlose, personalisierte Interaktionen die Norm sind, war die Wahl der richtigen KI-Plattform noch nie so wichtig wie heute. Was einst ein operatives Anliegen der Service- oder Marketingabteilungen war, ist heute zu einer zentralen strategischen Frage für Führungsteams geworden. In Branchen, in denen das Kundenerlebnis im Mittelpunkt steht, wie E-Commerce und Reisen, geht es nicht mehr nur um Effizienzsteigerung, sondern darum, in einem Markt wettbewerbsfähig zu bleiben, in dem sich die Erwartungen der Kunden täglich weiterentwickeln.

halo
Aug 06, 2025 • AI

Warum vorgefertigte KI-Agenten eine bahnbrechende Neuerung sind

In der schnelllebigen Welt von heute erwarten Kunden einen sofortigen, nahtlosen Service. Ob es um die Verfolgung einer Bestellung, die Vereinbarung eines Termins oder die Abwicklung einer Rücksendung geht – Unternehmen stehen unter dem Druck, schnelle und präzise Antworten zu liefern, ohne dabei die Kosten in die Höhe zu treiben oder ihre Teams zu überlasten. Vorgefertigte KI-Agenten, die auf agentenbasierter KI basieren, treten an, um diese Herausforderung zu meistern.

Is this region a better fit for you?
Go
close icon