Hier sammeln die Neohelden die wichtigsten Begriffe rund um Conversational AI, Voice, Chatbots und co., um den KI-Begriff in diesem Bereich zu demystifizieren.
Ein Standard von Microsoft, der eine einfache Darstellung von Inhalten in Chats, Teams oder Outlook ermöglicht. Die Neohelden haben diesen Standard in Flutter mit Microsoft re-implementiert.
Ein KI-Assistent ist ein sprach- bzw. chatbasiertes Nutzer-Interface, das Aufgaben für den Nutzer übernehmen kann.
Kurzform für “Applikation”. Apps sind Software-Programme für Plattformen, wie bspw. iOS oder Windows. Neo zum Beispiel gibt es auch als App für Android, iOS, macOS, Linux und Windows.
Chatbots sind Dialogsysteme, d.h. intelligente Systeme die Fragen von Nutzern verstehen und beantworten können. Sie werden gerne im Kundensupport eingesetzt, um Anfragen sofort, 24/7 und direkt zu beantworten. » Vergleich Chatbots vs. Digitale Assistenten
Die Confidence bezeichnet die Wahrscheinlichkeit, mit welcher bspw. eine Nutzeranfrage einem Intent zugeordnet werden konnte. Diese Angabe erfolgt meist in Prozent (0-1).
Bei einigen Conversational AI Plattformen kann ein Confidence Threshold eingestellt werden, sodass Fragen nur beantwortet werden, wenn die Confidence einen bestimmten Schwellwert überschreitet.
Conversational Artificial Intelligence ist der Oberbegriff für intelligente, dialogbasierte Systeme, die bspw. als Chatbots, Sprachassistenten oder Digitale Assistenten eingesetzt werden.
Eine App oder Web-App, über die Nutzer in Form einer natürlichen Konversation (Sprache oder Text) interagieren können. Das Ziel eines Conversational Interface ist es, eine Aufgabe in einer natürlich wirkenden Interaktionsform schneller und effizienter zu erledigen.
Ein Tool mit dem die Dialogführung eines Chatbots oder Sprachassistenten definiert werden können. Mit einem Dialog Management System werden die Antworten und Konversationsverläufe meist regel- oder kontextbasiert verfasst.
Ein Tool von Google, mit dem digitale Assistenten, Chatbots und Actions für den Google Assistant entwickelt werden können. Dialogflow umfasst dabei eine NLP-Komponenten sowie ein Dialog Management System. Alternativen sind LUIS, IBM Watson oder die Neo Enterprise Assistant Platform, die auch mit Dialogflow integriert werden kann.
Ein digitaler Assistent ist im Gegensatz zu einem Chatbot ein intelligenter Assistent, der „seinen” Nutzer kennt und ihm für verschiedenste Anwendungsfälle zur Seite steht (vgl. KI-Assistent). » Vergleich Digitale Assistenten vs. Chatbots
Anfragen können neben einem Intent auch weitere Infos beinhalten, die als sog. Entität extrahiert werden können. In einer Anfrage wie „Buche einen Flug nach New York” könnte New York als Entity „Destination” extrahiert werden, sodass ein Digitaler Assistent diese Information bereits kennt und verarbeiten kann. Häufig werden die Begriffe Entity und Slot als Synonyme verwendet.
Im Kontext von Conversational AI bezeichnet ein Flow eine Konversation, d.h. vom Start durch einen Intent oder eine Aktion eines Drittsystems bis zur erfolgreichen Beantwortung bzw. Bearbeitung durch den KI-Assistenten.
Ein Entwicklungs-Kit von Google auf Basis der Programmiersprache Dart, mit dem Apps für verschiedene Plattformen mit einer einzigen Code-Basis entwickelt werden können. Die Neohelden setzen Flutter für die Entwicklung der Neo App ein.
Intents sind im Endeffekt die Aktionen oder Aufgaben, die ein Digitaler Assistent für Dich erledigen kann. Es handelt sich dabei quasi um Kategorien, in welche beispielsweise Nachrichten oder E-Mails von einem KI-Modell kategorisiert werden. Ein Intent sollte dabei immer das Ziel bzw. die Intension des Nutzers widerspiegeln. Für das Training des KI-Modells wird jedem Intent einige Beispiel-Sätze (Utterances) hinzugefügt.
Mit einem IVR-System können Anrufer automatisiert natürliche Konversationen führen. Es ist quasi, als wäre ein Digitaler Assistent am anderen Ende der Leitung, sodass Anrufe 24/7 und vollautomatisch beantwortet werden können.
Die Oberfläche bzw. Schnittstelle, über die ein Nutzer mit seiner Software interagiert.
Die JavaScript Object Notation ist ein Datenformat, mit dem strukturiert Daten zwischen Systemen oder Komponenten übermittelt werden können. Die Besonderheit hier ist die einfache Lesbarkeit und Nachvollziehbarkeit für Menschen und die zugleich einfache Verarbeitbarkeit für Maschinen.
Microsoft Luis kann, ähnlich wie Dialogflow, genutzt werden, um Intents und Entities aus Nutzeranfragen zu extrahieren. Alternativen sind neben Dialogflow auch IBM Watson oder die Neo Enterprise Assistant Platform, die aber auch mit LUIS integriert werden kann.
Beschreibt den Ansatz, dass Systeme oder Programme einfach angepasst werden können, ohne dass dafür eine Programmierung mit einer Programmiersprache notwendig ist, indem bspw. im Baustein-Prinzip gearbeitet wird.
Der Einsatz von Technologie und Algorithmen zur Übersetzung von menschlicher Sprache in maschinell-verarbeitbare Daten. NLP kann also als „Übersetzer” zwischen Mensch und Maschine fungieren und dafür sorgen, dass entsprechende Funktionen oder Aktionen ausgeführt werden.
NLU ist ein Feld innerhalb von NLP, das sich mit dem Verständnis und der Interpretation der Sprache befasst. Es geht also darum, zu verstehen, was ein Text bedeutet und was damit gemeint ist.
Mit dieser Conversational-AI Plattform können eigene digitale Assistenten und Chatbots entwickelt sowie betrieben werden. Im Gegensatz zu anderen Anbietern kann die NEAP auch On-Premises betrieben werden, ist offline-fähig und als Low-Code/No-Code Plattform einfach nutzbar.
Mit der Neo App können Nutzer mit dem digitalen Assistenten Neo interagieren. Die App unterstützt dabei sowohl Text- wie auch Spracheingabe und kann diverse Inhaltsformate, wie einfachen Text, Adaptive Cards, Bilder oder Videos, darstellen.
Die App läuft dabei Cross-Plattform auf iOS, Android, macOS, Windows und Linux sowie im Web und kann mit der NEAP direkt genutzt werden.
Wenn ein Sprachmodell eine Anfrage nicht einem Intent zuordnen kann oder dies nur mit einer geringen Wahrscheinlichkeit erfolgen konnte, wird eine No-Intent oder Low-Confidence Aktion ausgeführt, sodass der Digitale Assistent diesen Fehler entsprechend händeln kann.
In der Neo Enterprise Assistant Platform werden alle Anfragen in ein einheitliches JSON-Schema überführt, sodass sie von verschiedenen Systemen bearbeitet und angereichert werden können. Mehr dazu gibt’s in der Neohelden Dokumentation.
Im Gegensatz zum Wake Word muss bei einem Sprachassistenten mit Push to Talk ein Button gedrückt werden, um eine Konversation per Sprache zu starten.
Ein Reprompt ist eine Rückfrage innerhalb eines Flows an einen Nutzer, bspw. wenn weitere Informationen notwendig sind, um die gewünschte Aktion auszuführen. Wenn also schon bekannt ist, wie lange ein Raum gebucht werden soll, aber der Start-Zeitpunkt noch nicht genannt wurde, würde mit einem Reprompt die entsprechende Rückfrage gestellt werden.
Bezeichnet die Antwort, die ein Nutzer auf seine Anfrage erhält. Diese können je nach Conversational AI Plattform auch interaktiv und multimodal gestaltet werden.
Ein Software Development Kit ist eine Sammlung von Programmierwerkzeugen bzw. Bibliotheken, die eine einfachere Entwicklung ermöglichen.
Die Transkription von Sprache zu Text, häufig auch Speech Recognition genannt. Mit Hilfe von KI-Modellen werden hier Audio-Daten in Text umgewandelt und in entsprechende Wörter bzw. Sätze strukturiert.
Bezeichnet einen KI-Assistent, der primär über Sprache (Voice) genutzt wird. Beispiele aus dem privaten Umfeld sind Alexa, Google Assistant oder Siri.
Bezeichnet das geschulte bzw. trainierte KI-Modell, das aus den Anfragen eines Nutzers Intents und Entities extrahieren kann. Im Endeffekt ist es die Künstliche Intelligenz, die menschliche Sprache in Maschinensprache übersetzen muss.
Das Vorlesen von Text durch eine digitale Stimme. Hierbei werden Sätze und Wörter möglichst real-klingend in Audio „übersetzt”.
Ein Beispielsatz, der zum Schulen des Sprachmodells einem Intent zugeordnet wird. Auf Basis all dieser Beispielsätze lernt das Modell dann, zwischen verschiedenen Befehlen bzw. Anfragen zu unterscheiden, sodass ein entsprechender Dialog oder Prozess gestartet werden kann.
Ein VUI bezeichnet ein Interface, das primär über Spracheingabe bedienbar ist. Beispiele sind Amazon Alexa oder Google Assistant.
Sprachassistenten können mit einem Wake Word „aufgeweckt“ werden: Mit einem Wake Word wie bspw. „Hey Neo” kann der Sprachassistent aktiviert werden, sodass eine darauf folgende Anfrage entsprechend verarbeitet werden kann.