Intelligente Agenten

Wer erinnert sich nicht an die aufdringlich schlaue Büroklammer, die uns ungefragt mit Tipps zu Funktionen in Word, Excel, Powerpoint und Outlook beglückte. Seit Karl Klammer – so hieß der spärlich animierte Neunmalklug – aus den Office-Paketen entfernt wurde, hat sich auf dem Gebiet der digitalen Assistenzsysteme einiges getan. Längst beschränken sich Avatare, Assistenten und Chatbots nicht mehr auf die reine Darbietung von Infos oder die Antwort zu fest vorgegebenen Frageoptionen. In diesem Blogbeitrag vertiefen wir das Thema NLP, Chatbots und Sprachassistenten weiter.

Gute Bots – Schlechte Bots

Assistenzsysteme finden sich in allen Lebensbereichen: Sei es bei der sprachgesteuerten Routenplanung im Fahrzeug,  als Bestandteil von Reservierungsservices, Betriebssystemen und Mobiltelefonen in Gestalt von Siri, Cortana & Co.

So unterschiedlich wie die Einsatzbereiche sind auch die verwendeten Technologien. Angefangen bei simplen, regelbasierten Frage-Antwortsystemen für sehr eingeschränkte Themenbereiche bis hin zu hochkomplexen High-Tech-Anwendungen wie IBMs Watson müssen die Systeme je nach Einsatzzweck verschiedenste Anforderungen erfüllen. Letzterer verfügt z.B. über eine Reihe von statistischen Tools, mit denen es u.a. möglich ist, Sentimentanalysen (automatische Erkennung von Gemütszuständen) durchzuführen. 

Einer der ersten Chatbots, ELIZA, vermittelte bereits 1966 den Eindruck eines aufmerksamen Gesprächspartners, der auf Themen des  menschlichen Chatpartners eingeht. Hierzu kamen in der einfachsten Version des Programms lediglich vorformulierte Sätze und eine Wörterbuchabfrage zum Einsatz, die der Varianz in der Wortwahl des Chatbots diente.
Gut 60 Jahre später sind Chatbots vor allem im Online-Kundenservice vieler Unternehmen etabliert und helfen bei der Erstorientierung bei häufig gestellten Fragen zum Produktsortiment oder zu Serviceleistungen. Auf der dunklen Seite des Netzes sind Chatbots in sozialen Netzwerken unkenntlich hinter vermeintlich menschlichen  Profilen unterwegs, beeinflussen über automatisch generierte Posts die Meinungsbildung vor Wahlen oder verleiten Liebessuchende zur Preisgabe intimer Details. 

Der Geist in der Maschine

Dialogsysteme vereinen zahlreiche Technologien und Verfahren in sich. Sie unterscheiden sich zunächst einmal in Bezug auf die Komplexität der zu verarbeitenden Eingabesprache. Die Spracherkennung in Mobiltelefonen unterstützt bei häufigen Abläufen (Anrufe, Texterstellung) durch kurze Einzelbefehle („Rufe Karl an“, „Aktiviere Bluetooth“). Oder sie erleichtert die Texterstellung, indem die Sprachanalyse das Gesprochene in einen Text umwandelt, der per E-Mail, SMS oder Messenger-Nachricht verschickt werden kann. Bei letzterem handelt es sich um eine sogenannte Speech-to-Text Komponente, die das Gesprochene in Text umwandelt, ohne eine Analyse der Bedeutung vorzunehmen.

Weiter entwickelte Dialogsysteme,  die in Form eines animierten Charakters mit dem Nutzer kommunizieren, sind in der Lage, auf frei formulierte, gesprochene oder geschriebene Sprache zu reagieren. Sie geben Auskunft zu spezifischen Themen, nehmen Reservierungen entgegen oder führen komplexe Abläufe in Fertigungsprozessen aus. Oft werden diese Systeme als Expertensysteme beschrieben, da sie in der Regel auf ein eng umgrenztes Fachgebiet zugeschnitten sind.

Zu den Voraussetzungen solcher Systeme zählen Komponenten, die eine Interaktion erst möglich machen: Sprach-/Texterkennung, Sprach-/Textanalyse, Antwortgenerierung und Sprachsynthese. Weitere Komponenten zur pragmatischen Analyse unterstützen die Dialogplanung und vermitteln somit den Eindruck eines menschlichen Gegenübers, der authentisch und situationsgemäß auf Äußerungen des menschlichen Dialogpartners reagiert. 
Damit das System den Eingabetext versteht, muss eine grammatische Analyse erfolgen, die dem Gesprochenen eindeutige grammatische Funktionen zuweist und die Beziehungen der Objekte analysiert, auf die im Satz Bezug genommen wird. Diese kann auf regelbasierten und/oder statistischen Sprachmodellen basieren. Semantische Modelle helfen, mehrdeutige Aussagen zu analysieren und die Intention des Fragenden auf das hinterlegte Weltwissen abzubilden. 
Damit ein Dialogsystem Auskunft geben kann, ist es, genau wie der Mensch auch, neben der Sprachverarbeitung auch auf einen Langzeitspeicher der relevanten Informationen (das sogenannte Weltwissen) angewiesen. Dieses kann in Datenbanken abgelegt oder aber auch in Form von Ontologien  hinterlegt sein. Letztere bilden das Weltwissen durch zahlreiche Verknüpfungen (Relationen) zwischen Konzepten (Objekten) ab, die wiederum zahlreiche Attribute (Eigenschaften) tragen können. Findet sich in der Wissensdatenbank ein Inhalt, der zu der gewünschten Auskunft passt, muss dieser in eine Satzstruktur eingebettet werden, die als möglichst passende Antwort auf die Frageform des Kunden passt (F: „Ich möchte ein automatisches Garagentor bauen!“ A: „Sie möchten ein automatisch angetriebenes Garagentor. Hierzu finden sie in unserem Sortiment folgende Komponenten: …“).

Selbstlernende Netze

Auch sehr gute Antwortsysteme sind häufig noch durch die Möglichkeiten beschränkt, die ihre Schöpfer in ihnen angelegt haben. Wurde bspw. kein Wissen zur Beantwortung der Frage „Wann betrat ein Mensch zum ersten mal den Mond?“ hinterlegt, so kann das System nur mit einer Standardantwort („Tut mir leid, hierzu habe ich leider keine Informationen“) reagieren.  Da es kaum einen Bereich der Informationsverarbeitung gibt, der noch nicht durch die Systeme beeinflusst ist oder in den nächsten Jahren beeinflusst sein wird, profitieren auch Dialogsysteme von den Entwicklungen neuronaler künstlicher Intelligenz. Zum einen unterstützten neuronale Systeme bei der Sprachanalyse und Textgenerierung, die im Rahmen der neuronalen maschinellen Übersetzung (NMT) bereits beachtliche Fortschritte erzielt. Die Stärke neuronaler Netz liegt jedoch vor allem auch in der Fähigkeit, Zusammenhänge zwischen Sachverhalten in großen Datenmengen selbständig zu erkennen und zu gewichten. So kann ein System, das Zugang zu großen Datenmengen hat, Zusammenhänge selbst erschließen und seine Wissensbasis eigenständig erweitern. Der menschliche Anteil der Organisation des Weltwissens wird somit immer kleiner, wenn auch nicht völlig verzichtbar: Die Einschätzung der Datenqualität sowie die Zusammenstellung qualitativer Daten und die Modellierung der Modellwelt für das maschinelle Lernen obliegt – zumindest heute noch – weitgehend dem menschlichen Urteilsvermögen.

Fazit

Aktuell gewinnen Dialog-/Assistenzsystemen aufgrund der Fortschritte in der maschinellen Sprachverarbeitung zunehmend an Bedeutung. Je genauer die Sprachanalyse und -erzeugung mithilfe neuer Verfahren umsetzbar ist, desto alltagstauglicher werden auch (multilinguale) Dialogsysteme. Jedoch: Subtile Bedeutungsunterschiede, Erkennung der Sprecherintention, Bildsprache und Ironie in der gesprochenen und geschriebenen Sprache stellen die Maschine vor Herausforderungen, die durch einen menschlichen Zuhörer leicht aufgelöst werden können.  Zur Verständigung ist also noch eine maschinengerechte Ausdrucksweise erforderlich. Außerdem müssen die Systeme von ‚Hand‘ vorbefüttert werden. Auch wenn es im wissenschaftlichen Bereich mittlerweile Roboter gibt, die sich Ihre Welt von Grund auf selbst erschließen, so müssen Bots für den Dienstleistungsbereich zunächst mit viel Aufwand für Ihren Einsatzbereich vorbereitet werden.

Die Utopie (oder Distopie) einer vollautomatisierten Dienstleistungsgesellschaft liegt also noch in weiter Ferne.

Related Posts