Sag‘s doch einfach - Sprachassistenten als Mittler zwischen Verwaltung und Bürger:innen
Sag‘s doch einfach - Sprachassistenten als Mittler zwischen Verwaltung und Bürger:innen
von Thilo Ernst
Editor's Note: Für effektive, innovative und effiziente Lösungen auf Grundlage von künstlicher Intelligenz (KI) braucht es ein Verständnis der Domäne, in der sie zum Einsatz kommen sollen. Die Arbeit an möglichen KI-Anwendungen sollte somit immer mit einer Problem- und Anforderungsanalyse aus der Domäne heraus beginnen. Mit Blick auf die öffentliche Verwaltung fallen in diesem Zusammenhang drei allgemeine Entwicklungstrends ins Auge, die sowohl den domänenspezifischen Kontext als auch die Nutzungspotenziale für den Einsatz von KI veranschaulichen. mehr lesen
Während sich – befeuert durch den demografischen Wandel – (1) Personalengpässe und Rationalisierungsdruck im öffentlichen Dienst immer mehr verfestigen, sieht sich die öffentliche Verwaltung zur gleichen Zeit (2) steigenden fachlichen Anforderungen und gesellschaftlichen Ansprüchen gegenüber (Qualität, Korrektheit, Schnelligkeit, Einfachheit, Offenheit und Transparenz etc.). Quer zu diesen Trends verläuft (3) der übergeordnete Prozess der digitalen Transformation in Staat und Gesellschaft, der u. a. mit einem exponentiellen Anstieg von verfügbaren bzw. zu bewältigenden Daten unterschiedlichster Art einhergeht. Bezieht man KI in die Betrachtung ein, ergeben sich zahlreiche Nutzungsszenarien in verschiedenen Anwendungsbereichen der Verwaltung, die sowohl nach Effizienzerwägungen als auch mit Blick auf die sich verändernden qualitativen Ansprüche an Verwaltungshandeln sinnvoll erscheinen.
KI-Anwendungen können menschliche Tätigkeiten bzw. Fähigkeiten substituieren oder unterstützen und verstärken. In der Leistungsverwaltung werden beispielsweise die Klassifikation von Dokumenten und ihre Zuordnung zu Prozessarten oder konkreten Vorgängen praktisch ohne menschliche Tätigkeit bzw. Aufsicht erfolgen können, während - sozusagen am anderen Ende des Möglichkeitsspektrums – für Mitarbeitende bei komplexen Entscheidungsfindungsprozessen mit administrativen Beurteilungsspielräumen eine datenbasierte Unterstützung angemessen sein wird. Der Einsatz von Chatbots und Sprachassistenten für das Auskunfts- und Antragswesen veranschaulicht als aktuelles Anwendungsbeispiel die Mehrwerte insbesondere für Bürgerinnen und Bürger. Der Erbringung öffentlicher Leistungen durch die Verwaltung liegen teilweise komplexe verwaltungsinterne Prozesse und gesetzliche Vorgaben zugrunde. Hinzu kommen die „zuständigkeitsorientierte" Organisation und eine konstant zunehmende Spezialisierung und funktionale Ausdifferenzierung der Verwaltung. Für Bürger:innen bedarf es eines immer größeren Koordinationsaufwandes und Orientierungswissens, um effektiv und effizient mit der Verwaltung in Interaktion zu treten. Aus den beachtlichen Fortschritten im Bereich der natürlichen Sprachverarbeitung und -generierung ergeben sich - weitestgehend noch ungenutzte - Innovationspotenziale auch für die Neugestaltung der Schnittstellen und Interaktionsmodi zwischen Bürger:innen und Verwaltung. An den Schnittstellen reduzieren KI-basierte Assistenzsysteme die Komplexität und den Koordinationsaufwand und verknüpfen Ansprüche und Bedarfe von Bürger:innen mit den entsprechenden Informationen, Verfahren, Prozessen und Zuständigkeiten im „Maschinenraum" des Staates.
In einer Blog-Reihe schauen wir uns die Potenziale dieser Technologie, ihre zentralen Bausteine sowie die Voraussetzungen ihres Einsatzes in der öffentlichen Verwaltung an.
Sie hören aufs Wort: Sprachassistenten als Interaktionskanal und Alltagshelfer
Die Beiträge dieser Serie konzentrieren sich auf ein Thema, das dank in jüngerer Zeit massiv an Popularität gewinnender Produkte und Services großer Internetdienstleister heute im Wortsinn in aller Munde ist: Intelligente Sprachassistenten. Im Zwiegespräch mit Siri, Alexa oder Google Assistant ist es so bequem wie nie zuvor, sich über die aktuelle Wettervorhersage, die neuesten Nachrichten oder den Stand eines Bundesligaspiels zu informieren. Auffinden und Abspielen von Musik- oder Videoinhalten, Zugriff auf Wikipedia-Einträge, Mobilitätsdienste und sogar die Ausführung kompletter Onlinebestellungen physischer Güter werden von diesen Assistenten ebenso unterstützt. Diese aus kostenoptimierten Frontend-Geräten (auch Smartphones können als Klienten verwendet werden) und einem cloudbasierten, den Löwenanteil der Intelligenz realisierenden Backend bestehenden Lösungen etablieren sich in einem schnell wachsenden Spektrum von Dienstkontexten als weitreichende Alternative zur konventionellen Interaktion mit Touchscreen oder Tastatur und Maus. Sie eröffnen den Internetkonzernen zusätzliche Kundenschichten und Geschäftssegmente und ermöglichen eine noch tiefere Durchdringung und perfektere Unterstützung des Alltagslebens der Nutzer mit den auf diese Weise umgesetzten Online-Dienstleistungen. Die Kehrseite ist ein substanzieller Zusatzschub für die kommerzielle Überwachung: Noch mehr Nutzerdaten werden im Alltagsleben erfasst und zentralisiert bei den Internetkonzernen verwertet - was jedoch der breiten Popularität der Smart Assistants offensichtlich keinen Abbruch tut. Fairerweise ist auch zu erwähnen, wie hilfreich Siri, Alexa und Google Assistant insbesondere für sehbehinderte oder mobilitätseingeschränkte Nutzer:innen sind, welchen diese Technologien eine z. T. qualitativ gesteigerte Teilhabe am modernen Leben ermöglichen können.
Wegweiser und Übersetzer: Potenziale für die öffentliche Verwaltung
Ein im kommerziellen Sektor so populärer und leistungsfähiger neuer Interaktionskanal erscheint natürlich auch hochinteressant, um die Interaktion von Bürger:innen mit öffentlichen Verwaltungen und konkret mit digital unterstützten Verwaltungsprozessen effizienter und attraktiver zu gestalten. Maßgeschneidert an die konkrete Prozess- und Datenlandschaft angepasste, KI-gestützte digitale Verwaltungsassistenten könnten einfache Beratungsfunktionen wahrnehmen und die Bürger:in beim Stellen von Anträgen unterstützen. Die Attraktivität der Verwaltungsdienstleistungen einer Behörde kann so erheblich gesteigert werden, ohne dass zusätzliche Personalressourcen benötigt werden. Entscheidend hierfür ist zunächst eine natürlichsprachliche Schnittstelle, die den Nutzer:innen ermöglicht, ihr Anliegen frei gesprochen zu formulieren, anstatt sie mit einem starren Korsett vorgegebener Einordnungen oder Menüauswahlen zu konfrontieren, worin sie erst mühsam ihrer Intention nahekommende Einträge suchen müssen.
Aus technischer Sicht könnte auch ein sprachgestützter digitaler Verwaltungsassistent einer deutschen Behörde auf der Basis einer Assistenzplattform eines global agierenden Internetdiensteanbieters realisiert werden. Diese Plattformen sind allerdings einerseits für andere Anwendungsfälle optimiert. Andererseits sind sie aber auch nicht durchgängig an die substanziellen Anforderungen deutscher Behörden bezüglich Datenschutz und Datensouveränität angepasst – ein Problem, das ähnlich auch in anderen Bereichen (z. B. sichere industrielle Cloud-Anwendung) existiert und einen nachhaltigen Bedarf an deutscher bzw. europäischer Technologie für solche sensitiven Bereiche impliziert, um den Datenschutz der Bürger:innen und die Datensouveränität der Behörden zu gewährleisten. Daher wurden auf diesem Gebiet bereits entsprechende Forschungs- und Entwicklungsinitiativen gestartet.
Unter der Motorhaube: Deep Learning
Um gesprochene oder als Freitext eingegebene Nutzeranfragen maschinell zu analysieren, ausreichend zu verstehen und inhaltlich passende Antworten zu erzeugen, steht inzwischen eine breite Vielfalt von Methoden zur Verfügung. Die traditionellen, hochspezialisierten und überaus komplexen Algorithmen zur Spracherkennung und -Synthese erhalten inzwischen sehr starke (z. T. sogar überlegene) Konkurrenz durch maßgeschneiderte Deep-Learning-Verfahren, und auch bei der textuellen Sprachauswertung (natural language processing, NLP), der Intentionserkennung und der Antwortgenerierung werden zusätzlich zu klassischen KI-Methoden (wie bspw. Regelsystemen) in immer stärkerem Maße Verfahren des maschinellen Lernens eingesetzt.
Sie können's auch schriftlich
Zusammen sind die genannten KI-Methoden (die in zukünftigen Beiträgen dieser Serie noch näher diskutiert werden) in der Lage, die Realisierung allgemeiner Konversationsschnittstellen zu unterstützen. Damit kann dasselbe Kernsystem den Nutzer:innen sowohl in gesprochener Kommunikation als auch als schriftlicher Konversationspartner mit E-Mail- oder Chatinterface gegenübertreten. Derartige textbasierte Systeme, wenn auch bisher meist mit eher begrenzter Intelligenz, wurden als „Chatbots" bekannt und sind inzwischen in vielen beratungsintensiven Branchen (z. B. Versicherungswesen) mit Erfolg in entsprechende Webauftritte und deren Backendsysteme integriert. Sie reduzieren den Aufwand für Hotlines und Anfragebearbeitung per E-Mail erheblich, indem zumindest häufig vorkommende und einfache Anfragen automatisch beantwortet werden. Der Rest wird automatisch vorklassifiziert sowie zur Weiterleitung an menschliche Bearbeiter mit geeigneter Spezialkompetenz aufbereitet.
Obwohl sich schon ein formfreier textueller Austausch mit einem Chatbot für viele Nutzer als deutlich angenehmer darstellt als eine klassische formularbasierte Web-Schnittstelle, belegt der Erfolg der Smart Assistants, dass eine Konversation in gesprochener Sprache oft als noch natürlicher und flüssiger empfunden wird. Manche Nutzer:innen bevorzugen jedoch weiterhin einen rein schriftlichen Austausch oder sind wegen einer Behinderung darauf angewiesen. Ein KI-gestützter digitaler Verwaltungsassistent sollte daher idealerweise sowohl die textuelle als auch die gesprochene Interaktion unterstützen.
Wegen der aktuellen Popularität des Themas, aber auch in Anbetracht des erheblichen Interesses seitens konkreter Behörden und ihrer IT-Dienstleister werden die nächstfolgenden Beiträge dieser Serie sich primär den für die Sprachschnittstelle eines solchen Assistenzsystems relevanten KI-Methoden zuwenden, wie Spracherkennung, Sprachsynthese und NLP, und werden Möglichkeiten aufzeigen, entsprechende Funktionalität auch ohne Rückgriff auf die Angebote der Internetriesen zu realisieren, um sie in naher Zukunft für die Bürger:innen nutzbar zu machen.
Veröffentlicht: 27.02.2020