Warum eigentlich Smart Assistants?
In den letzten Jahren gab es in jeder Dekade neue technologische Entwicklungen, welche die Computertechnologie und unsere Gesellschaft nachhaltig verändert haben. Während in den Anfängen des Computerzeitalters in den 1970er-Jahren der Character Mode den Ton angab, kam in den 1980er-Jahren das GUI (Graphical User Interface) dazu. In den 1990er-Jahren hat das World Wide Web die nächste Stufe der Evolution eingeläutet und in den 2000er-Jahren übernahm das Mobile Web als nächster revolutionärer Meilenstein die Führung. Seit einigen Jahren hat das VUI (Voice User Interface) Einzug gehalten, und damit stehen wir am Anfang der nächsten Revolution.
Doch ist hier etwa nur der Wunsch einer jungen Branche der Vater der Gedanken? Oder steckt da mehr dahinter?
Für die Antwort auf diese Frage lohnt sich ein Blick in die Vergangenheit der Filmgeschichte. Bereits Ende der Sechzigerjahre ließ sich im Film „2001: Odyssee im Weltraum“ ein Computer mit Namen HAL 9000 per Sprache steuern. Ungefähr zur gleichen Zeit sprach auch Captain Kirk mit seiner Crew in „Star Trek“ mit dem Bordcomputer. Und in den Achtzigern konnte der „Knight Rider“ David Hasselhoff sogar schon mit K.I.T.T. sprechen, einem Sportwagen mit künstlicher Intelligenz. In allen Beispielen schlummerte die Vision, die Computertechnologie mit der menschlichen Stimme steuern und beherrschen zu können. Damals waren dies noch Hirngespinste von realitätsfremden Science-Fiction-Autoren. Doch erst jetzt ist die Technologie so weit, um die Visionen der damaligen Zeit real werden zu lassen.
Zugegeben, die ersten Sprachanwendungen sind nett, aber läuten Pupsgeneratoren und langweilige, aber sprachgesteuerte Ratespiele wirklich eine neue Revolution ein?
Seien wir ehrlich, die ersten Websites waren nicht viel mehr als ellenlange Textwüsten, die miteinander per Hyperlink verknüpft werden konnten. Irgendwann wurden die Texte durch Bilder und dynamische Inhalte aufgewertet. Die ersten Smartphone-Apps hatten auch größtenteils den Nutzwert eines kaputten Pappkartons. Das Gleiche erleben wir jetzt gerade, wenn es um Smart Assistants wie Amazon Alexa, Google Assistant oder Apples Siri geht. Einfach strukturierte Alexa Skills mit geringem Nutzwert nehmen aktuell den größten Raum ein. Selbst große Unternehmen starten mit eher durchwachsenen und wenig durchdachten Sprachanwendungen.
Entdecken Sie den Voice Assistants Track der webinale!
Anwendungsfälle für Smart Assistants
Ich bin persönlich davon überzeugt, dass dies nicht der Fall ist. Während die Kinder seit dem Smartphoneboom ganz natürlich mit Touchscreens aufwachsen, steht die aktuell nachwachsende Generation ganz verblüfft vor einem CD-Player und wundert sich, warum dieser nicht auf Sprachkommandos reagiert. Auch für die ältere Generation werden Smart Assistants eine Chance sein, den Kontakt zur Außenwelt nicht abreißen zu lassen. Wer nicht mehr so beweglich wie früher ist oder weniger gut sehen kann, für den kann eine Sprachsteuerung ein wahrer Segen sein.
Hier ein paar Gedanken, wie konkrete Anwendungsfälle abseits von Ratespielchen, Faktenskills oder dem Hinzufügen von Milch zur Einkaufsliste aussehen könnten:
-
- Schon heute funktioniert die Versorgung mit Nachrichten und Unterhaltungsmedien wie Musik oder Hörspielen per Sprachassistenten sehr gut. Der Markt der Voice Games ist groß im Kommen, nicht zuletzt seit der Veröffentlichung der Echo-Buttons für Alexa. Interaktive Spiele für ein oder mehrere Personen werden immer beliebter, erfordern aber auch mehr Fantasie bei Nutzern und Entwicklern, da hier schwache Ideen nicht mehr durch opulente Grafik kaschiert werden können.
- Unter anderem arbeiten Ford und BMW an der Alexa-Integration in ihre neusten Modelle. Damit wird der Fahrer nicht nur bei der Fahrt und der Bedienung seines Automobils unterstützt, sondern er kann sich auf Nachfrage gezielt mit den gewünschten Informationen oder Musik versorgen, ohne eine Hand vom Lenkrad nehmen zu müssen. Zudem besteht auch eine große Chance, die Unsitte des nervösen Herumgetippes des Fahrers auf dem Smartphone nachhaltig einzudämmen. Somit kann ein Smart Assistant auch zu mehr Sicherheit im Straßenverkehr führen.
- Im Arbeitsleben werden Smart Assistants für Erleichterung sorgen, wenn der ölverschmierte Automechaniker während der Reparatur dringend benötigte Ersatzteile nachbestellen kann oder in einem Meeting der digitale Sprachassistent die aktuellen Umsatzzahlen auf Zuruf liefert. Das Smart Business steckt zwar noch in den Kinderschuhen, doch hat Amazon hierfür bereits die technischen und infrastrukturellen Grundlagen geschaffen.
- Und nicht zuletzt steht auch Voice Commerce noch am Anfang. Von den einen verspottet, von den anderen in den Himmel gehypt, liegt besonders hier die Wahrheit irgendwo in der Mitte. Den Verkauf von regelmäßig benötigten Produkten wie Katzenfutter, Klopapier oder Druckertinte wird sicher von Amazon selbst dominiert werden. Auf der anderen Seite werden wohl nur wenige Nutzer nur mit gesprochenen Inforationen ein paar Turnschuhe, ein Auto oder eine Schrankwand kaufen. Dennoch bietet Voice Commerce viele Ansatzpunkte in Sachen Service und Produktberatung, die in Kombination mit einem klassischen Webshop indirekt zu mehr Kundenzufriedenheit und Umsatz führen können. Interaktive Einkaufsberater können hier den Nutzer eine Vorauswahl treffen lassen, die ihn durch bewussten Medienbruch zu einer maßgeschneiderten Auswahl führen.
UX mit Voice
Doch bis die Smart Assistants genauso in unserem privaten wie beruflichen Alltag dieselbe Rolle spielen wie die Smartphones heute, ist es noch ein langer Weg. Eine Sprachanwendung zu konzipieren und zu entwickeln, ist etwas völlig anderes als eine Website oder eine Smartphone-App. Niemand will sich Dutzende Flugangebote oder Hunderte Produkttreffer von Alexa vorlesen lassen. Es gilt die Faustregel, dass der menschliche Verstand sich nur zwischen drei gehörten Varianten entscheiden kann, während er bei einer visuellen Darstellung viel mehr Optionen erfassen kann.
Somit müssen die Smart Assistants in vielen Bereichen eine Filterfunktion übernehmen.
Ein weiterer wichtiger Unterschied liegt in der Steuerung einer Sprachanwendung im Gegensatz zu einer Website oder einer App. Während auf einem Display der Klick auf einen simplen O.K.-Button recht eindeutig zu verarbeiten ist, müssen wir bei eine Sprachanwendung viele verschiedene Varianten abfangen können. Jeder Mensch spricht anders, die einen sind wortgewaltig, andere einsilbig. Zwischen einem bestätigenden O.K. und „Ja, genau, ich will diese grünen Turnschuhe jetzt sofort haben“ gibt es große Unterschiede.
Zudem müssen Voice-Designer und Entwickler immer auf das Unerwartete vorbereitet sein. Wer auf die Frage „Möchtest du Pizza oder Pasta bestellen?“ nicht sauber auf die Antwort „Ja“ des Nutzers reagieren kann, wird viel Frust ernten oder die falsch gestellte Frage umformulieren müssen. Wenn der Nutzer dann auch noch auf dieselbe Frage mit „12 Uhr“ antwortet und die Sprachanwendung dies nicht verarbeiten kann, wird es ganz schwierig. Während in einer Webanwendung oder einer App bestimmte Prozesse linear ausgestaltet werden können, können wir uns bei einer Sprachanwendung nicht darauf verlassen, dass der Nutzer unserem Prozess wirklich folgt.
Ein weiteres Problem stellen auch die Inhalte an. Wer glaubt, dass er nur seine vorhandenen Blogbeiträge oder Produktdaten durch die Stimme von Alexa oder dem Google Assistant unangepasst vorlesen lassen kann, ist auf dem Holzweg. Was visuell funktioniert, funktioniert rein sprachlich wiedergegeben meist nicht. Ein Produktname wie „Lisdon Denim Herren Straight Fit Leg Jeans Hose (W34/L34)“ mag in einer Darstellung durchaus funktionieren. Wer den Produktnamen aber nur hört, wird Schwierigkeiten haben, das Gesagte zu erfassen.
Um einmal bei Alexa zu bleiben: Die meisten Skills arbeiten recht einfach. Man fordert den Skill auf, etwas zu tun, und dieser antwortet mit dem Wetter, einem Witz oder einer mehr oder minder interessanten Information. Wenige Skills sind wirklich interaktiv, führen einen Dialog mit dem Nutzer und bieten auch unterschiedliche Möglichkeiten für die Nutzung. Das größte Potenzial liegt bei interaktiven Skills, die dem Nutzer helfen, Dinge einfacher zu tun oder zu unterhalten. Und das kann schnell sehr komplex werden.
Monetarisierung und Marketing
Wenn es um die Monetarisierung geht, hat sich in der Vergangenheit einiges getan. Zwar sind bei Amazon immer noch alle Alexa Skills kostenfrei zu nutzen und auch Werbung innerhalb eines Alexa Skills muss sehr strikte Auflagen einhalten. So, ist es z.B. nicht erlaubt, die Stimme von Alexa für Werbung zu verwenden. Dies hat bereits einigen Marktteilnehmern das Genick gebrochen, die auf interaktive Werbung mit Alexa gebaut hatten.
Dennoch gibt es verschiedene Ansätze, wie Unternehmen z.B. ihre Alexa Skills monetarisieren können. Zum einen werden erfolgreiche Skills direkt von Amazon vergütet. Dies kann für einzelne Entwickler oder kleinere Agenturen ein lukratives Zusatzgeschäft darstellen. Ein planbares Zukunftsmodell ist dies aber nicht. Interessanter ist die von Amazon in den USA bereits geschaffene Möglichkeit, per In-Skill-Käufe direkt Produkte oder Dienstleistungen bezahlen zu können. Das schafft die Grundlagen für den Kauf von Medienprodukten oder zusätzlichen Inhalten und Features durch den Nutzer.
Auch weiterhin können gut gemachte Sprachanwendungen auch zur Markenpflege oder Nutzergenerierung beitragen und damit zur indirekten Monetarisierung führen. Durchdachte Sprachanwendungen fördern das Image eines Unternehmens, währen schnell herausgebrachte Voice-Anwendungen und Mee-Too-Skills eher dem Image schaden können. Selbst große bekannte Unternehmen sind bei schlechter Leistung nicht davor gefeit, dass die Nutzer unzufrieden sind und diesen Unmut in negativen Rezensionen freien Lauf lassen. Unternehmen sollten also sich ausführliche Gedanken machen und sich nicht durch Schnellschüsse ihrer Chancen berauben.
Fazit
Das Thema Smart Assistants oder neudeutsch Voice steckt zwar immer noch am Anfang und wird auch aufgrund durchwachsener bisheriger Implementationen zu Recht noch belächelt. Dennoch sind digitale Sprachassistenten gekommen, um zu bleiben. Die Visionen, die teilweise ein halbes Jahrhundert alt sind, lassen sich heute aufgrund der modernen Technologien in die Tat umsetzen.
Doch der Weg ist steinig und darf nicht auf die leichte Schulter genommen werden. Die kreativen Möglichkeiten in der Zukunft sind jedoch lediglich durch unsere Fantasie begrenzt.
webinale Sessions mit Fokus auf Voice Assistants
→ Alexa, ich möchte Turnschuhe kaufen!
→ Das nächste große Ding: Nach GUI und MUI kommt VUI. Entwicklung von Amazon Alexa-Skills