Sprache als Schnittstelle
2018 boten mehr als eine Milliarde Geräte weltweit die Möglichkeit einer Sprachsteuerung an (vgl. T3n 2018) und es sieht ganz danach aus, als würde sich dieser Trend fortsetzen. Es sieht sogar sehr stark danach aus. Das bedeutet, dass der Umgang mit Sprache in unterschiedlichen digitalen Kontexten immer selbstverständlicher wird.
Aktuelles Beispiel: der Hype um #clubhouse. Hier ist die Stimme das zentrale Element.
“Clubhouse is a new type of social network based on voice—where people around the world come together to talk, listen and learn from each other in real- time.” (clubhouse.io)
Das mag erst einmal unwichtig oder profan erscheinen - ist es aber nicht. Unsere Stimme spielt als Knotenpunkt eine große Rolle, Voice User Interfaces sind die Zukunft. Denn Sprachmuster lassen sich hervorragend analysieren. Dabei geht es nicht nur um den Inhalt unserer Gespräche, sondern auch darum, was unsere Stimme oder die Art wie wir sprechen über uns verrät.
Warm gemacht haben wir uns mit Sprachnachrichten, Live-Videos aber auch mit Sprachassistenten, die - entgegen meiner anfänglichen Erwartung - immer mehr werden. Im Jahr 2019 hatte in UK bereits jeder fünfte und in Deutschland jeder zehnte Haushalt einen Smart Speaker (vgl. Strategy Analytics 2019 / voicebot.ai).
Die Entwicklung in diesem Bereich schreitet mit Riesenschritten voran und erinnert massiv an den Film „Her“, in dem sich der Charakter Theodore in seine Sprachassistentin verliebt. Das liegt hauptsächlich daran, dass sie ihm nicht nur sachliche Informationen oder harte Fakten auf Nachfrage liefert, sondern mit ihm interagiert. Auf ihn eingeht, auf seine Gefühlslage und (meist trübe) Stimmung, die sich sogleich aufhellt.
VOICE FIRST
SPRACHE IST DIE SCHNITTSTELLE DER ZUKUNFT
Für neuere Sprach-KIs in unserer Realität ebenso ein Klacks. Sie sind schon empfänglich für die feinen Facetten eines Gesprächs, für die Nuancierung der Stimme - Tonalität, Pausen, Stimmfarbe - alles, was ein Gespräch lebendig macht und Resonanz mit dem Gegenüber erzeugt, wird von der Künstlichen Intelligenz aufgenommen und eingeordnet.
Genau wie bei „Her“ arbeiten Entwickler daran, die Sprach-Interaktion auf ein emotionales Level zu bringen, sodass ein Teil im Bewusstsein des menschlichen Parts möglicherweise sogar vergisst, dass es sich bei der Sprecherin (Assistenten sind auch in der digitalen Welt meist weiblich) tatsächlich um einen „Roboter“ handelt.
Das Gespräch mit Sprachassistenten soll also so authentisch wie möglich gestaltet sein. Amazon hat bereits ein Patent angemeldet: die clevere Sprachassistentin Alexa kann den emotionalen und physischen Zustand ihrer Nutzerinnen und Nutzer erkennen.
GRUSELIG? WELL, I THINK SO
Wenn Alexa eine belegte Stimme erkennt, schlägt sie vor, Hustenbonbons zu bestellen – oder möglicherweise einen Corona-Test zu machen. Bei einem Nieser ist sie so nett, Taschentücher zu ordern – wird kein Widerspruch eingelegt, sind das natürlich Taschentücher der Hauseigenen Amazon Marke. Sehr praktisch, dieses Internet der Dinge.
Sprache ist DIE real-digitale Schnittstelle der Zukunft.
Ich bin gespannt darauf, ob das Thema Datenschutz durch die Analyse eines so persönlichen Parameters künftig stärker in den Fokus gerät.