Gleich vorweg: Erwarten Sie hier bitte keinen ausgewogenen Text über Sprachassistenten. Dafür haben mich Alexa & Co. schon viel zu häufig genervt. Dazu brauchte ich nicht einmal meinen eigenen Assistenten: Schon die Besuche bei Freunden mit mehr oder minder „smarten Homes“ haben mir gereicht.
Freilich müssen Sprachsteuerung und Heimautomation nicht unnütz sein – in bestimmten Situationen sind Cortana, Google Now und Siri wirklich hilfreich. Wenn beide Hände am Lenkrad bleiben müssen oder wenn beide Arme im Gips stecken, ist es wirklich praktisch, wenn einen der Assistent beim Wort nimmt.
Wie so vieles in der Computerei kann Sprachsteuerung ebenso ein Fluch sein wie ein Segen. Zeit für eine Abwägung von Pro und Kontra.
Neulich schickte mir eine Freundin einen Witz, den ich nicht wiederfinde und deshalb frech aus dem Gedächtnis rekonstruiere: „In den 1980ern hieß es: ‚Oh Gott, wir werden durch versteckte Wanzen belauscht!‘ 2019 heißt es: ‚Hallo Wanze, schreib mal eben Klopapier auf den Einkaufszettel.‘“
Inzwischen hat man sogar die Wahl, von wem man sich belauschen lassen will. Die bekanntesten Sprachassistenten sind Alexa von Amazon, Siri von Apple, Assistant von Google, Cortana von Microsoft und Bixby von Samsung. Aber auch im Voicemail-System mancher DSL-Provider stecken mitunter Sprachassistenten, die ganz leidlich gesprochene Kunden- und Telefonnummern verstehen und Störungsmeldungen erkennen. Ganz zu schweigen von meinem Lieblings-Assistenten, der am besten als „störrisch wie ein niederbayerischer Esel“ beschriebenen Sprachsteuerung meines Auto-Navis.
Allein bringen Assistenten kaum etwas
Für sich können Sprachassistenten wenig mehr als einfache Auskünfte zu geben: Wie ist das Wetter, lies mir Nachrichten vor, wo läuft der aktuelle Spider-Man. Damit sie aktiv werden können, bedarf es zusätzlicher Hardware zur Heimautomation – Stichwort „Smart Home“.
Smart Homes sind die Modelleisenbahnen des 21. Jahrhunderts: Ich verstehe zwar die Genugtuung darüber, wenn im Erdgeschoss auf Stimmbefehl hin die Lichter ausgehen, ohne dass man nochmal runterschlurfen müsste. Letztlich ist diese Freude aber genauso kindlich, wie wenn am H0-Bahnübergang die Schranken sinken, bevor die Lok durchbrettert.
Per Sprachassistent und Heimautomation-Hardware lassen sich Wohnungen vorheizen, Fenster kippen, Rollos ausfahren, Rasen sprengen und Türen versperren. Alles aus der Ferne oder aus der Badewanne. Was früher das jüngste Kind der Familie machen musste, erledigt jetzt der Sprachassistent – ohne jemals zu maulen. Das ist Fortschritt.
Wo Assistenten nützlich sind
Der Fairness halber sei angemerkt, dass Assistenten auch extrem nützlich sein können. Für eine Person im Rollstuhl kann sprachgesteuerte Heimautomation beispielsweise einen deutlichen Gewinn an Selbstständigkeit bedeuten. Kann man sich nur unter Qualen oder gar nicht zum Fenstergriff recken, ist ein ferngesteuerter Motor kein Spielzeug mehr, sondern eine sinnvolle Verbesserung der Lebensqualität.
Liegt nach einem Unfall der Arm im Gips, hilft ein aufs Wort hörendes Handy über die drögen Wochen der Heilung hinweg. Bei einem Navigationsgerät ist Sprachsteuerung eigentlich Pflicht – wenn das Navi bei 120 km/h auf der Autobahn meldet, da sei ein Stau und ob man eine 30 Minuten kürzere Route nehmen wolle, muss es zuverlässig auf ein erleichtertes „ja freilich“ reagieren können.
Solange es Personen gibt, für die Sprachassistenten eine sinnvolle Bereicherung darstellen und nicht nur Geek-Spielerei, habe ich auch nichts dagegen, dass sie sich an immer mehr Orten breitmachen – Hauptsache, ich kann sie umgehen. Wenn mir das Voicemail-System meines Netzanbieters auf die Nerven geht, nuschele ich so lange herum, bis der Computer aufgibt und mich an einen Menschen weiterreicht.
Lieber künstliche Intelligenz als gar keine?
Gern werden Sprachassistenten mit künstlicher Intelligenz in einen Topf geworfen. Das soll cool wirken oder bedrohlich, je nach Gesinnung des Schreibenden – in jedem Fall ist es heiße Luft. Nur ganz kurz: Künstliche Intelligenz gibt es nicht. „Maschinelles Lernen“ trifft es besser: Grob gesagt lernen Computer, Muster zu erkennen, und passen ihre Reaktionen an diese Muster an.
Mit dem Lernen ist es bei Sprachassistenten nicht weit her: Bisher reagieren die meisten nur auf ein begrenztes Vokabular und sind selbst dann noch recht wählerisch bei der Umsetzung. Vor kurzem versuchte ein lieber Freund, einen Alexa-Lautsprecher dazu zu bringen, die Lampe neben seinem Sofa auszuschalten. Er versuchte es dreimal in unterschiedlichem Tonfall, wobei die Lautstärke seiner Stimme mit jedem Versuch zunahm. Ich saß still auf dem Sofa und war hin- und hergerissen, ob ich ihn bemitleiden oder verspotten sollte.
Vielleicht ist der Unterschied zum bockigen Kind doch nicht so groß: Als Filius habe ich auch mitunter die Ohren auf Durchzug gestellt, wenn Mama aus dem Wohnzimmer laut meinen Namen rief. Ich wusste, dass ich gebraucht wurde, aber ich hatte keine Lust.
Vermutlich war bei Alexa aber keine gespielte, sondern echte Schwerhörigkeit im Spiel. Die Erkennung übernehmen ja weder Lautsprecher noch Handy selbst. Stattdessen schicken sie die Tonaufzeichnungen an die großen neuronalen Netze in der Cloud, die der dummen Hardware in Haus oder Hand dann sagen, wie sie reagieren soll. Hakt die Verbindung, macht der Assistent nur „Hä?“ – natürlich viel höflicher als ein unwilliges Kind.
Ohne zusätzliche menschliche Hilfe wäre die aktuelle Assistentengeneration komplett aufgeschmissen. Von Google und Amazon ist bekannt, dass hinter den Kulissen eine Phalanx von Drittwelt-Schreibkräften emsig Transkripte aufgezeichneter Unterhaltungen anfertigt, um die Erkennungsrate der Assistenten zu verbessern. Apple, Microsoft und Samsung werden es nicht anders handhaben. Was für ein Aufwand, nur damit Alexa künftig auch eine mit vollem Mund dahergenuschelte Bestellung eines Jahresvorrats an Salz-und-Essig-Chips zügig entgegennimmt.
Der Standard ist weiblich
Mich stört zu viel Grundsätzliches an Sprachassistenten, als dass ich ihnen in meinem Haushalt eine Chance geben wollte. Das beginnt damit, dass alle Sprachassistenten standardmäßig alle warme, weibliche Stimmen haben.
Nicht, dass ich eine sich überschlagende männliche Kreischstimme à la Gilbert Gottfried herbeisehnen würde, das nicht. Aber trotzdem wurmt mich, dass Voice Assistants grundsätzlich alle weiblich sind. Das Rollenklischee von der devoten Frau ist nach meinem Geschmack noch nicht lange genug abgehangen. Nur Apple Siri, Google Assistant und Samsung Bixby bieten überhaupt die Option, mit Männerstimmen zu antworten – Google stellt sogar vier männliche Stimmen zur Auswahl. Amazon Alexa und Microsoft Cortana sind hingegen ganz auf weibliche Stimmen festgelegt – warme, weibliche Stimmen, die den Einkaufszettel geduldig um Klopapier ergänzen, sofern die Leitung steht.
Gravierender ist aber, dass der eingangs erwähnte Witz doch einen sehr bitteren wahren Kern hat. Immer wieder zeichnen Sprachassistenten Gespräche auf, weil sie ein dahingeworfenes Wort für eine direkte Anrede gehalten haben. In den USA soll Alexa auch schon reagiert haben, wenn im Fernsehen ihr Name fiel. Jüngst hat Amazon ein Patent angemeldet, dass Alexa eine Anweisung auch dann ausführt, wenn das Aktivierungswort erst nach dem Befehl kommt. Das kann nur funktionieren, wenn das System konstant mithört.
In ioco veritas
So etwas weckt Begehrlichkeiten: Die deutschen Innenminister sind der Meinung, dass der Zugriff auf Sprachaufzeichnungen von Smart-Home-Geräten keine Erlaubnis zur „akustischen Wohnraumüberwachung“ voraussetze, sondern nur eine Durchsuchung sei: Schließlich lagen die Aufnahmen schon vor und wurden nicht extra für die Ermittler angefertigt.
Erst die daraus entstandene Debatte führte mir das Datenschutzproblem von Sprachassistenten in aller Klarheit vor Augen. Letztlich speichern und verarbeiten Amazon, Apple, Google & Co. die Aufzeichnungen ihrer Assistenten nach ihren eigenen Regeln. In einem Land, in dem ein guter Teil der Bevölkerung über Jahrzehnte hinweg systematisch vom Staat ausgespäht wurde, erzeugt so etwas unweigerlich ein mulmiges Gefühl.
Wenn Alexa nicht einmal zuverlässig versteht, dass sie die Stehlampe ausschalten soll, mag ich mir nicht ausmalen, was mir blühen könnte, wenn die Assistentin eine lebhafte Diskussion über Terroranschläge als Planung eines solchen fehlinterpretiert. Moment, gerade klopft jemand sehr laut an meine Tür ...
Alexa, sind die Kartoffeln schon gar ? Alexa antwortet : Nein noch nicht, aber GOOGLE schickt gare Kartoffeln !
VG