"Sag Siri einfach, was es machen soll. Siri versteht, was du sagst, weiß, was du meinst, und spricht sogar mit dir". So, wie Apple für sein smartes "Speech Interpretation and Recognition Interface" wirbt, so bezeichnet Microsoft sein Pendant Cortana als "neue lernfähige persönliche Assistentin". Da kann Google nicht hinten anstehen: "Die richtigen Informationen zur richtigen Zeit. Mit Google Now bleiben Sie über alles auf dem Laufenden, was Sie interessiert", verspricht das Unternehmen.
Der Tenor ist bei allen drei großen IT-Konzernen derselbe: Die persönlichen Assistenten sollen das Leben einfacher machen.
Was steckt hinter den digitalen persönlichen Assistenten?
Aber stimmt das überhaupt? Was leisten Siri, Cortana und Google Now wirklich? Wie funktionieren die digitalen Assistenten und woher bekommen sie die persönlichen Informationen über ihre Nutzer? Drohen eventuell Gefahren durch die Preisgabe dieser Daten, und welche Auswirkungen ergeben sich durch ihre Nutzung? Das sind nur einige der Fragen, denen wir in diesem Überblick nachgehen.
Rückblende: Software für Spracherkennung existiert schon seit den 1990er-Jahren, doch ihre Qualität war enttäuschend. Zwar funktionierte im Prinzip das Diktieren am PC, praxistauglich aber war die Erkennung nicht. In der Folge sind die meisten Programmhersteller wieder vom Markt verschwunden, und bis auf wenige Nischen wie in der Medizin und der Justiz hat sich Diktier-Software nie wirklich durchgesetzt. Eine funktionierende Spracherkennung aber ist essentielle Voraussetzung für digitale Assistenten: Wenn der Assistent nicht versteht, was der Benutzer von ihm möchte, kann er natürlich auch keine ordentliche Antwort geben.
In der Zwischenzeit aber haben sich Voraussetzung und Funktionsweise völlig geändert. Arbeitete die Sprach-Software früher auf einem einzelnen PC, läuft sie heute in der Cloud. Einzige Voraussetzung ist also eine ausreichend schnelle Verbindung, die Rechenpower für die Sprachanalyse selbst ist dann praktisch unbegrenzt. Wie leistungsfähig solche ins Internet ausgelagerten Anwendungen bereits sind, illustriert Skype. Der Dienst ermöglicht Telefongespräche mit Übersetzung praktisch in Echtzeit. Aktuell unterstützt er Englisch, Spanisch, Französisch, Deutsch, Italienisch und Mandarin, weitere Sprachen sollen folgen. Der Schreib-/Chat-Modus verarbeitet sogar über 50 Sprachen, ebenso der Online-Übersetzer von Google.