Mercedes-Benz integriert iPhones
Einen anderen Weg verfolgt Mercedes-Benz. Der Stuttgarter Autokonzern bietet seit Anfang 2013 die Integration des iPhones zusammen mit dem Sprachassistenten Siri in seiner E- und A-Klasse an. Nachdem BMW und Audi ursprünglich ähnliche Pläne verfolgten, ist Mercedes-Benz der erste deutsche Autohersteller, der diese Möglichkeit wahrnimmt. Bislang war das nur bei Automodellen von General Motors und Hyundai möglich. Bevor Mercedes-Fahrer Siri nutzen können, benötigen sie allerdings das Navigationsgerät "Drive Kit Plus" und die "Digital-Drive-Style"-App. Über die Oberfläche des Zusatzgeräts erhält der Fahrer Zugriff auf die Siri-Funktionen.
Auf diese Weise sind Funktionen wie E-Mail-Diktate, SMS verschicken, News abrufen oder Musik auswählen per Spracheingabe verfügbar. Da Siri über einen Open-Domain-Erkenner arbeitet und die Sprachinformationen via Apple-Server verarbeitet werden, versteht das System allerdings manche Sprachbefehle erst nach einer Wiederholung. Bei der Weiterentwicklung des Sprachassistenten ist Mercedes-Benz von Apple abhängig. Siri bietet außerdem keinen Zugriff auf das Navigationsgerät an. Wer sich also per Sprachbefehl navigieren lassen möchte, muss nach alternativen Navigationssystemen Ausschau halten. Der Autobauer bekundet zwar, nachbessern zu wollen, und möchte das nächste Release der Digital-Drive-Style-App auch mit entsprechenden Funktionen ausstatten. Ob dies über das iPhone oder ein separates Navigationssystem möglich sein wird, bleibt indes offen.
Ford Sync nun auch in Deutschland
Ford präsentierte bereits 2008 auf der Detroit International Auto Show das integrierte Kommunikationssystem "Sync". Seit Oktober vergangenen Jahres ist das System auch in Europa erhältlich. Hinter Sync verbirgt sich ein Spracherkennungssystem, das in Kombination mit einem Smartphone arbeitet. Die Architektur für die Plattform wurde in Kooperation mit dem Softwarekonzern Microsoft entwickelt, der unter anderem die Sprachfunktionen beisteuerte.
Der US-Autobauer wirbt etwa mit Funktionen für die Musikwahl oder das Vorlesen von Textnachrichten. Zudem können Ford-Fahrer per Spracheingabe im Telefonbuch suchen, Verkehrsnachrichten abrufen und sogar Apps auf Blackberry-, und Android-Geräten sowie iPhones installieren. Ford hat das System derart erweitert, dass sich rund um Sync praktisch ein eigenes Ökosystem mit zahlreichen Zusatzanwendungen entwickelt hat. Momentan ist das System für verschiedene Modelle in Deutschland verfügbar, unter anderem B-Max, Fiesta und Focus ST.
Etwas unpraktisch gestaltet sich allerdings die Auswahl nicht erkannter Sprachbefehle - was in der Praxis häufig vorkommen kann - über das integrierte Display. Auch bei Sync hat der Fahrer keinen Sprachzugriff auf ein Navigationsgerät. Dafür bietet das System einen Notruf-Assistenten, sobald der Fahrer das Handy per Bluetooth einbindet. Wird etwa der Airbag bei einem Unfall ausgelöst, verbindet sich dieser automatisch mit der Notrufzentrale.
Das Smartphone lässt sich neben Bluetooth auch über ein USB-Kabel anschließen. In diesem Modus lässt sich auch erst der gesamte Funktionsumfang von Sync nutzen. So kann etwa nur per USB-Kabel die komplette Musikbibliothek des Mobiltelefons mit Sync synchronisiert werden. Ein weiterer Nachteil ist die umständliche Synchronisation. Telefongespräche und Nachrichten werden über das Mobilfunknetz abgearbeitet. Gleichzeitig synchronisiert Sync etwa das Telefonbuch, damit der Fahrer per Sprachbefehl darauf zugreifen kann.
Alternative: Navigationsgerät
Da die meisten integrierten Anwendungen bisher keine Spracherkennung für die Navigation unterstützen, müssen Autofahrer alternativ auf entsprechend ausgestattete Navigationsgeräte zurückgreifen. Hersteller wie Tomtom und Garmin bieten eine ganze Palette von Modellen an. So hat Tomtom beispielsweise "Via 130" und "Via 135" im Repertoire. Das niederländische Unternehmen bewirbt die Geräte mit der "Speak & Go"-Funktion. Die Spracherkennung reagiert auf komplette Sätze, so dass beispielsweise ein Ziel mit Hilfe der integrierten Freisprecheinrichtung und dem Kommando des Fahrers angesteuert wird. "Es genügt, eine Adresse, ein Sonderziel oder ‚Bring mich nach Hause` zu sagen und Tomtom plant die Route ans Ziel", verspricht Corinne Vigreux, Managing Director bei Tomtom.
Insgesamt sind 1000 vordefinierte Befehle im Navigationsgerät gespeichert. Die Bedienoberfläche des Via 135 Traffic Europe hat der Hersteller beispielweise so eingerichtet, dass es fertige Wortgruppen vorgibt, die der Fahrer ansagen kann. Zudem gibt es ein Menü für vorhandene Kommandos. Der Vorteil bei dem grammatikbasierten System ist, dass die bekannten Sprachbefehle zuverlässig verarbeitet werden. Die Sprachbausteine müssen nicht extra per Internet-Verbindung an einen Server gesendet werden. Der Nachteil: Möchte ein Fahrer bei 120 km/h ein Ziel per Spracherkennung eingeben, dürfte das Gerät Probleme bekommen. Sagt er Wörter, die nicht im System vordefiniert sind, dann setzt das Gerät aus. Hier muss sich der Fahrer mit der Touch-Steuerung zufriedengeben.
Ähnlich wie die Automobilhersteller präsentierte Garmin sein aktuelles Navigationsgerät "nüvi 3597 LMT" Anfang des Jahres auf der CES. Ein zentrales Feature des Geräts ist die sprachgesteuerte Navigation. Garmin wirbt wie Tomtom für einen ständigen Abgleich von Verkehrsdaten, so dass die Geräte per gesprochene Ansage auch auf Verkehrsstörungen hinweisen können. Das nüvi 3597 LMT ist wie alle anderen Modelle von Garmin nicht mit einem Internet-basierten Live-Service ausgestattet. Vordefinierte Sprachbefehle speichert der Hersteller somit ebenfalls direkt auf dem Gerät. Diese lassen sich auf die häufigsten Menüpunkte anwenden. Das Navigationsgerät bietet somit nicht nur die sprachbasierte Eingabe von Navigationszielen, sondern auch die Steuerung des Geräts.
Fazit
Der Dialog zwischen Fahrer und Auto ist kein Zukunftsszenario mehr. Plattformen wie Sync oder Dragon Drive sind Beleg dafür, dass sich Systeme mit Sprachfunktionen zunehmend in den Fahrzeugen breitmachen. Leider bieten nicht alle Systeme einen Zugriff auf Navigationsfunktionen. Als Ersatz können Autofahrer Navigationsgeräte mit Sprach-Features nutzen. Diese zeichnen sich zwar durch relativ zuverlässige Spracherkennung aus, häufig aber nur für vordefinierte Wörter. Ohne Internet-Verbindung können die Geräte nicht dynamisch auf die Sätze des Fahrers reagieren. Schließlich sind die Umgebungsgeräusche im Auto durch den Motor oft so laut, dass die Systeme die Wörter schwer erkennen können. Ein Trend bei Navigationsgeräten werden daher in Zukunft Hybridgeräte sein, die das Kartenmaterial lokal abgespeichert haben, gleichzeitig aber zur Verarbeitung der Sprache mit Open-Domain-Server verbunden sind.
- Sprachsteuerung
Computer und Maschinen per Spracheingabe zu steuern gehörte für die meisten Experten bisher noch ins Reich der Science-Fiction. Doch mit stärkerer Hardware und neuen Techniken könnten die Visionen bald wahr werden. - Siri von Apple
Der von Apple und Nuance entwickelte Sprachassistent Siri (Speech Interpretation and Recognition Interface) ist seit dem iPhone 4S ein ständiger Begleiter der Apple-Gemeinde. Als vorinstallierte Anwendung erlangte Siri eine enorme Reichweite. - Dragon TV von Nuance
Bei der Anwendung Dragon TV von Nuance hört das Fernsehgerät den umliegenden Raum kontinuierlich nach Befehlen ab. Wer seinen Fernseher per Sprache steuern möchte, kann die Plattform des Spezialisten beispielsweise mit der Frage "Läuft gerade die Tagesschau" konfrontieren und bekommt auch eine Antwort. - Talking Terminal von Semvox
Das Talking Terminal von Semvox tritt in die direkte Interaktion mit dem Anwender. Möchte eine Person etwa im Supermarkt erklärt bekommen, wo die Getränkeabteilung ist, dann beschreibt das Talking Terminal den Weg per Sprachausgabe. - Interaktives Handbuch von Semvox
Auf Basis des Talking Terminal hat Semvox zudem ein interaktives Handbuch entwickelt, das derzeit im Rahmen des Projekts "Cyber-Physische Produktionssysteme" (Cypros) getestet wird. Das System ist eine Kombination aus Sprachsteuerung und RFID-basierter Interaktion