Theoretisch ist eine computerisierte Sprechererkennung ebenso als Identifikationsmethode geeignet wie die gängigen biometrischen Ansätze des Fingerabdrucks oder der Retinalscans, doch sind entsprechende Methoden bisher relativ langsam. Ein internationales Forscherteam hat nun einen deutlich schnelleren Ansatz zur Sprach-Authentifizierung entwickelt, der praxistaugliche Lösungen ein Stück näher rücken lässt.
"Mit dieser Methode erreichen wir ohne nennenswerte Genauigkeitsverluste eine Beschleunigung um einen Faktor zehn bis 20 gegenüber dem zugrunde liegenden Goldstandard", sagt Tomi Kinnunen, Informatiker an der University of Eastern Finland. Der Weg zum Massenmarkt ist aber noch weit.
Massenmarkt braucht Echtzeiterkennung
Für aktuelle Forensik-Anwendungen beispielsweise zum Vergleich aufgenommener Stimmproben mag es genügen, wenn Sprechererkennung einige Minuten oder sogar Stunden dauert. Damit sie aber im Massenmarkt Akzeptanz gewinnen kann, sind nicht nur geringe Fehlerraten, sondern auch eine schnelle Reaktionszeit nötig, so Robert Rodman, Informatikprofessor an der North Carolina State University . "Will man ein Authetifizierungs-System fürs Web oder Handy schaffen, bedeutet das eine Echtzeit-Anforderung", betont Kinnunen.
Eine entsprechend leistungsfähige Sprach-Authentifizierung könnte vielseitig zum Einsatz kommen. "Potenzielle Nutzer umfassen Regierungen, Finanzwirtschaft, Gesundheitswesen und die Telekommunikationsindustrie", meint der Rodman. Mögliche Anwendungen wären beispielsweise der Schutz vor Identitätsdiebstahl, Betrugsprävention oder auch der Bereich Datensicherheit. Die aktuelle Verbesserung von Sprechererkennungsmethoden sehen sehen die Forscher als Schritt in diese Richtung.
Mehr Security-News
Umwelt und Mensch als Hindernisse
Kinnunen zufolge ist die Geschwindigkeit der Sprechererkennung aber nur ein Teilproblem. "Die Methoden beständig gegenüber Umweltfaktoren zu machen ist eine größere Hürde dafür, die Technologie für ein breites Publikum nützlich zu machen", erklärt er. Derzeit seien Systeme zu ungenau, wenn ein User sich erst in einem leisen Büro anmeldet und dann beispielsweise im Auto wieder authentifizieren will. Ferner sei der Effekt menschlicher Faktoren wie Trunkenheit oder Wut noch nicht ausreichend erforscht.
"Sicherheit ist nicht immer entscheidend, beispielsweise wenn Familienmitglieder in einem intelligenten Haushalt erkannt werden sollen", meint Kinnunen. Es sei schließlich keine Katastrophe, wenn ein User von der Stereoanlage die falsche Musik vorgespielt bekommt. Für solche Systeme könne die Sprechererkennung in fünf bis zehn Jahren breit verfügbar werden. Bei wirklich sicherheitskritischen Anwendungen wie etwa als Authentifizierung bei Kreditkartenzahlungen könne es leicht noch 20 Jahre dauern. Selbst dann bleibe abzuwarten, ob die Nutzerakzeptanz groß genug ist, damit sich Sprechererkennung gegenüber anderen Lösungen durchsetzen kann. (pte/rw)