Kann man künftig auch eingeschwärzte Passagen in einem Dokument lesen? Die irische Informatikerin Claire Whelan sagt ja. Der an der Dublin City University Studierenden ist es gelungen, eine Technik zu entwickeln, mit der sich solche Dokumente entschlüsseln lassen.
Die Studentin legte ihrem Verfahren eine Kombination aus handelsüblicher Texterkennungssoftware und elektronischem Lexikon zugrunde. Zunächst bestimmte sie den Schrift-Font. Durch Abmessen der Schwärzung ließ sich nahezu exakt die Länge des zensierten Wortes ableiten, - plus oder minus drei Pixel.
Sodann prüfte sie mit Hilfe des Lexikons die Menge der sinnvollen Wörter in einem zensierten Beispielsatz. Nach einer Grammatik-Prüfung blieben von 1530 möglichen Wörtern noch 346 übrig. Die nun folgende semantische Prüfung besorgte Whelan selbst: Sie las den Satz auf Sinnhaftigkeit. übrig blieben bei dieser Methode, die Software schwer fällt, weil sie sich sozusagen nicht für richtige Variante entscheiden kann, genau sieben Wörter.
Nun konnte sie das Dokument mit hoher Plausibilität lesen, so die Studentin gegenüber der W Nature. Klar ist übrigens, dass Dokumente, in denen mehrere zusammenhängende Sätze geschwärzt sind, sich ihrer Technik entziehen.
Nachdem Whelan ihre Methode vergangene Woche auf einer Sicherheitskonferenz in der Schweiz demonstrierte, indem sie in einem geschwärzten Dokument der amerikanischen Armee über den Einsatz von Helikoptern der irakischen Armee entzifferte, dass "mit hoher Wahrscheinlichkeit" Südkorea dem Irak logistisch geholfen haben müsste, erklärten Sicherheits-Experten prophylaktisch, ihr Software-gestützter Ansatz sei "besorgniserregend".
In der folgenden Diskussion wiesen Sicherheitsexperten darauf hin, dass geschwärzte Dokumente nur eingescannt und mit veränderten Fonts ausgedruckt werden müssten, um zu verbergen, was nicht ans Licht der öffentlichkeit gelangen soll. Exakt diese Befürchtung äußerte auch ein Sprecher der amerikanischen Bürgerrechtsorganisation "Freedom of Information Act". (wl)