Keine Hexerei

Wie kommt eigentlich Chinesisch in den Computer?

10.06.2008
Bei Tausenden und Zigtausenden von Schriftzeichen müssten chinesische oder japanische Tastaturen eigentlich riesig groß sein, sind sie aber nicht...

Immer mehr Deutsche lernen Chinesisch oder Japanisch, ein Grund auch für IT-Fachhändler sich mit der Frage zu beschäftigen, wie diese Sprachen bei der Vielzahl von Schriftzeichen in den Computer kommen.

Einige Online-Händler wie etwa Abitz.com haben sich schon auf multilinguale Soft- und Hardware spezialisiert, um die stark wachsende Nachfrage in Deutschland und anderen europäischen Ländern befriedigen zu können.

Die ersten chinesischen Schreibmaschinen hatten riesige austauschbare Platten mit jeweils einigen tausend Schriftzeichen. Die heutigen Tastaturen haben aber nicht mehr Tasten als die englische oder deutsche, genutzt werden sogar weniger Tasten als bei europäischen Sprachen.

Voraussetzung für die Darstellung chinesischer Zeichen ist natürlich ein entsprechender Zeichensatz und ein Kodierungsprogramm, das aus mehreren ASCII-Zeichen chinesische bilden kann.

Für die Eingabe über die Tastatur gibt es verschiedene Verfahren, die über so genannte Input Method Editors (IMEs) ausgewählt werden können. Microsoft Windows unterstützt zehn davon. Die einfachste Methode ist die über eine Lautschrift.

Taiwan-Tastatur des HP Mini-Note: oben die Lautschrift Bopomofo, unten Piktogramme oder Radikale für den grafischen Aufbau von Zeichen gemäß Cangjie. Auf A liegt z.B. die Sonne, auf F das Feuer, auf V die (schwangere) Frau, auf B der Mond, auf M der Bogen, auf U der Berg.

In China wird dafür eine Bejing Hanyu Pinyin genannte Lautschrift mit lateinischen Buchstaben verwendet, in Taiwan Bopomofo (bo auf der 1, po auf dem Q, mo auf dem A...), eine aus chinesischen Zeichen abgeleitete Lautschrift mit 37 Symbolen, die auf der dargestellten Tastatur in rot zu sehen sind und anders als Hanyu Pinyin vertikal übereinander angeordnet neben dem entsprechenden chinesischen Zeichen stehen können.

Was Chinesisch einfach und doch wieder schwer macht, ist die Lautarmut. Europäer mit gutem Gehör können bei der Hochsprache Mandarin nur etwa 410 Laute unterscheiden. Manche davon sind so ähnlich), dass selbst viele Chinesen Probleme haben, diese richtig auszusprechen, geschweige denn in der richtigen Lautschrift wiederzugeben.

Mit den Tönen, bei Mandarin 4 bis 5 (gleich bleibend, ansteigend, abfallend und wieder ansteigend, abfallend und tonlos), gibt es nur etwa 1.300 bis 1.400 verschiedene Laute. Deutsch mit Fremdwörtern kennt dagegen über 15.000 verschiedene Silben oder Laute.

Allein für den Laut "ji" (so wie in Jeep) im fallenden 4. Ton sind in einem großen Standardwörterbuch über 60 verschiedene Zeichen mit jeweils unterschiedlicher Bedeutung gelistet. Manche Dialekte wie das Taiwanesische oder in Hongkong gesprochene Kantonesisch haben acht oder sogar noch mehr Töne.

Problem bei den wenigen Mandarin-Lauten ist, dass wie gesagt selbst mit dem entsprechenden richtigen Ton noch eine große Auswahl an Zeichen zur Verfügung steht. Moderne Algorithmen geben aber ähnlich wie bei T9 am Handy die wahrscheinlichsten Zeichenfolgen vor, so dass die Eingabemethode mittlerweile recht flüssig von der Hand geht, und das sogar, ohne jeweils die Tasten für die Tonzeichen zu betätigen zu müssen. Handelt es sich wie um mehrsilbige Wörter, werden die Zeichen rückwirkend korrigiert.

Nur bei weniger geläufigen oder falsch angezeigten Einzelzeichen, Eigennamen oder gleich lautenden Wörtern muss man noch aus einer Zeichen- oder Vokabelliste die richtige Auswahl treffen.

Kinder in China oder Taiwan sind zunächst auf eine romanisierte oder chinesische Lautschrift angewiesen, erst in der Mittelschule kommen sie ohne aus und verlernen diese dann teilweise wieder. Da die meisten Zeichen aus einem Grundbestandteil und einem Lautteil bestehen, können Chinesen für sie fremde Schriftzeichen meist aus dem Kontext heraus verstehen.

In China steht die Pinyin-Lautschrift bei Straßennamen und staatlichen Gebäuden oft dabei, in Taiwan nur bei Straßennamen und wenn es sich um weniger bekannte Eigennamen handelt.

Chinesen, die mit der Lautschrift auf Kriegsfuß stehen, sind auf andere Eingabemethoden angewiesen. Die einfachste ist (eine saubere Aussprache vorausgesetzt) die Spracheingabe, gefolgt von der über ein Tablett oder Touchscreen. Sekretärinnen und andere Profis bedienen sich aber lieber anderer Eingabemethoden.

Auf der im Bild zu sehenden Tastatur sind in blau und schwarz verschiedene chinesische Zeichen zu sehen. Diese dienen verschiedenen Eingabemethoden auf Basis bestimmter häufig wieder kehrender Zeichen oder Zeichenbestandteilen, aus denen sich mit wenigen Tastenanschlägen andere Zeichen eingeben lassen.

Allerdings ist auch den meisten Chinesen nicht geläufig, wie die Zeicheneingabe über solche Zeichen und Zeichenbestandteile funktioniert.

Führt keine der genannten Eingabemethoden zum richtigen Ziel, kann man mit manchen Eingabesystemen auch alle Striche zählen oder so wie in einem chinesischen Wörterbuch das Zeichen über eine Radikalliste finden.

Radikale sind im traditionellen Chinesisch (Langzeichen, in Taiwan und Hongkong gebräuchlich) 214 Grundbestandteile von Zeichen. Hat man den Grundbestandteil (zum Beispiel Mensch, Pferd, Gold oder Wasser) anhand der Strichzahl (bis zu 16, z.B. beim Drachen) ausfindig gemacht, muss man nur noch die restlichen Striche zählen und das gesuchte Zeichen aus einer mehr oder weniger großen Liste raussuchen. Diese gibt dann die Seitenzahl für das gesuchte Zeichen an.

Chinesische Lang- und Kurzzeichen, der Reihe nach untereinander Drache (lóng), zurückkehren (gui) und schützen (wèi).

In Taiwan sind wie gesagt, traditionelle Langzeichen üblich, in der Volksrepublik China wurden 1956 wegen der enormen Analphabetenrate für bestimmte Zeichen und Radikale Kurzzeichen eingeführt. Der Drache (Long) hat in Langzeichen als Piktogramm 16 Striche, im Kurzzeichen besitzt er nur fünf Striche, ist aber kaum noch als solcher zu erkennen.

Sehr große Wörterbücher listen bis weit über 50.000 chinesische Zeichen auf. Gebraucht werden aber in der Regel nur ein paar Tausend. Der taiwanesische Zeichensatz nach dem Big5-Code hat fast 14.000 Zeichen, der in China gebräuchliche GB2312-Code knapp 7.000 Zeichen. Die Codes sind jeweils nicht kompatibel und müssen je nach Herkunft unter Ansicht-Kodierung im E-Mail-Programm oder Explorer geändert werden.

Es gibt mittlerweile Unicode-Zeichensätze, die sehr viel mehr chinesische (Lang- und Kurzzeichen), japanische und koreanische Schriftzeichen umfassen. Im GB18030 Unicode sind sogar 110.000 verschiedene Zeichen definiert. Ein in Japan herausgegebenes Wörterbuch enthält rund 100.000 chinesische Zeichen. Blieben noch genug für nahezu alle lebenden und toten Sprachen.

Microsoft bietet für alle neuen Windows-Betriebssysteme Service-Packs für asiatische Sprachen an. Diese kommen oft schon mit dem Betriebssystem und müssen unter Systemsteuerung-Spracheigenschaften nur installiert werden. Bei vorinstalliertem Windows XP kann man die Sprachunterstützung über den System-Ordner "Regions- und Sprachsteuerung" laden. Dort findet man auch eine Auswahl von möglichen Eingabemethoden. (kh)