Ich erweitere und überarbeite das elektronische Japanisch-Deutsche Wörterbuch
Wadoku Jiten von Ulrich Apel. Diesen Wortschatz konvertiere ich derzeit in zwei verschiedene
Formate. Zum einen ist es das EDICT-Format nach Jim Breen
in EUC,
dass zum Beispiel mit dem
Japanese Word
Processor von Glenn Rosenthal arbeiten kann. Eine in UTF-8 kodierte
Datei steht nun auch zur Verfügung, die unter anderem mit dem neuen
JWPce 1.4 arbeitet. Der Vorteil hier ist, dass sämtliche Umlaute und Diakritika
dargestellt werden können. Zum anderen ist es die komplette Konvertierung des Datenbestandes des Wadoku Jiten in
UNICODE bzw. UTF-8. In diesem Wörterbuch finden sich viele Informationen, Beispielsätze
in "normalem" Deutsch, d.h. mit sämtlichen Umlauten und
anderen diakritischen Zeichen. Der Aufbau der Datenbank ist
JAPANISCH | LESUNG (in Hiragana) | WORTART | DEUTSCH | KOMMENTAR | VERWEIS
mit vielen Anmerkungen zu Doppelschreibungen, etymologischen Anmerkungen, etc.
Eine in Perl programmierte Suchmaschine finden Sie unter
www.bibiko.de/wadoku.
Desweiteren übersetze ich das KANJIDIC ins Deutsche, einem Kanji-Wörterbuch mit vielen Informationen zu Kodierung, Lesungen und deren deutsche Bedeutungen etc.
Vor allem für die Sprachen Japanisch, Chinesisch, Tibetisch (auch
Koreanisch, Mongolisch und indische Sprachen) arbeite ich an Lösungen für:
Textparsing,
Grundformreduktionen, enzyklopädische Datenbanken und Wörterbücher,
morphologische Analyzer, Konvertierungsproblematiken etc.
Wo liegen Probleme der Darstellung der Schriften am Computer? Wie kann mit
den Problemen umgehen lernen? Dies soll nur ein kurzer Abriss sein.
Die Vorabversionen der Dateien können von dieser Homepage kostenlos
heruntergeladen werden. Die einzige Bedingung, die ich damit verbinde, ist es,
mich über alle Fehler, Anregungen, Erweiterungen, etc. sofort in
Kenntnis zu setzen.
Jeder, der diese Projekte unterstützen möchte, kann sich an mich wenden.
Bei Fragen können Sie mich jederzeit über
mail at bibiko.de erreichen.