1997 Fiscal Year Annual Research Report
全世界の文字の混在処理を可能とするマルチリンガル入出力・文書処理・通信機構の研究
Project/Area Number |
07558275
|
Research Institution | Waseda University |
Principal Investigator |
小原 啓義 早稲田大学, 理工学部, 教授 (40063367)
|
Co-Investigator(Kenkyū-buntansha) |
森崎 正人 日本電信電話株式会社, 光ネットワーク研究所, 主幹研究員
片岡 朋子 早稲田大学, メディアネットワークセンター, 訪問研究員 (80137075)
片岡 裕 早稲田大学, メディアネットワークセンター, 訪問研究員 (70288017)
|
Keywords | 国際化 / 地域化 / 多言語化 / テキスト処理 / 自然言語処理 / 組版 / デジタル図書館 / 構造化文書 |
Research Abstract |
世界の文字の完全な混在処理は、文字単位のテキスト処理と図形単位の表示処理の実現が必須である。前年度までの研究で、文字と表示図形の個数が、1対1とは限らず多対1となるケースが頻出することが判明した(Devanagai文字、Thai文字)。そのため、文字コードのコードポイントと文字の関係が多対1及び、文字と表示図形の関係が多対1であるケースでも正しく処理可能とするシステムを完成した。これによって、文字は文字単位でテキスト処理が可能となり、表示においては表示される図形単位として上下左右の全表記方向での無矛盾な処理が可能となった(Mulsaic'97)。 本システムは、ISO2022を満足するため、文字コード間で重複する文字を等価に扱う必要が生じ、また、図書館では、例えば平仮名・カタカナや大文字・小文字を特価に扱う必要があるなど、テキスト処理における文字処理をPOSIXから拡張することが必須であった。そのため、これらの要求を満足する完全な国際化可能なライブラリを実現した。これによって、本システムは、全世界のあらゆる文字コードを受理し、全ての文字を混在可能なだけでなく、一般化したテキスト処理ルーチンによってあらゆる文字を統一的にテキスト処理可能とした(ISFST'97)。 本研究は、国際化処理が言語に非依存であることを証明して実装し、同時に真に言語に依存する処理を言語依存処理(言語情報を文字情報に付加しなければ処理可能ではないテキスト処理)として明示的に分離し、真の多言語環境の実現を示した。
|
-
[Publications] Kataoka,Y.,et al: "The Essentials for Developing Multilingual Computing Environment" The 2nd Workshop on Multilinguality in Software Industry. IJCAI-97. 1-8 (1997)
-
[Publications] Kataoka,Y.,et al: "Processing All the World's Characters : The Internationalization" International Symposium on Future Software Technology. 1. 159-169 (1997)