2004 Fiscal Year Annual Research Report
国際符号化文字集合におけるCollating Weightの設計法に関する研究
Project/Area Number |
16650001
|
Research Institution | Nagaoka University of Technology |
Principal Investigator |
三上 喜貴 長岡技術科学大学, 工学部, 教授 (70293264)
|
Co-Investigator(Kenkyū-buntansha) |
町田 和彦 東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (70134749)
|
Keywords | 文字コード / 言語情報処理 / 辞書配列 / 順序集合 / インド系言語 |
Research Abstract |
本年度は計画の初年度にあたり,辞書配列順序の記述形式の開発及び辞書配列順データの収集と入力,次年度以降の研究準備にあてた. 辞書配列順序の記述形式については,論文としてのとりまとめを得るには至っていないが,科研費申請時に着想していた順序集合と順序集合間の二種類の演算を用いた形式で記述できるか否かを,タミル語,ミャンマー語の研究者とともに検討を加えた.この結果,多重子音を作らず末子音も少ないタミル語の場合,辞書順序の定義は比較的シンプルな構造で記述できるが,ミャンマー語のように多重子音が多く,また,CVC構造の音節において頭子音C,末子音C,母音Vの順序でソートキーが構成されるという特殊な性格を持つ辞書順序の場合など,当初予定していた「音節構造式と辞書順序の形式記述形式が相同的になる」という仮説が成立しそうも無いケースも見出された.この点は更に幾つかの言語によって検証を進めていく必要が有る. また,辞書順序データについては,タミル語の辞書についてデータの入力を行ったほか,次年度以降の研究準備としては,シンディ語の研究者とのコンタクトを始めており,まずは,ミャンマー語,タミル語,シンディ語の三つの言語を対象に当初の検討を進める予定である. シンディ語は当初予定に入れていなかった言語であるが,国内にシンディ語を母語とする有力な研究協力者が得られたこと,また,シンディ語はアラビア文字及びインド系文字の双方で表記される言語であるために,辞書順序の使用文字体系への依存性を検討するうえでも格好の素材である,との理由から取り上げることにしたものである.
|
Research Products
(3 results)