2006 Fiscal Year Annual Research Report
国際符号化文字集合におけるCollating weightの設計法に関する研究
Project/Area Number |
16650001
|
Research Institution | Nagaoka University of Technology |
Principal Investigator |
三上 喜貴 長岡技術科学大学, 技術経営研究科, 教授 (70293264)
|
Co-Investigator(Kenkyū-buntansha) |
町田 和彦 東京外国語大学, アジアアフリカ言語文化研究所, 教授 (70134749)
|
Keywords | 文字コード / 言語情報処理 / 辞書配列 / 順序集合 / インド系言語 |
Research Abstract |
研究の最終年度にあたり,音節構造記述方式(syllable structure notation)と辞書順序の形式的記述方式(formal notation of lexicographic order)の研究,有効性の検証を行った.前者については生成文法の文法構造をモデルとし,後者についてはPartial Order Set(POSET)とComplete Order Set(COSET)をベースとする順序の合成式によって記述した. 音節文字の辞書順序は,母音から構成される母音順序と,子音(結合子音を含む)から構成される子音順序の2次元で構成され,アルファベットを利用する言語の辞書順序が一次元的構造をもつことと対比をなす.こうした基本的特徴を捉えつつ,各言語の個別の特徴を如何に効果的に表現するかという点について,記述力の高い形式記述方法が得られた. モデルとしてはミャンマー語を用い,その音節構造を表記の記述方式で記述するとともに,Myanmar Language Commission編纂のMyanmar-English Dictionaryの辞書順序を表記形式で記述し,この順序を実現するアルゴリズムを開発した.しかし,依然として特殊な前処理を必要とするアルゴリズムに止まっており,引き続き,工夫を行う必要がある.また,クメール語,シンハラ語についても上記と同様の検討を行った. 今後,これらを踏まえて,最終的な記述形式を完成させたい.
|