研究概要 |
本年度は計画の2年度目にあたり,辞書配列順序の記述形式の開発を引き続き継続するとともに,辞書配列順データの収集と入力,次年度以降の研究準備にあてた. 辞書配列順序の記述形式については,論文としてのとりまとめを得るには至っていないが,科研費申請時に着想していた順序集合と順序集合間の二種類の演算を用いた形式で記述できるか否かを,昨年度のタミル語,ミャンマー語に加えてスリランカの研究者とともにシンハラ語,クメール語についての検討を加えた.昨年度までに,多重子音を作らず末子音も少ないタミル語の場合,辞書順序の定義は比較的シンプルな構造で記述できるが,ミャンマー語のように多重子音が多く,また,CVC構造の音節において頭子音C,末子音C,母音Vの順序でソートキーが構成されるという特殊な性格を持つ辞書順序の場合など,当初予定していた「音節構造式と辞書順序の形式記述形式が相同的になる」という仮説が成立しそうも無いケースも見出された.しかし,シンハラ語やクメール語の場合,比較的複雑な音節構成をとるにもかかわらず「音節構造式と辞書順序の形式記述形式が相同的になる」という仮説が妥当すると思われる.しかし,特にシンハラ語,クメール語では,両側から挟みこむ形のいくつかの母音記号についてはUCS/Unicode上で複数のコードの合成として表されるケースが多く,これが障害となる可能性が高い. また,辞書順序データについては,前年度のタミル語に加えて,ミャンマー語,シンハラ語,ヒンディ語の辞書順序についてデータの入力を行った.シンディ語についてもアラビア文字およびインド系文字の両方で表記される言語であることから辞書順序検討の格好の対象であるとして入力を検討したが,特にシンディ語で使用されるアラビア追加文字フォントの利用に問題があるために,これは当面断念することとした.
|