• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

国際符号化文字集合におけるCollating weightの設計法に関する研究

研究課題

研究課題/領域番号 16650001
研究機関長岡技術科学大学

研究代表者

三上 喜貴  長岡技術科学大学, 工学部, 教授 (70293264)

研究分担者 町田 和彦  東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (70134749)
キーワード文字コード / 言語情報処理 / 辞書配列 / 順序集合 / インド系言語
研究概要

本年度は計画の2年度目にあたり,辞書配列順序の記述形式の開発を引き続き継続するとともに,辞書配列順データの収集と入力,次年度以降の研究準備にあてた.
辞書配列順序の記述形式については,論文としてのとりまとめを得るには至っていないが,科研費申請時に着想していた順序集合と順序集合間の二種類の演算を用いた形式で記述できるか否かを,昨年度のタミル語,ミャンマー語に加えてスリランカの研究者とともにシンハラ語,クメール語についての検討を加えた.昨年度までに,多重子音を作らず末子音も少ないタミル語の場合,辞書順序の定義は比較的シンプルな構造で記述できるが,ミャンマー語のように多重子音が多く,また,CVC構造の音節において頭子音C,末子音C,母音Vの順序でソートキーが構成されるという特殊な性格を持つ辞書順序の場合など,当初予定していた「音節構造式と辞書順序の形式記述形式が相同的になる」という仮説が成立しそうも無いケースも見出された.しかし,シンハラ語やクメール語の場合,比較的複雑な音節構成をとるにもかかわらず「音節構造式と辞書順序の形式記述形式が相同的になる」という仮説が妥当すると思われる.しかし,特にシンハラ語,クメール語では,両側から挟みこむ形のいくつかの母音記号についてはUCS/Unicode上で複数のコードの合成として表されるケースが多く,これが障害となる可能性が高い.
また,辞書順序データについては,前年度のタミル語に加えて,ミャンマー語,シンハラ語,ヒンディ語の辞書順序についてデータの入力を行った.シンディ語についてもアラビア文字およびインド系文字の両方で表記される言語であることから辞書順序検討の格好の対象であるとして入力を検討したが,特にシンディ語で使用されるアラビア追加文字フォントの利用に問題があるために,これは当面断念することとした.

  • 研究成果

    (4件)

すべて 2005

すべて 雑誌論文 (4件)

  • [雑誌論文] 世界の文字と文字コード(前編)2005

    • 著者名/発表者名
      三上喜貴
    • 雑誌名

      情報処理 VOL.46 NO.8

      ページ: 1919-1924

  • [雑誌論文] 世界の文字と文字コード(後編)2005

    • 著者名/発表者名
      三上喜貴
    • 雑誌名

      情報処理 VOL.46 NO.9

      ページ: 1046-1052

  • [雑誌論文] Myanmar, Languages in the Cyberspace2005

    • 著者名/発表者名
      Wunna Ko Ko, Yoshiki Mikami
    • 雑誌名

      長岡技術科学大学言語・人文科学研究報告 VOL.19

      ページ: 249-264

  • [雑誌論文] Unicode Spreading on the Web : A Case of Asian Domains2005

    • 著者名/発表者名
      P.Zavarsky, Wunna Ko Ko, Y.Mikami, YC.Chew, T.Kobayashi
    • 雑誌名

      The 29th Internationalization & Unicode Conference, March 6-8, 2006, San Francisco, CA USA

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi