研究課題/領域番号 |
06680383
|
研究種目 |
一般研究(C)
|
配分区分 | 補助金 |
研究分野 |
情報システム学(含情報図書館学)
|
研究機関 | 武蔵工業大学 |
研究代表者 |
上原 徹三 武蔵工業大学, 工学部, 教授 (60257102)
|
研究分担者 |
石川 知雄 武蔵工業大学, 工学部, 教授 (00202961)
|
研究期間 (年度) |
1994 – 1995
|
研究課題ステータス |
完了 (1995年度)
|
配分額 *注記 |
2,100千円 (直接経費: 2,100千円)
1995年度: 500千円 (直接経費: 500千円)
1994年度: 1,600千円 (直接経費: 1,600千円)
|
キーワード | 古文 / 文法 / 辞書 / 形態素解析 / 構文解析 / 係り受け / 漢字かな変換 / 日本語処理 / 自然語処理 |
研究概要 |
日本語処理や日本文文書処理の対象拡大として、古文の計算機処理を取り上げた。旧仮名遣いのべた書き表現の「伊勢物語」の文を対象とし、次の実験を実施した。 1.文節分けと漢字仮名変換:自立語辞書・付属語辞書と文節を構成する文法規則と、それによる漢字仮名変換処理に関し、自作プログラムの試作による実験、および、文法と辞書を全面的に取替えられる日本文入力システムWnnによる文法・辞書の定義と漢字仮名変換実験を実施した。後者の実験で単語分けの正解率は約90%、漢字仮名変換の正解率は約97%であった。作成した自立語辞書は「伊勢物語」の用語の範囲であり、一般の古文への応用のためには、規模が小さい。付属語辞典の単語と接続規則については、同時代の古文への適用性はあるものと考えられる。 文節間の係り受け解析:単語分け後の文節間の係り受けを対象とした。文法規則は正しい表現かどうかを識別する規則であり、経験則は文法規則から正しい複数個の文法的解釈があるとき、それらの間の優先度を付けるための規則である。文法規則は、設定した品詞、文節の構成、および、文節の係り受け関係による文の構成という点から、いわゆる学校文法に従ったものである。経験則については、既存の文法書に記載されているものが少ないので、実験を進めながら独自に設定した。「伊勢物語」の107文について実験した結果、正解文を一位として解答したものが96文となった。 最後に、上記の実施事項に直接に関連する範囲で、次のような課題が挙げられる。 1.現在の文法の枠内で、品詞の細分、それに対応する文法規則の精細化を図ること。 格文法の適用などにより今回扱った係り受け経験則より強い規則を得ること。 3.古文に関する辞書情報、文例情報などのデータ面の充実を図ること。
|