Budget Amount *help |
¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 1996: ¥1,000,000 (Direct Cost: ¥1,000,000)
|
Research Abstract |
本研究の目的として,日本語文章中に出現する名詞並列の並列構造を字面解析で高速に抽出し,書き手に提示する方法を構築することをあげた. 1.日本語文章中から宇面の情報で並列のキ-を抽出する方法を構築した. 日本語文章を字面だけの情報で解析し活用語の活用形,品詞を推定する活用チェック法を構築した.この活用チェック法と字種情報を用いて,日本語文章を文節に区切り,文節の性質を求めることが可能である.文節の性質の情報を用いて,名詞並列の並列のキ-を抽出する方法を構築した.構築した抽出法を評価するために,論文の抄録文に適用して並列のキ-を抽出した.その結果,適合率95.2%,再現率97.3%で抽出できることが判明した。 2.名詞並列の並列要素を推定する方法を構築した. 上記の抽出法で得られた名詞並列の並列のキ-似対して,まず並列要素(前置要素,後置要素)の最長範囲を計算し,その範囲内で並列要素を推定する.まず,並列要素の存在を示す表層的な手がかりを探し,それが見付かれば,並列要素を決定する.手がかりがなければ,構造的な類似性に基づいて並列要素を推定する.この推定法を評価するために,論文の抄録文に適用した.その結果,推定精度は70.5%となった. 3.書き手への指摘法を設計し,プロトタイプを作成した. 並列構造を書き手に指摘するシステムのプロトタイプとしてXウインドウシステム上で動作するものを作成した.このシステムでは,名詞並列を含む文を表示し,その文を解析して得られた並列要素を縦に並べ,グラフ状に表示する.さらに,「表層的な手がかりがない」や「並列要素の最長範囲が長い」など,並列構造を書き手が再考する時に参考になる情報を一緒に表示する.
|