1997 Fiscal Year Annual Research Report
日本語文の並列構造推定法の構築およびその推敲支援システムへの応用に関する研究
Project/Area Number |
09780389
|
Research Institution | Kyushu University |
Principal Investigator |
菅沼 明 九州大学, 大学院・システム情報科学研究科, 助教授 (70235852)
|
Keywords | 字面解析 / 文章推敲支援 / 日本語文書処理 / テキスト処理 / 並列構造の推定 |
Research Abstract |
本研究では日本語文中にある並列構造を抽出し、並列要素を推定する方法を構築することを目的としている。知らない単語が並列構造中にある場合に、読み手が行なう並列構造の推定法を模倣し、その推定法を計算機上に実現する。計算機が推定した並列構造を書き手に提示することで、違った角度から文章を眺める機会を与える。本年度の研究で以下のことを明らかにした。 (1)並列のキ-の抽出法の構築に関して 名詞並列、述語並列、部分的並列の存在を示す並列のキ-を文字情報によって抽出する手法を検討し、精度良く抽出できることを確認した。さらに、抽出した並列のキ-によって上記3種類の並列構造をある程度区分する方法を構築した。名詞並列と部分的並列に関しては、並列のキ-だけでは区別できないが、述語並列に関してはほぼ区別して抽出できる。 (2)並列要素の推定法の構築に関して 字種の変化を利用して仮の文節に区切ることは可能である。この仮の文節単位で並列要素を推定する方法を構築している。名詞並列、部分的並列に関しては良い精度で推定できている。述語並列について、表層的な手がかりと構造的類似性を用いた並列要素の推定法を設計した。しかし、この推定法を文章に適用して述語並列の並列要素の推定を行ったところ、名詞並列、部分的並列ほどはうまく推定できていない。そのため、推定法の改良は必要と思われる。 (3)プロトタイプの作成に関して 並列構造に関する情報を書き手に提供する方法について考察した。書き手が文章を違った角度から眺める機会を与えるために、推定した情報をグラフィカルに表示し、問題点を指摘できるような表示法を検討した。さらに、設計した並列要素の推定法を計算機上にプロトタイプとして実現した。
|
Research Products
(2 results)