日本語文章推敲支援システムのための漢字分類情報を用いた字面解析手法の構築
Project/Area Number |
07780368
|
Research Category |
Grant-in-Aid for Encouragement of Young Scientists (A)
|
Allocation Type | Single-year Grants |
Research Field |
情報システム学(含情報図書館学)
|
Research Institution | Kyushu University |
Principal Investigator |
菅沼 明 九州大学, 工学部, 講師 (70235852)
|
Project Period (FY) |
1995
|
Project Status |
Completed (Fiscal Year 1995)
|
Budget Amount *help |
¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 1995: ¥1,100,000 (Direct Cost: ¥1,100,000)
|
Keywords | 字面解析 / 文章推敲支援 / 日本語文書処理 / 利用者インタフェース / テキスト処理 |
Research Abstract |
本研究の目的として,日本語文章中に出現する漢字を手がかりにして文章を高速に解析する方法の構築をあげていた。 1.表を用いて活用語の活用形を推定する活用チェック法を構築した. 活用語を語幹と活用語尾に分解し,それぞれを解析するための表を用意した.語幹の最後の文字に現れる漢字を調査した結果,JIS第一水準漢字の83%が,漢字一文字で動詞,形容詞,形容動詞の区別ができることが判明した.これを利用して,語幹に関しては最後の文字だけを漢字と平仮名に区別して登録した.さらに,活用語尾表と語幹の表とで別々に品詞を推定し,両方の推定結果が一致した場合に,活用語の品詞と活用形を確定する活用チェック法を構築した. 2.接続助詞「が」の抽出および否定表現の抽出に活用チェック法を適用し,抽出精度が向上することを確かめた. 接続助詞「が」および否定表現の抽出法は,以前,判定条件を満たす文字列を抽出する方法で取り出していた.この抽出法を活用チェック法を利用する方法に変更した.新聞記事200万文字の文章を対象として,新しい方法で抽出実験を行なった結果,接続助詞「が」の抽出精度が95%,否定表現の抽出精度が87.3%と共に10%向上した. 3.活用チェック法を用いて動詞の表記揺れを指摘する方法を構築した. 活用チェック法によって文章中の動詞を抽出し,その表記の揺れ(送りが名の揺れ,漢字表記・平仮名表記の揺れなど)を検出する方法を構築した.この方法は文章を高速に解析し,揺れを取りこぼしなく抽出する.
|
Report
(1 results)
Research Products
(3 results)