研究課題/領域番号 |
01880008
|
研究機関 | 九州大学 |
研究代表者 |
牛島 和夫 九州大学, 工学部, 教授 (40037750)
|
研究分担者 |
菅沼 明 九州大学, 工学部, 助手 (70235852)
古川 善吾 九州大学, 工学部, 講師 (30190135)
稲田 俊明 九州大学, 文学部, 助教授 (80108258)
松永 勝也 九州大学, 文学部, 教授 (10036999)
|
キーワード | 推敲支援 / 字面解析 / 日本語文書処理 / ソフトウェアの移植 / パ-ソナルコンピュ-タ / ワ-クステ-ション / 利用者インタフェ-ス / テキスト処理 |
研究概要 |
日本語文章推敲支援ツ-ル『推敲』は、日本語ワ-ドプロセッサなどで作られた日本語文章ファイルを解析して、推敲に役立つ情報を書き手に提供することを目的としたツ-ルである。 1.パソコン上に実現した『推敲』Ver.1.8を試用してもらった感想をもとにして、若干の機能拡張を施した『推敲』Ver.1.9を作成した。追加機能の主なものは、新たに抽出法を構築した“wa"と発音する「は」を抽出する機能と、指摘した結果をファイルに保存する機能である。そのほか、字面解析アルゴリズムの精度を向上させた。このバ-ジョンアップに伴って『推敲』の使用手引書も改訂した。 2.『推敲』Ver.1.8の感想で最も多かった編集機能の追加に関して、仕様を検討した。この際、『推敲』で使用している検索に適した日本語テキストの管理に関するデ-タ構造の見直しを行った。さらに、その仕様をもとにして、パソコン上の『推敲』に編集機能を実装し、『推敲』Ver.2.1を実現した。 3.これまでに構築してきた字面解析アルゴリズムは科学技術文章約70万字を調査して導いたものである。これが科学技術文章以外の文章に対しても有効であることを調べるために、約2000万字の新聞記事デ-タに適用して評価を行った。今年度は、それら字面解析アルゴリズムのうち昨年度までに評価が終了していなかった否定表現の抽出アルゴリズムを評価した。その結果、抽出精度は93.4%であることがわかった。 4.格助詞を字面解析で抽出するアルゴリズムを構築するにあたり、科学技術文章約70万字について調査を行った。その結果、格助詞「が」については約90%の精度で抽出できることがわかった。さらに、格助詞「に」と「で」については、字面だけでは格助詞だけを精度良く抽出することが困難であることが判明した。
|