研究課題/領域番号 |
01880008
|
研究種目 |
試験研究(B)
|
研究機関 | 九州大学 |
研究代表者 |
牛島 和夫 九州大学, 工学部, 教授 (40037750)
|
研究分担者 |
古川 善吾 九州大学, 工学部, 講師 (30190135)
平原 正樹 九州大学, 工学部, 講師 (10192717)
高木 利久 九州大学, 情報処理教育センター, 助教授 (30110836)
稲田 俊明 九州大学, 文学部, 助教授 (80108258)
松永 勝也 九州大学, 文学部, 助教授 (10036999)
|
キーワード | 推敲支援 / 字面解析 / 日本語文書処理 / ソフトウェアの移植 / パ-ソナルコンピュ-タ / ワ-クステ-ション / 利用者インタフェ-ス / テキスト処理 |
研究概要 |
日本語文章推敲支援ツ-ル「推敲」は、日本語テキストを解析し、推敲に役立つ情報を書き手に提供することを目的としたツ-ルである。この研究に先立ってこのツ-ルをパソコン(PC9801)上に開発した。 1.パソコン版「推敲」をIBM5550とFMR60に移植した。IBM版は、平成3年4月から早稲田大学理工学部における技術文書作成教育で使用される予定である。 2.ワ-クステ-ション上に「推敲」を実現するために、二つの抽象デ-タ型デ-タ構造「文フォルダ」と「文字列フォルダ」とを用意した。これらのデ-タ構造を操作する基本演算を一つ一つインプリメントし、基本演算を複数個組み合わせたマクロを定義する機能をインプリメントした。マクロ定義をファイル化しておくことによって、ワ-クステ-ション版「推敲」のプロトタイプ版を完成できる見通しを得た。 3.利用分野の拡大のため、他大学のドイツ語教官、留学生担当教官、付属病院医師のほか、雑誌編集者などにパソコン版「推敲」を配布し、評価を依頼した。平成3年度前半には評価を終了する見込みである。評価結果をまとめ、次の版の設計に活かす予定である。 4.これまで構築してきた字面解析アルゴリズムは科学技術文章約70万字を調査して導いたものである。これを一般の文章への適用可能性を調べるために、約2千万字の新聞記事デ-タに適用して評価した。その結果、受身抽出アルゴリズムについては、「現われ」「表われ」のほかに「分かれ」「生まれ」を特別に扱うことによって、抽出精度(候補として抽出したもののうちで正しいものの割合)を98.4%にできることが分かった。また、「ワ」と発音する「は」を抽出するアルゴリズムの抽出精度は98.0%である。このほか、否定表現を抽出するアルゴリズムを評価中である。
|