研究課題/領域番号 |
61880007
|
研究機関 | 九州大学 |
研究代表者 |
牛島 和夫 九大, 工学部, 教授 (40037750)
|
研究分担者 |
高木 利久 九州大学, 工学部, 助手 (30110836)
古川 善吾 九州大学, 工学部, 助手 (30190135)
末吉 敏則 九州大学, 大学院総合理工学研究科, 助教授 (00117136)
荒木 啓二郎 九州大学, 工学部, 助教授 (40117057)
|
キーワード | プロトタイピング / 日本語文章処理 / 字面解析 / 推敲支援ツール / 正規化日本語文字 / マンマシンインターフェース / ワークステーション / パーソナルコンピュータ |
研究概要 |
日本語ワードプロセッサの主な仕事は文章の入力,書式の設定,文書の出力と保存であって、文章の推敲を積極的に助けるわけではない。しかし、ワードプロセッサで作られた文章は機械が読める形式で蓄えられているので、計算機で文章の中に踏み込んで推敲に役立つ情報を取り出し、質の高い文章を作る助けをしたい。我々は数年前から九州大学大型計算機センターのFACOM-M382のOS【IV】/F4日本語処理環境(JEF)のもとで日本語文章推敲支援ツール『推敲』の開発を行って来た。しかし、文章作成の基本はあくまで個人的作業である。この研究では、すでに大型計算機上にプロトタイプを実現し、仕様の大部分が確定しているソフトウェアを、個人用計算機(ワークステーションあるいはパーソナルコンピュータ)上に使用できるようにして実用化と普及とを図ろうとするものである。個人用計算機上での実現には処理速度や記憶容量の厳しい制約を考慮せねばならぬ。 1.個人用計算機における日本語文字コード体系と日本語ワードプロセッサで用いる日本語テキストのフォーマットとを調査した。個人用計算機上に正規化日本語文字コードに基づく日本語テキスト処理パッケージを構築した。個人用計算機上で、正規化日本語テキストに基づく高速パターンマッチングアルゴリズムの実行可能性を確認した。 2.上記1.を利用して、ワークステーション上に『推敲』の既存の機能を移し換えることができた。しかし個人用計算機を考慮したマン-マシンインターフェースは不十分であり次年度の研究課題である。 3.我々の研究室で収集した機械可読の日本語文章ファイル約百万字分を解析し、文字の出現頻度に基づく字面解析法を考案した。これによって文章中から接続助詞『が』や、受身形の検出を高速に行うことができる。これを『推敲』の機能拡張に応用する。
|