1995 Fiscal Year Annual Research Report
ハイパーテキスト,データベース技術の複合による文書処理とマニュアル整理への応用
Project/Area Number |
05452364
|
Research Institution | Kyushu University |
Principal Investigator |
島崎 眞昭 九州大学, 大型計算機センター, 教授 (60026242)
|
Co-Investigator(Kenkyū-buntansha) |
渡辺 善隆 九州大学, 大型計算機センター, 助手 (90243972)
松延 栄治 九州大学, 大型計算機センター, 助手 (30199830)
石田 慶樹 九州大学, 大型計算機センター, 講師 (20201030)
天野 浩文 九州大学, 大型計算機センター, 助教授 (80231992)
佐藤 周行 九州大学, 大型計算機センター, 助教授 (20225999)
|
Keywords | ハイパーテキスト / データベース / マニュアル / HTML / WWW / マルチメディア / 表面情報 / 意味情報 |
Research Abstract |
本年度は過去2年間の蓄積を踏まえて、プレーンな形のテキストから内容情報を自動的に抽出するソフトウェアの開発に専念した。テクニカルライティングの際に教育されるさまざまなルールが、読者のスキムリーディングを可能にするために表面情報と対応つけて規定されていることを確認し、具体的にひとつの教科書を「インプリメント」することにした。具体的に、まず英語用のテクニカルライティングの規則がどの程度日本語の論文に適用されるかをマニュアルで解析した。結果として、英語でのルールは日本語の論文でも十分適用可能であることを確認した。この際に、文章中の論理展開に使われる特定のシグナルワードを抽出した。さらにLAT_EX中、重要な位置を占める環境のうちで、特に重要なものとして章節構造、並列構造などに対応する環境を抽出した。これらを総合してLAT_EXからHTMLへの内容構造を反映したトランスレータtexaを作成した。プログラムtexaは従来作成されたLAT_EXからHTMLへの変換プログラムの機能を包含し、さらに内容情報を抽出し、それに対応したハイパーテキストを出力することができる。ここでは文章全体に対する目次、さらに段落に対するトピックセンテンスに代表される抽象化がなされるようになっている。さらに、段落のその文章中での役割をシグナルワードから決定し、関連する段落にリンクをはることができる。これらはブラウジング用にNetScape2.0以上を利用することで出力されたハイパーテキストを効率良くブラウズすることができる。 さらにこれらのプログラムの開発の結果得られた知見をまとめて報告書を作成した。
|
Research Products
(1 results)