研究課題/領域番号 |
07680389
|
研究種目 |
一般研究(C)
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 北陸先端科学技術大学院大学 |
研究代表者 |
佐藤 理史 北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (30205918)
|
研究期間 (年度) |
1995
|
研究課題ステータス |
完了 (1995年度)
|
配分額 *注記 |
2,000千円 (直接経費: 2,000千円)
1995年度: 2,000千円 (直接経費: 2,000千円)
|
キーワード | ダイジェスト自動生成 / 電子ニュース / ワールドワイドウェブ |
研究概要 |
本研究では、電子ニュースにおける、いわゆる「掲示型」と呼ばれるニュースグループ(例えば、fj. wantedやfj. forsale等)のダイジェストを自動作成する方法について検討し、fj. wantedのダイジェストの自動生成システムを実現した。 本システムの中心技術は、ニュース記事からその記事のカテゴリを判定し、その記事の内容を端的に表すサマリ文を抽出する技術である。本研究で開発した方法は,言わば「斜め読みを模擬した処理」であり、まず、表層的な表現を手がかりとして、42の特徴を抽出する。次に、それらの特徴を利用したルールによって、記事のカテゴリとサマリ文を抽出する。ブラインドデータに対する実験において、本方法は、カテゴリ判定正解率81%、サマリ文抽出正解率76%という値を示した。抽出されたサマリ文はカテゴリ毎に整理され、HTML形式のダイジェストとして出力される。このとき、元の記事へのポインタは、ハイパーテキストのリンクとして埋め込まれる。作成されたダイジェストは、WWWのクライアントプログラムによって読むことができる。 本研究で開発した方法は、fj. wantedを対象としたものであるが、他の掲示情報型ニュースグループや質問応答型のニュースグループのダイジェスト作成にも、同様な手法が適用できると考えられる。また、本方法をさらに発展させることによって、FAQの自動作成も可能になると考えられる。
|