1995 Fiscal Year Annual Research Report
Project/Area Number |
07680389
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
佐藤 理史 北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (30205918)
|
Keywords | ダイジェスト自動生成 / 電子ニュース / ワールドワイドウェブ |
Research Abstract |
本研究では、電子ニュースにおける、いわゆる「掲示型」と呼ばれるニュースグループ(例えば、fj. wantedやfj. forsale等)のダイジェストを自動作成する方法について検討し、fj. wantedのダイジェストの自動生成システムを実現した。 本システムの中心技術は、ニュース記事からその記事のカテゴリを判定し、その記事の内容を端的に表すサマリ文を抽出する技術である。本研究で開発した方法は,言わば「斜め読みを模擬した処理」であり、まず、表層的な表現を手がかりとして、42の特徴を抽出する。次に、それらの特徴を利用したルールによって、記事のカテゴリとサマリ文を抽出する。ブラインドデータに対する実験において、本方法は、カテゴリ判定正解率81%、サマリ文抽出正解率76%という値を示した。抽出されたサマリ文はカテゴリ毎に整理され、HTML形式のダイジェストとして出力される。このとき、元の記事へのポインタは、ハイパーテキストのリンクとして埋め込まれる。作成されたダイジェストは、WWWのクライアントプログラムによって読むことができる。 本研究で開発した方法は、fj. wantedを対象としたものであるが、他の掲示情報型ニュースグループや質問応答型のニュースグループのダイジェスト作成にも、同様な手法が適用できると考えられる。また、本方法をさらに発展させることによって、FAQの自動作成も可能になると考えられる。
|
Research Products
(4 results)
-
[Publications] 佐藤理史: "情報のダイジェスティングとその応用" 人工知能学会並列人工知能研究会,SIG‐PPAI‐9502. 41-44 (1995)
-
[Publications] 佐藤 円: "電子ニュースのダイジェスト自動生成" 情報処理学会論文誌. 36. 2371-2379 (1995)
-
[Publications] 佐藤理史: "ネットニュースのダイジェスト自動生成" 情報処理学会「自然言語処理の応用に関するシンポジウム」論文集. 81-88 (1995)
-
[Publications] 佐藤理史: "ネットニュースグループfi.wantedのダイジェスト自動生成" 自然言語処理. 3(掲載予定). (1996)