2001 Fiscal Year Annual Research Report
テキスト・表・画像の対応構造に基づくマルチメディアコンテンツの要約に関する研究
Project/Area Number |
13680452
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
遠藤 勉 九州工業大学, 情報工学部, 教授 (10112294)
|
Co-Investigator(Kenkyū-buntansha) |
徳久 雅人 九州工業大学, 情報工学部, 助手 (10274557)
|
Keywords | マルチメディア文書 / WWW / 要約 / 情報統合 / 情報検索 / 情報抽出 / 感性情報 / 文書生成 |
Research Abstract |
検索エンジンを用いてWWWから収集した複数の製品(パソコン)情報に対して,各々の製品の特徴をテキスト・表・画像の対応構造に基づき抽出・統合・要約することにより,ユーザの要求に合致した製品選択を支援するシステムの構築を目的として,今年度は以下の研究課題に取り組んだ。 1.Webページから製品性能表ならびに画像データを抽出するプログラムの開発 パソコンに関する製品性能表および画像を再現率96%以上,適合率94%以上で抽出できた。さらに,画像の内容を隣接するテキストのキーワードを用いて分類するプログラムを開発した。分類精度はTF*IDF法で79%であった。 2.製品性能表からの特徴抽出と要約文生成アルゴリズムの開発 HTMLで記述されている複数のパソコン性能表を[機種名,機能項目,値]の3つ組からなるリスト(表構造)に変換し,それぞれのパソコンの相対的な特徴データを抽出し,これらを日本語文章として生成出力するシステムを開発した。 3.パソコンに関するユーザの要求や好みの調査と製品の機能項目との対応付け ユーザの要求を「グラフィックスに強い」や「モバイル可能」など5個の大項目に分類して,表構造の機能項目との対応づけを明らかにした。さらに,表構造の特徴データに得点を与え,ユーザの要求に合致したパソコン群をランキング出力するシステムを開発した。 4.パソコン以外の製品に対する特徴抽出法の有効性の評価 携帯電話およびデジタルカメラの性能表に対して同様の特徴抽出実験を行い,比較的小規模のキーワードと単位辞書の変更で移行可能なことが確認できた。
|
Research Products
(6 results)
-
[Publications] 嶋田和孝, 伊藤哲郎, 遠藤勉: "Classification of Images Using Their Neighboring Sentences"Proceedings of PACLING2001 (Pacific Association for Computational Linguistics 2001). 250-256 (2001)
-
[Publications] 福本篤史, 遠藤勉, 嶋田和孝: "Information Extraction from Specifications on the World Wide Web"Proceedings of PACLING2001 (Pacific Association for Computational Linguistics 2001). 109-116 (2001)
-
[Publications] 賀川経夫, 遠藤勉: "ペンを利用したマルチモーダル対話におけるペン操作の生成"電子情報通信学会技術研究報告[TL2001-1〜8]. Vol.101 No.61. 9-16 (2001)
-
[Publications] 嶋田和孝, 伊藤哲郎, 遠藤勉: "入力質問文を用いた動的な特徴抽出処理"電子情報通信学会技術研究報告[TL2001-1〜8]. Vol.101 No.61. 43-50 (2001)
-
[Publications] 嶋田和孝, 伊藤哲郎, 遠藤勉: "表からの特徴抽出処理-他種類データヘの適用-"電子情報通信学会技術研究報告[TL2001-29〜34]. Vol.101 No.485. 27-34 (2001)
-
[Publications] 賀川経夫, 遠藤勉: "テキストを対象とした発話に伴うペン操作の解析に関する一検討"電子情報通信学会技術研究報告[TL2001-29〜34]. Vol.101 No.485. 35-42 (2001)