• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

テキスト・表・画像の対応構造に基づくマルチメディアコンテンツの要約に関する研究

研究課題

研究課題/領域番号 13680452
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関九州工業大学

研究代表者

遠藤 勉  九州工業大学, 情報工学部, 教授 (10112294)

研究分担者 嶋田 和孝  九州工業大学, 情報工学部, 助手 (50346863)
徳久 雅人  九州工業大学, 情報工学部, 助手 (10274557)
研究期間 (年度) 2001 – 2003
研究課題ステータス 完了 (2003年度)
配分額 *注記
2,400千円 (直接経費: 2,400千円)
2003年度: 600千円 (直接経費: 600千円)
2002年度: 600千円 (直接経費: 600千円)
2001年度: 1,200千円 (直接経費: 1,200千円)
キーワードマルチメディア文書 / WWW / 要約 / 情報統合 / 情報検索 / 情報抽出 / 感性情報 / 文書生成
研究概要

検索エンジンを用いてWWWから収集した複数の製品(パソコン)情報に対して,各々の製品の特徴をテキスト・表・画像の対応構造に基づき抽出・統合・要約することにより,ユーザの要求に合致した製品選択を支援するシステムの構築を目的として研究を行った結果,以下の成果が得られた。
1.Webページからの製品性能表の自動抽出
TSVM(Transductive Support Vector Machines)を用いて,HTML文書から製品性能表を自動抽出するプログラムを開発した。素性は,<TABLE>等でタグ付けされた領域から抽出し,tf・idf等で重み付けされたキーワードである。実験により,少量の訓練セットで高い表領域抽出率(F値で98%)が得られることを確認した。
2.製品性能表からの特徴抽出と製品選択支援システムの構築
性能表は[機種名,属性,値]のリストの集合(表構造)に変換され,集合中の標準値(平均値,最頻値)との比較により各属性値がスコア付けされる。ユーザの要求(「モバイルPC」,「グラフィックスに強い」等)」に応じて各属性を重み付けし,要求に合致するパソコン群をランキング出力するシステムを開発した。重みは適合性フィードバックやユーザの指定により変更可能である。検索結果は表だけでなく,日本語文章やレーダチャート等多様な形式で出力される。
3.画像データの分類と特徴抽出
Webページから画像を抽出し,その内容を隣接する文章のキーワードを用いて分類するプログラムを開発した。分類精度はtf・idfによる重み付けで79%である。さらに,製品画像の背景領域を除去し,C4.5を用いて製品領域の色情報(黒,白,シルバー)による分頬を行った。精度は約80%である。

報告書

(4件)
  • 2003 実績報告書   研究成果報告書概要
  • 2002 実績報告書
  • 2001 実績報告書
  • 研究成果

    (30件)

すべて その他

すべて 文献書誌 (30件)

  • [文献書誌] 嶋田和孝, 伊藤哲郎, 遠藤勉: "Classification of Images Using Their Neighboring Sentences"Proceedings of PACLING2001(Pacific Association for Computational Linguistics 2001). 250-256 (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] 福本篤史, 遠藤勉, 嶋田和孝: "Information Extraction from Specifications on the World Wide Web"Proceedings of PACLING2001(Pacific Association for Computational Linguistics 2001). 109-116 (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] 嶋田和孝, 福本篤史, 遠藤勉: "Information Extraction from Personal Computer Specifications on the Web Using a User's Request"IEICE Transactions on Information and Systems. Vol.E86-D, No.8. 1386-1395 (2003)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] 嶋田和孝, 伊藤哲郎, 遠藤勉: "Multiform Summarization from Product Specifications"Proceedings of PACLING2003(Pacific Association for Computational Linguistics 2003). 83-92 (2003)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] 嶋田和孝, 林晃司, 遠藤勉: "Keyword and Weighting for Product Specifications Extraction"Proceedings of PACLING2003(Pacific Association for Computational Linguistics 2003). 285-293 (2003)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] 嶋田和孝, 遠藤勉他: "Information Modeling and Knowledge Bases XV"IOS Press. 333 (2004)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] Kazutaka Shimada, Tetsuro Ito, Tsutomu Endo: "Classification of Images Using Their Neighboring Sentences"Proceedings of PACLING2001 (Pacific Association for Computational Linguistics 2001). 250-256 (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] Atsushi Fukumoto, Tsutomu Endo, Kazutaka Shimada: "Information Extraction from Specifications on the World Wide Web"Proceedings of PACLING2001 (Pacific Association for Computational Linguistics 2001). 109-116 (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] Kazutaka Shimada, Atsushi Fukumoto, Tsutomu Endo: "Information Extraction from personal Computer Specifications on the Web Using a User's Request"IEICE Transactions on Information and Systems. Vol.E86-b, No.8. 1386-1395 (2003)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] Kazutaka Shimada, Tetsuro Ito, Tsutomu Endo: "Multiform Summarization from Product Specifications"Proceedings of PACLING2001 (Pacific Association for Computational Linguistics. 83-92 (2003)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] Kazutaka Shimada, Koji Hayashi, Tsutomu Endo: "Keyword and Weighting for Product Specifications Extraction"Proceedings of PACLING2001 (Pacific Association for Computational Linguistics. 285-293 (2003)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] Kazutaka Shimada, Tsutomu Endo: "Product Specifications Summarization and Product Ranking System using User's Request"Information Modeling and Knowledge Bases, IOS Press. 333 (2004)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] 嶋田和孝, 福本篤史, 遠藤勉: "Information Extraction from Personal Computer Specifications on the Web Using a User's Request"IEICE Transactions on Information and Systems. Vol.E86-D No.8. 1386-1395 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 嶋田和孝, 伊藤哲郎, 遠藤勉: "Multiform Summarization from Product Specifications"Proceedings of PACLING2003(Pacific Association for Computational Linguistics 2003). 83-92 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 嶋田和孝, 林晃司, 遠藤勉: "Keyword and Weighting for Product Specifications Extraction"Proceedings of PACLING2003(Pacific Association for Computational Linguistics 2003). 285-293 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 遠藤勉: "対話支援型問題解決のための文脈情報処理"教育システム情報学会研究報告. Vol.18 No.3. 23-28 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 関恒仁, 嶋田和孝, 遠藤勉: "Web上の製品性能表における属性クラスタリング"第11回電子情報通信学会九州支部学生会講演会講演論文集. 113 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 林晃司, 嶋田和孝, 遠藤勉: "機械学習を用いたWWWからの製品性能表の分類と抽出"言語処理学会第10回年次大会発表論文集. 733-736 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 林晃司, 嶋田和孝, 遠藤勉: "WWWからの性能表抽出のためのキーワード獲得と重み付け"電子情報通信学会技術研究報告Tl2002-48〜53[思考と言語]. Vol.102 No.688. 13-18 (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 林晃司, 嶋田和孝, 遠藤勉: "WWWからの製品性能表抽出"言語処理学会第9回年次大会発表論文集. 377-380 (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 森松俊允, 福本篤史, 嶋田和孝, 遠藤勉: "製品性能表を用いた製品選択支援システムの構築"電気関係学会九州支部第55回連合大会講演論文集. 502 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 福本篤史, 嶋田和孝, 遠藤勉: "製品性能表からの表構造生成"電気関係学会九州支部第55回連合大会講演論文集. 503 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 林晃司, 遠藤勉, 嶋田和孝: "Webページからの製品性能表抽出"第10回電子情報通信学会九州支部学生会講演会. 126 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 片山智央, 嶋田和孝, 遠藤勉: "Web上の画像からの製品領域の抽出"第10回電子情報通信学会九州支部学生会講演会. 141 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 嶋田和孝, 伊藤哲郎, 遠藤勉: "Classification of Images Using Their Neighboring Sentences"Proceedings of PACLING2001 (Pacific Association for Computational Linguistics 2001). 250-256 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 福本篤史, 遠藤勉, 嶋田和孝: "Information Extraction from Specifications on the World Wide Web"Proceedings of PACLING2001 (Pacific Association for Computational Linguistics 2001). 109-116 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 賀川経夫, 遠藤勉: "ペンを利用したマルチモーダル対話におけるペン操作の生成"電子情報通信学会技術研究報告[TL2001-1〜8]. Vol.101 No.61. 9-16 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 嶋田和孝, 伊藤哲郎, 遠藤勉: "入力質問文を用いた動的な特徴抽出処理"電子情報通信学会技術研究報告[TL2001-1〜8]. Vol.101 No.61. 43-50 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 嶋田和孝, 伊藤哲郎, 遠藤勉: "表からの特徴抽出処理-他種類データヘの適用-"電子情報通信学会技術研究報告[TL2001-29〜34]. Vol.101 No.485. 27-34 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 賀川経夫, 遠藤勉: "テキストを対象とした発話に伴うペン操作の解析に関する一検討"電子情報通信学会技術研究報告[TL2001-29〜34]. Vol.101 No.485. 35-42 (2001)

    • 関連する報告書
      2001 実績報告書

URL: 

公開日: 2001-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi