• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

閲覧者の観点によるWeb情報構造化のためのWebページ分割アルゴリズムの実現

研究課題

研究課題/領域番号 22500128
研究機関名古屋工業大学

研究代表者

新谷 虎松  名古屋工業大学, 工学(系)研究科(研究院), 教授 (00252312)

研究分担者 大囿 忠親  名古屋工業大学, 工学(系)研究科(研究院), 准教授 (90324475)
キーワード知的エージェント / Webページ分割
研究概要

HTMLを意味的な構造へと変換するためのWebページ分割アルゴリズムの設計を中心に行った.具体的には、(1)人間によるWebページ分割に関する調査、および(2)アルゴリズムの設計を行った.(1)では、人間がどのようにWebページを意味あるブロック(Webブロック)として分割しているのかを調査した.ここでは多数のWebページを人手によってWebブロックへ分割させ,具体的なデータ(Webページ分割事例)を収集するための実験を行った.実験環境として,専用のWebアプリケーションを開発した.本アプリケーションは,Webページのレンダリング結果の画像を被験者に提示し,簡単な操作でWebページの分割方法や閲覧者の観点などを記録できるようにした.被験者にはWebページの分割方法だけでなく,Webページのそれぞれの断片の役割,および断片間の関係を簡便に記述させた.収集したデータに基づき,人間のWebページ分割のための認識モデル,Webページの断片の役割を推定するために必要な知見,およびWebページの断片間の関係を推定するための知見を整理し,HTMLを意味的な構造へと変換するための汎用的なヒューリスティクスとして蓄積した.(2)では、本研究テーマの予備的研究において得られた成果(HTMLにおけるタグの構造だけでなく,レイアウトを考慮したWebページ分割アルゴリズムの実現)に基づきWebページ上の情報をWebブロックに分割するWebページ分割アルゴリズムのコアを設計した.予備的研究によりWebページ分割に関連して,レンダリング後のHTMLのイメージを解析することで,HTMLを文字列として解析するよりも良い結果が得られることを示したが,汎用性がなかった.本研究では、ここでの汎用性を高めるための工夫として,(1)で得られたヒューリスティクスを考慮した新たな階層型の解析手法に基づくアルゴリズムの設計を試みた.

  • 研究成果

    (9件)

すべて 2011 2010

すべて 雑誌論文 (2件) (うち査読あり 1件) 学会発表 (7件)

  • [雑誌論文] ユーザの観点に基づくイベント系列化を用いたWebニュース記事閲覧支援システムの実装2011

    • 著者名/発表者名
      平田紀史, 白松俊, 大囿忠親, 新谷虎松
    • 雑誌名

      人工知能学会誌

      巻: Vol.26 No.1 ページ: 228-236

    • 査読あり
  • [雑誌論文] iPadによるおもしろい電子書籍のはじまり2011

    • 著者名/発表者名
      新谷虎松
    • 雑誌名

      理大科学フォーラム

      巻: 第28巻第3号 ページ: 42-47

  • [学会発表] On Facilitating Argumentation by Designing Agreement-Oriented Rules2010

    • 著者名/発表者名
      高崎隼
    • 学会等名
      The 2010 International Congress on Computer Applications and Computational Science (CACS2010)
    • 発表場所
      Singapore
    • 年月日
      2010-12-05
  • [学会発表] Fake Web Page Protection by Using Push Delivery2010

    • 著者名/発表者名
      大囿忠親
    • 学会等名
      9^<th> IEEE/ACIS International Conference on Computer and Information Science (ICIS2010)
    • 発表場所
      山形,日本
    • 年月日
      2010-08-19
  • [学会発表] A Corpus-based Analysis of Coreferential Recency Effect in Japanese Discourse for Tracking Dynamic Topic2010

    • 著者名/発表者名
      白松俊
    • 学会等名
      9^<th> IEEE/ACIS International Conference on Computer and Information Science (ICIS2010)
    • 発表場所
      山形,日本
    • 年月日
      2010-08-19
  • [学会発表] System for Supporting Web-based Public Debate Using Transcripts of Face-to-face Meeting2010

    • 著者名/発表者名
      白松俊
    • 学会等名
      The 23^<rd> International Conference on Industrial, Engineering & Other Applications of Applied Intelligent Systems (IEA-AIE2010)
    • 発表場所
      Cordoba, Spain
    • 年月日
      2010-06-04
  • [学会発表] Building and Analyzing Corpus to Investigate Appropriateness of Argumentative Discourse Structure for Facilitating Consensus2010

    • 著者名/発表者名
      白松後
    • 学会等名
      The 23^<rd> International Conference on Industrial, Engineering & Other Applications of Applied Intelligent Systems (IEA-AIE2010)
    • 発表場所
      Cordoba, Spain
    • 年月日
      2010-06-02
  • [学会発表] Generating an Event Arrangement for Understanding News Articles on the Web2010

    • 著者名/発表者名
      平田紀史
    • 学会等名
      The 23^<rd> International Conference on Industrial, Engineering & Other Applications of Applied Intelligent Systems (IEA-AIE2010)
    • 発表場所
      Cordoba, Spain
    • 年月日
      2010-06-01
  • [学会発表] Architecture for Automated Search and Negotiation in Affiliation among Community Websites and Blogs2010

    • 著者名/発表者名
      Robin Swezey
    • 学会等名
      The 23^<rd> International Conference on Industrial, Engineering & Other Applications of Applied Intelligent Systems (IEA-AIE2010)
    • 発表場所
      Cordoba, Spain
    • 年月日
      2010-06-01

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi