• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2006 Fiscal Year Annual Research Report

大規模テキストからの頻出イベント時系列コーパスの自動構築とWEB時間追跡への応用

Research Project

Project/Area Number 16500078
Research InstitutionUniversity of Yamanashi

Principal Investigator

岩沼 宏治  山梨大学, 大学院医学工学総合研究部, 教授 (30176557)

Keywordsデータマイニング / 頻出系列 / テキスト / WEB / オンラインアルゴリズム / 新聞記事 / ブラウジング支援 / 時間追跡
Research Abstract

本年度は,大規模テキストからの頻出イベント時系列コーパスの自動構築にむけて以下の3つの課題について研究を行い,成果を得た.
1.緩和法に基づく大規模系列データからの頻出部分系列の高速マィニング
2.情報量と頻度に基づく知的系列データマィニング手法
3.Webアクセスログに対する系列データマィニングーページ滞在時間系列の解析
4.イベント系列コーパス自動生成のための時間系列上の新聞記事中の重要単語の抽出
第1番目の成果は,我々がこれまでに開発したオンライン抽出アルゴリズムはウィンドウ幅無限長の場合の頻出系列を抽出するものであるが,これを緩和問題の高速算法としてもちいて,ウィンドウ幅有限長の条件下における頻出系列の高速抽出アルゴリズムを開発し,実験的評価により有用性を示した.第2の成果は,自己情報に基づく系列の有用性の基準を新しく考察し,系列全体頻度尺度と融合を試みたものである.実際の応用によっては,単に頻出である部分系列はあまり有用な系列とはならない場合があり,それに対処する技術である.対象系列の平均自己情報量および最低自己情報量が系列の絞り込みに有効であり,頻度尺度と組み合わせて高速アルゴリズムを構築した.第3の成果はこれまでの研究成果をWEBアクセスログ解析に応用したもので,ページの閲覧滞在時間を考慮したページ閲覧系列の高速解析を可能にしている.実験的評価によりその有用性を確認している.第4の成果として,成果を新聞記事コーパスからのイベント系列コーパスの自動構築のために,新たに時間系列上の重要単語の判別抽出法を開発し,その有効性を実験的に確認した.大規模新聞記事コーパスに適用し,ィベント系列コーパスの構築を行い,試験的な系列コーパスを得た.

  • Research Products

    (6 results)

All 2006

All Journal Article (6 results)

  • [Journal Article] 緩和法に基づく系列データからの頻出部分系列の高速マイニング2006

    • Author(s)
      丸山育嗣, 岩沼宏治, 鍋島英知
    • Journal Title

      第5回情報科学技術レターズ LF-006

      Pages: 113-116

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] 専門検索エンジンの高速半自動生成法,2006

    • Author(s)
      宮川礼子, 鈴木 悠生, 鍋島英知, 岩沼宏治
    • Journal Title

      第5回情報科学技術レターズ LL-005

      Pages: 113-116

  • [Journal Article] Rapid Synthesis of Domain-Specific Web Search Engines Based on Semi-automatic Training-Example Generation2006

    • Author(s)
      H.Nabeshima, R.Miyagawa, Y.Suzuki, K.Iwamura:
    • Journal Title

      Proceedings of the International Conference on Web Intelligence 2006 (WI'06),

      Pages: 769-772

  • [Journal Article] Webアクセスログに対する系列データマイニング-ページ滞在時間系列の解析2006

    • Author(s)
      吉田修, 岩沼宏治, 鍋島英知
    • Journal Title

      電子情報通信学会技術研究報告 AI2006-14

      Pages: 7-12

  • [Journal Article] 極大系列抽出を目的とする系列包含検査の高速化アルゴリズム2006

    • Author(s)
      市川博規, 岩沼宏治, 鍋島英知
    • Journal Title

      電子情報通信学会技術研究報告 AI2006-13

      Pages: 7-12

  • [Journal Article] 情報量と頻度に基づく知的系列データマイニング手法2006

    • Author(s)
      大塚尚貴, 岩沼宏治, 鍋島英知
    • Journal Title

      人工知能学会 データマイニングと統計数理研究会資料 SIG-DMSM-603

      Pages: 81-88

URL: 

Published: 2008-05-08   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi