• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Research-status Report

離散データ構造からの知識発見手法を用いた公共事業入札の分析

Research Project

Project/Area Number 23500185
Research InstitutionGakushuin University

Principal Investigator

久保山 哲二  学習院大学, 付置研究所, 准教授 (80302660)

Co-Investigator(Kenkyū-buntansha) 福元 健太郎  学習院大学, 法学部, 教授 (50272414)
Project Period (FY) 2011-04-28 – 2014-03-31
Keywordsネットワーク分析 / グラフ編集距離 / 公共事業入札
Research Abstract

本年度は、入札データからの業者間の繋がりをネットワーク構造として捉え、ネットワーク構造の変化を検出するための手法についての既存研究の調査を行った。この結果を踏まえ、まずは要素技術として次の3点つの部分目標に着目して、研究を行った。(1) 時系列ネットワーク構造の大域的変化検出、(2) ネットワークの局所的なコミュニティ構造の分析、(3) 系列データの分割による抽象化。まずは、ネットワーク構造の時系列変化を、グラフ編集距離に基づき、構造の編集操作のコストとして検出するための手法を開発した。グラフ編集距離は1つのグラフ構造をもう1つのグラフ構造に変形させるために必要な編集操作の最小コストとして定義されており、一般には計算困難な問題であるが、グラフの節点ラベルの業者は一意に定まるため、効率的な多項式時間アルゴリズムが設計可能である。グラフ編集距離によって、時系列に沿ったネットワーク構造の変化の度合いを計測した。この手法を、Web上の掲示板における語の繋がりのネットワーク構造のイベント検出に適用し、実際に大域的なネットワーク構造変化の検出を行い、その有効性を示した。さらに、ネットワークの局所構造を検出する手法の開発のため、論文の引用関係に基づく研究者ネットワークからの研究コミュニティの抽出を例に、グラフの最大流問題を用いた既存のコミュニティ抽出アルゴリズムの改良をおこなった。また、時系列データを意味のあるまとまり毎に分割し、抽象化するための手法を隠れマルコフモデルとグラフ構造のカーネル主成分分析を用いて実現した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

初年度は、(1)入札関連データの集取、および、(2) 談合の有無と相関のある特徴量・指標の探索が、目的であった。(1)の入札関連データの収集については、Webで公開されていてクローラーによりデータが自動収集可能な自治体からは、クローラーによりデータを収拾した。また、Webからのデータが入手困難な自治体のうち、過去に談合事件等の特徴的なイベントがあった自治体については、情報開示請求によりデータを収集し、紙媒体によりデータが開示されたものについては、OCRや手作業により電子的なデータを作成した。概ね予定通りデータの収拾が進んでおり、順次データベース化を行なっている。(2)の談合に関連した特徴量・指標の探索については、入札関連データを収集途中であったため保留した。かわりに、既に手元にある時系列のネットワークデータを用いて、先に次年度以降に予定していた時系列ネットワークからのコミュニティ抽出に関連した手法の開発を行った。そのため、研究目的に若干前後する部分が発生したが、全期間を通した研究の進捗の観点からは、おおむね順調に研究が進展しているといえる。また、これらの成果について国際会議および国内研究会にて発表した。

Strategy for Future Research Activity

今後は、実際に収集した入札関連データを用いたアルゴリズムの改善と、業者間ネットワークからの異常検知等の実際的な検証を行う予定である。そのために、初年度予定していた談合の有無と相関のある特徴量や指標の検討を行う。そのために、まず、入手可能なあらゆる特徴量と落札率や談合事件の発生した時期との関わりを、整合性(Consistency)に基づく特徴選択手法やL1正則化付きロジスティック回帰モデル等を用いて探索的に見つけ出す。さらに、これらの特徴量に基づきグラフ構造カーネルを設計し、入札データの背後にあるイベントを検出問題として、回帰モデルおよび識別モデルを設計する。また、計量経済学の分野での落札率を被説明変数とする回帰モデルによる既存手法をベースラインとして、実データを用いて、提案モデルの有効性を検証する。

Expenditure Plans for the Next FY Research Funding

国際会議での研究成果発表のための出張旅費、および、国内での成果発表と関連研究者との打ち合わせのための出張旅費、ネットワーク構造の分析とプレゼンテーションのためのPCおよび周辺機器購入のための研究費支出を予定している。

  • Research Products

    (7 results)

All 2012 2011

All Journal Article (4 results) (of which Peer Reviewed: 4 results) Presentation (3 results)

  • [Journal Article] Extracting research communities by improved maximum flow algorithm2012

    • Author(s)
      Y. Nakamura, T. Horiike, T. Kuboyama, and H. Sakamoto
    • Journal Title

      International Journal of Knowledge-Based and Intelligent Engineering Systems

      Volume: 16(1) Pages: 25-34

    • DOI

      10.3233/KES-2012-0230

    • Peer Reviewed
  • [Journal Article] Consumer behavior analysis from buzz marketing sites over time series concept graphs2011

    • Author(s)
      T. Kuboyama, T. Hashimoto, and Y. Shirota
    • Journal Title

      In Knowledge-Based and Intelligent Information and Engineering Systems, 13th International Conference (KES), volume 5712 of Lecture Notes in Computer Science

      Pages: 73-83

    • DOI

      10.1007/978-3-642-23863-5_8

    • Peer Reviewed
  • [Journal Article] Detecting unexpected correlation between a current topic and products from buzz marketing sites2011

    • Author(s)
      Takako Hashimoto, Tetsuji Kuboyama, and Yukari Shirota
    • Journal Title

      Lecture Notes in Computer Science, Databases in Networked Information Systems

      Volume: 7108 Pages: 147--161

    • DOI

      10.1007/978-3-642-25731-5_13

    • Peer Reviewed
  • [Journal Article] Understanding user behavior through summarization of window transition logs2011

    • Author(s)
      Ryohei Saito, Tetsuji Kuboyama, Yuta Yamakawa, and Hiroshi Yasuda
    • Journal Title

      Lecture Notes in Computer Science, Databases in Networked Information Systems

      Volume: 7108 Pages: 162--178

    • DOI

      10.1007/978-3-642-23863-5_8

    • Peer Reviewed
  • [Presentation] 大規模ネットワークデータ分析のためのデータ圧縮ツール2012

    • Author(s)
      松本美玲, 山抱由依, 中原昌哉, 久保山哲二, 坂本比呂志
    • Organizer
      第85回人工知能基本問題研究会
    • Place of Presentation
      下呂交流会館
    • Year and Date
      2012年2月3日
  • [Presentation] ソーシャルメディア分析 --時事問題をきっかけとした想定外の消費行動抽出--2012

    • Author(s)
      橋本隆子, 久保山哲二, 白田由香利
    • Organizer
      第85回人工知能基本問題研究会
    • Place of Presentation
      下呂交流会館
    • Year and Date
      2012年2月3日
  • [Presentation] 作業ウィンドウの時系列ログデータからの業務遷移パターン抽出2011

    • Author(s)
      齋藤良平, 山川裕大, 久保山哲二
    • Organizer
      第82回人工知能基本問題研究会
    • Place of Presentation
      釧路工業高専
    • Year and Date
      2011年8月4日

URL: 

Published: 2013-07-10  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi