2011 Fiscal Year Research-status Report
離散データ構造からの知識発見手法を用いた公共事業入札の分析
Project/Area Number |
23500185
|
Research Institution | Gakushuin University |
Principal Investigator |
久保山 哲二 学習院大学, 付置研究所, 准教授 (80302660)
|
Co-Investigator(Kenkyū-buntansha) |
福元 健太郎 学習院大学, 法学部, 教授 (50272414)
|
Project Period (FY) |
2011-04-28 – 2014-03-31
|
Keywords | ネットワーク分析 / グラフ編集距離 / 公共事業入札 |
Research Abstract |
本年度は、入札データからの業者間の繋がりをネットワーク構造として捉え、ネットワーク構造の変化を検出するための手法についての既存研究の調査を行った。この結果を踏まえ、まずは要素技術として次の3点つの部分目標に着目して、研究を行った。(1) 時系列ネットワーク構造の大域的変化検出、(2) ネットワークの局所的なコミュニティ構造の分析、(3) 系列データの分割による抽象化。まずは、ネットワーク構造の時系列変化を、グラフ編集距離に基づき、構造の編集操作のコストとして検出するための手法を開発した。グラフ編集距離は1つのグラフ構造をもう1つのグラフ構造に変形させるために必要な編集操作の最小コストとして定義されており、一般には計算困難な問題であるが、グラフの節点ラベルの業者は一意に定まるため、効率的な多項式時間アルゴリズムが設計可能である。グラフ編集距離によって、時系列に沿ったネットワーク構造の変化の度合いを計測した。この手法を、Web上の掲示板における語の繋がりのネットワーク構造のイベント検出に適用し、実際に大域的なネットワーク構造変化の検出を行い、その有効性を示した。さらに、ネットワークの局所構造を検出する手法の開発のため、論文の引用関係に基づく研究者ネットワークからの研究コミュニティの抽出を例に、グラフの最大流問題を用いた既存のコミュニティ抽出アルゴリズムの改良をおこなった。また、時系列データを意味のあるまとまり毎に分割し、抽象化するための手法を隠れマルコフモデルとグラフ構造のカーネル主成分分析を用いて実現した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度は、(1)入札関連データの集取、および、(2) 談合の有無と相関のある特徴量・指標の探索が、目的であった。(1)の入札関連データの収集については、Webで公開されていてクローラーによりデータが自動収集可能な自治体からは、クローラーによりデータを収拾した。また、Webからのデータが入手困難な自治体のうち、過去に談合事件等の特徴的なイベントがあった自治体については、情報開示請求によりデータを収集し、紙媒体によりデータが開示されたものについては、OCRや手作業により電子的なデータを作成した。概ね予定通りデータの収拾が進んでおり、順次データベース化を行なっている。(2)の談合に関連した特徴量・指標の探索については、入札関連データを収集途中であったため保留した。かわりに、既に手元にある時系列のネットワークデータを用いて、先に次年度以降に予定していた時系列ネットワークからのコミュニティ抽出に関連した手法の開発を行った。そのため、研究目的に若干前後する部分が発生したが、全期間を通した研究の進捗の観点からは、おおむね順調に研究が進展しているといえる。また、これらの成果について国際会議および国内研究会にて発表した。
|
Strategy for Future Research Activity |
今後は、実際に収集した入札関連データを用いたアルゴリズムの改善と、業者間ネットワークからの異常検知等の実際的な検証を行う予定である。そのために、初年度予定していた談合の有無と相関のある特徴量や指標の検討を行う。そのために、まず、入手可能なあらゆる特徴量と落札率や談合事件の発生した時期との関わりを、整合性(Consistency)に基づく特徴選択手法やL1正則化付きロジスティック回帰モデル等を用いて探索的に見つけ出す。さらに、これらの特徴量に基づきグラフ構造カーネルを設計し、入札データの背後にあるイベントを検出問題として、回帰モデルおよび識別モデルを設計する。また、計量経済学の分野での落札率を被説明変数とする回帰モデルによる既存手法をベースラインとして、実データを用いて、提案モデルの有効性を検証する。
|
Expenditure Plans for the Next FY Research Funding |
国際会議での研究成果発表のための出張旅費、および、国内での成果発表と関連研究者との打ち合わせのための出張旅費、ネットワーク構造の分析とプレゼンテーションのためのPCおよび周辺機器購入のための研究費支出を予定している。
|