• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

機械学習によるロングテール現象の解決方法に関する研究

Research Project

Project/Area Number 21240011
Research InstitutionThe University of Tokyo

Principal Investigator

中川 裕志  東京大学, 情報基盤センター, 教授 (20134893)

Co-Investigator(Kenkyū-buntansha) 吉田 稔  東京大学, 情報基盤センター, 助教 (40361688)
佐藤 一誠  東京大学, 情報基盤センター, 助教 (90610155)
Keywords機械学習 / ネットワークデータ / Web / 統計 / 曖昧正解消 / プライバシー保護 / データマイニング / 言語学習
Research Abstract

本年度は、繰り延べ理由であったプライバシー保護データマイニングと当初計画で推進した研究の総仕上げと成果発表を行った。まず、プライバシー保護データマイニングに関しては、多数の個人がネネットワークで接続し、直接の送受信のある相手との交信状況しか分からない状態で、全加入者からの交信履歴情報は集めるが、各参加者は自分に情報が流出しないという制約下で、ネットワークの参加者のEMアルゴリズムを行う。プライバシー保護のためにデータは準同型性公開鍵暗号で暗号化し、暗号化したままで行える加算を基礎にしたアルゴリズムおよび参加者間のプロトコルを設計した。この成果はPAKDD2012で採択された。
本研究の当初計画の仕上げとしては、大規模データに適したオンライン学習で、正則化によってロングテール情報を喪失する傾向があることへの対策として、識別器が安定した重み持つ特徴は排除しない制約を加えることに成功し、この問題への解決の有力な解決策をしめした。この内容はデータマイニングの最難関国際会議ICDM2012にて論文が採択された。また、Wikipediaからのロングテール情報の抽出手法として、半教師有り学習を基礎にし、判例データを高い確率で排除する情報抽出アルゴリズムを開発した。この方法で、is in, live in などの類似な関係を表現する言い回しを抽出でき、テキストデータベースかたの情報抽出における有力なアルゴリズムを提案し、計算言語学の最難関国際会議であるACL2012において論文採択された。最後に言語学習においては、学習者の言語能力に適応して単語に対訳を附するシステムを開発し、その結果はACMの論文誌に採録が決定した。

Current Status of Research Progress
Reason

24年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

24年度が最終年度であるため、記入しない。

  • Research Products

    (6 results)

All 2013 2012 Other

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (2 results) Book (1 results) Remarks (1 results)

  • [Journal Article] Personalized Reading Support for Second-Language Web Documents2013

    • Author(s)
      Yo Ehara, Nobuyuki Shimizu, Takashi Ninomiya, Hiroshi Nakagawa
    • Journal Title

      ACM Transactions on Intelligent Systems and Technology

      Volume: 4(2) Pages: accepted

    • Peer Reviewed
  • [Journal Article] Healing Truncation Bias : Self-weighted Truncation framework for Dual Averaging2012

    • Author(s)
      Hidekazu Oiwa, Shin Matsushima, and Hiroshi Nakagawa
    • Journal Title

      IEEE International Conference on Data Mining(ICDM)

      Volume: 12 Pages: 575-584

    • Peer Reviewed
  • [Presentation] Reducing Wrong Labels in Distant Supervision for Relation Extraction2012

    • Author(s)
      Shingo Takamatsu, Issei Sato, Hiroshi Nakagawa
    • Organizer
      50th annual meeting of the Association for Computational Linguistics (ACL)
    • Place of Presentation
      Jeju, Korea
    • Year and Date
      20120608-20120614
  • [Presentation] Privacy-Preserving EM Algorithm for Clustering on Social Network2012

    • Author(s)
      Yang Bin, Hiroshi Nakagawa
    • Organizer
      The 16th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD)
    • Place of Presentation
      Kuala Lumpur, Malaysia
    • Year and Date
      20120529-20120601
  • [Book] 情報法 (第8章)2012

    • Author(s)
      中川裕志
    • Total Pages
      133-159
    • Publisher
      有斐閣
  • [Remarks] 公表論文リスト

    • URL

      http://www.r.dl.itc.u-tokyo.ac.jp/node/46/

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi