• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

機械学習によるロングテール現象の解決方法に関する研究

研究課題

研究課題/領域番号 21240011
研究機関東京大学

研究代表者

中川 裕志  東京大学, 情報基盤センター, 教授 (20134893)

研究分担者 吉田 稔  東京大学, 情報基盤センター, 助教 (40361688)
清田 陽司  東京大学, 情報基盤センター, 特任講師 (10401316)
キーワード機械学習 / クラスタリング / Web / 統計 / 曖昧性解消 / プライバシー保護 / データマイニング / 言語学習
研究概要

(1)名前参照の曖昧性解消のための実時間クラスタリングの強化については、情報検索に関する国際会議CLEFの質問カテゴリゼーションタスクに参加し、5チーム中2位の成績を収めた。
(2)並列化アルゴリズムにおいては、申請者が既に提案した変分ベイズ法をロングテールに対応するPitMan-Yoモデルに適用し高い性能を得た。この成果はデータマイングのトップカンファレンスであるKDD2010にて論文が採択された。さらにこのテーマに関しては、複数のデータベースを統合して関係抽出を行う目的で、確率的行列分解を応用したアルゴリズムを開発して評価した。その結果をPAKDD2011にて論文発表した。
(3)個人適応化は、個々人によって異なる英語能力に対応するように、個人ごとの言語能力を機械学習手法で推定し、能力に比較して高い難度の単語の訳文を同時表示するシステムを開発し、評価した。この結果はACM Transactionに論文採録が決まった。
一方、これらの研究を通じてWeb上におけるロングテールの最たるものに秘匿性の高いデータの存在を無視できないことが判明してきた。この状況に対応する技術として最近注目されているプライバシー保護データマイニングを利用することを繰り越しにおけるテーマとした。繰り越しの年度においては、複数の通信プロバイダが自己の顧客間および.自己の顧客と他の通信プロバイダの間のアクセス情報は持つが、相手側の顧客間のアクセスは秘匿されたようなネットワーク構造において、全通信プロバイダの情報を総合してページランクないしHITSのようなリンク解析を行うために暗号技術および特殊なプロトコルを開発した。この結果は情報処理学会論文誌に掲載された。

  • 研究成果

    (7件)

すべて 2012 2011 2010 その他

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (3件) 備考 (1件)

  • [雑誌論文] Personalized Reading Support for Second-Language Web Document2012

    • 著者名/発表者名
      Yo Ehara, Nobuyuki Shimizu, Takashi Ninomoya, Hiroshi Nakagawa
    • 雑誌名

      ACM Transactions on Intelligent Systems and Technology

      巻: (掲載確定)

    • 査読あり
  • [雑誌論文] 特徴の出現回数に応じたL1正則化を実現する教師ありオンライン学習手法2011

    • 著者名/発表者名
      大岩秀和, 松島慎, 中川裕志
    • 雑誌名

      情報処理学会論文誌

      巻: 50 TOM 4 ページ: 84-93

    • 査読あり
  • [雑誌論文] 統合したグラフのプライバシ保護リンク解析2011

    • 著者名/発表者名
      森井正覚, 佐久間淳, 佐藤一誠, 中川裕志
    • 雑誌名

      情報処理学会論文誌

      巻: 50 TOD 4 ページ: 52-60

    • 査読あり
  • [学会発表] Probabilistic Matrix Factorization Leveraging Contexts for Unsupervised Relation Extraction2011

    • 著者名/発表者名
      Shingo Takamatsu, Issei Sato, Hiroshi Nakagawa
    • 学会等名
      PAKDD2011
    • 発表場所
      Shenzhen, China
    • 年月日
      2011-05-24
  • [学会発表] ITC-UT : Tweet Categorization by Query Categrization for On-line Reputation management2010

    • 著者名/発表者名
      Minoru Yoshida, Shin Matsushima, Shingo Ono, Hiroshi Nakagawa
    • 学会等名
      CLEF 2010 Labs WePS
    • 発表場所
      Padua, Italy
    • 年月日
      2010-09-22
  • [学会発表] Topic Models with Power-Law Using Pitman-Yor Process2010

    • 著者名/発表者名
      Issei Sato, Hiroshi Nakagawa
    • 学会等名
      16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining
    • 発表場所
      Washington, DC, USA
    • 年月日
      2010-07-26
  • [備考]

    • URL

      http://www.r.dl.itc.u-tokyo.ac.jp/node/46/

URL: 

公開日: 2013-06-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi