• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

機械学習によるロングテール現象の解決方法に関する研究

研究課題

研究課題/領域番号 21240011
研究種目

基盤研究(A)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関東京大学

研究代表者

中川 裕志  東京大学, 情報基盤センター, 教授 (20134893)

研究分担者 吉田 稔  東京大学, 情報基盤センター, 助教 (40361688)
清田 陽司  東京大学, 情報基盤センター, 助教 (10401316)
佐藤 一誠  東京大学, 情報基盤センター, 助教 (90610155)
連携研究者 二宮 崇  東京大学, 情報基盤センター, 講師 (20444094)
研究期間 (年度) 2009 – 2012
研究課題ステータス 完了 (2012年度)
配分額 *注記
47,060千円 (直接経費: 36,200千円、間接経費: 10,860千円)
2011年度: 14,560千円 (直接経費: 11,200千円、間接経費: 3,360千円)
2010年度: 14,950千円 (直接経費: 11,500千円、間接経費: 3,450千円)
2009年度: 17,550千円 (直接経費: 13,500千円、間接経費: 4,050千円)
キーワード知識発見 / データマイニング / 機械学習 / テキストマイニング / Web / ネットワークデータ / 統計 / 曖昧正解消 / プライバシー保護 / 言語学習 / クラスタリング / 曖昧性解消 / テキスト / 非負行列分解 / GPU / アルゴリズム
研究概要

2009年度は当初の予定通り、Webにおける人名検索結果を同姓同名であるが異なる人物ごとにまとめるクラスタリングシステムを開発し、実験的に評価した。2010年度は大規模データ処理のために非負の確率行列分解アルゴリズムを提案し、既存のLDAと同様な性能を得ることを実証し、並列化アルゴリズムにおいては変分ベイズ法をロングテールに対応するPitMan-Yoモデルに適用し高い性能を得た。2011年度は最近注目されているプライバシー保護データマイニングをネットワークデータに応用した。2012年度は、プライバシー保護データマイニングの応用手法と大規模データに適したオンライン学習で、新規な正則化手法を提案した。

報告書

(4件)
  • 2012 研究成果報告書 ( PDF )
  • 2011 実績報告書
  • 2010 実績報告書
  • 2009 実績報告書
  • 研究成果

    (57件)

すべて 2013 2012 2011 2010 2009 その他

すべて 雑誌論文 (21件) (うち査読あり 21件) 学会発表 (30件) 図書 (2件) 備考 (4件)

  • [雑誌論文] Personalized Reading Support for Second-Language Web Documents2013

    • 著者名/発表者名
      Yo Ehara,Nobuyuki Shimizu,Takashi Ninomoya,Hiroshi Nakagawa
    • 雑誌名

      ACM Transactions on Intelligent Systems and Technology

      巻: 4(2)

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] Personalized Reading Support for Second-Language Web Documents2013

    • 著者名/発表者名
      Yo Ehara, Nobuyuki Shimizu, Takashi Ninomiya, Hiroshi Nakagawa
    • 雑誌名

      ACM Transactions on Intelligent Systems and Technology

      巻: 4(2)

    • 関連する報告書
      2011 実績報告書
    • 査読あり
  • [雑誌論文] Privacy-Preserving EM Algorithm for Clustering on Social Network2012

    • 著者名/発表者名
      Yang Bin,Hiroshi Nakagawa
    • 雑誌名

      P.-N.Tan et al.(Eds.):PAKDD 2012,Part I

      巻: LNAI 7301 ページ: 542-553

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] Healing Truncation Bias : Self-weighted Truncation framework for Dual Averaging2012

    • 著者名/発表者名
      Hidekazu Oiwa, Shin Matsushima, and Hiroshi Nakagawa
    • 雑誌名

      IEEE International Conference on Data Mining(ICDM)

      巻: 12 ページ: 575-584

    • 関連する報告書
      2011 実績報告書
    • 査読あり
  • [雑誌論文] Personalized Reading Support for Second-Language Web Document2012

    • 著者名/発表者名
      Yo Ehara, Nobuyuki Shimizu, Takashi Ninomoya, Hiroshi Nakagawa
    • 雑誌名

      ACM Transactions on Intelligent Systems and Technology

      巻: (掲載確定)

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Probabilistic Matrix Factorization Leveraging Contexts for Unsupervised Relation Extraction2011

    • 著者名/発表者名
      Shingo Takamatsu,Issei Sato,Hiroshi Nakagawa
    • 雑誌名

      PAKDD2011, Springer Lecture Notes Artificial Intelligence (LNAI)6634,Part I.

      ページ: 87-99

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] 特徴の出現回数に応じたL1正則化を実現する教師ありオンライン学習手法2011

    • 著者名/発表者名
      大岩秀和,松島慎,中川裕志
    • 雑誌名

      情報処理学会論文誌

      巻: Vol.50 TOM4(3) ページ: 84-93

    • NAID

      170000066490

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] 統合したグラフのプライバシ保護リンク解析2011

    • 著者名/発表者名
      森井正覚,佐久間淳,佐藤一誠,中川裕志
    • 雑誌名

      情報処理学会論文誌

      巻: Vol.50 TOD4(2) ページ: 52-60

    • NAID

      40019597872

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] Nobuyuki Shimizu and Hiroshi Nakagawa.Deterministic shift-reduce parsing for unification-based grammars2011

    • 著者名/発表者名
      Takashi Ninomiya,Takuya Matsuzaki
    • 雑誌名

      Natural Language Engineering

      巻: vol.17,no.3 ページ: 331-365

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] 特徴の出現回数に応じたL1正則化を実現する教師ありオンライン学習手法2011

    • 著者名/発表者名
      大岩秀和, 松島慎, 中川裕志
    • 雑誌名

      情報処理学会論文誌

      巻: 50 TOM 4 ページ: 84-93

    • NAID

      170000066490

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] 統合したグラフのプライバシ保護リンク解析2011

    • 著者名/発表者名
      森井正覚, 佐久間淳, 佐藤一誠, 中川裕志
    • 雑誌名

      情報処理学会論文誌

      巻: 50 TOD 4 ページ: 52-60

    • NAID

      40019597872

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] 確率的潜在意味解析における特異値行列の非対角化の解釈とその評価2011

    • 著者名/発表者名
      柴山直樹, 中川裕志
    • 雑誌名

      人工知能学会論文誌

      巻: 26(1) ページ: 262-272

    • NAID

      130000455375

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Succinct Semi-structured Data Mining Based on FREQT2010

    • 著者名/発表者名
      佐藤一誠、中川裕志
    • 雑誌名

      日本データベース学会論文誌

      巻: Vol.9,No.1 ページ: 76-81

    • NAID

      130000337146

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] PAアルゴリズムにおけるラベルなしデータからの学習2010

    • 著者名/発表者名
      松島慎、佐藤一誠、二宮崇、中川裕志
    • 雑誌名

      日本データベース学会論文誌

      巻: Vol.9,No.1 ページ: 82-87

    • NAID

      40017216480

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] Mining Numbers in Text Using Suffix Arrays and Clustering Based on Dirichlet Process Mixture Models2010

    • 著者名/発表者名
      Minoru Yoshida.Hiroshi Nakagawa
    • 雑誌名

      (PAKDD 2010) Part II

      ページ: 230-237

    • NAID

      120007131162

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] 多クラス識別問題におけるPassive-Aggressiveアルゴリズムの効率的厳密解法2010

    • 著者名/発表者名
      松島慎、清水伸幸、吉田和弘、二宮崇、中川裕志
    • 雑誌名

      電子情報通信学会論文誌:情報爆発特集号

      巻: Vol.J93-D.No.6 ページ: 724-732

    • NAID

      110007618347

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] Spectral Methods and Text Mining Automatic Expansion of User2010

    • 著者名/発表者名
      Nobuyuki Shimizu,Masashi Sugiyama,Hiroshi Nakagawa
    • 雑誌名

      IEICE Transactions,E93-D

      巻: 6 ページ: 1378-1385

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] コーパス検索支援のための動的同義語候補抽出2010

    • 著者名/発表者名
      吉田稔,中川裕志,寺田昭
    • 雑誌名

      人工知能学会論文誌

      巻: 25(1) ページ: 122-132

    • NAID

      130000151243

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] 確率的潜在意味解析における特異値行列の非対角化の解釈とその評価2010

    • 著者名/発表者名
      柴山直樹、中川裕志
    • 雑誌名

      人工知能学会論文誌

      巻: Vol.26,No.1 ページ: 262-272

    • NAID

      130000455375

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] 二段階クラスタリングを単語重み付与に応用した人名曖昧性解消2010

    • 著者名/発表者名
      吉田稔、池田雅紀、小野真吾、佐藤一誠、中川裕志
    • 雑誌名

      日本データベース学会論文誌

      巻: 9(2) ページ: 19-24

    • NAID

      40017420150

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] コーパス検索支援のための動的同義語候補抽出2009

    • 著者名/発表者名
      吉田稔、中川裕志、寺田昭
    • 雑誌名

      人工知能学会論文誌

      巻: 25(1) ページ: 122-132

    • NAID

      130000151243

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [学会発表] Privacy-Preserving EM Algorithm for Clustering on Social Network.2013

    • 著者名/発表者名
      Bing Yang,Issei Sato,Hiroshi Nakagawa
    • 学会等名
      The 16th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD2012)
    • 発表場所
      Kuala Lumpur,Malaysia
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Mining words in the minds of second language learners:learner-specific word difficulty2012

    • 著者名/発表者名
      Yo Ehara,Issei Sato,Hidekazu Oiwa,and Hiroshi Nakagawa
    • 学会等名
      25th International Conference on Computational Linguistics (COLING 2012)
    • 発表場所
      Mumbai, India
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Healing Truncation Bias:Self-weighted Truncation framework for Dual Averaging2012

    • 著者名/発表者名
      Hidekazu Oiwa,Shin Matsushima,and Hiroshi Nakagawa
    • 学会等名
      12th IEEE International Conference on Data Mining(ICDM)
    • 発表場所
      Brussels
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Practical Collapsed Variational Bayes Inference for Hierarchical Dirichlet Process.2012

    • 著者名/発表者名
      Issei Sato,Ken-ich Kurihara,Hiroshi Nakagawa
    • 学会等名
      18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, (KDD 2012)
    • 発表場所
      Beijing,China
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Rethinking Collapsed Variational Bayes Inference for LDA.2012

    • 著者名/発表者名
      Issei Sato,Hiroshi Nakagawa
    • 学会等名
      29th International Conference on Machine Learning (ICML 2012)
    • 発表場所
      Edinburgh,Scotland
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Reducing Wrong Labels in Distant Supervision for Relation Extraction.2012

    • 著者名/発表者名
      Shingo Takamatsu,Issei Sato,Hiroshi Nakagawa
    • 学会等名
      ACL 2012
    • 発表場所
      Jeju,Korea on
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] テキストマイニングによる機器異常診断支援の試み第4回データ工学と情報マネジメントに関するフォーラム2012

    • 著者名/発表者名
      吉田稔,中川裕志,渋谷久恵,前田俊二
    • 学会等名
      第10回日本データベース学会年次大会
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] ブートストラップ法のための能動学習2012

    • 著者名/発表者名
      江原遥,佐藤一誠,中川裕志
    • 学会等名
      言語処理学会第18回年次大会
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] ソーシャルメディアによる風邪流行の予測2012

    • 著者名/発表者名
      谷田和章,荒牧英治,佐藤一誠,吉田稔,中川裕志
    • 学会等名
      言語処理学会第18回年次大会
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] ソーシャルメディアを用いた風邪薬販売量の予測2012

    • 著者名/発表者名
      谷田和章,荒牧英治,佐藤一誠,吉田稔,中川裕志
    • 学会等名
      言語処理学会第18回年次大会,広島
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Privacy-Preserving EM Algorithm for Clustering on Social Network2012

    • 著者名/発表者名
      Yang Bin, Hiroshi Nakagawa
    • 学会等名
      The 16th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD)
    • 発表場所
      Kuala Lumpur, Malaysia
    • 関連する報告書
      2011 実績報告書
  • [学会発表] Reducing Wrong Labels in Distant Supervision for Relation Extraction2012

    • 著者名/発表者名
      Shingo Takamatsu, Issei Sato, Hiroshi Nakagawa
    • 学会等名
      50th annual meeting of the Association for Computational Linguistics (ACL)
    • 発表場所
      Jeju, Korea
    • 関連する報告書
      2011 実績報告書
  • [学会発表] Probabilistic Matrix Factorization Leveraging Contexts for Unsupervised Relation Extraction2011

    • 著者名/発表者名
      Shingo Takamatsu, Issei Sato, Hiroshi Nakagawa
    • 学会等名
      PAKDD2011
    • 発表場所
      Shenzhen, China
    • 年月日
      2011-05-24
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Secure Clustering in Private Networks.2011

    • 著者名/発表者名
      Bing Yang,Issei Sato,Hiroshi Nakagawa
    • 学会等名
      11th IEEE International Conference on Data Mining(ICDM)
    • 発表場所
      Vancouver,Canada
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Probabilistic Frequency-aware Truncated methods for Sparse Online Learning.2011

    • 著者名/発表者名
      Hidekazu Ooiwa,Shin Matsushima,Hiroshi Nakagawa
    • 学会等名
      The European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECML PKDD 2011)
    • 発表場所
      Athens,Greek
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Twitterによる風邪流行の推測2011

    • 著者名/発表者名
      谷田和章,荒牧英治,佐藤一誠,吉田稔,中川裕志
    • 学会等名
      人工知能学会情報編纂研究会第6回研究会,東京
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Person Name Disambiguation and Other Problems2010

    • 著者名/発表者名
      Minoru Yoshida,Hiroshi Nakagawa:Web People Search
    • 学会等名
      Tutorial of The 2nd Asian Conference on Machine Learning (ACML2010)
    • 発表場所
      Tokyo,Japan
    • 年月日
      2010-11-08
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] ITC-UT : Tweet Categorization by Query Categrization for On-line Reputation management2010

    • 著者名/発表者名
      Minoru Yoshida, Shin Matsushima, Shingo Ono, Hiroshi Nakagawa
    • 学会等名
      CLEF 2010 Labs WePS
    • 発表場所
      Padua, Italy
    • 年月日
      2010-09-22
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Topic Models with Power-Law Using Pitman-Yor Process2010

    • 著者名/発表者名
      Issei Sato, Hiroshi Nakagawa
    • 学会等名
      16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining
    • 発表場所
      Washington, DC, USA
    • 年月日
      2010-07-26
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Person Name Disambiguation by Bootstrapping2010

    • 著者名/発表者名
      Minoru Yoshida
    • 学会等名
      The 33rd ACM SIGIR Conference
    • 発表場所
      Geneva, Swiss
    • 年月日
      2010-07-20
    • 関連する報告書
      2009 実績報告書
  • [学会発表] Deterministic Single-Pass Algorithm for LDA.2010

    • 著者名/発表者名
      Issei Sato,Kenich Kurihara,Hiroshi Nakagawa
    • 学会等名
      Neural Information Processing Systems Conference (NIPS2010)
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Topic Models with Power-Law Using Pitman-Yor Process.2010

    • 著者名/発表者名
      Issei Sato,Hiroshi Nakagawa
    • 学会等名
      <16>^ ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,(KDD2010)
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Collusion-Resistant Privacy-Preserving Data Mining2010

    • 著者名/発表者名
      Bin Yang,Hiroshi Nakagawa,Issei Sato,Jun Sakuma
    • 学会等名
      <16>^ ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,(KDD2010)
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Person Name Disambiguation by Bootstrapping2010

    • 著者名/発表者名
      Minoru Yoshida,Masaki Ikeda,Shingo Ono,Issei Sato,Hiroshi Nakagawa
    • 学会等名
      The 33rd Annual ACM SIGIR Conference.
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Exact Passive-Aggressive Algorithm for Multiclass Classification Using Support Class2010

    • 著者名/発表者名
      Shin Matsushima,Nobuyuki Shimizu,Kazuhiro Yoshida,Takashi Ninomiya,Hiroshi Nakagawa
    • 学会等名
      the 2010 SIAM International Conference on Data Mining (SDM'2010)
    • 発表場所
      This paper is selected as top 12 papers of SDM
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Discovering Serendipitous Information from Wikipedia by Using its Network Structure2010

    • 著者名/発表者名
      Yohei Noda,Yoji Kiyota,Hiroshi Nakagawa
    • 学会等名
      In Proceedings of 4th Int'l AAAI Conference on Weblogs and Social Media(ICWSM 2010),poster session
    • 発表場所
      Washington,D.C.,USA
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Person Name Disambiguation on the Web by TwoStage Clustering.2nd Web People Search Evaluation Workshop (WePS 2009)2009

    • 著者名/発表者名
      Masaki Ikeda,Shingo Ono,Issei Sato,Minoru Yoshida and Hiroshi Nakagawa
    • 学会等名
      18th WWW Conference
    • 発表場所
      Madrid, Spain
    • 年月日
      2009-04-21
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Quantum Annealing for Variational Bayes Inference2009

    • 著者名/発表者名
      Issei Sato,Kenichi Kurihara,Shu Tanaka,Seiji Miyashita and Hiroshi Nakagawa
    • 学会等名
      The <25>^ Conference on Uncertainty in Artificial Intelligence (UAI2009)
    • URL

      http://www.cs.mcgill.ca/~uai2009/proceedings.html

    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Latent Dirichlet Allocation における決定論的オンラインベイズ学習2009

    • 著者名/発表者名
      佐藤 一誠, 中川裕志
    • 学会等名
      情報処理学会自然言語処理研究会
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Wikipediaからの意外性のある情報の抽出2009

    • 著者名/発表者名
      野田陽平,清田陽司,中川裕志
    • 学会等名
      NLP若手の会第4回シンポジウム,京都大学
    • 関連する報告書
      2012 研究成果報告書
  • [図書] 情報法,(宇賀克也,長谷部恭男 編:第 8 章 データベースサービスとコンテンツ)2012

    • 著者名/発表者名
      中川裕志
    • 出版者
      有斐閣
    • 関連する報告書
      2012 研究成果報告書
  • [図書] 情報法 (第8章)2012

    • 著者名/発表者名
      中川裕志
    • 出版者
      有斐閣
    • 関連する報告書
      2011 実績報告書
  • [備考]

    • URL

      http://www.r.dl.itc.u-tokyo.ac.jp/node/46/

    • 関連する報告書
      2012 研究成果報告書
  • [備考] 公表論文リスト

    • URL

      http://www.r.dl.itc.u-tokyo.ac.jp/node/46/

    • 関連する報告書
      2011 実績報告書
  • [備考]

    • URL

      http://www.r.dl.itc.u-tokyo.ac.jp/node/46/

    • 関連する報告書
      2010 実績報告書
  • [備考]

    • URL

      http://www.r.dl.itc.u-tokyo.ac.jp/node/10

    • 関連する報告書
      2009 実績報告書

URL: 

公開日: 2009-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi