• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

Wikipediaマイニングによる大規模Webオントロジの構築

Research Project

Project/Area Number 21300032
Research InstitutionThe University of Tokyo

Principal Investigator

中山 浩太郎  The University of Tokyo, 知の構造化センター, 特任助教 (00512097)

Co-Investigator(Kenkyū-buntansha) 荒牧 英治  東京大学, 知の構造化センター, 特任講師 (70401073)
岡 瑞起  東京大学, 知の構造化センター, 特任研究員 (10512105)
増田 勝也  東京大学, 知の構造化センター, 特任研究員 (20512114)
松尾 豊  東京大学, 大学院・工学系研究科 総合研究機構, 准教授 (30358014)
Keywords情報システム / 人工知能 / ディレクトリ・検索
Research Abstract

21年度においては,計画通り「情報の信頼性」と「スケーラビリティ」を重点的に研究開発した.特に,信頼性向上に関しては,大規模テストコレクションを作成したことにより,情報の信頼性の評価をより客観的に行うことができるようになったことが重要な成果である.また,正解集合としてテストコレクションを用意することで,リンク共起性解析などの素性を利用した機械学習手法の適用が可能となり,より高い精度を実現できた.重要な素性の組み合わせを発見することができることから,計算量を押さえつつ,精度を向上するための素性の組み合わせを調べることができた.スケーラビリティについては,主に自然言語処理がボトルネックになるため,PCクラスタを利用した自然言語処理とリンク構造解析の分散処理を実現するルーチンの開発を進めた.PCクラスタを利用した分散環境における自然言語解析も,効率的な方法が確立できた.また,計画では多様な情報との融合に関する研究も本年度に一部推進する予定であったが,こちらも計画通りに進めた.特に,Web情報との融合に関しては,格助詞を利用したWeb検索によって意味情報を抽出する方法を提案・実装し,評価することができた.
これらの研究成果は,次年度以降の研究開発において重要なステップとなる.特に,スケーラビリティの高い解析手法とWeb情報との融合は,次年度の研究開発を進める上で大きな助けとなることが期待される.また,大規模テストコレクションは,我々の研究だけでなく,他の研究者が利用できる基盤リソースとして提供されることから,当該分野の研究促進に貢献できるのではないかと期待される.

  • Research Products

    (11 results)

All 2010 2009 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (7 results) Remarks (1 results)

  • [Journal Article] Improving the extraction of bilingual terminology from wikipedia.2009

    • Author(s)
      M.Erdmann, K.Nakayama, T.Hara, S.Nishio.
    • Journal Title

      ACM Transactions on Multimedia Computing, Communications and Applications(http://portal.acm.org/citation.cfm?id=1596995) Vol.5 Issue 4(Web)

    • Peer Reviewed
  • [Journal Article] Wikipediaマイニング:Wikipedia研究のサーベイ2009

    • Author(s)
      中山浩太郎, 伊藤雅弘, Erdmann, M., 白川真澄, 道下智之, 原隆浩, 西尾章治郎
    • Journal Title

      情報処理学会論文誌:データベース(TOD) 2(4)

      Pages: 49-60

    • Peer Reviewed
  • [Journal Article] Wikipediaマイニング近未来チャレンジキックオフ編2009

    • Author(s)
      中山浩太郎, 伊藤雅弘, Erdmann, M., 白川真澄, 道下智之, 原隆浩, 西尾章治郎
    • Journal Title

      人工知能学会論文誌 Vol.24 No.6

      Pages: 549-557

    • Peer Reviewed
  • [Presentation] Web検索を用いた関連のある概念間の関係抽出手法2010

    • Author(s)
      白川真澄, 中山浩太郎, 荒牧英治, 原隆浩, 西尾章治郎
    • Organizer
      第2回データ工学と情報マネジメントに関するフォーラム(DEIM2010)
    • Place of Presentation
      兵庫県淡路市
    • Year and Date
      2010-02-28
  • [Presentation] Wikipediaマイニング2009

    • Author(s)
      中山浩太郎
    • Organizer
      Web学会シンポジウム
    • Place of Presentation
      東京大学
    • Year and Date
      2009-12-07
  • [Presentation] Using an svm classifier to improve the extraction of bilingual terminology from wikipedia2009

    • Author(s)
      M.Erdmann, K.Nakayama, T.Hara, S.Nishio
    • Organizer
      WikiAI conjunction with International Joint Conference on Artificial Intelligence
    • Place of Presentation
      California, USA
    • Year and Date
      2009-07-13
  • [Presentation] Wikipediaのカテゴリ構造解析とクラスタリングによる概念ベクトルの生成2009

    • Author(s)
      白川真澄, 中山浩太郎, 原隆浩, 西尾章治郎
    • Organizer
      第23回人工知能学会全国大会
    • Place of Presentation
      サンポートホール高松
    • Year and Date
      2009-06-17
  • [Presentation] Wikipediaの概念に基づく連想関係テストコレクション「WikiSimi3000」2009

    • Author(s)
      伊藤雅弘, 中山浩太郎, 原隆浩, 西尾章治郎
    • Organizer
      第23回人工知能学会全国大会
    • Place of Presentation
      サンポートホール高松
    • Year and Date
      2009-06-17
  • [Presentation] ウィキペディアを用いた語義曖昧性解消手法と情報検索への応用2009

    • Author(s)
      道下智之, 中山浩太郎, 原隆浩, 西尾章治郎
    • Organizer
      第23回人工知能学会全国大会
    • Place of Presentation
      サンポートホール高松
    • Year and Date
      2009-06-17
  • [Presentation] Wikipedia relatedness measurement methods and influential features2009

    • Author(s)
      K.Nakayama, M.Ito, T.Hara, S.Nishio
    • Organizer
      IEEE International Symposium on Mining and Web(MAW)
    • Place of Presentation
      Bradford, UK
    • Year and Date
      2009-05-26
  • [Remarks] 成果報告用Webサイト

    • URL

      http://sigwp.org

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi