• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

類義語検索とタグ付き自然言語検索を組み合わせた意外で価値ある情報の発見支援

Publicly Offered Research

Project AreaCyber Infrastructure for the Information-explosion Era
Project/Area Number 21013051
Research Category

Grant-in-Aid for Scientific Research on Priority Areas

Allocation TypeSingle-year Grants
Review Section Science and Engineering
Research InstitutionNational Institute of Information and Communications Technology

Principal Investigator

鳥澤 健太郎  独立行政法人情報通信研究機構, 知識創成コミュニケーション研究センター言語基盤グループ, グループリーダー (70282712)

Co-Investigator(Kenkyū-buntansha) 黒田 航  独立行政法人情報通信研究機構, 知識創成コミュニケーション研究センター・言語基盤グループ, 研究員 (30425764)
村田 真樹  鳥取大学, 大学院・工学研究科・情報エレクトロニクス専攻, 教授 (50358884)
風間 淳一  独立行政法人 情報通信研究機構, 知識創成コミュニケーション研究センター 言語基盤グループ, 主任研究員 (60377439)
山田 一郎  独立行政法人 情報通信研究機構, 知識創成コミュニケーション研究センター 言語基盤グループ, 専門研究員 (70536169)
STIJN De saeger  独立行政法人 情報通信研究機構, 知識創成コミュニケーション研究センター 言語基盤グループ, 専門研究員 (40535994)
Project Period (FY) 2009 – 2010
Project Status Completed (Fiscal Year 2010)
Budget Amount *help
¥4,900,000 (Direct Cost: ¥4,900,000)
Fiscal Year 2010: ¥2,400,000 (Direct Cost: ¥2,400,000)
Fiscal Year 2009: ¥2,500,000 (Direct Cost: ¥2,500,000)
Keywordsインターネット高度化 / 情報検索 / 知識獲得 / 自然言語 / テキストマイニング / 意味ネットワーク / 言語資源 / ネット検索
Research Abstract

本研究の目的は、平成20年度までに開発した検索ディレクトリ「鳥式」にあるトラブル、ツールのような固定されたカテゴリに加えて、ユーザが、鳥式上の関連語の新規なカテゴリを設定することを可能とし、情報の深堀りを可能とすることである。本年度は通常の自然言語で書かれた質問文で、ある語と意味的関係を持つ語の集合を回答とするようなものに対して、Web6億ページから回答を抽出するエンジンを開発した。また、情報通信研究機構の既存技術である音声認識器とそのエンジンを接続することで、スマートフォンに音声で入力された質問に回答できるシステムを開発した。処理できる質問文は、「デフレの原因」から「病気の予防策」「特定の材料を使うメニュー」「ある国から輸入されているもの」「テレビ番組のキャラクター」「哲学的な概念の提唱者」「作曲家の作品」まで非常に広範囲にわたるが、これは結局のところ、鳥式上の関連語の新規なカテゴリをオンラインで設定していることに他ならない。また、一部のタイプに対する質問の回答は対象となっているWeb文書6億ページに陽に書いてあるものにとどまらず、やはり我々が開発したアルゴリズムによって、自動発見された推論規則によって「推測」された回答や、類推によって推測された回答も含み、こうした回答はその根拠とともにユーザに提示される。こうした意味で、開発したシステムは従来の質問応答システムとは一線を画す。また、システムは音声認識から回答の抽出、推測までサーバー一台でほぼリアルタイムで動作する。これはやはり従来の類似システムが巨大な計算パワーを要したのと対照をなす。なお、システムの動作状況を示すデモビデオがhttp://www2.nict.go.jp/x/x161/で視聴できる。

Report

(2 results)
  • 2010 Annual Research Report
  • 2009 Annual Research Report
  • Research Products

    (21 results)

All 2011 2010 2009

All Journal Article (6 results) (of which Peer Reviewed: 6 results) Presentation (11 results) Patent(Industrial Property Rights) (4 results)

  • [Journal Article] 単語分布類似度を用いた類推による単語間の意味的関係獲得法2011

    • Author(s)
      土田正明
    • Journal Title

      情報処理学会論文誌

      Volume: (採録予定(印刷中))

    • Related Report
      2010 Annual Research Report
    • Peer Reviewed
  • [Journal Article] WWWからの大規模動詞含意知識の獲得2011

    • Author(s)
      橋本力
    • Journal Title

      情報処理学会論文誌

      Pages: 293-307

    • Related Report
      2010 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Organizing the Web's Information Explosion to Discover Unknown Unknowns2010

    • Author(s)
      Kentaro Torisawa
    • Journal Title

      New Generation Computing (Special Issue on Information Explosion)

      Pages: 217-236

    • Related Report
      2010 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Hypernym Discovery Based on Distributional Similarity and Hierarchical Structures2009

    • Author(s)
      Ichiro Yamada
    • Journal Title

      Proceedings of EMNLP 2009

      Pages: 929-937

    • Related Report
      2009 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Large Scale Relation Acquisition using Class Dependent Patterns2009

    • Author(s)
      Stijn De Saeger
    • Journal Title

      Proceedings of ICDM 2009

      Pages: 764-769

    • Related Report
      2009 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Bilingual Co-Training for Monolingual Hyponymy Relation Acquisition2009

    • Author(s)
      Jong-Hoon Oh
    • Journal Title

      Proceedings of ACL-IJCNLP 2009

      Pages: 432-440

    • Related Report
      2009 Annual Research Report
    • Peer Reviewed
  • [Presentation] Extracting Paraphrases from Definition Sentences on the Web2011

    • Author(s)
      Chikara Hashimoto
    • Organizer
      ACL-HLT 2011
    • Place of Presentation
      Portland, Oregon, USA
    • Year and Date
      2011-06-22
    • Related Report
      2010 Annual Research Report
  • [Presentation] Large Scale Similarity-based Relation Expansion2010

    • Author(s)
      Masaaki Tsuchida
    • Organizer
      IUCS 2010
    • Place of Presentation
      北京 中華人民共和国
    • Year and Date
      2010-10-19
    • Related Report
      2010 Annual Research Report
  • [Presentation] Generating Information-Rich Taxonomy from Wikipedia2010

    • Author(s)
      Ichiro Yamada
    • Organizer
      IUCS 2010
    • Place of Presentation
      北京 中華人民共和国
    • Year and Date
      2010-10-19
    • Related Report
      2010 Annual Research Report
  • [Presentation] Co-STAR : A Co-training Style Algorithm for Hyponymy Relation Acquisition from Structured and Unstructured Text2010

    • Author(s)
      Jong-Hoon Oh
    • Organizer
      COLING 2010
    • Place of Presentation
      北京 中華人民共和国
    • Year and Date
      2010-08-24
    • Related Report
      2010 Annual Research Report
  • [Presentation] A Bayesian Method for Robust Estimation of Distributional Simlarities2010

    • Author(s)
      Jun'ichi Kazama
    • Organizer
      ACL 2010
    • Place of Presentation
      Uppsala, Sweden
    • Year and Date
      2010-07-12
    • Related Report
      2010 Annual Research Report
  • [Presentation] 単語の意味クラスを用いたパターン学習による大規模な意味的関係獲得2010

    • Author(s)
      Stijn De Saeger
    • Organizer
      第16回言語処理学会年次大会予稿集
    • Place of Presentation
      東京大学本郷キャンパス(東京都)
    • Year and Date
      2010-03-11
    • Related Report
      2009 Annual Research Report
  • [Presentation] Wikipediaを利用した日本語WordNetへの用語追加の検討2010

    • Author(s)
      山田一郎
    • Organizer
      第16回言語処理学会年次大会予稿集
    • Place of Presentation
      東京大学本郷キャンパス(東京都)
    • Year and Date
      2010-03-11
    • Related Report
      2009 Annual Research Report
  • [Presentation] 類推による単語間の意味的関係獲得法2010

    • Author(s)
      土田正明
    • Organizer
      第16回言語処理学会年次大会予稿集
    • Place of Presentation
      東京大学本郷キャンパス(東京都)
    • Year and Date
      2010-03-11
    • Related Report
      2009 Annual Research Report
  • [Presentation] Evolving the NICT Concept Dictionary2010

    • Author(s)
      Kentaro Torisawa
    • Organizer
      FlaReNet Forum(招待講演)
    • Place of Presentation
      Institut d'Estudis Catalans (SPAIN・Barcelona)
    • Year and Date
      2010-02-12
    • Related Report
      2009 Annual Research Report
  • [Presentation] Monolingual Knowledge Acquisition and a Multilingual Information Environment2009

    • Author(s)
      Kentaro Torisawa
    • Organizer
      International Workshop on Spoken Language Translation 2009(招待講演)
    • Place of Presentation
      日本科学未来館(東京都)
    • Year and Date
      2009-12-02
    • Related Report
      2009 Annual Research Report
  • [Presentation] Webから作る超大規模辞書-価値ある情報の発見/創出/伝達の基盤2009

    • Author(s)
      鳥澤健太郎
    • Organizer
      国立情報学研究所軽井沢土曜懇話会(招待講演)
    • Place of Presentation
      国立情報学研究所国際高等セミナーハウス(長野県)
    • Year and Date
      2009-10-02
    • Related Report
      2009 Annual Research Report
  • [Patent(Industrial Property Rights)] 言い換え関係集合取得装置、言い換え関係集合取得方法,及びプログラム2010

    • Inventor(s)
      橋本力, 鳥澤健太郎, 他
    • Industrial Property Rights Holder
      情報通信研究機構
    • Patent Publication Number
      2010-163472
    • Filing Date
      2010-07-21
    • Related Report
      2010 Annual Research Report
  • [Patent(Industrial Property Rights)] 相互機械学習装置、相互機械学習方法、及びプログラム2010

    • Inventor(s)
      呉鍾勲, 鳥澤健太郎, 他
    • Industrial Property Rights Holder
      情報通信研究機構
    • Industrial Property Number
      2010-184356
    • Filing Date
      2010-08-19
    • Related Report
      2010 Annual Research Report
  • [Patent(Industrial Property Rights)] 言語モデル学習装置及びコンピュータプログラム2010

    • Inventor(s)
      ステインデサーガ, 鳥澤健太郎, 他
    • Industrial Property Rights Holder
      情報通信研究機構
    • Industrial Property Number
      2010-224870
    • Filing Date
      2010-10-04
    • Related Report
      2010 Annual Research Report
  • [Patent(Industrial Property Rights)] 自然言語文生成装置及びコンピュータプログラム2010

    • Inventor(s)
      ステインデサーガ, 鳥澤健太郎, 他
    • Industrial Property Rights Holder
      情報通信研究機構
    • Industrial Property Number
      2010-224872
    • Filing Date
      2010-10-04
    • Related Report
      2010 Annual Research Report

URL: 

Published: 2009-04-01   Modified: 2018-03-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi