• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

類義語検索とタグ付き自然言語検索を組み合わせた意外で価値ある情報の発見支援

公募研究

研究領域情報爆発時代に向けた新しいIT基盤技術の研究
研究課題/領域番号 21013051
研究種目

特定領域研究

配分区分補助金
審査区分 理工系
研究機関独立行政法人情報通信研究機構

研究代表者

鳥澤 健太郎  独立行政法人情報通信研究機構, 知識創成コミュニケーション研究センター言語基盤グループ, グループリーダー (70282712)

研究分担者 黒田 航  独立行政法人情報通信研究機構, 知識創成コミュニケーション研究センター・言語基盤グループ, 研究員 (30425764)
村田 真樹  鳥取大学, 大学院・工学研究科・情報エレクトロニクス専攻, 教授 (50358884)
風間 淳一  独立行政法人 情報通信研究機構, 知識創成コミュニケーション研究センター 言語基盤グループ, 主任研究員 (60377439)
山田 一郎  独立行政法人 情報通信研究機構, 知識創成コミュニケーション研究センター 言語基盤グループ, 専門研究員 (70536169)
STIJN De saeger  独立行政法人 情報通信研究機構, 知識創成コミュニケーション研究センター 言語基盤グループ, 専門研究員 (40535994)
研究期間 (年度) 2009 – 2010
研究課題ステータス 完了 (2010年度)
配分額 *注記
4,900千円 (直接経費: 4,900千円)
2010年度: 2,400千円 (直接経費: 2,400千円)
2009年度: 2,500千円 (直接経費: 2,500千円)
キーワードインターネット高度化 / 情報検索 / 知識獲得 / 自然言語 / テキストマイニング / 意味ネットワーク / 言語資源 / ネット検索
研究概要

本研究の目的は、平成20年度までに開発した検索ディレクトリ「鳥式」にあるトラブル、ツールのような固定されたカテゴリに加えて、ユーザが、鳥式上の関連語の新規なカテゴリを設定することを可能とし、情報の深堀りを可能とすることである。本年度は通常の自然言語で書かれた質問文で、ある語と意味的関係を持つ語の集合を回答とするようなものに対して、Web6億ページから回答を抽出するエンジンを開発した。また、情報通信研究機構の既存技術である音声認識器とそのエンジンを接続することで、スマートフォンに音声で入力された質問に回答できるシステムを開発した。処理できる質問文は、「デフレの原因」から「病気の予防策」「特定の材料を使うメニュー」「ある国から輸入されているもの」「テレビ番組のキャラクター」「哲学的な概念の提唱者」「作曲家の作品」まで非常に広範囲にわたるが、これは結局のところ、鳥式上の関連語の新規なカテゴリをオンラインで設定していることに他ならない。また、一部のタイプに対する質問の回答は対象となっているWeb文書6億ページに陽に書いてあるものにとどまらず、やはり我々が開発したアルゴリズムによって、自動発見された推論規則によって「推測」された回答や、類推によって推測された回答も含み、こうした回答はその根拠とともにユーザに提示される。こうした意味で、開発したシステムは従来の質問応答システムとは一線を画す。また、システムは音声認識から回答の抽出、推測までサーバー一台でほぼリアルタイムで動作する。これはやはり従来の類似システムが巨大な計算パワーを要したのと対照をなす。なお、システムの動作状況を示すデモビデオがhttp://www2.nict.go.jp/x/x161/で視聴できる。

報告書

(2件)
  • 2010 実績報告書
  • 2009 実績報告書
  • 研究成果

    (21件)

すべて 2011 2010 2009

すべて 雑誌論文 (6件) (うち査読あり 6件) 学会発表 (11件) 産業財産権 (4件)

  • [雑誌論文] 単語分布類似度を用いた類推による単語間の意味的関係獲得法2011

    • 著者名/発表者名
      土田正明
    • 雑誌名

      情報処理学会論文誌

      巻: (採録予定(印刷中))

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] WWWからの大規模動詞含意知識の獲得2011

    • 著者名/発表者名
      橋本力
    • 雑誌名

      情報処理学会論文誌

      ページ: 293-307

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Organizing the Web's Information Explosion to Discover Unknown Unknowns2010

    • 著者名/発表者名
      Kentaro Torisawa
    • 雑誌名

      New Generation Computing (Special Issue on Information Explosion)

      ページ: 217-236

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Hypernym Discovery Based on Distributional Similarity and Hierarchical Structures2009

    • 著者名/発表者名
      Ichiro Yamada
    • 雑誌名

      Proceedings of EMNLP 2009

      ページ: 929-937

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Large Scale Relation Acquisition using Class Dependent Patterns2009

    • 著者名/発表者名
      Stijn De Saeger
    • 雑誌名

      Proceedings of ICDM 2009

      ページ: 764-769

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Bilingual Co-Training for Monolingual Hyponymy Relation Acquisition2009

    • 著者名/発表者名
      Jong-Hoon Oh
    • 雑誌名

      Proceedings of ACL-IJCNLP 2009

      ページ: 432-440

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [学会発表] Extracting Paraphrases from Definition Sentences on the Web2011

    • 著者名/発表者名
      Chikara Hashimoto
    • 学会等名
      ACL-HLT 2011
    • 発表場所
      Portland, Oregon, USA
    • 年月日
      2011-06-22
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Large Scale Similarity-based Relation Expansion2010

    • 著者名/発表者名
      Masaaki Tsuchida
    • 学会等名
      IUCS 2010
    • 発表場所
      北京 中華人民共和国
    • 年月日
      2010-10-19
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Generating Information-Rich Taxonomy from Wikipedia2010

    • 著者名/発表者名
      Ichiro Yamada
    • 学会等名
      IUCS 2010
    • 発表場所
      北京 中華人民共和国
    • 年月日
      2010-10-19
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Co-STAR : A Co-training Style Algorithm for Hyponymy Relation Acquisition from Structured and Unstructured Text2010

    • 著者名/発表者名
      Jong-Hoon Oh
    • 学会等名
      COLING 2010
    • 発表場所
      北京 中華人民共和国
    • 年月日
      2010-08-24
    • 関連する報告書
      2010 実績報告書
  • [学会発表] A Bayesian Method for Robust Estimation of Distributional Simlarities2010

    • 著者名/発表者名
      Jun'ichi Kazama
    • 学会等名
      ACL 2010
    • 発表場所
      Uppsala, Sweden
    • 年月日
      2010-07-12
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 単語の意味クラスを用いたパターン学習による大規模な意味的関係獲得2010

    • 著者名/発表者名
      Stijn De Saeger
    • 学会等名
      第16回言語処理学会年次大会予稿集
    • 発表場所
      東京大学本郷キャンパス(東京都)
    • 年月日
      2010-03-11
    • 関連する報告書
      2009 実績報告書
  • [学会発表] Wikipediaを利用した日本語WordNetへの用語追加の検討2010

    • 著者名/発表者名
      山田一郎
    • 学会等名
      第16回言語処理学会年次大会予稿集
    • 発表場所
      東京大学本郷キャンパス(東京都)
    • 年月日
      2010-03-11
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 類推による単語間の意味的関係獲得法2010

    • 著者名/発表者名
      土田正明
    • 学会等名
      第16回言語処理学会年次大会予稿集
    • 発表場所
      東京大学本郷キャンパス(東京都)
    • 年月日
      2010-03-11
    • 関連する報告書
      2009 実績報告書
  • [学会発表] Evolving the NICT Concept Dictionary2010

    • 著者名/発表者名
      Kentaro Torisawa
    • 学会等名
      FlaReNet Forum(招待講演)
    • 発表場所
      Institut d'Estudis Catalans (SPAIN・Barcelona)
    • 年月日
      2010-02-12
    • 関連する報告書
      2009 実績報告書
  • [学会発表] Monolingual Knowledge Acquisition and a Multilingual Information Environment2009

    • 著者名/発表者名
      Kentaro Torisawa
    • 学会等名
      International Workshop on Spoken Language Translation 2009(招待講演)
    • 発表場所
      日本科学未来館(東京都)
    • 年月日
      2009-12-02
    • 関連する報告書
      2009 実績報告書
  • [学会発表] Webから作る超大規模辞書-価値ある情報の発見/創出/伝達の基盤2009

    • 著者名/発表者名
      鳥澤健太郎
    • 学会等名
      国立情報学研究所軽井沢土曜懇話会(招待講演)
    • 発表場所
      国立情報学研究所国際高等セミナーハウス(長野県)
    • 年月日
      2009-10-02
    • 関連する報告書
      2009 実績報告書
  • [産業財産権] 言い換え関係集合取得装置、言い換え関係集合取得方法,及びプログラム2010

    • 発明者名
      橋本力, 鳥澤健太郎, 他
    • 権利者名
      情報通信研究機構
    • 公開番号
      2010-163472
    • 出願年月日
      2010-07-21
    • 関連する報告書
      2010 実績報告書
  • [産業財産権] 相互機械学習装置、相互機械学習方法、及びプログラム2010

    • 発明者名
      呉鍾勲, 鳥澤健太郎, 他
    • 権利者名
      情報通信研究機構
    • 産業財産権番号
      2010-184356
    • 出願年月日
      2010-08-19
    • 関連する報告書
      2010 実績報告書
  • [産業財産権] 言語モデル学習装置及びコンピュータプログラム2010

    • 発明者名
      ステインデサーガ, 鳥澤健太郎, 他
    • 権利者名
      情報通信研究機構
    • 産業財産権番号
      2010-224870
    • 出願年月日
      2010-10-04
    • 関連する報告書
      2010 実績報告書
  • [産業財産権] 自然言語文生成装置及びコンピュータプログラム2010

    • 発明者名
      ステインデサーガ, 鳥澤健太郎, 他
    • 権利者名
      情報通信研究機構
    • 産業財産権番号
      2010-224872
    • 出願年月日
      2010-10-04
    • 関連する報告書
      2010 実績報告書

URL: 

公開日: 2009-04-01   更新日: 2018-03-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi