• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

大規模日本語コーパスに基づく確率的オントロジーの構築

研究課題

研究課題/領域番号 18700138
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関東京工業大学

研究代表者

寺井 あすか  東京工業大学, 大学院・情報理工学研究科, 21世紀COE研究員 (70422540)

研究期間 (年度) 2006 – 2007
研究課題ステータス 完了 (2007年度)
配分額 *注記
3,500千円 (直接経費: 3,500千円)
2007年度: 1,900千円 (直接経費: 1,900千円)
2006年度: 1,600千円 (直接経費: 1,600千円)
キーワード知識発見とデータマイニング / 言語統計解析 / オントロジー
研究概要

本研究の目的は、大規模言語コーパスに基づく係り受け頻度データを用いて、確率的オントロジーを構築した。本研究で構築する、確率的オントロジーとは、概念によって形成されるカテゴリーの階層構造と、概念のカテゴリーへの帰属確率(概念が与えられたときのカテゴリーの条件付確率)を付与したものである。
新聞10年分(1993年〜2002年)の形容詞-名詞、名詞-"が"-動詞、名詞-"に"-動詞、名詞-"を"-動詞の係り受け頻度データを用いて、名詞に関する確率的オントロジーを構築した。まず、毎日新聞コーパス10年分(1993年〜2002年)から、形容詞-名詞、名詞-動詞に関する係り受け頻度データを、CaboCha(工藤、松本2002)を用いて抽出した。次に、抽出した係り受け頻度データに対し、潜在クラスが介在し、単語A(形容詞または動詞)と単語N(名詞)が共起するという仮定に基づく言語統計解析(Kameya、Sato 2005)を用いて潜在クラスの推定を行った。各名詞をP(名詞|潜在クラス)という確率で表現し、これらの言語統計解析結果に対して、ソフトクラスタリングモデルであるRoseモデル(1990)を用いることで、各階層におけるカテゴリーのセントロイドを推定することで、名詞の確率的階層構造を作成した。また、下位カテゴリーのセントロイドの上位カテゴリーへの帰属確率を計算することで、上位カテゴリーへの下位カテゴリーの帰属確率を求めた。
さらに、心理学実験を行うことで、構築した確率的階層構造の妥当性の検証を行った。

報告書

(2件)
  • 2007 実績報告書
  • 2006 実績報告書
  • 研究成果

    (3件)

すべて 2008 2007

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (2件)

  • [雑誌論文] Construction of a Probabilistic Hierarchical Structure based on aJapanese Corpus and a Japanese Thesaurus2008

    • 著者名/発表者名
      Asuka Terai, Bin Liu, Masanori Nakagawa
    • 雑誌名

      T. Tokunaga and A. Ortega (Eds.):LKR2008, LNAI 4938, Springer-Verlag Berlin Heidelberg

      ページ: 132-147

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [学会発表] A method for the construction of a probabilistic hierarchical structiire based on a statistical analysis of a large-scale corpus2007

    • 著者名/発表者名
      Asuka Terai, Bin Liu, Masanori Nakagawa
    • 学会等名
      the 1st International Conference on Semantic Computing, IEEE Computer Society
    • 発表場所
      Irvine (USA)
    • 年月日
      2007-09-17
    • 関連する報告書
      2007 実績報告書
  • [学会発表] Hierarchical Probabilistic Categorization of Japanese Words2007

    • 著者名/発表者名
      Asuka Terai, Bin Liu, Masanori Nakagawa
    • 学会等名
      the 15th International and 72nd Annual Meeting of the Psychometric Society (IMPS2007)
    • 発表場所
      東京(日本)
    • 年月日
      2007-07-09
    • 関連する報告書
      2007 実績報告書

URL: 

公開日: 2006-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi