• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

不完全データに基づく数量化II類と語の共起性判定への応用

研究課題

研究課題/領域番号 13680450
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関九州大学

研究代表者

冨浦 洋一  九州大学, 大学院・システム情報科学研究院, 助教授 (10217523)

研究分担者 田中 省作  九州大学, 情報基盤センター, 助手 (00325549)
日高 達  九州大学, 大学院・システム情報科学研究院, 教授 (30037931)
研究期間 (年度) 2001 – 2003
研究課題ステータス 完了 (2003年度)
配分額 *注記
3,500千円 (直接経費: 3,500千円)
2003年度: 600千円 (直接経費: 600千円)
2002年度: 2,300千円 (直接経費: 2,300千円)
2001年度: 600千円 (直接経費: 600千円)
キーワード語の共起性 / 重回帰モデル / 語の実ベクトル表現 / 知識獲得 / 統語的曖昧さ解消 / 自然言語処理 / 語彙共起性 / 構文構造の暖昧さ解消 / 語のベクトル表現 / 構文解析 / 語の共起性判定 / 選択制約 / 意味獲得
研究概要

語彙の共起性は自然言語処理における基本的な知識の一つであり,これを利用して自然言語文の統語的曖昧さや多義語の語義の曖昧さを解消することができる.しかし,共起し得る語の組は膨大であり,大規模な構文解析済みコーパスを用いたとしても,共起可能な語の組を網羅的に収集することは困難である.そこで,本研究では,構文解析済みのコーパスから得られる共起データを学習データとして,語の共起性を推定する手法を開発した.提案する推定法では,語を実ベクトル(ワードベクトル)に対応させ,語wが関係fで語w'に係る係りやすさの程度(共起性)を,wのワードベクトルと<f,w'>に対応した重みベクトルとの内積とする重回帰モデルで表現する.通常の重回帰分析と異なり,重みベクトルだけではなく,説明変量であるワードベクトルも同時に学習すること,モデルの学習では,学習データに存在しない語の組に対する共起を信頼度付の擬似的な負例(共起性なし)として扱っていることが,本手法の特徴である.
EDRコーパスから抽出した共起データを学習データとして,名詞と助詞・動詞の共起性推定実験を行い,推定された共起性を次の2通りの方法で評価したところ,良好な結果を得た.
1.学習データには存在しないが,他のコーパスで共起が観測された語の組に対する推定された共起性の値の分布の調査による直接的な評価,
2.統語的曖昧さ解消実験による間接的な評価.

報告書

(4件)
  • 2003 実績報告書   研究成果報告書概要
  • 2002 実績報告書
  • 2001 実績報告書
  • 研究成果

    (15件)

すべて その他

すべて 文献書誌 (15件)

  • [文献書誌] 冨浦 洋一 et al.: "言語コーパスからの語の共起性の推定"言語処理学会第8回年次大会. 631-634 (2002)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] 冨浦洋一 et al.: "言語コーパスからの語の共起性の推定と統語的曖昧さ解消実験による評価"言語処理学会第9回年次大会. 242-245 (2003)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] 冨浦洋一 et al.: "言語コーパスからの語の共起性の推定"情報処理学会論文誌. 45. 324-332 (2004)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] Y.Tomiura et al.: "Estimation of Words' Cooccurrency from Corpus"Proc. of the 8th Annual Meeting of The Association for Natural Language Processing (in Japanese).. 631-634 (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] Y.Tomiura et al.: "Estimation of Words' Cooccurrency from Corpus and its Evaluation through Experiment of Syntactic Disambiguation"Proc. of the 9th Annual Meeting of The Association for Natural Language Processing (in Japanese).. 242-245 (2003)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] Y.Tomiura et al.: "Estimation of Words' Cooccurrency from Corpus"IPSJ Journal (in Japanese).. 324-332 (2004)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2003 研究成果報告書概要
  • [文献書誌] 冨浦 洋一: "言語コーパスからの語の共起性の推定と統語的曖昧さ解消実験による評価"言語処理学会第9回年次大会. (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 冨浦 洋一: "言語コーパスからの語の共起性の推定"情報処理学会論文誌. 45・1. 324-332 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 見戸 直樹: "重回帰分析による係り受けの曖昧さ解消"電気関係学会九州支部第55回連合大会予稿集. 623 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 緒方 伸輔: "語彙共起性判定における学習・評価データに関する考察"電気関係学会九州支部第55回連合大会予稿集. 626 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 冨浦 洋一: "共起データに基づく名詞のn次元空間への配置"情報処理学会自然言語処理研究会. NL-154(未定). (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 冨浦 洋一: "言語コーパスからの語の共起性の推定と統語的曖昧さ解消実験による評"言語処理学会第9回年次大会予稿集. (未定). (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 渡邊 慎一郎: "語彙共起性判定の為の単語ベクトルの獲得"電気関係学会九州支部第54回連合大会予稿集. 634 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 行野 顕正: "階層型ニューラルネットを用いた語彙共起性の判定"電気関係学会九州支部第54回連合大会予稿集. 635 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 冨浦 洋一: "言語コーパスからの語の共起性の判定"言語処理学会第8回年次大会. (印刷中). (2002)

    • 関連する報告書
      2001 実績報告書

URL: 

公開日: 2001-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi