• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 実績報告書

代表性のあるコーパスを利用した日本語意味解析

計画研究

研究領域代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備
研究課題/領域番号 18061003
研究機関東京工業大学

研究代表者

奥村 学  東京工業大学, 精密工学研究所, 准教授 (60214079)

研究分担者 白井 清昭  北陸先端科学技術大学院大学, 情報科学研究科, 准教授 (30302970)
竹内 孔一  岡山大学, 大学院・自然科学研究科, 講師 (80311174)
中村 誠  北陸先端科学技術大学院大学, 情報科学研究科, 助教 (50377438)
高村 大也  東京工業大学, 精密工学研究所, 助教 (80361773)
キーワード語義タグ付コーパス / 単語の新語義発見 / 機械学習 / 語彙概念構造 / クラスタリング
研究概要

本研究課題では, 研究項目Aで構築する代表性のあるコーパスを用いた実証研究として, 以下の3つの日本語意味解析手法の開発を行う.
1)機械学習手法に基づく多義性解消手法の開発と, それを用いた代表性のある語義タグ付コーパスの半自動構築
2)単語の新語義, 新用法の自動発見手法の開発
3)語彙概念構造に基づく動詞の意味構造の自動抽出手法の開発と, それを用いた動詞の述語項構造辞書の自動構築手法の開発
1)では, 語義タグ付け支援, 新語義候補の検出, 多義性解消システムの性能改善を目的として, クラスタリング時に, 教師情報を部分的に利用する半教師ありクラスタリング手法を開発している. 今年度は代表性のあるコーパスでは不可欠となる異ジャンルコーパスへの対応を実現した. 2)では, 昨年度までに開発した単語クラスタリング手法を元に, クラスタと既存の辞書の意味とを対応付けることにより, クラスタ中の用例がどのような意味を持つのか, あるいは既存の辞書にない新語義であるのかを決定する手法を開発した. 3)では, 動詞の語義を決定する要因として係り関係にある名詞との組み合わせが重要であることから, 動詞と係り名詞を同時にクラスタリングしながら, 大規模テキストから動詞の共通概念を自動取得する方法を開発した. 同時クラスタリング法により, 共通概念を持つ動詞クラスタと同時に, 対応する名詞クラスタが得られるため, 実際の辞書構築において人が語義を理解しやすい形の出力が得られている.

  • 研究成果

    (7件)

すべて 2009 2008

すべて 雑誌論文 (2件) 学会発表 (5件)

  • [雑誌論文] コーパスにおける語の意味の自動識別2009

    • 著者名/発表者名
      白井清昭
    • 雑誌名

      国文学解釈と鑑賞 Vol.74, No.1

      ページ: 61-69

  • [雑誌論文] 現代日本語書き言葉均衡コーパスを用いた意味解析-語義の自動特定,新語義の発見-2008

    • 著者名/発表者名
      奥村学, 白井清昭
    • 雑誌名

      言語 Vol.37, No.8

      ページ: 66-73

  • [学会発表] Semi-supervised Clustering for Word Instances and Its Effect on Word Sense Disambiguation2009

    • 著者名/発表者名
      Kazunari Sugiyama, Manabu Okumura
    • 学会等名
      The 10th International Conference on Inte lligent Text Processing and Computational Linguistics (CICLing 2009)
    • 発表場所
      Mexico City
    • 年月日
      2009-03-05
  • [学会発表] 新語義発見のための用例クラスタと辞書定義文の対応付け2009

    • 著者名/発表者名
      田中博貴, 中村誠, 白井清昭
    • 学会等名
      第15回言語処理学会年次大会
    • 発表場所
      鳥取大学
    • 年月日
      2009-03-04
  • [学会発表] BCCWJを用いた新しい語義曖昧性解消タスク2009

    • 著者名/発表者名
      奥村学, 白井清昭
    • 学会等名
      第15回言語処理学会轍大会
    • 発表場所
      鳥取大学
    • 年月日
      2009-03-04
  • [学会発表] 多義性を考慮した同時共起クラスタリングによる動詞の類語抽出2009

    • 著者名/発表者名
      高橋秀幸, 竹内孔一
    • 学会等名
      電子情報通信学会,言語理解とコミュニケーション研究会
    • 発表場所
      倉敷芸文館
    • 年月日
      2009-01-27
  • [学会発表] Extraction of Verb Synonyms using Co-clustering Approach2008

    • 著者名/発表者名
      Koichi Takeuchi
    • 学会等名
      Second International Symposium on Universal Communication (ISUC 2008)
    • 発表場所
      Osaka International Convention Center.
    • 年月日
      2008-12-16

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi