• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Annual Research Report

代表性のあるコーパスを利用した日本語意味解析

Planned Research

Project AreaCompilation of a balanced corpus of written Japanese: Infrastructure for the coming Japanese linguistics
Project/Area Number 18061003
Research InstitutionTokyo Institute of Technology

Principal Investigator

奥村 学  Tokyo Institute of Technology, 精密工学研究所, 准教授 (60214079)

Co-Investigator(Kenkyū-buntansha) 白井 清昭  北陸先端科学技術大学院大学, 情報科学研究科, 准教授 (30302970)
竹内 孔一  岡山大学, 大学院・自然科学研究科, 講師 (80311174)
中村 誠  北陸先端科学技術大学院大学, 情報科学研究科, 助教 (50377438)
高村 大也  東京工業大学, 精密工学研究所, 助教 (80361773)
Keywords語義タグ付コーパス / 単語の新語義発見 / 機械学習 / 語彙概念構造 / クラスタリング
Research Abstract

本研究課題では, 研究項目Aで構築する代表性のあるコーパスを用いた実証研究として, 以下の3つの日本語意味解析手法の開発を行う.
1)機械学習手法に基づく多義性解消手法の開発と, それを用いた代表性のある語義タグ付コーパスの半自動構築
2)単語の新語義, 新用法の自動発見手法の開発
3)語彙概念構造に基づく動詞の意味構造の自動抽出手法の開発と, それを用いた動詞の述語項構造辞書の自動構築手法の開発
1)では, 語義タグ付け支援, 新語義候補の検出, 多義性解消システムの性能改善を目的として, クラスタリング時に, 教師情報を部分的に利用する半教師ありクラスタリング手法を開発している. 今年度は代表性のあるコーパスでは不可欠となる異ジャンルコーパスへの対応を実現した. 2)では, 昨年度までに開発した単語クラスタリング手法を元に, クラスタと既存の辞書の意味とを対応付けることにより, クラスタ中の用例がどのような意味を持つのか, あるいは既存の辞書にない新語義であるのかを決定する手法を開発した. 3)では, 動詞の語義を決定する要因として係り関係にある名詞との組み合わせが重要であることから, 動詞と係り名詞を同時にクラスタリングしながら, 大規模テキストから動詞の共通概念を自動取得する方法を開発した. 同時クラスタリング法により, 共通概念を持つ動詞クラスタと同時に, 対応する名詞クラスタが得られるため, 実際の辞書構築において人が語義を理解しやすい形の出力が得られている.

  • Research Products

    (7 results)

All 2009 2008

All Journal Article (2 results) Presentation (5 results)

  • [Journal Article] コーパスにおける語の意味の自動識別2009

    • Author(s)
      白井清昭
    • Journal Title

      国文学解釈と鑑賞 Vol.74, No.1

      Pages: 61-69

  • [Journal Article] 現代日本語書き言葉均衡コーパスを用いた意味解析-語義の自動特定,新語義の発見-2008

    • Author(s)
      奥村学, 白井清昭
    • Journal Title

      言語 Vol.37, No.8

      Pages: 66-73

  • [Presentation] Semi-supervised Clustering for Word Instances and Its Effect on Word Sense Disambiguation2009

    • Author(s)
      Kazunari Sugiyama, Manabu Okumura
    • Organizer
      The 10th International Conference on Inte lligent Text Processing and Computational Linguistics (CICLing 2009)
    • Place of Presentation
      Mexico City
    • Year and Date
      2009-03-05
  • [Presentation] 新語義発見のための用例クラスタと辞書定義文の対応付け2009

    • Author(s)
      田中博貴, 中村誠, 白井清昭
    • Organizer
      第15回言語処理学会年次大会
    • Place of Presentation
      鳥取大学
    • Year and Date
      2009-03-04
  • [Presentation] BCCWJを用いた新しい語義曖昧性解消タスク2009

    • Author(s)
      奥村学, 白井清昭
    • Organizer
      第15回言語処理学会轍大会
    • Place of Presentation
      鳥取大学
    • Year and Date
      2009-03-04
  • [Presentation] 多義性を考慮した同時共起クラスタリングによる動詞の類語抽出2009

    • Author(s)
      高橋秀幸, 竹内孔一
    • Organizer
      電子情報通信学会,言語理解とコミュニケーション研究会
    • Place of Presentation
      倉敷芸文館
    • Year and Date
      2009-01-27
  • [Presentation] Extraction of Verb Synonyms using Co-clustering Approach2008

    • Author(s)
      Koichi Takeuchi
    • Organizer
      Second International Symposium on Universal Communication (ISUC 2008)
    • Place of Presentation
      Osaka International Convention Center.
    • Year and Date
      2008-12-16

URL: 

Published: 2010-06-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi