• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2007 年度 実績報告書

代表性のあるコーパスを利用した日本語意味解析

計画研究

研究領域代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備
研究課題/領域番号 18061003
研究機関東京工業大学

研究代表者

奥村 学  東京工業大学, 精密工学研究所, 准教授 (60214079)

研究分担者 白井 清昭  北陸先端科学技術大学院大学, 情報科学研究科, 准教授 (30302970)
竹内 孔一  岡山大学, 大学院・自然科学研究科, 講師 (80311174)
中村 誠  北陸先端科学技術大学院大学, 情報科学研究科, 助教 (50377438)
高村 大也  東京工業大学, 精密工学研究所, 助教 (80361773)
キーワード語義タグ付コーパス / 機械学習 / 単語の新語義発見 / 語彙概念構造 / クラスタリング
研究概要

本研究課題では,研究項目Aで構築する代表性のあるコーパスを用いた実証研究として,以下の3つの日本語意味解析手法の開発を行う.
1) 機械学習手法に基づく多義性解消手法の開発と,それを用いた代表性のある語義タグ付コーパスの半自動構築
2) 単語の新語義,新用法の自動発見手法の開発
3) 語彙概念構造に基づく動詞の意味構造の自動抽出手法の開発と,それを用いた動詞の述語項構造辞書の自動構築手法の開発
1)では,前年度に開発した多義性解消手法を改良するとともに,その手法を用いた語義タグ付コーパス半自動構築手法の開発を行った.2)では,前年度に開発した単語クラスタリング手法を改良した.有効な特徴ベクトルの要素を検討したり,特徴ベクトルをまとめるクラスタリング手法のいくつかを実験的に比較したりすることにより,手法の精度向上を目指した.3)では,前年度の手法の見直しを行った.また,1),2)における単語の意味分類との対応付けを検討した.語彙概念構造による動詞の意味と,1),2)における単語の語義との対応付けについて,まず人手で分析した.

  • 研究成果

    (2件)

すべて 2008

すべて 学会発表 (2件)

  • [学会発表] 単語の用例の半教師有りクラスタリング2008

    • 著者名/発表者名
      杉山 一成, 奥村 学
    • 学会等名
      情報処理学会自然言語処理研究会
    • 発表場所
      情報通信研究機構
    • 年月日
      2008-03-27
  • [学会発表] 用例のクラスタリング結果を利用した語義曖昧性解消手法2008

    • 著者名/発表者名
      杉山 一成, 奥村 学
    • 学会等名
      言語処理学会第14回年次大会
    • 発表場所
      東京大学
    • 年月日
      2008-03-19

URL: 

公開日: 2010-02-04   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi