研究分担者 |
白井 清昭 北陸先端科学技術大学院大学, 情報科学研究科, 准教授 (30302970)
竹内 孔一 岡山大学, 大学院・自然科学研究科, 講師 (80311174)
中村 誠 北陸先端科学技術大学院大学, 情報科学研究科, 助教 (50377438)
高村 大也 東京工業大学, 精密工学研究所, 助教 (80361773)
|
研究概要 |
本研究課題では, 研究項目Aで構築する代表性のあるコーパスを用いた実証研究として, 以下の3つの日本語意味解析手法の開発を行う. 1)機械学習手法に基づく多義性解消手法の開発と, それを用いた代表性のある語義タグ付コーパスの半自動構築 2)単語の新語義, 新用法の自動発見手法の開発 3)語彙概念構造に基づく動詞の意味構造の自動抽出手法の開発と, それを用いた動詞の述語項構造辞書の自動構築手法の開発 1)では, 語義タグ付け支援, 新語義候補の検出, 多義性解消システムの性能改善を目的として, クラスタリング時に, 教師情報を部分的に利用する半教師ありクラスタリング手法を開発している. 今年度は代表性のあるコーパスでは不可欠となる異ジャンルコーパスへの対応を実現した. 2)では, 昨年度までに開発した単語クラスタリング手法を元に, クラスタと既存の辞書の意味とを対応付けることにより, クラスタ中の用例がどのような意味を持つのか, あるいは既存の辞書にない新語義であるのかを決定する手法を開発した. 3)では, 動詞の語義を決定する要因として係り関係にある名詞との組み合わせが重要であることから, 動詞と係り名詞を同時にクラスタリングしながら, 大規模テキストから動詞の共通概念を自動取得する方法を開発した. 同時クラスタリング法により, 共通概念を持つ動詞クラスタと同時に, 対応する名詞クラスタが得られるため, 実際の辞書構築において人が語義を理解しやすい形の出力が得られている.
|