2008 年度自己評価報告書

代表性のあるコーパスを利用した日本語意味解析

計画研究

研究領域	代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備
研究課題/領域番号	18061003
研究種目	特定領域研究
配分区分	補助金
審査区分	人文・社会系
研究機関	東京工業大学
研究代表者	奥村学東京工業大学, 精密工学研究所, 准教授 (60214079)
研究期間 (年度)	2006 – 2010
キーワード	語義タグ付コーパス / 単語の新語義発見 / 機械学習 / 語彙概念構造 / クラスタリング
研究概要	日本語を対象にした言語処理研究では, 形態素解析, 構文解析について研究が進み, 高精度なツールの開発も行われてきており, それらのツールが日本語学, 日本語教育など他の研究分野でも広く利用されるようになってきている. その一方で, 意味解析については依然研究が遅れており, 一般に利用可能なツールの開発レベルにまで解析精度が到達していない. また, 代表性, 継時性のあるコーパスを用いた言語処理研究は, これまでそのようなコーパスが存在しなかったため, 日本語に関してはまったく行われてこなかったと言って良い. そこで本研究課題では, 研究項目A で構築する代表性, 継時性のあるコーパスを用いた実証研究を行う. 具体的には, 以下の3つを柱とした日本語意味解析手法の開発を行う. (1)機械学習に基づく多義性解消手法の開発とそれを用いた代表性のある語義タグ付コーパスの半自動構築タグ付コーパスから学習した多義性解消システムによりタグ付コーパス作成コストの軽減を図るとともに, 作成されたコーパスを用いてbootstrap的に多義性解消システムの性能向上を図る. (2)単語の新語義, 新用法の自動発見手法の開発時を経るにしたがって単語の意味は変化し, 新しい意味が生まれることが知られている. 継時性のあるコーパスで顕著に見られるこの言語現象を自動的に発見する手法を開発する. (3)語彙概念構造に基づく動詞の意味構造の自動抽出手法の開発と, それを用いた動詞の述語項構造辞書の自動構築手法の開発語彙概念構造は動詞の振る舞いに関する分析から動詞の意味をそれが取る名詞同士の意味関係で記述する言語学に基づく意味構造である. 文の意味構造は, (1)で特定される単語の語義と(3)で抽出される意味構造の統合により得ることができる.

研究成果
(6件)

すべて 2009 2008 2007 その他

すべて雑誌論文 (2件) 学会発表 (3件) 備考 (1件)

[雑誌論文] コーパスにおける語の意味の自動識別2009
- 著者名/発表者名
  白井清昭
- 雑誌名
  
  国文学解釈と鑑賞 Vol. 74, No. 1
  
  ページ: 61-69
[雑誌論文] 現代日本語書き言葉均衡コーパスを用いた意味解析-語義の自動特定, 新語義の発見-2008
- 著者名/発表者名
  奥村学, 白井清昭
- 雑誌名
  
  言語 Vol.37,No.8
  
  ページ: 66-73
[学会発表] Manabu Okumura, Semi-supervised Clustering for Word Instances and Its Effect on Word Sense Disambiguation2009
- 著者名/発表者名
  Kazunari Sugiyama
- 学会等名
  The 10th International Conference on Intelligent Text Processing and Computational Linguistics(CICLing 2009)
- 発表場所
  Mexico City
- 年月日
  2009-03-05
[学会発表] Extraction of Verb Synonyms using Co-clustering Approach2008
- 著者名/発表者名
  Koichi Takeuchi
- 学会等名
  Second International Symposium on Universal Communication(ISUC 2008)
- 発表場所
  Osaka
- 年月日
  20081215-16
[学会発表] Personal Name Disambiguation in Web Search Results Based on a Semi-Supervised Clustering Approach2007
- 著者名/発表者名
  Kazunari Sugiyama, Manabu Okumura
- 学会等名
  Proc. of the 10th International Conference on Asian Digital Libraries, Lecture Notes in Computer Science(LNCS)(Springer Verlag)
- 発表場所
  Hanoi
- 年月日
  20071210-13
[備考] ホームページ
- URL
  http://oku-gw.pi.titech.ac.jp/wsd.html

2008 年度 自己評価報告書

代表性のあるコーパスを利用した日本語意味解析

研究代表者

奥村 学 東京工業大学, 精密工学研究所, 准教授 (60214079)

研究成果

[雑誌論文] コーパスにおける語の意味の自動識別2009

著者名/発表者名

雑誌名

[雑誌論文] 現代日本語書き言葉均衡コーパスを用いた意味解析-語義の自動特定, 新語義の発見-2008

著者名/発表者名

雑誌名

[学会発表] Manabu Okumura, Semi-supervised Clustering for Word Instances and Its Effect on Word Sense Disambiguation2009

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Extraction of Verb Synonyms using Co-clustering Approach2008

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Personal Name Disambiguation in Web Search Results Based on a Semi-Supervised Clustering Approach2007

著者名/発表者名

学会等名

発表場所

年月日

[備考] ホームページ

URL

2008 年度自己評価報告書

奥村学東京工業大学, 精密工学研究所, 准教授 (60214079)