自動獲得した世界知識に基づく自然言語テキスト中の関連性認識

研究課題

研究課題/領域番号	06J11710
研究種目	特別研究員奨励費
配分区分	補助金
応募区分	国内
研究分野	知能情報学
研究機関	東京大学
研究代表者	笹野遼平東京大学, 大学院・情報理工学系研究科, 特別研究員(DC1)
研究期間 (年度)	2006 – 2008
研究課題ステータス	完了 (2008年度)
配分額 *注記	2,800千円 (直接経費: 2,800千円) 2008年度: 900千円 (直接経費: 900千円) 2007年度: 900千円 (直接経費: 900千円) 2006年度: 1,000千円 (直接経費: 1,000千円)
キーワード	自然言語処理 / 照応解析 / 省略解析 / 固有表現認識 / 格フレーム / 大規模コーパス / 固有表現抽出 / 格フレーム構築 / ゼロ照応解析 / 自然言語 / 共参照解析 / 形態素解析
研究概要	日本語テキスト中の照応現象の解析を目的とし、固有表現認識の高精度化、照応解析に必要な知識の自動獲得、および、自動獲得した知識を用いて照応現象を解析する手法を提案し、実験によりその有効性を示した。本年度は特に、大規模テキストからの照応・省略解析に必要となる知識の自動獲得、および、大域的情報を用いた高精度な固有表現認識という昨年度までの研究成果に基づき、大規模テキストから自動獲得した用言格フレーム、名詞格フレームを用い、省略・橋渡し指示を確率的に解析するモデルを提案した。提案モデルでは、まず、テキスト中に出現した談話要素の認識を行い、すべてのテキスト中の表現を認識された談話要素に関連付けている。その上で、格フレームを用いてゼロ代名詞の検出を行い、さらに、格フレームや表層格、出現位置に関する選好を確率的に評価し、談話要素の中から適切な先行詞を決定している。WEBコーパスを用いた実験の結果、従来手法と比べて十分な精度を達成しており、提案モデルが省略・橋渡し指示現象を適切にモデル化できていることを確認した。さらに、談話解析における格フレーム構築に用いるコーパスサイズの影響の調査を行った。この調査のために、160万文から16億文までの6種類の異なるサイズのコーパスから用言格フレームの構築を行い、構築された6つの格フレームを構文・格解析、省略解析に適用している。構文・格解析実験、省略解析実験の結果、より大規模なコーパスを用いることにより、これらの解析の精度が向上すること、および、さらに大規模なコーパスを用いることにより、さらなる精度の向上が望まれることを示した。

報告書

(3件)

研究成果

(6件)

すべて 2008

すべて雑誌論文 (2件) (うち査読あり 2件) 学会発表 (4件)

[雑誌論文] 自動獲得した名詞関係辞書に基づく共参照解析の高度化2008
- 著者名/発表者名
  笹野遼平
- 雑誌名
  
  自然言語処理 15(5)
  
  ページ: 99-118
- NAID
  10024449000
- 関連する報告書
  2008 実績報告書
- 査読あり
[雑誌論文] 大域的情報を用いた日本語固有表現認識2008
- 著者名/発表者名
  笹野遼平
- 雑誌名
  
  情報処理学会論文誌 49(11)
  
  ページ: 3765-3776
- NAID
  40019554496
- 関連する報告書
  2008 実績報告書
- 査読あり
[学会発表] A Fully-Lexicalized Probabilistic Model for Japanese Zero Anaphora Resolution2008
- 著者名/発表者名
  Ryohei Sasano
- 学会等名
  22nd International Conference on Computational Linguistics (Coling 2008)
- 発表場所
  Manchester, UK
- 年月日
  2008-08-18
- 関連する報告書
  2008 実績報告書
[学会発表] コーパスサイズの拡大および用例の汎化による格フレームのカバレッジの改善2008
- 著者名/発表者名
  笹野遼平, 河康大輔, 黒橋禎夫
- 学会等名
  言語処理学会第14回年次大会
- 発表場所
  東京
- 年月日
  2008-03-19
- 関連する報告書
  2007 実績報告書
[学会発表] 分布類似度を用いた大規模格フレームの自動構築2008
- 著者名/発表者名
  濱田慧, 笹野遼平, 柴田知秀, 河原大輔, 黒橋禎夫
- 学会等名
  言語処理学会第14回年次大会
- 発表場所
  東京
- 年月日
  2008-03-19
- 関連する報告書
  2007 実績報告書
[学会発表] Japanese Named Entity Recognition Using Structural Natural Language Processing2008
- 著者名/発表者名
  Ryohei Sasano, Sadao Kurohashi
- 学会等名
  Third International Joint Conferenceon Natural Language Processing, (IJCNLP2008)
- 発表場所
  Hyderabad,India
- 年月日
  2008-01-09
- 関連する報告書
  2007 実績報告書

自動獲得した世界知識に基づく自然言語テキスト中の関連性認識

研究代表者

笹野 遼平 東京大学, 大学院・情報理工学系研究科, 特別研究員(DC1)

2,800千円 (直接経費: 2,800千円)

報告書

研究成果

[雑誌論文] 自動獲得した名詞関係辞書に基づく共参照解析の高度化2008

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] 大域的情報を用いた日本語固有表現認識2008

著者名/発表者名

雑誌名

NAID

関連する報告書

[学会発表] A Fully-Lexicalized Probabilistic Model for Japanese Zero Anaphora Resolution2008

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] コーパスサイズの拡大および用例の汎化による格フレームのカバレッジの改善2008

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 分布類似度を用いた大規模格フレームの自動構築2008

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Japanese Named Entity Recognition Using Structural Natural Language Processing2008

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

笹野遼平東京大学, 大学院・情報理工学系研究科, 特別研究員(DC1)