2012 年度実績報告書

自然言語処理における全体最適化のための大規模・超並列処理

研究課題

研究課題/領域番号	23700177
研究機関	奈良先端科学技術大学院大学
研究代表者	小町守奈良先端科学技術大学院大学, 情報科学研究科, 助教 (60581329)
キーワード	自然言語処理 / 知識獲得 / 情報抽出 / 単語クラスタリング
研究概要	本年度も研究目的の (1) に示した超大規模多クラス意味カテゴリ獲得の研究を継続した。具体的には Basilisk (Thelen and Riloff 2002) を実装し、Pennacchiotti and Pantel (2009) の実験設定に従い、Wikipedia 英語版のデータを用いて競合するカテゴリのパターンやインスタンスを用いた知識獲得の評価を行なった。実験の結果、複数のクラスからの意味カテゴリ獲得を同時に (排他的に) 行なうことによって、個々のクラスの意味カテゴリ獲得性能が向上することが示された。また、理論的分析としては Wei Liu and Shih-Fu Chang. Robust Multi-Class Transductive Learning with Graphs. CVPR 09. と同様の分析が可能であることが分かった。また、研究目的 (2) に関して、本年度は単語クラスタリングに関する調査を継続した。英語テキストに対して Brown Clustering を実行し、動詞と係り受け関係にある名詞に対するクラスを用いた教師あり学習によって、英語の動詞誤り検出・訂正タスクにおけるデータスパースネスの問題の解消に取り組んだ。研究成果は言語処理学会年次大会で発表するとともに、査読あり国際会議に投稿した。また、GPGPU を活用した自然言語処理の一分野として深層学習 (deep learning) について調査した。

研究成果
(1件)

すべてその他

すべて学会発表 (1件)

[学会発表] 学習者の誤り傾向を反映した英語動詞選択誤りへの訂正候補推薦
- 著者名/発表者名
  澤井悠, 小町守, 松本裕治
- 学会等名
  言語処理学会第19回年次大会
- 発表場所
  名古屋大学