2012 年度実績報告書

一度しか出現しない単語の意味推定とその応用に関する研究

研究課題

研究課題/領域番号	22500126
研究機関	金沢大学
研究代表者	佐藤賢二金沢大学, 電子情報学系, 教授 (10215783)
研究期間 (年度)	2010-10-20 – 2013-03-31
キーワード	人工知能 / 自然言語処理 / 画像、文章、音声等認識
研究概要	本研究課題の目的である「一度しか出現しない単語に対する意味推定」を可能にするためには、その周辺に出現する高頻度単語の意味カテゴリを事前に確立した上で、文脈情報を用いて低頻度単語の意味カテゴリを推定するアルゴリズムを開発する必要がある。このような背景のもと、平成２４年度は以下の研究を行った。１．前年度は主語・述語・目的語の関係（SVO）に基づいて単語の意味予測を行った。今年度はこれとは異なる角度、すなわち主語または目的語に含まれる意味的主辞以外の単語を使った意味推定に関する研究を行った。テキストコーパスとして2011年にBioMed Centralで発表された約１万本の論文のフルテキスト情報を用い、約100万個のセンテンスから名詞句を抽出した後、形容詞＋名詞の２ワードから成る名詞句に絞り込み、修飾・被修飾の関係についてクラスタリングを行うことで、意味的に類似した名詞のクラスタが得られることを確認した。さらに、修飾する（あるいは修飾を受ける）単語の種類数と頻度に基づいたスコアを用いることにより、形容詞の意味的決定能を自然に数量化できることを明らかにした。２．前年度に開発したクラスタリングアルゴリズムを改良し、ノイズと外れ値を除去する前処理を加えた。これにより、単語の意味的クラスタリングをさらに高精度に行えることが分かった。
現在までの達成度 (区分)	理由 24年度が最終年度であるため、記入しない。
今後の研究の推進方策	24年度が最終年度であるため、記入しない。

研究成果

(2件)

すべて 2013 2012

すべて学会発表 (2件)

[学会発表] ANALYSIS OF NOUN PHRASES EXTRACTED FROM BIOMEDICAL TEXTS FOR SEMANTIC CATEGORY PREDICTION2013
- 著者名/発表者名
  Kenji Satou
- 学会等名
  The Pacific Symposium on Biocomputing 2013 (PSB2013)
- 発表場所
  Fairmont Orchid, Big Island of Hawaii
- 年月日
  20130103-20130107
[学会発表] 構文情報を用いた名詞の意味推定2012
- 著者名/発表者名
  武田徳明
- 学会等名
  平成24年度電気関係学会北陸支部連合大会
- 発表場所
  富山県立大学
- 年月日
  20120901-20120902