• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

多義語を考慮した単語間の共起性の測定

研究課題

研究課題/領域番号 08780327
研究種目

奨励研究(A)

配分区分補助金
研究分野 知能情報学
研究機関茨城大学

研究代表者

新納 浩幸  茨城大学, 工学部, 助手 (10250987)

研究期間 (年度) 1996
研究課題ステータス 完了 (1996年度)
配分額 *注記
900千円 (直接経費: 900千円)
1996年度: 900千円 (直接経費: 900千円)
キーワードコーパス / 慣用表現 / 定型表現 / 知識獲得
研究概要

本研究の目的は,ある単語どうしがどの程度強い結び付き(共起性)を持つかを単語の語義まで考慮して測定する方法を提案することであった.本研究を遂行する上で最も困難な点は多義語の語義を推定する処理にある.本年度はこの点に対してコーパスから得られた大量の係り受けデータと,既存のシソ-ラスを用いることで,語義を推定することを試み,その結果を利用した共起性の測定を行なった.この結果に関する学会発表も行なった.
処理の概略を述べる.まずコーパスから実際に現れた名詞と動詞の大量の共起データを収集する.次に共起データのすべての名詞に対して,分類語彙表から各名詞の語義を割り当てる.これによって,[(名詞の語義),R,V]のデータが得られる.ここでVは動詞,Rは格助詞を表す.ここである名詞が多義である場合が問題であるが,多義でない[(名詞の語義),R,V]も多数得られているために,この部分の(名詞の語義)の分布状況から,先の多義である名詞がこの動詞に対してどの語義であるかが推定できる.
ランダムサンプルによる評価では,約7割の正解率を得ている.また分類語彙表における語義では語義が荒過ぎる点と,不足語義が多数ある点が判明した.これらに対する対処についても研究発表を行なった.

報告書

(1件)
  • 1996 実績報告書
  • 研究成果

    (2件)

すべて その他

すべて 文献書誌 (2件)

  • [文献書誌] H.Shinnou: "Redefining similarity in a thesaurus by using corpora" Proc.of COLING-96. 1131-1135 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] H.Shinnou: "Finding a Deficiency of a Meaning in a Bunrui-goi-hyon Entry by Using Copora" Proc.of PACLIC-11. 177-186 (1996)

    • 関連する報告書
      1996 実績報告書

URL: 

公開日: 1996-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi