研究概要 |
本研究の目的は,ある単語どうしがどの程度強い結び付き(共起性)を持つかを単語の語義まで考慮して測定する方法を提案することであった.本研究を遂行する上で最も困難な点は多義語の語義を推定する処理にある.本年度はこの点に対してコーパスから得られた大量の係り受けデータと,既存のシソ-ラスを用いることで,語義を推定することを試み,その結果を利用した共起性の測定を行なった.この結果に関する学会発表も行なった. 処理の概略を述べる.まずコーパスから実際に現れた名詞と動詞の大量の共起データを収集する.次に共起データのすべての名詞に対して,分類語彙表から各名詞の語義を割り当てる.これによって,[(名詞の語義),R,V]のデータが得られる.ここでVは動詞,Rは格助詞を表す.ここである名詞が多義である場合が問題であるが,多義でない[(名詞の語義),R,V]も多数得られているために,この部分の(名詞の語義)の分布状況から,先の多義である名詞がこの動詞に対してどの語義であるかが推定できる. ランダムサンプルによる評価では,約7割の正解率を得ている.また分類語彙表における語義では語義が荒過ぎる点と,不足語義が多数ある点が判明した.これらに対する対処についても研究発表を行なった.
|