研究概要 |
日本語文では,二つの名詞句を「の」で結合した名詞句『NPのNP』が頻出する.このうち,「その人」や「A氏」のような個体を指示する名詞句(T)と「新しい車」や「写真」のような性質を表す名詞句(CN)から構成される名詞句『TのCN』では,二つの名詞句間の意味的な関係は表層的には現れない.T,CNの主辞の名詞をそれぞれn_1,n_2とすると,意味的な関係としては,「その人の新しい車」における『持っている』,「公園のベンチ」における『位置する』などのような,n_1,n_2の荒い意味分類から特定できる一般的な関係の他,「A氏の写真」における『写した』などのn_1やn_2に固有の関係がある.後者の意味関係は,多くの場合n_1あるいはn_2どちらか一方から容易に連想される動詞で表される関係であり,この動詞の候補は,以下のようにして,優先順位付きで求めることができる.すなわち,名詞nから動詞vを連想する連想の強度を条件付確率P(v/n)で定量化し,名詞から動詞を連想する困難さ(連想の不確実さ)をエントロピー H(n)=-Σ__vP(v|n)logP(v|n) で定量化し,n_1,n_2の内,H(n)の小さい方が意味関係を連想する名詞と考え,そのnに対してP(v|n)に応じて候補vを優先付けする.さらに,名詞間の意味関係を表す動詞vは,適当な格助詞c_1,c_2を補った場合,「n_1c_1n_2c_2v」が係り受け制約を満足する(意味の通る)文となる動詞でなければならない. EDRコーパスから抽出した「TのCN」のうち,名詞間の意味関係が名詞固有の意味関係となっているもの369個に対して,名詞固有の意味関係を表す動詞の抽出実験を行ない,そのうち,318個(86%)が,上位20位までに正解の意味関係が抽出されていた.なお,各名詞に対する上記のエントロピーは,EDRコーパスにおける共起関係より求め,係り受け制約はIPAL基本動詞辞書に記載のものを用いた.
|