2018 Fiscal Year Annual Research Report
Corpus based analysis of semantic features of compound verbs and their synonymous expressions
Project/Area Number |
16K02727
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
神崎 享子 豊橋技術科学大学, 情報メディア基盤センター, 特任准教授 (00450693)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 複合動詞 / 類義表現 |
Outline of Annual Research Achievements |
複合動詞は、類義表現として単純動詞だけではなく、句とも対応することがある。本研究では類義表現語句をコーパスから抽出し、複合動詞の類義表現の特徴を分析した。また国立国語研究所発行の『分類語彙表』の意味体系と関連付けを行った。 対象にする複合動詞は、国立国語研究所の『複合動詞レキシコン』に収録されている語である。コーパスから類義表現語句を自動抽出したのは収録されている約2700語の複合動詞に対してであるが、『分類語彙表』と対応付けしたのは高頻度に使用される400語である。 コーパスから深層学習のword2vecやコサイン類似度という尺度で複合動詞の類義表現をとり、多義的な類義表現を分類するためにクラスタリング手法(k-means++)と主成分分析の手法を用いて、各複合動詞ごとに多義に分類された類義表現語句を出力し結果を人手で精査した。その際、評価基準となったのは『複合動詞レキシコン』である。複合動詞の類義表現抽出や複合動詞の意味的特徴については、LREC2018とAPCLC2018の査読付き会議において発表した。 本研究では高頻度400語の複合動詞の類義表現について合計2690語の類義表現語句を得、複合動詞の意味はたとえば「立ち寄る」は「ちょっと寄る」「ちらっと寄る」など副詞との関係や、「突き破る」は「破って飛び出す」のようにテ形連続の句の形とも関係があるが、さらに感性的な意味合いとも関係が深いことがわかった。 また、類義表現の中で、分類語彙表の意味体系と1対1で対応した語は962語/2690語(35%)、類義語が複数の意味項目と一致しているのが588語/2690語(21%)であった。現段階では句は対応付けられなかった。対応付けられなかった句は1140語/2690語(42%)であった。
|