今年度は、1) 国際シンポジウム「日本語及びアジア諸言語における複合動詞・複雑動詞の謎」(国立国語研究所)への参加、2) テキストデータからの複合動詞の抽出を行うプログラムの実装、を行った。 1)では、日本語とその他のアジア諸言語における複合動詞の基本的性質についての知見を深め、参加した他の研究者との交流からデータベース構築に当たってどのような情報が必要になるかを考察することができた。また、2)については、「Webデータに基づく複合動詞データベース」の構築方法(山口昌也 2013)を参考にした。このプログラムによって、複数のテキストデータから複合動詞の形式、それを含む文、および、格要素をデータ化することができた。 その一方で、今後解決すべき課題が多く残されていることも判明した。受身形や使役形については、結局適切な検索方法を開発することができなかった。また、意味情報との関連づけについてもほぼ着手できずに終わった。格要素の出現パターンと意味の間には一定の関係があると考えられ、その関係を明らかにすることで有益なデータが得られることが予測されるが、市販の日本語の辞書の記述は意味と格要素の関連がほとんど記述されていないため、その関連づけを明らかにするのが困難である。『日本語基本動詞用法辞典』のような格要素が明確に記述された辞書の利用を含めた検討が必要である。また、コンピューターの扱いにあまり詳しくない研究者や日本語学習者も利用できる簡便なシステムの開発も十分に達成できなかった。
|