2006 年度実績報告書

「辞書にない語」の体系的な収集とデータベース化に関する研究

研究課題

研究課題/領域番号	17652051
研究機関	立命館大学
研究代表者	大野裕立命館大学, 理工学部, 教授 (40271407)
キーワード	日本語教育 / 語彙 / 口語的表現 / 自律学習 / e-ラーニング
研究概要	ウェブ上で定期的に随筆的な文章を採取し、形態素解析を行なった上、人手で不適切な解析結果を洗い出し、その中で文字言語でもよく見られる口語的表現や、表記上の口語的なバリエーションを選び出した。既存の辞書の使いにくさの一つの原因である収録語の偏りを補正するための資料を作成した。これにより「柔らかめ」の表現で辞書類に収録されてこなかったものをある程度特定することができた。学内のサーバでこれらの語の辞書を公開し、留学生向けの読解授業での活用を試みた。既存の辞書のもう一つの欠点として、語義解説が実際の用例分布から離れているものが多くあることにも着目したが、この点に関しては人手による作業(辞書に掲載された語義を網羅的に調べ、文脈に適合するかを判断する)の負担が当初の予想をはるかに上回っていたため、体系的な調査を行なうことが不可能であった。研究過程で抽出された語をデータベース化し、その検索をウェブ上で行なうためのインターフェースを構築した。研究代表者の担当する授業で学生(留学生)への利用を促した。データベースの規模、閲覧者の規模ともに小規模であったため、運用面での支障は生じなかったが、聴き取り調査の結果で本格的に有効活用されるためには、データベースの網羅性を格段に高める必要があることが分かった。聴き取り調査では更に、実際の学習の中では単体の電子辞書の利用が群を抜いており、ウェブで(パソコンで)辞書検索できるという特性は、さほど重要視されていないことが確認された。