研究概要 |
本年度は,ある語と共起しそうで共起しない単語(他の類語では使うがその語と一緒に使うと誤用となる単語),類語では用いられるがその語では用いられない用法・文構造,ある語と特徴的に結びつく単語(他の類語では使わないがその語とは共起する単語),他の類語では用いられないがその語では用いられる用法・構造を学習者および教師に提示するシステムを構築した.コーパスとして,新聞10年分を構文解析器CaboChaでタグ付けしたものを用いた.このコーパスから,分類語彙表の名詞エントリに関して,共起する動詞,形容詞の頻度を学習し,頻度,MI値,t値をデータベース化した.また,当該名詞が関係する,複合語,接頭辞,接尾辞に関しても同様にデータベース化した.これらのデータベースをWeb上から容易に利用できるようにした.システムには2つの使い方がある.まず,名詞を2つ入力すると,システムは,それらの共起関係の共通点と差異を表示する.次に,名詞を一語入力すると,システムは,その語の主な共起関係を表示すると同時に,用法がある程度以上似ている類語を呈示する.類語は,学習者にとって有用な類語のみを表示するため(ある程度以上使い方が似ているものを選ぶため),分類語彙表に属する類語群の中から,共通する共起語の多いものを選ぶことにより絞り込み,平均2.8の類語を得た.ユーザはこれらの類義語をクリックすることにより,システムの第一の機能である2語の比較機能を用いることができる.
|