2003 Fiscal Year Annual Research Report
自然言語処理技術を用いた理工系日本語作文支援に関する基礎的研究
Project/Area Number |
14580183
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
仁科 喜久子 東京工業大学, 留学生センター, 教授 (40198479)
|
Co-Investigator(Kenkyū-buntansha) |
綛田 はるみ 東京工業大学, 留学生センター, 客員助教授 (40424840)
村岡 貴子 大阪大学, 留学生センター, 教授 (30243744)
奥村 学 東京工業大学, 精密工学研究所, 助教授 (60214079)
|
Keywords | 理工系文書 / 分野別文型特徴 / 日本語学習支援 / シソーラス / 形態素解析 / 類語 / データ中の構文型別頻度 / 統語データベース |
Research Abstract |
本年度は,ある語と共起しそうで共起しない単語(他の類語では使うがその語と一緒に使うと誤用となる単語),類語では用いられるがその語では用いられない用法・文構造,ある語と特徴的に結びつく単語(他の類語では使わないがその語とは共起する単語),他の類語では用いられないがその語では用いられる用法・構造を学習者および教師に提示するシステムを構築した.コーパスとして,新聞10年分を構文解析器CaboChaでタグ付けしたものを用いた.このコーパスから,分類語彙表の名詞エントリに関して,共起する動詞,形容詞の頻度を学習し,頻度,MI値,t値をデータベース化した.また,当該名詞が関係する,複合語,接頭辞,接尾辞に関しても同様にデータベース化した.これらのデータベースをWeb上から容易に利用できるようにした.システムには2つの使い方がある.まず,名詞を2つ入力すると,システムは,それらの共起関係の共通点と差異を表示する.次に,名詞を一語入力すると,システムは,その語の主な共起関係を表示すると同時に,用法がある程度以上似ている類語を呈示する.類語は,学習者にとって有用な類語のみを表示するため(ある程度以上使い方が似ているものを選ぶため),分類語彙表に属する類語群の中から,共通する共起語の多いものを選ぶことにより絞り込み,平均2.8の類語を得た.ユーザはこれらの類義語をクリックすることにより,システムの第一の機能である2語の比較機能を用いることができる.
|
Research Products
(3 results)
-
[Publications] 戸次徳久, 仁科喜久子: "名詞の類語に関する情報の抽出に関する検討--名詞-述語関係,生産性を中心に"日本語教育方法研究会誌. 10-2. 28-29 (2003)
-
[Publications] 阿辺川武, 八木豊, 戸次徳久, 杉本茂樹, 傅亮, 仁科喜久子, 奥村学: "日本語学習支援システム「あすなろ」開発の新しい展開--構文学習とその評価--"情報処理学会第65回全国大会論文集. 3T6-2 (2003)
-
[Publications] 村岡貴子, 仁科喜久子, 深尾百合子, 因京子: "種々の理系分野における留学生の学位論文使用言語-日本語論文作成指導のための基礎調査-"専門日本語研究会予稿集. 9-9 (2003)