2002 Fiscal Year Annual Research Report
自然言語処理技術を用いた理工系日本語作文支援に関する基礎的研究
Project/Area Number |
14580183
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
仁科 喜久子 東京工業大学, 留学生センター, 教授 (40198479)
|
Co-Investigator(Kenkyū-buntansha) |
綛田 はるみ 東京工業大学, 留学生センター, 客員助教授 (40424840)
村岡 貴子 大阪大学, 留学生センター, 助教授 (30243744)
奥村 学 東京工業大学, 精密工業研究所, 助教授 (60214079)
|
Keywords | 理工系文書 / 分野別文型特徴 / 日本語学習支援 / シソーラス / 形態素解析 / 類語 / データ中の構文型別頻度 / 統語データベース |
Research Abstract |
本年度は、文の骨格は正しいが、適切な語を用いていないために、どこか不自然な文を作ってしまうことのある日本語上級者の文章作成を支援するため、形容詞の選択について研究した。学習者は、適切な語を選択する際に、母語-日本語辞書や類語辞書を用いることができるが、それらは、実際の文章運用をすべて網羅するものではない。辞書では、用法の説明や例文に限りがある一方で、候補となる単語が多すぎて、しばしば、最適な語を絞り込めないことが起きてしまう。学習者に課題を与えるのではなく、自由な文章入力に対して、その文章での語の運用を考え、不自然な部分があれば、適切な語を呈示する試作システムを開発した。システムは、OSにLINUXを用い、WWW上に実装した。システムの概略は、フォームに文章を入力すると、用いられている語が適切かどうかを判断し、より適した語があれば修正候補として挙げ、画面に表示するというものである。システム内部では、まず、フォームに入力された文章を受け取り、それを1文づつに分解する。そして、それぞれ1文ごとに、形態素解析を行う。それにより得られた結果を構文解析する。こうして得られた文の掛かり受け構造の中から形容詞を含む関係を抽出している。次に修正候補の形容詞を概念シソーラス及び統語関係データベースから得る。得られた修正候補と入力形容詞を、シソーラスを用いてデータを補いつつ当該の関係に関して統語関係データベースに問い合わせる。そして、得られた(1)構文に関する頻度、(2)単語同士の頻度、(3)シソーラスを用いた回数、(4)用いた語のシソーラスにおける当該語からの距離、の4点から、それぞれの形容詞に関して得点を与え、適切性の判定を行っている。そして、この得点に従って結果を出力している。また、理工系文書解析のための統語関係データベースを構築した。研究成果は国内では日本語教育学会、海外では米国での国際会議で発表した。
|
Research Products
(5 results)
-
[Publications] 阿辺川武, 八木豊, 戸次徳久, 杉本茂樹, 傳亮, 仁科喜久子, 奥村学: "日本語学習支援システム「あすなろ」開発の新しい展開・・構文学習とその評価・・"情報処理学会第65回全国大会論文集. 3T6-2 (2002)
-
[Publications] 村岡貴子, 仁科喜久子, 深尾百合子, 因京子: "種々の理系分野における留学生の学位論文使用言語-日本語論文作成指導のための基礎調査-"専門日本語研究会予稿集. 9-9 (2003)
-
[Publications] 戸次徳久, 仁科喜久子: "機能語の抽出ツールの開発"日本語教育方法研究会誌. 9-1. 10-11 (2002)
-
[Publications] 村岡貴子, 仁科喜久子, 因京子, 深尾百合子: "専門日本語教育の現状と将来の方向"日本語教育. 112. 82-82 (2002)
-
[Publications] Totsugi Norihisa, Nishina Kikuko: "Development of a System for Composition in Japanese Utilising the Dependency Structure Analyser・・Focusing on Adjectives"Castel/J 2002 Proceedings-The Third International Conference on Computer Assisted Systems For Teaching &. 67-70 (2002)