2005 Fiscal Year Annual Research Report
自然言語処理技術を用いた理工系日本語作文支援に関する基礎的研究
Project/Area Number |
14580183
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
仁科 喜久子 東京工業大学, 留学センター, 教授 (40198479)
|
Co-Investigator(Kenkyū-buntansha) |
奥村 学 東京工業大学, 精密工学研究所, 助教授 (60214079)
村岡 貴子 大阪大学, 留学生センター, 教授 (30243744)
|
Keywords | 理工系文書 / 共起出現 / 誤用データ / 形態素解析 / 論理展開構造 / コーパス / 中国語母音話者 / 形容動詞 |
Research Abstract |
1.自然言語処理技術利用について 本研究で作成した共起表現検索システムを用いて、主に形容詞、形容動詞と名詞の共起データを新聞10年分とWeb上のテキストから語彙について統計的な情報量計算によって語彙間の共起の妥当性を判断した。 2.解析ツール利用による研究 ・昨年に続いて中国人日本語学習者作文の誤用解析データを収集し、学習者コーパスを作成した。補足データとして国研対訳データベースの日本人母語話者のデータを利用し、母語話者のデータを形態素解析ソフト茶筌にかけ、全ての形態素にタグ(品詞や活用形など)を付与し、その中から対象となるフレーズを抽出して、学習者のフレーズと比較した。 ・上記コーパス中から、特に形容詞、形容動詞と名詞の共起に注目して、誤用と正用に振り分け、それぞれの特徴から誤用の傾向を検討した結果、中国語母語話者においては、漢語系形容動詞を多用することから誤用も多いことが明らかになった。また日本語における形容詞、形容動詞の本質的な性質について考察も行った。 3.理工系論文作成形式の分析について 上記の語彙レベルでの作文支援は自然言語処理利用による教育的な利用の実現性がみえてきた。しかしながら、作文支援システムの全体像としては、文章構成への視点が必要である。今年度は、理系日本語学習者にとっての理工系論文の論理展開構造を示すべきであると考え、農学系、工学系論文の緒言に焦点を絞り、モデル化を試みた。また論文作成に関する概念形成を促進するために日本語に対する論文スキーマ提示を提案することで、自然言語処理利用の作文支援システムの今後の指針を得た。
|
Research Products
(7 results)