研究課題/領域番号 |
14580183
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
科学教育
|
研究機関 | 東京工業大学 |
研究代表者 |
仁科 喜久子 東京工業大学, 留学生センター, 教授 (40198479)
|
研究分担者 |
奥村 学 東京工業大学, 精密工学研究所, 助教授 (60214079)
村岡 貴子 大阪大学, 留学生センター, 教授 (30243744)
綛田 はるみ 東京工業大学, 留学生センター, 客員助教授 (40424840)
|
研究期間 (年度) |
2002 – 2005
|
研究課題ステータス |
完了 (2005年度)
|
配分額 *注記 |
3,600千円 (直接経費: 3,600千円)
2005年度: 800千円 (直接経費: 800千円)
2004年度: 700千円 (直接経費: 700千円)
2003年度: 900千円 (直接経費: 900千円)
2002年度: 1,200千円 (直接経費: 1,200千円)
|
キーワード | 理工系文書 / 共起出現 / 誤用データ / 形態素解析 / 論理展開構造 / コーパス / 中国語母語話者 / 形容動詞 / 中国語母音話者 / 分野別文型特徴 / 日本語学習支援 / シソーラス / 類語 / 誤用コーパス / 語彙運用 / データ中の構文型別頻度 / 統語データベース |
研究概要 |
1.自然言語処理技術利用について 本研究で作成した共起表現検索システムを用いて、主に形容詞、形容動詞と名詞の共起データを新聞10年分とWeb上のテキストから語彙について統計的な情報量計算によって語彙間の共起の妥当性を判断した。 2.解析ツール利用による学習者誤用研究 ・昨年に続いて中国人日本語学習者作文の誤用解析データを収集し、学習者コーパスを作成した。補足データとして国研対訳データベースの日本人母語話者のデータを利用し、母語話者のデータを形態素解析ソフト茶筌にかけ、全ての形態素にタグ(品詞や活用形など)を付与し、その中から対象となるフレーズを抽出して、学習者のフレーズと比較した。 ・上記コーパス中から、特に形容詞、形容動詞と名詞の共起に注目して、誤用と正用に振り分け、それぞれの特徴から誤用の傾向を検討した結果、中国語母語話者においては、漢語系形容動詞を多用することから誤用も多いことが明らかになった。また日本語における形容詞、形容動詞の本質的な性質について考察も行った。 3.理工系論文作成形式の分析について 上記の語彙レベルでの作文支援は自然言語処理利用による教育的な利用の実現性がみえてきた。しかしながら、作文支援システムの全体像としては、文章構成への視点が必要である。今年度は、理系日本語学習者にとっての理工系論文の論理展開構造を示すべきであると考え、農学系、工学系論文の緒言に焦点を絞り、モデル化を試みた。また論文作成に関する概念形成を促進するために日本語に対する論文スキーマ提示を提案することで、自然言語処理利用の作文支援システムの今後の指針を得た。
|