1997 Fiscal Year Annual Research Report
日本語学習者の作文コーパス:電子化による共有資源化
Project/Area Number |
08558020
|
Research Institution | Nagoya University |
Principal Investigator |
大曾 美恵子 名古屋大学, 言語文化部, 教授 (30262918)
|
Co-Investigator(Kenkyū-buntansha) |
小森 早江子 中部大学, 国際関係学部, 助教授 (60221248)
外池 俊幸 名古屋大学, 言語文化部, 助教授 (80180157)
杉浦 正利 名古屋大学, 言語文化部, 助教授 (80216308)
白井 英俊 中京大学, 情報科学部, 助教授 (10134462)
市川 保子 九州大学, 留学生センター, 教授 (70223089)
|
Keywords | 日本語学習者 / 作文 / 誤用 / CHILDES |
Research Abstract |
二年目の今年は昨年に引き続き、作文データの入力を行った。コーパスの構築には昨年書き言葉研究用にいくつかの修正を加えたCHILDESのCHATフォーマットである。入力の段階で更にいくつかの問題点が明らかになり、それに対処すべくフォーマットを改正、整備していった。 次にデータ分析をどのようなフォーマットで記述するかに関して全員で検討した。当初、誤用環境の記述、誤用と見なされる理由、誤用自体の記述、誤用の修正と4つに分けて記述する案を試行したが、入力者にかかる負担が大きく、記述の均一性の維持が難しいことが判明した。そこで方針を変更し、誤用と見なされる理由を自然言語で入力してもらうことにした。しかし、後でキーワード検索がスムーズに行くよう、必要と思われる用語のリストを入力者に配布し、できるだけそれらの用語を使って理由を記述してもらいたい旨、依頼した。分析の入ったデータも徐々に増えてきているので、今後その分析をコンピュータで処理し、誤用の記述に必要なラベルを決定する予定である。 また、上記作業と並行して、公開可能な作文データを収集するため、日本語学習者及び、日本語母語話者が情報の交換に使っているメーリングリスト「すばる」を使うことにし、参加者にメールをデータとして使用することを了承する旨の文書に署名してもらった。これらのメールの分析も進みつつある。 先行研究となる『日本語の普遍性と個別性に関する理論的及び実証的研究』(1985-89年度代表者井上和子)の一環たる「外国人学習者の日本語誤用例の収集・整理と分析」(分担社寺村秀夫)のデータをワークステーションに載せ、研究用として公開する許可も得たので、申し込み者には3月中に公開する予定である。
|
Research Products
(5 results)
-
[Publications] 杉浦正利: "「日本語学習者の作文コーパス:電子化による共有資源化」" 言語処理学会第3回年次大会発表論文集. 541-544 (1997)
-
[Publications] 小森早江子: "オンラインデジタル動画漢字学習支援システム" 情報処理学会研究報告97-CH-36. 97・108. 49-54 (1997)
-
[Publications] 大曽美恵子: "「じゃないか」のアクセントとイントネーション" 日本語教育論文集-小出詞子先生退職記念-. 195-203 (1997)
-
[Publications] 市川保子: "接読詞と外国人学習者の誤用" 九州大学留学生センター紀要. ・9. (1998)
-
[Publications] Tonoike,Toshiyuki: "A semantic analysis of hierarchical clause structure injury" Topics in Constraint-Based Grammar of Japanese. 219-251 (1998)