2009 Fiscal Year Annual Research Report
「非母語話者による日本語話し言葉コーパス」構築の更なる充実と分析・研究
Project/Area Number |
19320077
|
Research Institution | Osaka University |
Principal Investigator |
土岐 哲 Kyoto University of Foreign Studies, 外国語学部, 教授 (10138662)
|
Co-Investigator(Kenkyū-buntansha) |
鹿島 央 名古屋大学, 留学生センター, 教授 (60204377)
中西 久実子 京都外国語大学, 外国語学部, 准教授 (30296769)
山下 洋一 立命館大学, 情報理工学部, 教授 (80174689)
江崎 哲也 山梨大学, 留学生センター, 講師 (40420343)
岡田 祥平 大阪大学, 文学研究科, 助教 (20452401)
|
Keywords | コーパス / 非母語話者 / 音声学 / 日本語教育 / モノローグ / 話し言葉 / 日本語話し言葉コーパス |
Research Abstract |
本研究課題は、前課題*を含めると5年にわたり、日本語非母語話者が産出した日本語音声の実態把握や、中間言語研究、社会言語学的研究等に資するデータとすべく、学習者コーパスを構築してきた。 今年度は、これまでに各種学会等で収録した日本語非母語話者が産出した日本語(自発発話・モノローグ)の音声データに対し、個人情報消去、形態論情報付与、音素ラベル付与を行った。個人情報の消去は、データから個人が特定されないようにするための処理で、音声データと、一旦は書き起こしたデータに対して行った。これは、コーパスを公開する上で欠かせないものである。また、形態論情報に関しては、書き起こしたデータに対して単位境界・代表形・代表表記・品詞・活用の種類・活用形などの情報を『日本語話し言葉コーパス(CSJ)』に準拠して付与した。さらに、音声データと書き起こしたファイル等をもとに、分節音情報を付与した。これらの作業はいずれもデータの正確さを期すため、2重3重のチェックを経た。その後、今年度処理を施したものとこれまでに集積したデータをあわせ、『非母語話者による日本語話し言葉コーパス(CSJ-NNS)ver.2』として発行、頒布した。 また、『非母語話者による日本語話し言葉コーパス』の概要と、それを用いた研究の可能性を示した、土岐・江崎・岡田(2009)「『非母語話者による日本語話し言葉コーパス』の可能性」を執筆し、非母語話者音声研究に新たな視座を提示した。 *:科研費基盤(A)「『非母語話者による日本語話し言葉コーパス』の構築と分析・研究」(研究代表者:土岐哲課題番号17202011)
|
Research Products
(4 results)