2018 Fiscal Year Annual Research Report
話題が語彙・文法・談話ストラテジーに与える影響の解明
Project/Area Number |
18H00676
|
Research Institution | Kyoto University of Education |
Principal Investigator |
中俣 尚己 京都教育大学, 教育学部, 准教授 (00598518)
|
Co-Investigator(Kenkyū-buntansha) |
山内 博之 実践女子大学, 文学部, 教授 (20252942)
橋本 直幸 福岡女子大学, 国際文理学部, 准教授 (30438113)
建石 始 神戸女学院大学, 文学部, 教授 (70469568)
小口 悠紀子 首都大学東京, 人文科学研究科, 助教 (70758268)
小西 円 東京学芸大学, 留学生センター, 准教授 (60460052)
堀内 仁 国際教養大学, 国際教養学部, 准教授 (40566634)
森 篤嗣 京都外国語大学, 外国語学部, 教授 (30407209)
合田 陽子 (太田陽子) 一橋大学, 国際教育交流センター, 准教授 (20373037)
加藤 恵梨 大手前大学, 現代社会学部, 講師 (70770311)
澤田 浩子 筑波大学, 人文社会系, 准教授 (70379022)
清水 由貴子 聖心女子大学, 現代教養学部, 講師 (60735851)
山本 和英 長岡技術科学大学, 工学研究科, 准教授 (40359708)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | コーパス / 話題 / 特徴語 / 話し言葉 / 関東と関西の対立 |
Outline of Annual Research Achievements |
2018年7月7日に京都教育大学で第1回ミーティングを行い、作業方針を固めた。以下、「新規コーパス構築」「既存コーパス分析」のそれぞれの作業について順番に実績を述べる。 新規コーパス構築では、120ペア、240名の調査協力者を集めることにした。関西60ペア、関東60ペアで、さらに性別でも「男男」「男女」「女女」でバランスをとる。その上で、話題選定班の協力の元、『実践日本語教育スタンダード』を元に15の話題を選定し、各5分ずつの談話を録音することにした。調査に先立ち、協力者への説明や、同意の取り方、さらには指示の出し方など細かいプロトコルを定め、共有した。2018年度は120ペアのうち55ペアの録音を完了し、ほぼ半分の録音が完了した。2019年10月に全作業を完了する予定である。 既存コーパス分析では、名大会話コーパスの全てのファイルを目で読み、『実践日本語教育スタンダード』をベースに話題の分割を行うことにした。プレ調査の結果、各ファイルにつき3名の作業者を当てることが妥当と判断した。分割のための書式を定め、結果を機械分析班が作成したプログラムで加工し、その後対面ですり合わせ作業を行う。全129ファイルを4分割して作業を進めることにした。現在、分割の作業進捗度は75%程度であり、全体の25%については2019年3月にすり合わせの作業を実施した。なお、代表者は全ファイルの作業をすでに終えている。作業の完了は2019年9月の見込みである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
新規コーパス構築は55/120ペア完了しており、45.8%の進捗である。当初から2018年度と2019年度に分けて構築する計画であり、完全に予定通り進捗している。 既存コーパス分割については、すり合わせまで完了したのが25%であるが、個人の作業では完成に近づいている。作業が遅れているのは作業者どうしのすり合わせを対面でやるため、予定の調整が難しいこと、また、30ファイルのすり合わせに15時間と予想以上に時間がかかるためである。しかしながら、これも2019年度前半には完了し、2019年度後半には分析に取り掛かれるため、大きな遅延とは呼べない。
|
Strategy for Future Research Activity |
新規コーパスについては2019年度は録音を完了し、第一次の文字化までを行う。 既存コーパスについては2019年度に前半に分析が完了する予定である。作業でタグ付けを行っている話題は大変細かいため、そのままでは分析できない。まず、話題ごとの語数を計量したり、似ている話題を多変量解析でまとめるといった前処理が必要であるが、この結果自体、「日本人はどんな話題をよく話すのか」といった疑問に対する回答になるため、関連学会などで報告する価値のあるものとなる。その後は、話題ごとの特徴語の抽出を行う他、話題から話題への遷移について、マルコフモデルなどを用いて記述することも考えている。
|
Research Products
(2 results)