研究課題/領域番号 |
16H03426
|
研究機関 | 専修大学 |
研究代表者 |
丸山 岳彦 専修大学, 文学部, 准教授 (90392539)
|
研究分担者 |
相澤 正夫 大学共同利用機関法人人間文化研究機構国立国語研究所, 大学共同利用機関等の部局等, 教授 (80167767)
山崎 誠 大学共同利用機関法人人間文化研究機構国立国語研究所, 大学共同利用機関等の部局等, 教授 (30182489)
山口 昌也 大学共同利用機関法人人間文化研究機構国立国語研究所, 大学共同利用機関等の部局等, 准教授 (30302920)
久能 三枝子 (高田三枝子) 愛知学院大学, 文学部, 准教授 (90468398)
佐野 真一郎 慶應義塾大学, 商学部(日吉), 准教授 (30609615)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | コーパス日本語学 / 話し言葉コーパス / 経年変化 |
研究実績の概要 |
本研究の目的は、昭和期に録音された音声資料を現代の技術によって新たに「昭和話し言葉コーパス」として整備し、その分析結果とともに一般公開することによって、「コーパスに基づく話し言葉の経年変化に関する実証的研究」という、新しい研究領域の方法論を開拓することである。昭和20年代~30年代の録音資料(講演、雑談)を体系的に整理し、種々のアノテーションを施して、50時間分(独話25時間、対話25時間)の「昭和話し言葉コーパス」を構築する。また、現代語の話し言葉コーパスとの比較・対照を通して、音韻・語彙・文法・文体・発話行為などの観点から、話し言葉の経年変化の実態を明らかにする。 平成28年度から30年度にかけて、「録音資料のカタログ作成、メタデータの整備」「転記テキストの作成」「アノテーション」という三段階の工程により、コーパス整備を進めることを計画している。 平成28年度は、録音資料のカタログ作成、メタデータの整備、転記テキストの作成、という三つの作業を実施した。1950年代に国立国語研究所で収集された自然談話の録音資料を取りまとめ、音源資料の一覧を作成した。メタデータの整備は、各音源資料に対して、録音年月日・録音場所・発話者(氏名、性別、年齢、肩書など)を付与していく作業であるが、当時の状況が不明な録音資料も多くあり、順調に進んだとは言えない。また一つの録音資料の中に異なる録音が混在している場合など、当初は想定しなかった問題が見つかった。転記テキストの整備は、音声の書き起こし作業が完了した。ここに時間情報を付与し、有用性の高いデータを作成していくことが、今後の課題となる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成28年度の計画のうち、音声データの文字化については順調に進み、当初の計画よりも速いペースで完了した。一方、メタデータの整備については、録音日や話者についての記録が見つからず、当時の録音状況の詳細が分からない事例が発生したこともあったため、当初の計画からはやや遅れている。
|
今後の研究の推進方策 |
平成28年度に作成が完了した転記テキストに対して、時間情報を付与していく作業を実施する。試行の結果、当初の想定よりも作業時間を多く要することが判明したため、作業者を雇用して作業に当たる予定である。メタデータの整備については、詳細が不明な部分に対してどのような情報を付与するかの検討を踏まえ、より体系的なデータ整備を目指す。
|