2019 Fiscal Year Annual Research Report
「昭和話し言葉コーパス」の構築による話し言葉の経年変化に関する実証的研究
Project/Area Number |
16H03426
|
Research Institution | Senshu University |
Principal Investigator |
丸山 岳彦 専修大学, 文学部, 教授 (90392539)
|
Co-Investigator(Kenkyū-buntansha) |
山崎 誠 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (30182489)
山口 昌也 大学共同利用機関法人人間文化研究機構国立国語研究所, 音声言語研究領域, 准教授 (30302920)
佐野 真一郎 慶應義塾大学, 商学部(日吉), 准教授 (30609615)
相澤 正夫 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 名誉教授 (80167767)
久能 三枝子 (高田三枝子) 愛知学院大学, 文学部, 准教授 (90468398)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | コーパス言語学 / 昭和話し言葉コーパス / 経年変化 / コーパス / 話し言葉 / 言語学 / コーパス日本語学 / 話し言葉コーパス |
Outline of Annual Research Achievements |
(1)『昭和話し言葉コーパス』の構築: 2018度までに作成した独話の音声資料(17時間分)について、音声データ、時間情報付き転記テキスト(TextGrid形式、tsv形式)、メタデータ等をパッケージ化し、「『昭和話し言葉コーパス』モニター公開データ」として一般公開を開始した(5月)。さらに、転記テキスト部分の形態素解析を実施し、人手で修正したうえで、コーパス検索アプリケーション「中納言」上で「昭和話し言葉コーパス(モニター公開版)」として一般公開を開始した(1月)。また、会話の音声資料(25時間分)について、時間情報付き転記テキストを整備・精緻化する作業を進めた。会話の場合、話者の同定や発話内容の聞き取りなどにおいて多くの困難があったが、1950年代当時の転記テキスト(紙媒体)を資料庫から発掘して参照するなどして、情報の確定に努めた。これにより、25時間分の会話データについて、時間情報付き転記テキストを完成させることができた。さらに、1950年代当時の調査票(フェイスシート)を資料庫から発掘し、各録音資料に対するメタデータ(録音年月日・録音場所・発話者情報(氏名、性別、年齢、肩書など)の記録)の整備を進めた。 今後、会話データの転記テキストに対して形態素解析を実施し、人手修正をしたうえで、コーパス検索アプリケーション「中納言」上で独話と合わせて「昭和話し言葉コーパス(完成版)」として2020年度内に一般公開する予定である。
(2) 成果発表: 国内外における書籍や論文の刊行、学術学会での研究発表などを行ったほか、チェコ共和国のカレル・プラハ大学で「コーパス日本語学ワークショップ」を開催するなど、多くの点で成果があった。
|
Research Progress Status |
令和元年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和元年度が最終年度であるため、記入しない。
|
Research Products
(18 results)
-
-
-
-
-
-
-
-
-
-
-
-
-
[Book] 文化情報学事典2019
Author(s)
村上征勝(監修)、丸山岳彦(分担執筆)
Total Pages
850
Publisher
勉誠出版
ISBN
978-4-585-20071-0
-
-
-
-
-