• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

Expansion of corpus by annotating speaker's information to conversation sentences

Research Project

Project/Area Number 15H03212
Research InstitutionNational Institute for Japanese Language and Linguistics

Principal Investigator

山崎 誠  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (30182489)

Co-Investigator(Kenkyū-buntansha) 茂木 俊伸  熊本大学, 大学院人文社会科学研究部(文), 准教授 (20392540)
柏野 和佳子  大学共同利用機関法人人間文化研究機構国立国語研究所, 音声言語研究領域, 准教授 (50311147)
高崎 みどり  お茶の水女子大学, 名誉教授 (60096237)
金 明哲  同志社大学, 文化情報学部, 教授 (60275469)
清水 まさ子  日本女子大学, 文学部, 研究員 (80649468)
Project Period (FY) 2015-04-01 – 2019-03-31
Keywords会話文 / 話者情報 / コーパス / 擬似的話し言葉 / 役割語
Outline of Annual Research Achievements

1.コーパスへの話者情報付与作業 ひきつづき話者情報の付与の本作業を行い,図書館サブコーパスの日本文学,英米文学に対する情報付与作業を進めた.話者情報を付与したサンプル数は,2557サンプルで,これは対象とする図書館サブコーパスの小説の全体(2668サンプル)の約96%にあたる。これらのサンプルには,話者名,話者の性別(男,女),話者の年代(若年層(~19歳),成年層(20~59歳),老年層(60歳以上)の情報を付与した.そのうち約半数のサンプルには会話の相手の話者名および話者の身分・職業の情報も付与した.また,将来的にオンライン検索ツールである「中納言」に搭載できるよう,データの仕様を検討した。
2.話者情報を利用した研究としては,昨年度に引き続き以下の研究を行った。(1)小説の地の文と会話文との語彙的な比較では,会話文には名詞の割合が低く,代名詞の割合が高いことが分かった。また,数値的には小さいものの,会話文では地の文に比べて感動詞の割合が10倍以上あったことが特徴的である。(2)翻訳小説(外国語から日本語に翻訳した小説)と日本語小説(もともと日本語で書かれた小説)の会話文の違いとしては,日本語小説の方が1サンプル当たりの会話の分量が多いことが分かった。また,対数尤度比(LLR)による特徴語を分析すると,日本語小説には「さん」「さま」「先生」「ちゃん」「君(くん)」などの人につく接尾辞や名詞が有意に多かったのに対し,翻訳小説では,「彼」「私」「君(きみ)」「あなた」などの人称代名詞や「イエス」「イギリス」」「マイケル」などの固有名詞が有意に多かった。
3.実際の話し言葉と擬似的な話し言葉の比較では,代名詞の「あれ」が話し言葉に多く,その用法も現場文脈指示が少なく,言語文脈指示や記憶文脈指示の2用法が中心であることが分かった。

Research Progress Status

平成30年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

平成30年度が最終年度であるため、記入しない。

  • Research Products

    (12 results)

All 2019 2018

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 2 results) Presentation (9 results) Book (1 results)

  • [Journal Article] Annotation and Quantitative Analysis of Speaker Information in Novel Conversation Sentences in Japanese2018

    • Author(s)
      山崎誠,宮嵜由美,柏野和佳子
    • Journal Title

      Proceedings of the 11th edition of the Language Resources and Evaluation Conference (LREC2018)

      Volume: 11 Pages: 1078-1091

    • Peer Reviewed / Open Access
  • [Journal Article] 文末語の使用率に基づいた筆者識別―探索的多変量解析の実施と分析結果に対すスコアリングによる検討―2018

    • Author(s)
      財津 亘, 金 明哲
    • Journal Title

      計量国語学

      Volume: 31(6) Pages: 417-425

    • Peer Reviewed / Open Access
  • [Presentation] 『日本語日常会話コーパス』モニター公開版における終助詞―話者と会話の属性に着目して―2019

    • Author(s)
      山崎誠
    • Organizer
      シンポジウム「日常会話コーパス」IV
  • [Presentation] 『日本語日常会話コーパス』モニター公開版の語彙2019

    • Author(s)
      山崎誠,大村舞
    • Organizer
      言語処理学会25回年次大会
  • [Presentation] 学術的文章作成時に留意すべき 「話し言葉的な語」とは2019

    • Author(s)
      柏野和佳子
    • Organizer
      第7回 早稲田大学 ライティング・フォーラム
  • [Presentation] 日常会話の自称詞と小説会話の自称詞2019

    • Author(s)
      柏野和佳子
    • Organizer
      シンポジウム「日常会話コーパス」IV
  • [Presentation] 話し言葉における代名詞「あれ」の用法の分布2018

    • Author(s)
      山崎誠
    • Organizer
      言語資源活用ワークショップ2018
  • [Presentation] BCCWJ小説会話文への発話者情報の付与と計量的分析2018

    • Author(s)
      山崎誠,宮嵜由美,柏野和佳子
    • Organizer
      計量国語学会第62回大会
  • [Presentation] 話し言葉における「あれ」の用法 ―母語話者と学習者のコーパスによる比較―2018

    • Author(s)
      山崎誠
    • Organizer
      公開シンポジウム「コーパスを使った類義表現・多義語の研究」
  • [Presentation] 文末表現に着目した文学作品の分類2018

    • Author(s)
      金明哲
    • Organizer
      日本分類学会シンポジウム
  • [Presentation] 現代日本語小説の文体的特徴の変化について―大正・昭和の作品を中心として―2018

    • Author(s)
      李 広微, 金明哲
    • Organizer
      第46回日本行動計量学会
  • [Book] テキストアナリティクス2018

    • Author(s)
      金 明哲
    • Total Pages
      224
    • Publisher
      共立出版
    • ISBN
      978-4-320-11261-2

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi