• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

言語コーパスに対する読文時間付与とその利用

研究課題

研究課題/領域番号 25284083
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

浅原 正幸  大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, 准教授 (80379528)

研究分担者 MIYAMOTO EDSON・T  筑波大学, 人文社会科学研究科(系), 准教授 (60335479)
小野 創  津田塾大学, 学芸学部, 准教授 (90510561)
研究期間 (年度) 2013-04-01 – 2017-03-31
キーワード読み時間 / 人間の文処理
研究実績の概要

研究作業者を雇用し、読み時間データに対して各種アノテーションを重ね合わせる作業を進めた。具体的には、統語情報としての係り受け・節境界情報、意味情報としての分類語彙表番号、談話情報としての情報構造アノテーションを重ね合わせた。
一般化線形混合モデルによる統計分析を行うことにより、次のような結果が得られた。たくさん係り受け関係を持つ文節の読み時間が短くなる現象が確認された。同様に節境界についても読み時間が短くなる傾向があり、節ラベルで分析すると 並列節>>名詞修飾節>>補足節, 副詞節の順に短くなることが確認された。分類語彙表番号においては、統語的な性質を表す「類」に関して「体」>>「その他」 >> 「相」 >> 「用」と読み時間が短くなる傾向が確認された。意味的な分類を表す「部門」に関しては、「生産物」>「自然」 >「関係」 ≒「主体」>「活動」という傾向がみられた。情報構造においては、特定性・有情性で読み時間が長くなる傾向がみられた。また、新情報と想定可能(Bridging)・旧情報が判別可能なレベルで読み時間に差があることが確認された。
得られた知見について、係り受けについては COLING-2016で発表を行った。情報構造については2016年度内に言語処理学会年次大会で発表を行った。ほかのものについても2017年度中に対外発表を行う。
また、統計処理手法として、一般化線形混合モデルではなく、Bayesian 線形混合モデルに基づく分析を進めた。

現在までの達成度 (段落)

28年度が最終年度であるため、記入しない。

今後の研究の推進方策

28年度が最終年度であるため、記入しない。

次年度使用額が生じた理由

28年度が最終年度であるため、記入しない。

次年度使用額の使用計画

28年度が最終年度であるため、記入しない。

研究成果

(9件)

すべて 2017 2016

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件、 謝辞記載あり 1件) 学会発表 (8件) (うち国際学会 2件)

  • [雑誌論文] 文書間類似度について2016

    • 著者名/発表者名
      浅原正幸・加藤祥
    • 雑誌名

      自然言語処理

      巻: 23-5 ページ: 463-498

    • DOI

      http://doi.org/10.5715/jnlp.23.463

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [学会発表] 『現代日本語書き言葉均衡コーパス』への情報構造アノテーションの構築2017

    • 著者名/発表者名
      宮内拓也・浅原正幸・中川奈津子・加藤祥
    • 学会等名
      言語処理学会第23回年次大会
    • 発表場所
      筑波大学
    • 年月日
      2017-03-13 – 2017-03-16
  • [学会発表] 『現代日本語書き言葉均衡コーパス』の読み時間とその被験者属性2017

    • 著者名/発表者名
      浅原正幸・小野創・宮本エジソン正
    • 学会等名
      言語処理学会第23回年次大会
    • 発表場所
      筑波大学
    • 年月日
      2017-03-13 – 2017-03-16
  • [学会発表] 読み時間と情報構造について(ちょっとみじかめ)2017

    • 著者名/発表者名
      浅原正幸
    • 学会等名
      言語処理学会第23回年次大会
    • 発表場所
      筑波大学
    • 年月日
      2017-03-13 – 2017-03-16
  • [学会発表] 『現代日本語書き言葉均衡コーパス』への情報構造アノテーションの分析2017

    • 著者名/発表者名
      宮内拓也・浅原正幸・中川奈津子・加藤祥
    • 学会等名
      言語資源活用ワークショップ2016
    • 発表場所
      国立国語研究所
    • 年月日
      2017-03-07 – 2017-03-08
  • [学会発表] 読み時間と情報構造について(ちょっとながめ)2017

    • 著者名/発表者名
      浅原正幸
    • 学会等名
      言語資源活用ワークショップ2016
    • 発表場所
      国立国語研究所
    • 年月日
      2017-03-07 – 2017-03-08
  • [学会発表] Reading Time Annotation for `Balanced Corpus of Contemporary Written Japanese'2016

    • 著者名/発表者名
      Masayuki ASAHARA, Hajime ONO, Edson T. MIYAMOTO
    • 学会等名
      Proceedings of COLING 2016, the 26th International Conference on Computational Linguistics
    • 発表場所
      大阪国際会議場
    • 年月日
      2016-12-14 – 2016-12-16
    • 国際学会
  • [学会発表] BCCWJ-DepPara: A Syntactic Annotation Treebank on the `Balanced Corpus of Contemporary Written Japanese'2016

    • 著者名/発表者名
      Masayuki ASAHARA, Yuji MATSUMOTO
    • 学会等名
      Proceedings of the 12th Workshop on Asian Language Resources (ALR12)
    • 発表場所
      大阪国際会議場
    • 年月日
      2016-12-13 – 2016-12-13
    • 国際学会
  • [学会発表] BCCWJ-EyeTracking - 『現代日本語書き言葉均衡コーパス』に対する読み時間アノテーション2016

    • 著者名/発表者名
      浅原正幸・小野創・宮本エジソン正
    • 学会等名
      電子情報通信学会 TL
    • 発表場所
      早稲田大学
    • 年月日
      2016-07-23 – 2016-07-23

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi