• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実績報告書

言語コーパスに対する読文時間付与とその利用

研究課題

研究課題/領域番号 25284083
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

浅原 正幸  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (80379528)

研究分担者 MIYAMOTO EDSON・T  筑波大学, 人文社会科学研究科(系), 准教授 (60335479)
小野 創  津田塾大学, 学芸学部, 准教授 (90510561)
研究期間 (年度) 2013-04-01 – 2017-03-31
キーワード言語資源 / 心理言語学 / コーパス言語学
研究実績の概要

H26年度4-6月期に視線走査法及び自己ペース読文法に基づく実験環境を確立した。BCCWJ の新聞記事サブコーパス10記事からなるデータセットを4セット作成し、被験者に対して副次的に実施するリーディングスパンテスト・アンケート・語彙数テストの仕様を確立した。
H26年度7-9月期に実験補助者を2名雇用し、50人規模で被験者実験を行いデータを取得した。さらにH26年度12月-3月に技術補佐員を2名雇用し、40人規模で被験者実験を行いデータの追取得を行った。有効な視線走査データはのべ40名分・自己ペース読文課題データはのべ80名分を超えるに至った。
読み時間データを取得したテキストデータの要約作文を取得し、BCCWJ の要約作文コーパスを数十人規模で構築した。要約作文は5つの観点からなる人手による評価指標を重畳的に付与した。さらにクラウドソーシングを用いて各テキストごとに100人規模の要約作文を収集した。
H26年度1-3月期に公開データの形式について検討した。初回視線停留時間・総視線停留時間・視線回帰停留時間の3つの時間をデータ化することとし、データ整形プログラムの開発を行った。
H26年度9月-1月期にコーパスコンコーダンサ ChaKi.NET の読み時間可視化機能を開発を行った。ChaKi.NET のプロジェクト機能(複数の観点からなるコーパスの可視化機能)を用いることで、単語列の線形順序と視線走査順序の2つの順序に基づく例文表示ができることになった。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

当初目標の年間100人規模の被験者実験を行い、安定して被験者実験の収集を行うことができている。
公開データの形式も確定し、コーパスの可視化ツールの整備も進められており、おおむね順調に進展している。

今後の研究の推進方策

H26年度の対外発表で日本語学習者のデータの収集を求めるコメントをいただいた。またBCCWJ 新聞データのみならず書籍データなどのほかのデータに対する読み時間データを求めるコメントもいただいた。
H27年度はデータを拡張するために、BCCWJ書籍データの実験環境を整備するとともに、日本語学習者に対する被験者実験の可能性について検討する。具体的には日本語学習者に対するアンケートの検討を行う。
またデータの分析を進める。現在、文節単位に半角空白を入れたデータと半角空白を入れていないデータの2種類のデータを各被験者から取得しており、半角空白の有無による読み時間の影響の調査を進める。
H27-H28年度可視化のためのソフトウェア ChaKi.NET の文節対応を進める。
さらに H26年度収集した読み時間と要約作文コーパスとの対比を行い、読み時間に基づ被験者ごとの自動要約の可能性について検討する。

次年度使用額が生じた理由

H26年度検討していた国際会議参加をH27年度に延期したため。

次年度使用額の使用計画

H27年度開催の国際会議参加費用に充当する。

研究成果

(5件)

すべて 2015 2014

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (4件) (うち招待講演 1件)

  • [雑誌論文] Integration costs in the processing of Japanese wh-interrogative sentences2014

    • 著者名/発表者名
      Ono Hajime and Kentaro Nakatani
    • 雑誌名

      Studies in Language Sciences, Journal of the Japanese Society for Language Sciences

      巻: 13 ページ: 13-31

    • 査読あり
  • [学会発表] コーパスコンコーダンサ『ChaKi.NET』のプロジェクト機能2015

    • 著者名/発表者名
      浅原正幸・森田敏生
    • 学会等名
      第7回コーパス日本語学ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      2015-03-10 – 2015-03-11
  • [学会発表] BCCWJ-SUMM: 『現代日本語書き言葉均衡コーパス』を元文書とした要約文書コーパス2015

    • 著者名/発表者名
      浅原正幸・杉真緒・柳野祥子
    • 学会等名
      第7回コーパス日本語学ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      2015-03-10 – 2015-03-11
  • [学会発表] 動詞の下位範疇化に対する積極的予測:干渉効果を通しての検討2015

    • 著者名/発表者名
      小野創
    • 学会等名
      第99回かがみやま言語科学コロキアム.
    • 発表場所
      広島大学, 東広島
    • 年月日
      2015-02-19 – 2015-02-19
    • 招待講演
  • [学会発表] 単一文書自動要約のための言語資源構築に向けて2015

    • 著者名/発表者名
      浅原正幸・加藤祥・今田水穂
    • 学会等名
      第220回情報処理学会自然言語処理研究会
    • 発表場所
      九州大学
    • 年月日
      2015-01-19 – 2015-01-20

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi