研究課題/領域番号 |
25284083
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
浅原 正幸 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (80379528)
|
研究分担者 |
MIYAMOTO EDSON・T 筑波大学, 人文社会科学研究科(系), 准教授 (60335479)
小野 創 津田塾大学, 学芸学部, 准教授 (90510561)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | 言語資源 / 心理言語学 / コーパス言語学 |
研究実績の概要 |
H26年度4-6月期に視線走査法及び自己ペース読文法に基づく実験環境を確立した。BCCWJ の新聞記事サブコーパス10記事からなるデータセットを4セット作成し、被験者に対して副次的に実施するリーディングスパンテスト・アンケート・語彙数テストの仕様を確立した。 H26年度7-9月期に実験補助者を2名雇用し、50人規模で被験者実験を行いデータを取得した。さらにH26年度12月-3月に技術補佐員を2名雇用し、40人規模で被験者実験を行いデータの追取得を行った。有効な視線走査データはのべ40名分・自己ペース読文課題データはのべ80名分を超えるに至った。 読み時間データを取得したテキストデータの要約作文を取得し、BCCWJ の要約作文コーパスを数十人規模で構築した。要約作文は5つの観点からなる人手による評価指標を重畳的に付与した。さらにクラウドソーシングを用いて各テキストごとに100人規模の要約作文を収集した。 H26年度1-3月期に公開データの形式について検討した。初回視線停留時間・総視線停留時間・視線回帰停留時間の3つの時間をデータ化することとし、データ整形プログラムの開発を行った。 H26年度9月-1月期にコーパスコンコーダンサ ChaKi.NET の読み時間可視化機能を開発を行った。ChaKi.NET のプロジェクト機能(複数の観点からなるコーパスの可視化機能)を用いることで、単語列の線形順序と視線走査順序の2つの順序に基づく例文表示ができることになった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初目標の年間100人規模の被験者実験を行い、安定して被験者実験の収集を行うことができている。 公開データの形式も確定し、コーパスの可視化ツールの整備も進められており、おおむね順調に進展している。
|
今後の研究の推進方策 |
H26年度の対外発表で日本語学習者のデータの収集を求めるコメントをいただいた。またBCCWJ 新聞データのみならず書籍データなどのほかのデータに対する読み時間データを求めるコメントもいただいた。 H27年度はデータを拡張するために、BCCWJ書籍データの実験環境を整備するとともに、日本語学習者に対する被験者実験の可能性について検討する。具体的には日本語学習者に対するアンケートの検討を行う。 またデータの分析を進める。現在、文節単位に半角空白を入れたデータと半角空白を入れていないデータの2種類のデータを各被験者から取得しており、半角空白の有無による読み時間の影響の調査を進める。 H27-H28年度可視化のためのソフトウェア ChaKi.NET の文節対応を進める。 さらに H26年度収集した読み時間と要約作文コーパスとの対比を行い、読み時間に基づ被験者ごとの自動要約の可能性について検討する。
|
次年度使用額が生じた理由 |
H26年度検討していた国際会議参加をH27年度に延期したため。
|
次年度使用額の使用計画 |
H27年度開催の国際会議参加費用に充当する。
|