研究課題/領域番号 |
26540121
|
研究機関 | 国立情報学研究所 |
研究代表者 |
相澤 彰子 国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 視線計測 / 自然言語処理 / 文書最適化 / 読み方モデル / 視線アラインメント |
研究実績の概要 |
電子端末を介した言語活動は、我々の日常生活になくてはならないものとなっている。読むべき対象が量的にも質的にも多様化し、対応して読み方のスキルも複雑になる中で、テキストの画像特徴や読み手の状況にも考慮した「読まれ方」の言語処理これまであまり検討されて来なかった。そこで本研究では、画面上でテキストを「読む」行為に焦点をあてて、その計測・モデル化・支援について検討を行う。 本年度は、画面上で人が文章を読む際の視線計測手法に焦点をあてて、視線停留点の座標軸上での分布を単語位置に対応づけるためのアラインメント手法の開発に取り組んだ。文書読解時の視線計測では、縦方向の系統的なずれ(測定誤差)が大きな問題となることが知られている。本研究では、逐次的な読みにおける視線移動が、文書の行に沿った特徴的なパターンを示す点に着目して新たな誤差関数を定義し、ダイナミックプログラミングを用いて効率的に視線と文書画像のアラインメントを行う手法を提案した。 ここで従来、視線とテキストのアラインメント研究では、評価および学習用として利用可能な正解データがほとんどなく、新たに作成する場合でもコストが大きいことが問題であった。そこで本年度は、ウェブアプリケーションを使った編集ツールの実装に取組み、これを用いて人手によるアラインメント正解データを作成した。さらに、上記で提案したアラインメント手法を正解データを用いて評価し、提案手法の有効性を示した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成26年度では、(1) 位置・言語特徴に基づく視線とテキストのアラインメント手法の開発、(2) 視線位置合わせツールの開発、(3) 視線移動パターンの類型化と自動分類ツールの実装の3つを研究課題としてあげており、それぞれについて概ね予定通りに検討を進めた。その成果は国際会議で発表予定あり、あわせて構築した位置合わせツールの公開も予定している。現時点では、評価・検証用のデータとして、単一の逐次リーディングタスクに関するものを用いていることから、次年度以降に他の種類のタスクに適用してさらに検討を進めたい。
|
今後の研究の推進方策 |
視線計測装置を用いて記録した視線の動きを、テキストの表示場所や読み手の属性と照合しながら分析・予測する手法を開発する。具体的には、対象テキストが母語でない場合の読み手の言語習得レベルと読み進め方の関係等に注目する予定である。 テキストを読む際の視線移動量を目的関数として、文書レイアウトの最適化を行う手法の検討に取り組む。具体的には自然言語処理における「言い換え」手法を用いて、与えられた領域内にテキストセグメントの内容を埋め込むよう工夫をする。 なお、当初は視線移動予測モデルとして、多様な言語特徴量を盛り込んだ機械学習ベースのものを想定していたが、測定誤差や汎用性を踏まえて実際の視線データを分析し、特徴量を取捨選択することを検討している。
|
次年度使用額が生じた理由 |
視線計測装置の補充を予定していたが、既存の機器を利用することができた。 リサーチアシスタントは研究所経費で雇用することができた。 学会等における成果発表は、開催スケジュールの都合で、年度内は機会がなかった。
|
次年度使用額の使用計画 |
データ増強のために、視線計測実験のデータ保存・解析用の計算機環境の補充とともに、音声化に必要な機器を投入する。 リサーチアシスタントを雇用して、視線の動きを記録し、レイアウト最適化に結び付ける照合作業を行う予定である。 平成27年6月に開催される国際学会EMDPAに参加し、成果発表を行う。
|