• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2011 年度 実施状況報告書

テキストの「読み方」モデルの構築と利用に関する研究

研究課題

研究課題/領域番号 23650076
研究機関国立情報学研究所

研究代表者

相澤 彰子  国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)

研究期間 (年度) 2011-04-28 – 2013-03-31
キーワード視線計測装置 / 読解行動 / テキスト理解 / 視線計測誤差 / 自然言語処理 / 言語インタフェース / 行動予測 / 文書構造解析
研究概要

本研究では、「読む」という行為を、読み手の言語の理解や知識の獲得と対応付けて解析する技術の確立を目指す。具体的には、画面上に表示される文字情報(テキスト)から人間が情報を得る際の「読み方」を視線計測装置を用いて実際に測定して、テキストの意味や文脈と照合しながら分析・予測する手法を開発する。このような「読み方」のモデル化と測定を通して、対象テキストの計算言語的な解析結果と読み手の興味や理解の容易性とを対応付け、社会生活で不可欠な「読む」行為の支援へと結びつける。具体的には、(1)読み方モデルの構築と視線情報からの注視テキストの抽出、および、(2)視線情報に基づく人間の言語行動の分析、の2つの課題に取り組み、中核となる手法の確立を目指す。 本年度は、言語処理やユーザインタフェース分野における視線データの利用について文献調査を行うとともに、視線計測装置を用いた実験環境を構築して、視線データを取得した。現実的なユーザ環境で得られる視線データには測定誤差が含まれることから、文書構造や言語的な知識を事前知識としてモデルに取込むことで、視線計測の精度を高める手法の開発に取り組んだ。その結果、注視点と単語領域の位置合わせ最適化問題を解く手法を提案し、これにより視線計測装置単独では補正できない誤差に対応できることを示した。また、複雑なレイアウト構造を持つ文書や、単語境界が明示されない日本語文書に対しても上記手法の適用を可能にするため、画面イメージの自動文字認識出力を言語タグつきのテキストに対応付ける手法を開発し、有効性を確認した。さらに、人間の読み方モデルの構築とテキスト読解・理解支援を目標として、文書中で被験者が注視する単語を、言語的およびレイアウト的特徴に基づき予測する機械学習手法を提案して効果を示すとともに、言語タスクや被験者による違いを考察した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

交付申請書では本年度の研究目標として、(1)テキスト要素と画面上の領域の対応付け、および、(2)予測遷移グラフと実際の計測結果に基づく事後確率計算、の2つを設定した。(1)については、注視点と単語領域との位置合わせ最適化問題を解くアプローチを提案するとともに、自動文字認識を組み合わせて任意のテキストについて単語境界を正しく認識する手法を開発し、当初の予定を達成した。(2)については、言語的なモデルだけではなく単語の出現場所情報を取り込む新たなモデルを提案するなど追加で検討した課題もあり、順調に研究を進めている。

今後の研究の推進方策

人間の読み方を分析するための言語理解タスクを設計して視線データを収集し、平成23年度で構築したモデルを検証する。言語モデルを用いた視線情報の誤り修正、および視線と語句の構文・意味役割との対応づけ手法を提案・評価し、成果の発表を行う。1.視線データの収集とコーパス整備:被験者実験によりデータを収集し、視線情報を埋め込んだ参照コーパスを構築する。品詞、構文木、述語項構造、照応関係などの言語アノテーションと視線情報を対応づけて分析することで、視線遷移の予測に有効な言語的な手がかりを抽出する。2.人間の文解析・読解過程のモデル化における有効性の検証:言語処理により自動付与される語句の様々な役割と実際に観測される注視順や停留時間とを対応づけ、これらを統計的に解析することで、テキストの読みやすさや人間の興味や理解の状態を推測し、読解支援に役立てる手法の開発に取り組む。

次年度の研究費の使用計画

視線計測装置を使った被験者実験および論文発表を予定しており、実験のための補助装置の購入・謝金・リサーチアシスタント雇用、成果発表のための出張・会議参加・英文校正・論文別刷代等を支出する予定である。

  • 研究成果

    (4件)

すべて その他

すべて 学会発表 (4件)

  • [学会発表] Synthesizing Image Representations of Linguistic Features over a Text for Predicting Areas of Attention in Reading

    • 著者名/発表者名
      Pascual Martinez-Gomez, Tadayoshi Hara, Chen Chen, Kyohei Tomita, Yoshinobu Kano and Akiko Aizawa
    • 学会等名
      12th Pacific Rim International Conference on Artificial Intelligence (accepted)
    • 発表場所
      クチン(マレーシア)
    • 年月日
      平成24年9月3-7日
  • [学会発表] OCRを用いた視線情報と閲覧テキストの言語的特徴の関連付け

    • 著者名/発表者名
      冨田恭平, 相澤彰子, Martinez-Gomez Pascual, 陳チェン, 原忠義, 狩野芳伸
    • 学会等名
      言語処理学会第18回年次大会
    • 発表場所
      広島市
    • 年月日
      平成24年3月13-16日
  • [学会発表] Image registration for text-gaze alignment.

    • 著者名/発表者名
      Pascual Martinez-Gomez, Chen Chen, Tadayoshi Hara, Yoshinobu Kano, Akiko Aizawa
    • 学会等名
      2012 ACM International Conference on Intelligent User Interfaces (IUI 2012)
    • 発表場所
      リスボン(ポルトガル)
    • 年月日
      平成24年2月14-17日
  • [学会発表] Quantitative analysis and inference on gaze data using natural language processing techniques

    • 著者名/発表者名
      Pascual Martinez-Gomez
    • 学会等名
      2012 ACM International Conference on Intelligent User Interfaces (IUI 2012)
    • 発表場所
      リスボン(ポルトガル)
    • 年月日
      平成24年2月14-17日

URL: 

公開日: 2013-07-10  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi