2011 Fiscal Year Research-status Report
テキストの「読み方」モデルの構築と利用に関する研究
Project/Area Number |
23650076
|
Research Institution | National Institute of Informatics |
Principal Investigator |
相澤 彰子 国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
|
Project Period (FY) |
2011-04-28 – 2013-03-31
|
Keywords | 視線計測装置 / 読解行動 / テキスト理解 / 視線計測誤差 / 自然言語処理 / 言語インタフェース / 行動予測 / 文書構造解析 |
Research Abstract |
本研究では、「読む」という行為を、読み手の言語の理解や知識の獲得と対応付けて解析する技術の確立を目指す。具体的には、画面上に表示される文字情報(テキスト)から人間が情報を得る際の「読み方」を視線計測装置を用いて実際に測定して、テキストの意味や文脈と照合しながら分析・予測する手法を開発する。このような「読み方」のモデル化と測定を通して、対象テキストの計算言語的な解析結果と読み手の興味や理解の容易性とを対応付け、社会生活で不可欠な「読む」行為の支援へと結びつける。具体的には、(1)読み方モデルの構築と視線情報からの注視テキストの抽出、および、(2)視線情報に基づく人間の言語行動の分析、の2つの課題に取り組み、中核となる手法の確立を目指す。 本年度は、言語処理やユーザインタフェース分野における視線データの利用について文献調査を行うとともに、視線計測装置を用いた実験環境を構築して、視線データを取得した。現実的なユーザ環境で得られる視線データには測定誤差が含まれることから、文書構造や言語的な知識を事前知識としてモデルに取込むことで、視線計測の精度を高める手法の開発に取り組んだ。その結果、注視点と単語領域の位置合わせ最適化問題を解く手法を提案し、これにより視線計測装置単独では補正できない誤差に対応できることを示した。また、複雑なレイアウト構造を持つ文書や、単語境界が明示されない日本語文書に対しても上記手法の適用を可能にするため、画面イメージの自動文字認識出力を言語タグつきのテキストに対応付ける手法を開発し、有効性を確認した。さらに、人間の読み方モデルの構築とテキスト読解・理解支援を目標として、文書中で被験者が注視する単語を、言語的およびレイアウト的特徴に基づき予測する機械学習手法を提案して効果を示すとともに、言語タスクや被験者による違いを考察した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
交付申請書では本年度の研究目標として、(1)テキスト要素と画面上の領域の対応付け、および、(2)予測遷移グラフと実際の計測結果に基づく事後確率計算、の2つを設定した。(1)については、注視点と単語領域との位置合わせ最適化問題を解くアプローチを提案するとともに、自動文字認識を組み合わせて任意のテキストについて単語境界を正しく認識する手法を開発し、当初の予定を達成した。(2)については、言語的なモデルだけではなく単語の出現場所情報を取り込む新たなモデルを提案するなど追加で検討した課題もあり、順調に研究を進めている。
|
Strategy for Future Research Activity |
人間の読み方を分析するための言語理解タスクを設計して視線データを収集し、平成23年度で構築したモデルを検証する。言語モデルを用いた視線情報の誤り修正、および視線と語句の構文・意味役割との対応づけ手法を提案・評価し、成果の発表を行う。1.視線データの収集とコーパス整備:被験者実験によりデータを収集し、視線情報を埋め込んだ参照コーパスを構築する。品詞、構文木、述語項構造、照応関係などの言語アノテーションと視線情報を対応づけて分析することで、視線遷移の予測に有効な言語的な手がかりを抽出する。2.人間の文解析・読解過程のモデル化における有効性の検証:言語処理により自動付与される語句の様々な役割と実際に観測される注視順や停留時間とを対応づけ、これらを統計的に解析することで、テキストの読みやすさや人間の興味や理解の状態を推測し、読解支援に役立てる手法の開発に取り組む。
|
Expenditure Plans for the Next FY Research Funding |
視線計測装置を使った被験者実験および論文発表を予定しており、実験のための補助装置の購入・謝金・リサーチアシスタント雇用、成果発表のための出張・会議参加・英文校正・論文別刷代等を支出する予定である。
|
-
-
-
[Presentation] Image registration for text-gaze alignment.
Author(s)
Pascual Martinez-Gomez, Chen Chen, Tadayoshi Hara, Yoshinobu Kano, Akiko Aizawa
Organizer
2012 ACM International Conference on Intelligent User Interfaces (IUI 2012)
Place of Presentation
リスボン(ポルトガル)
Year and Date
平成24年2月14-17日
-