情報メディアの伝達内容の構造を人間の認識特性に基づいて捉え、その構造を多様な利用形態に対応した全文データの柔軟な検索、提示、抽出、統合、加工などへ応用するための予備的検討として、以下の研究を行なった (1)テキスト構造の分析:多くの人が共通して認識できるテキスト構造を調べるため、数〜数十名の被験者が同一テキストの機能構造、修辞構造、内容のつながり、文の構造を分析する6種の認知実験を行った。対象テキストは、日英の新聞記事と日本語臨床症例報告を用いた。その結果、テキスト全体から捉えた機能構造は、被験者間の一致度がいずれの場合も80%以上と高く、応用のための枠組みとして有望であることが示された。分析方法、分析単位、共通に認識されない原因、システム組込みに適したテキスト構造のモデルのレベルについて考察した。 (2)テキスト構造の自動分析:多くの人が共通して認識したテキスト構造を自動的に分析するため、分析の手がかりとなる特徴的な表層的言語表現パターンを抽出し、それに基づいて自動分析を試みた。本研究では、新聞記事を対象とし、(1)テキスト全体からみた機能的構造、(2)文間の修辞構造の中の因果関係および説明関係に着目した。特徴的言語表現パターンの認定基準について検討し、自動分析では、従来から筆者が用いている特徴的な言語表現の組合せによるパターン照合に基づく方法に加え、ベイズ確率理論を取り入れた手法を試みた。 (3)テキスト構造に着目した、情報の検索、抽出、統合システムに関する研究:利用者との相互作用を含む、柔軟な情報検索の手法について検討した。OpenText Search Serverを用い、テキストの機能的構造(文役割)と書式構造が、全文データの検索精度の向上、および、柔軟な情報抽出に及ぼす効果について検討した。
|