今年度の前半では、主に形式概念分析を用いたインターネット上の画像検索結果の束構造可視化について研究を行った。これは、多数存在するインターネット上の画像から目的画像を迅速に発見することの支援を目的としている。提案システムでは、画像検索結果で得られる画像に関連するテキストについて形式概念分析を適用し、束構造化することで実現している。 しかし、関連テキストのみを用いて形式概念分析を適用しても、関連テキストが短く使用されている語が多種多様であるため、上手く構造化することができない。そこで、事前に選定した形容詞で画像検索を行い、その検索結果に含まれる画像群を用いて該当形容詞に対応付けられる色空間の判別器を機械学習にて生成した。この判別器にて可視化対象画像への属性付与を行った結果、関連テキストのみを用いる場合に比べて効果的な束構造化を行うことができた。 また、今年度の後半では対象を国会議事録とした束構造可視化システムを提案・構築した。この研究では、膨大に蓄積されている国会議事録を束構造により可視化し、大局的に把握することを目的としている。 提案システムでは、まず取得した国会議事録に含まれる発言を解析し、発言内のキーワードを抽出する。この抽出したキーワード群が形式概念分析における属性集合となる。続いて、各発言をオブジェクトとしたコンテクストの生成を行う。発言にあるキーワードが含まれていた場合、オブジェクトが属性を持っていると見なす。こうして得られたコンテクストに形式概念分析を適用することで、束構造を得ることができる。 衆議院本会議の議事録を用いて、提案システムによる可視化実験を行った。提案システムから出力される束構造から対象範囲の議事録に含まれているキーワードおよびそれらの関係を一目で読み取ることができるため、どのような議論が展開されたか大局的に把握することが可能となることが分かった。
|