研究概要 |
ウェブには、社会的な大事件から個人の小さな経験まで、あるいは専門家の評論から一般ユーザの意見まで、さまざまな事実や意見の膨大な情報が日々刻々蓄積されている。こうした情報の山は、使い方によっては人類共通の「知の宝庫」となる可能性を秘めている。本研究では、ウェブ文書中に言葉で書かれた事実情報や意見情報をその意味内容に基づいて整理する言語情報編集技術の開発に取り組んだ。事実や意見の情報を整理する方法には、個々の情報をさまざまな観点から分類し、大きな表のような構造をつくる方法と、個々の情報の間の関係をとらえ、ネットワーク型の構造をつくる方法が考えられる。 分類によって整理する方法については、ウェブ文書に書かれた個人の経験情報を<トピック,経験主,事態タイプ,事実性>という一般性の高い4種類の意味的な軸で分類し、巨大な経験データベースを自動生成する経験マイニング技術を世界で初めて開発した。「視力が戻る(=ポジティブな出来事)」のような幅広い事態表現を分類し、さらに事態の成立、不成立、願望などの事実性を区別して経験情報を収集する。これにより、たとえば「あるサービスの利用に伴うトラブル」や「ある商品に関心を持ちながらまだ買っていない人」など、複雑な検索も可能になる。 一方、関係によって整理する方法については、別々の文書に書かれた情報の間の隠れた根拠関係を自動的に検出する技術を開発した。前述の経験マイニング技術を発展させるとともに、情報検索基盤「TSUBAKI」や大規模知識ベース「鳥式」など、本特定領域の成果を融合することで実現した。「ブルーベリーは視力回復に効果がある?」のような質問に対し、それを支持する根拠と否定する根拠をそれぞれウェブから探し出して提示する。
|