研究概要 |
申請者は、研究計画に従い、以下の手法の研究を行った. 1.Webからの語彙化文法との統合を目的とした語彙知識の獲得 知識獲得に用いる語彙化文法を整備することを目的として,文法に含まれていない情報の中で推論知識獲得の際に有用であると思われる事物のクラスの属性情報を、大量のWeb文書から効率よく獲得する手法を提案した. 提案手法では,与えられた事物のクラス(例えば映画,野球選手,遊園地など)を含む大量のWebページを知識源とし,HTMLタグと文字修飾に基づく単純なパターンを用いた教師なし学習により,クラスの包括的な属性情報(例(映画):出演,監督,脚本など)を獲得する.本手法は既存手法と比べ,非常に高速に動作し,速度的には現実に存在するあらゆるカテゴリの属性知識を獲得することが可能である.実験では,第三者によって選ばれた10のクラスについて,各30個程度の属性を獲得した場合、得られた属性の8割程度が適切であることが確認できた. また,得られたクラスの属性知識の有用性を、各クラスに属する事物の属性情報を記述したWebページを発見するというタスクを通して評価した.実験では,クラスの属性知識を用いることで,事物に関する属性-属性値の情報を多く含むページを発見できることを確認した.この過程で得られた事物の属性情報を記述したページは,事物を話題とする常識的知識を多く含み,今後常識的推論知識を獲得する際にも有用な知識源となることが期待される. 国内旅費を利用して,この研究の成果を国内学会で発表した.また,国外の研究状況を把握するために外国旅費を利用して国際学会に参加した.科研費で使用したノート型コンピュータは1のプログラムの開発に使用した.
|