配分額 *注記 |
3,400千円 (直接経費: 3,400千円)
2007年度: 1,100千円 (直接経費: 1,100千円)
2006年度: 1,100千円 (直接経費: 1,100千円)
2005年度: 1,200千円 (直接経費: 1,200千円)
|
研究概要 |
申請者は研究計画に従い,前年度の研究成果である具対物の属性/値の発見手法を応用して,Webから動的に文章のトピックの情報を獲得・提示する文章作成支援システムを構築した. 提案システムは,まず,単純な語彙統語パタンを利用して,ユーザの書きかけの文章草稿から,その文章のトピックとなる(ユーザが潜在的に情報を必要とする)対象物を認識する.その後,昨年度提案した手法を用いて,Webのレイアウトから対象物に関する知識を属性/値の形で獲得し,ユーザに提示する。実際に,大手プログサイトのプログから語彙統語パタンにより認識できた対象物とその属性のうち,特に頻繁に現れていた20クラズ(例:女優)の対象物/属性(計611対象物/属性)について属性/値を獲得したところ,その約46.5%について属性/値を獲得することができた.また,獲得に要した時間は1対象物/属性当たり,平均20.7秒であった.提案システムは,知識獲得に利用するWebページ数を加減することで柔軟に知識の獲得率/速度をコントロールすることが可能であり,ブログ記事の作成支援など幅広い応用が考えられる. 今後は,提案システムを公開し,その利用者が作成・公開した文書から常識的推論規則の獲得を試みる.提案システムを利用して作成した文章は,必然的にトピックの属性/値を多く含むため,異なるユーザが作成した文章であってもトピックが同じであれば,共通して含まれる属性/値を手がかりにすることで,対応する文を容易に同定することができる.このようにして得られた文の対は,それ自身が常識的推論規則の知識源となるだけでなく,Webに存在する文書から,常識的推論規則を獲得する際にも有用な手がかりとなる. 外国旅費を利用して,本年度の成果を米国シリコンバレー及び、韓国釜山で行われた国際会議で発表した.
|