2006 Fiscal Year Annual Research Report
ことばの多様性を考慮した語彙化文法によるWeb文書からの常識的推論規則の獲得
Project/Area Number |
05J06970
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
吉永 直樹 北陸先端科学技術大学院大学, 情報科学研究科, 特別研究員(PD)
|
Keywords | 語彙知識 / 属性情報 / 教師なし学習 / 語彙化文法 / 推論規則 |
Research Abstract |
申請者は,研究計画に従い,前年度の研究成果であるクラスに対する属性/値の発見手法を利用して,様々なクラスに属するモノ(具対物)の属性/値の情報を獲得する手法を提案した. 提案手法では,入力の具対物と属するクラス(例えばローマの休日-映画)に対し,予め獲得しておいたクラスの属性語(映画であれば監督、脚本、出演など)を用いて,オンデマンドで具対物の属性/値の情報を獲得する.具体的には,具対物と属するクラス,及びクラスの属性語をクエリとしてWebから具対物の属性/値の知識源の文書を収集し,ページ中でクラスの属性語が現れている箇所を手がかりに,実際に具対物の属性情報を記述したレイアウトを同定する.次にレイアウト中でクラスの属性語が現れている文脈からオンザフライで属性/値の記述パターンを推定し,そのパターンを利用して属性/値を抽出する. 提案手法の有効性を確かめるために,50の具対物-クラスペアについて,実際にWebから属性/値の獲得を試みたところ,その74%について適切な属性/値を獲得することに成功した. 属性/値は具対物に関して記述された事実であり,同一の具対物に対して(複数のWeb制作者により)記述された事実の間の意味的包含関係を大局的に考慮することで、(局所的な文脈から取れないという意味で)自明でない常識的推論知識を含む意味的等価あるいは包含関係にある表現対を多数導出できると期待される. 外国旅費を利用して,昨年度の成果を英国エジンバラで行われたWWW国際会議で発表した.また,本年度の成果を国内学会で発表した.また,本年度の成果を国内学会で発表した.
|