2012 Fiscal Year Annual Research Report
特許文書からのクロスブートストラップによる表現抽出を用いたパテントマップ自動生成
Project/Area Number |
22500129
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
増山 繁 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (60173762)
|
Co-Investigator(Kenkyū-buntansha) |
酒井 浩之 成蹊大学, 理工学部, 講師 (70402659)
|
Project Period (FY) |
2010-04-01 – 2013-03-31
|
Keywords | 意味体系 / Wikipedia / 特許情報 |
Research Abstract |
特許文書からの技術語・効果語取得はパテントマップの自動生成などに役立つ。そこで、手がかり語を用いたブートストラップ法と文法パターンを併用し、これらの語を取得する手法を提案した。特許情報として抽出すべき対象を詳細に分析し、取得する方法を考案した.特許調査に必要な抽出対象を,A.技術の総称,B.技術構成要素,C.構成要素の機能/作用,D.発明の効果、と解明し、特許文書の構造を利用した取得手法を考案した.企業では製品開発に重要な特許調査で、関連技術分野の特許検索だけでなく,他社の競合特許と他社の競合製品の関係に着目し,製品の関連特許の特定,各特徴レベルの関連判定法を考案した。言語の意味的表現獲得の基礎として,自然言語処理における意味処理の基盤となる日本Wikipediaのカテゴリ階層に着目した。言語オントロジに対して、上位・下位関係を付加する研究を行った。因果関係を表す5パターンがあることを明確にした。文(ないし,連続する2文)を因果関係を表す特有の表現を用いて分類する手法を明確にした。記事の概要文Wikipediaが持つ記事の分類体系であるカテゴリにより多数存在するInfoboxテンプレートの種類中から記事に適した種類を推定する手法を提案した。メニュー階層評価のため、語対間の繋がりの理解容易さ価の定量化指標として、語が表わす概念間の親子関係を表す連想関係と、兄弟関係の二つの関係を用いた。心理実験による実験心理値との順位相関により評価した。2次元バブルチャートの見やすい配置を整数計画法を用いて定式化し、被験者評価してもらう試みを行った。価格.comからのトラブル情報を得るために「口コミ掲示板」の情報を利用した製品の係る動詞に着目する手法を考案した。
|
Current Status of Research Progress |
Reason
24年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
24年度が最終年度であるため、記入しない。
|