研究概要 |
大規模セマンティック情報資源構築プラットフォームを開発するために,平成21年度は,65万本以上の記事から構成されるオンライン百科事典「日本語ウィキペディア」から大規模汎用オントロジーに自動変換することを目的とした.具体的には,カテゴリ階層の洗練と目次見出しのスクレイピングによる概念上位下位(IS-A)関係,一覧記事のスクレイピングによるクラスーインスタンス関係,InfoboxのスクレイピングによるRDFトリプルデータ,リダイレクトリンクを利用した同義語集合を構築した.その結果,93,322個のIS-A関係(精度76.3%),421,989個のクラスーインスタンス関係(精度97.2%),1,485,751個のRDFトリプルデータ(精度95.8%),106,671個の同義語集合(精度67.03%)が得られた.しかしながら,上位概念の欠落が多い,過度の分化が特定概念で発生するなどの課題もあり,開発済みオントロジーとの統合により,課題を解消していく必要がある.また,開発された日本語ウィキペディアオントロジー(JWO)とLinked Dataを統合して,検索語句と関連する概念やインスタンスを提示することによる発想支援システムを開発し,アイデアを展開する段階で貢献が大きいことが確認できた.さらに,人型ロボット上で,JWOと動作オントロジーの照合に基づく音声対話と行動制御機能を実装し,健康法を教えることをケーススタディとして実証実験を行い,良好な結果を得た.
|