配分額 *注記 |
41,340千円 (直接経費: 31,800千円、間接経費: 9,540千円)
2009年度: 14,170千円 (直接経費: 10,900千円、間接経費: 3,270千円)
2008年度: 12,740千円 (直接経費: 9,800千円、間接経費: 2,940千円)
2007年度: 14,430千円 (直接経費: 11,100千円、間接経費: 3,330千円)
|
研究概要 |
情報流通と情報蓄積・共有,更には共創のグローバルな基盤に成長したWebを,コンピュータがその情報コンテンツの意味内容を把握できるようにして,検索・マイニング・編集・組織化等の意味に立ち入る操作を可能にする次世代知能化Webに向けた意味計算基盤の研究開発を行った.具体的には,メタデータ記述を中心とするSemantic Webとは異なり,我が国発の技術として我々が中心で国際標準化を行ってきた,自然言語テキストが表す概念意味の共通的記述言語であるCDL(Concept Description Language)に関する研究を進めた.CDLはコンピュータ・エスペラント語とも言える固有言語に依存しない共通言語の性質を有し,Webにおける言語障壁克服にも寄与する技術である.CDLに関する第一の技術課題は,テキストからCDLへの変換である.全自動機械翻訳が困難であるのと同様に,テキストからCDLへの全自動変換も困難であるので,人の負担の少ない半自動変換を目指し,語義(word sense)の選択と決定を介して,CDLへ変換するアプローチについて研究した.出来るだけの語義曖昧性解消をコンピュータにより行うことにより,人手介在の部分を減らすインタフェースの開発を行った.また,語句の単なるマッチングでなく,意味的なマッチングを可能とし,CDLデータの意味的検索法の研究開発を行った.本研究と並行する形でW3CのインキュベータグループでCDLを次世代Webへ向けた意味計算基盤とする国際標準化の活動も行った訳であるが,英語を主とし英語で事足りる国ではCDLのような言語の必要性の認識が薄く,この進展は一旦中断している. CDLは単語エンティティ間を関係識別子で結んで表すことをベースとしているが,関連研究として分布仮説に基づき,単語エンティティペア間の関係類似性をWeb検索エンジンの結果を利用して計算する手法を考案,開発した.この研究成果は,2009年5月のWWW国際会議(Web技術分野で世界で最も権威ある会議)にフルペーパーとして採録され,国際的に高い評価を得た.この原理を活用し,{(Tokyo, Japan),(?, France)}のようなエンティティ対を検索入力として,{?=Paris}を答えるような潜在関係検索エンジン(Latent Relational Search Engine)を開発した.これは特許出願も行った. 更に,Webから抽出した多数の任意エンティティペアから代表的で有意な関係を有するエンティティペアを効率的に抽出する,新しい共クラスタリング法によるOpen Information Extraction手法を創案,開発した.この研究成果も特許出願を行い,また2010年4月のWWW国際会議にフルペーパーとして採録され,高い評価を得た.
|