Budget Amount *help |
¥6,200,000 (Direct Cost: ¥6,200,000)
Fiscal Year 2008: ¥3,100,000 (Direct Cost: ¥3,100,000)
Fiscal Year 2007: ¥3,100,000 (Direct Cost: ¥3,100,000)
|
Research Abstract |
WWW(Web)は情報流通と情報蓄積・共有のグローバルな基盤に成長し, 今後ともその重要性は増していくが, その次世代基盤・標準に向けて我が国からの貢献は皆無に近い状況にある. W3Cを中心にして次世代Web基盤としてSemantic Webの標準化が進められているが, 本研究ではSemantic Webとは異なる側面を持つ代表者を含むグループによるWebテキストコンテンツ意味概念記述言語CDL(Concept Description Langauge)の国際標準化活動に連動し, CDLの使用環境ツール機能の研究開発を進めた. 特に重要な課題になっているテキスト文からCDLへ変換する方法については, 自然言語テキストの十分な意味理解が困難であるのと同様に完全自動化は困難であるので, 単語語彙の多義性解消を人手選択による援用で行うグラフィカルエディタ(現在は英文テキストが対象)を開発し, 人手負担を軽減した変換法を開発した. 並行してCDL関係の自動識別率向上に向けて, 英文テキストから関係をもつ単語対を同定し, 係り受け解析結果と周辺文脈単語及び辞書情報を利用し, CDL関係をSupport Vector Machine (SVM)により学習し識別する方法の研究開発を行った. また, CDLデータの意味に踏み込んだ検索インタフェースとして, SQL風の問合せ言語(仮称 : CDQL)を設計し, RDFの問合せ言語であるSPARQLを利用した実装を行った. CDLから少し離れた基盤的研究として, Web検索エンジンを利用する単語対間の関係類似度の効率的計測法を創案・開発した. これは(キリスト教, 教会), (イスラム教, ?X)といった問合せに対し, ?X=モスクと答えるような新しいWeb検索の道を拓く基盤技術になるものである. この研究は国際的にも高く評価され, Web分野で最高峰の国際会議であるWWW2009(2009年4月マドリッドで開催)にfull paperとして採択された.
|