2006 Fiscal Year Annual Research Report
自然言語意味概念記述言語CDLによる次世代知能化Web基盤
Project/Area Number |
18049012
|
Research Institution | The University of Tokyo |
Principal Investigator |
石塚 満 東京大学, 大学院情報理工学系研究科, 教授 (50114369)
|
Keywords | Web知能化 / 自然言語意味記述 / 次世代Web基盤 / テキストマイニング / 意味計算 |
Research Abstract |
情報流通・共有のグローバルなインフラに成長し,今後も重要性を増すWWW(Web)の次世代基盤として,Semantic Webの国際的標準化が進められている.Semantic Webはメタデータの共通的記述を対象にするのに対し,本研究ではWebの主要なソース情報である自然言語テキストが表す概念意味の共通的記述言語CDL(Concept Description Language)による次世代Web基盤に向けての研究を行った.CDLはNPO法人ISeC(石塚はこのメンバー)を中心に仕様を定め,W3Cで国際標準化活動を行っているが,この活動と連携して研究を進めた.大きな目標はコンピュータにもWebコンテンツの概念意味を把握できるようにする次世代Web基盤の構築であり,これを土台としてコンピュータが意味に踏み込んで人間と協働する範囲を格段に拡大することである. CDLは簡素な3つ組構造を基本とするが(概念を表すノードと関係を表すアークによるグラフ構造となる;ただし,ノードは属性-属性値が付加できる),現状での大きな課題は自然言語テキストから全自動でCDLに変換することは困難なことである.従って,意味役割(semanticrole)を出力するパーサを活用し,自然言語テキストから可能な3つ組構造を抽出する手法について研究し,成果を得た.現状では抽出困難な概念間の関係は人手で与えるものとし,これを容易にするインタフェースとしてのグラフィカル・エディタを開発した.(次第に人手の部分を減らし,自動化率を向上させていく予定である.) Semantic WebとCDLは対極的であると共に相補的でもあるので,両者を融合させて発展させる道を拓くため,CDL記述をSemantic WebのRDF(Resource Description Format)で表現する機能の開発も行った.
|
Research Products
(7 results)