自然言語テキスト意味概念の共通的記述によるWeb意味計算基盤
Publicly Offered Research
Project Area | Cyber Infrastructure for the Information-explosion Era |
Project/Area Number |
21013010
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Review Section |
Science and Engineering
|
Research Institution | The University of Tokyo |
Principal Investigator |
石塚 満 東京大学, 大学院・情報理工学系研究科, 教授 (50114369)
|
Project Period (FY) |
2009 – 2010
|
Project Status |
Completed (Fiscal Year 2010)
|
Budget Amount *help |
¥5,000,000 (Direct Cost: ¥5,000,000)
Fiscal Year 2010: ¥2,500,000 (Direct Cost: ¥2,500,000)
Fiscal Year 2009: ¥2,500,000 (Direct Cost: ¥2,500,000)
|
Keywords | 意味計算 / Web知能化 / テキスト意味表現 / 関係表現 / 関係検索 / 関係類似性 / テキスト処理 / 概念表現 / 次世代Web基盤 / 関係抽出 |
Research Abstract |
Web上の膨大な量の情報を活用するためには,今後,コンピュータにもWeb情報の表す意味を把握できるようにする意味計算(Semantic Computing)の共通的基盤を構築することが重要となる.ここではWeb情報で中心的役割を担う自然言語テキストが表す意味を対象にし,その概念レベルの意味を表す我が国発の共通的表現言語(英語や日本語といった特定の言語に依存しない)であるCDL(Concept Description Language)を中核として,意味計算基盤に向けた研究を進めた.特に,自然言語テキストからCDLへの半自動変換,CDLデータの類似検索も含む効率的意味的検索のメカニズムについて研究開発した.特に語彙曖昧性解消を介するテキストからCDLへの半自動変換法について成果を得た. CDLでの概念意味記述はテキスト中のエンティティ間の関係を規定することで行う.これに係わる,Webテキスト中のエンティティ対間の関係類似性の新計算法,逐次共クラスタリングによる関係を有するエンティティ対の新抽出法(Open Relation Extractionと称される),及び潜在的関係検索エンジンの研究開発も行った.
|
Report
(2 results)
Research Products
(13 results)