2006 Fiscal Year Annual Research Report
Project/Area Number |
16200007
|
Research Institution | The University of Tokyo |
Principal Investigator |
石塚 満 東京大学, 大学院情報理工学系研究科, 教授 (50114369)
|
Co-Investigator(Kenkyū-buntansha) |
土肥 浩 東京大学, 大学院情報理工学系研究科, 助手 (90260504)
大澤 幸生 東京大学, 大学院工学系研究科, 助教授 (20273609)
高間 康史 首都大学東京, システムデザイン学部, 助教授 (20313364)
|
Keywords | Web知能化 / 人工知能 / テキストマイニング / Webマイニング / 意味計算 / テキスト要約 / チャンス発見 |
Research Abstract |
情報流通・共有のグローバルなインフラに成長したWWW(Web)情報空間を知能化することによって,個人,組織,社会の創造性を高める情報空間にすることに向けて,主としてテキスト処理を基盤とする観点からWeb知能化に関する研究を行い,以下の成果を得た. 1)複数テキスト文書要約における抽出した重要文の順序決定手法:時間順序だけでなく,原文書中の前提情報,後置情報,話題の類似性も考慮して決定する新手法を考案,開発した.これは国際的観点からも高い新規性を有している. 2)Webからの企業間関係マイニング:これまでの人間関係マイニングに加えて,Webからの企業間の提携関係及び訴訟関係のマイニングを行う技術を開発した.更に,2エンティティ間の関係をWebからマイニングする汎用性のある枠組みについて研究した. 3)自然言語テキスト概念意味の共通的記述言語CDL(Concept Description Language)の研究:Semantic Webがメタデータの共通的記述であるのに対し,標記CDLによる次世代Webに向けてW3Cにおける国際標準化活動をNPO法人ISeC(セマンティックコンピューティング研究開発機構)を中心にして開始しているが,これに連携してテキストからCDL記述を(半)自動的に生成する研究を行った.現状は部分的な3つ組構造を生成する段階である. 4)テキストからの感情抽出:テキストの意味理解の一部として,テキストからの感情抽出について研究した.今後のテキスト意味理解にも有用と考えられる,常識ベースのコーパスを利用する高度な機能も考案,開発するという成果を得た. 5)Web検索エンジンを用いた語の関連性の算出:最初に,検索エンジンによる2語のAND検索によるヒット数を利用する語の関連度の算出法を考案,開発した.次いで,2語のAND検索によって出力される検索エンジンのsnippet情報を利用し,2語を含む周辺に現れる単語パターンも用いて関連度をより精度良く算出する新手法を考案,開発した.
|