2004 Fiscal Year Annual Research Report
Project/Area Number |
15200010
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
植村 俊亮 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00203480)
|
Co-Investigator(Kenkyū-buntansha) |
宮崎 純 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (40293394)
天笠 俊之 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (70314531)
波多野 賢治 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80314532)
前田 亮 立命館大学, 情報理工学部, 助教授 (20351322)
鈴木 優 立命館大学, 情報理工学部, 講師 (40388111)
|
Keywords | 言語横断情報検索 / 多言語処理 / セマンティックWeb / オントロジー / RDF / XML / Webディレクトリ |
Research Abstract |
本研究の目的は、セマンティックWebがもたらす情報を活用し、多言語処理、特に言語横断情報検索(Cross-Language Information Retrieval)システムの実現方式を確立することである。 最近では英語以外の言語によるWWWページ数が全体の半数を超えている。我々の目標は、この多彩な情報資源に対して、ある特定の言語、例えば日本語で質問をし、様々な言語からなるホームページをまとめて(言語横断的に)検索可能とすることである。とくに本研究では、セマンティックWebを活用し、言語横断に必要な対訳辞書、コーパスなどの言語資源をこれまでよりもはるかに容易に自動作成可能として、真の言語横断情報検索システムの実現を目指す。 本年度は、言語横断情報検索のための言語資源をWebから自動的に獲得するために、Yahooに代表される複数の言語版のあるWebディレクトリを利用し、その各カテゴリに登録されているWebページ中から対訳関係にある単語を自動的に抽出する方式を検討した。具体的には、複数の言語版のWebディレクトリの精密な対応付けを行い、言語横断情報検索の精度の改善を行う方式を提案し、実験した。このWebディレクトリの対応関係を利用し、対応関係にある文章群から統計的手法を用いて、言語間の概念関係のオントロジをより正確に自動生成する手法を明らかにし、日英の二言語に適用した。 また、Webディレクトリのカテゴリを部分文書とみなして、部分文書間の関係から精度の良い情報検索を行う手法を応用して、まず、日英の二言語に関して階層型オントロジを自動的に生成する手法を検討した。こうした成果により得られた多言語オントロジを、RDFのようなセマンティックWebの規格に適合させ、これらのデータを関係データベースに効率よく格納し、さらにそこから効率よく検索可能とする方式について検討し評価した。
|
Research Products
(6 results)