2003 Fiscal Year Annual Research Report
Project/Area Number |
15200010
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
植村 俊亮 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00203480)
|
Co-Investigator(Kenkyū-buntansha) |
波多野 賢治 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80314532)
天笠 俊之 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (70314531)
宮崎 純 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (40293394)
前田 亮 立命館大学, 理工学部, 助教授 (20351322)
|
Keywords | セマンテイックWeb / 言語横断情報検索システム / オントロジー / RDF / インデクス / 接尾辞配列 / XML |
Research Abstract |
本年度の研究目標は、複数言語オントロジーの自動生成、セマンティックWeb情報への索引付け、ならびにそれらを利用した多言語を対象とする言語横断情報検索システム実現のための基礎的研究である。 多言語を対象とする言語横断情報検索のための言語資源をWebから自動的に獲得するために、Yahooに代表される複数の言語版のあるWebディレクトリを利用し、その各カテゴリに登録されているWebページ中から対訳関係にある単語を自動的に抽出する方式を提案した。これにより、異なる意味を持つ単語に対して検索語の訳語曖昧性を解消でき、言語横断情報検索システムにおける検索精度が高まることを明らかにした。また、この技術を応用して、日英の2言語オントロジーを自動的に生成する方式を提案した。これにより、他の言語で書かれたWebディレクトリを利用することで、多言語オントロジーの自動生成の可能性が示された。 一方、セマンティックWeb情報への索引付けでは、RDFと呼ばれるXML形式で記述されるセマンティックWebの1つのレイヤーに着目して、RDF内の情報を高速に検索するためのインデキシング方式を提案した。RDFは、主語、述語、目的語からかる3つ組で記述され、これらが全体として有向グラフ構造を構成する。この有向グラフを複数の文字列として捉え、接尾辞配列を利用することにより、任意の主語と述語の関係を高速に検索するための索引を提案した。この索引により、従来提案されていた方式よりも非常に高速に検索可能であることが明らかとなった。さらに、XML形式で記述されるRDFデータの更新に対処するため、relative region coordinateと呼ぶデータの相対位置情報を利用したXML木の効率的な維持管理方法を提案し、その有効性を示した。
|
Research Products
(6 results)
-
[Publications] 杉山 一成, 波多野 賢治, 吉川 正俊, 植村 俊亮: "ハイパーリンクで結ばれた隣接ページの内容に基づくWebページのためのTF-IDF法の改良"電子情報通信学会論文誌. 87-D-I・2. 113-125 (2003)
-
[Publications] Dao Dinh Kha, Masatoshi Yoshikawa, Shunsuke Uemura: "XML Content Update using Relative Region Coordinate"IEICE Transactions on Information and Systems. E87-D・3. 771-779 (2004)
-
[Publications] 的野 晃整, 天笠 俊之, 吉川 正俊, 植村 俊亮: "接尾辞配列に基づいたRDFデータのための索引手法"情報処理学会論文誌:データベース. 45.TOD21(印刷中). (2004)
-
[Publications] Akiyoshi Matono, Toshiyuki Amagasa, Masatoshi Yoshikawa, Shunsuke Uemura: "An Indexing Scheme for RDF and RDF Schema based on Suffix Arrays"Proc.of First International Workshop on Semantic Web and Databases(SWDB). 151-168 (2003)
-
[Publications] Fatiha Sadat, Masatoshi Yoshikawa, Shunsuke Uemura: "Enhancing Cross-language Information Retrieval by an Automatic Acquisition of Bilingual Terminology from Comparable Corpora"Proc.of 26th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2003). 397-398 (2003)
-
[Publications] 木村 文則, 前田 亮, 越田 高志, 宮崎 純, 植村 俊亮: "Webディレクトリを用いた2言語オントロジーの構築"第24回デイジタル図書館ワークショップ論文集. 3-10 (2003)