2008 Fiscal Year Annual Research Report
Project Area | Cyber Infrastructure for the Information-explosion Era |
Project/Area Number |
18049069
|
Research Institution | National Institute of Informatics |
Principal Investigator |
安達 淳 National Institute of Informatics, コンテンツ科学研究系, 教授 (80143551)
|
Co-Investigator(Kenkyū-buntansha) |
大山 敬三 国立情報学研究所, コンテンツ科学研究系, 教授 (90177022)
|
Keywords | 情報検索 / 情報リンケージ / 大規模コーパス / テキスト処理 / 機械学習 |
Research Abstract |
本研究は、インターネット上で公開される各種テキストや個人・組織が管理する文書を対象として、関連する情報を結び付ける「情報リンケージ」プラットフォームの実現を目的とする。平成20年度は、情報リンケージプラットフォームの要素技術となる下記の研究に取り組んだ。 1. リンケージプラットフォームの研究 大規模データに対し、効率よくリンケージを行うための分散処理技術の研究を行った。本研究では、特に大規模な分散システムをリンケージに用いるため、自律性の高い分散処理法としてP2Pシステムを採用し、負荷分散や効率的なデータアクセスを可能するため、Huffman符号化法を利用したデータの配置法を提案した。 2. 半構造データリンケージのための木のマッチング研究 本年度は、2つの木の最大共通部分木を計算する問題に対して、既存の結果を改良する近似アルゴリズムを開発した。提案したアルゴリズムの性能は、木の高さhに依存するが、文字列に比較的浅い階層を持たせたようなデータに対しては高い性能が保証されている。 3. データベースを用いたリンケージシステムの研究開発 昨年度に引き続き大規模学術情報を対象としたアカデミックリンケージシステムの研究を進めた。本年度は、大規模な書誌データベースのリンケージをオンラインで行うための要素技術およびシステムのチューンアップを行った。
|
Research Products
(12 results)
-
-
-
-
-
-
-
-
-
[Presentation] Interaction and user Experiences with multimedia Techn ologies-Challenges and Future topics2008
Author(s)
Ansgar Scherp, Frank Nack,Klara Nahrstedt, Masashi Inoue, Andreas Girgensohn, Andreas Henrich, Philipp Sandhaus, Sabine Thieme, Michelle Zhou
Organizer
3rd International Workshop on Human-Centered Computing(HCC'08)
Place of Presentation
Vancouver, British Columbia, Canada
Year and Date
2008-10-31
-
-
-