研究課題/領域番号 |
15200010
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
メディア情報学・データベース
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
植村 俊亮 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00203480)
|
研究分担者 |
宮崎 純 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (40293394)
中島 伸介 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (90399535)
天笠 俊之 筑波大学, 計算科学研究センター, 講師 (70314531)
波多野 賢治 同志社大学, 文化情報学部, 講師 (80314532)
前田 亮 立命館大学, 情報理工学部, 助教授 (20351322)
鈴木 優 立命館大学, 情報理工学部, 助手 (40388111)
|
研究期間 (年度) |
2003 – 2006
|
研究課題ステータス |
完了 (2006年度)
|
配分額 *注記 |
23,660千円 (直接経費: 18,200千円、間接経費: 5,460千円)
2006年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2005年度: 3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2004年度: 9,490千円 (直接経費: 7,300千円、間接経費: 2,190千円)
2003年度: 9,620千円 (直接経費: 7,400千円、間接経費: 2,220千円)
|
キーワード | 多言語情報処理 / Webディレクトリ / セマンティックウェブ / 情報検索 / 言語資源 / 情報推薦 / タグ / 多言語処理 / 言語横断検索 / データベース / ディレクトリ / 言語横断情報検索 / セマンティックWeb / オントロジー / RDF / XML / セマンテイックWeb / 言語横断情報検索システム / インデクス / 接尾辞配列 |
研究概要 |
本研究課題では、1.Webディレクトリを利用した言語資源の構築と利用、2.セマンティックWebデータの格納方式と検索方法、3.高精度情報推薦のためのスコアリングと判別手法、4.リンク構造を有する構造化文書の解析方法の副研究課題を通して、セマンティックウェブのための多言語情報処理に関して研究を行った。 まず、1.に関して、Webディレクトリを利用してある言語のオントロジーを別の言語に翻訳することにより、二つの言語を対象としたオントロジーを構築する手法を提案した。また、Webディレクトリを言語資源として用いることを提案し、これを利用した言語横断情報検索システムの構築を行った。これらのシステムの実証実験を行い、Webディレクトリを言語資源として利用することが多言語アクセスシステムに有効であることを示した。 2.に関して、二項間の関係を表現する分を基本単位とするRDFを、関係データベースを利用して格納し、検索するためのアーキテクチャの提案を行った。RDFはコンテンツの意味を表現する簡潔な枠組であり、セマンティックウェブを実現するための必須要素である。具体的にはRDFデータを部分グラフに分割し、スキーマを含むグラフには、継承関係が分かるようインタバルナンバリングを利用し、インスタンスを含むグラフには経路問合せに対応するため、経路に基づく格納方式を利用した。これにより、経路式の長さに非依存な問合せ性能を得ることを可能とした。 3.に関しては、言語間に依存しないコンテキストに応じて、情報を推薦するための枠組を提案した。具体的には、コンテキストを多次元空間で表現し、Support Vector Machineを利用してコンテキストに応じた情報を判別することで対応した。これにより、従来の方式よりも高い精度でコンテキストに応じた情報推薦を実現した。 4.に関しては、Web情報を中心に、Webページやブログのリンク関係の解析により、構造化文書の高次情報の抽出する方法を提案した。Webページに関しては、高精度情報検索のために必要な部分Webグラフの範囲に関して詳細な解析を行った。また、ブログではアジテータと呼ばれるオピニオンリーダをブログ中から発見するためのグラフ解析ならびに情報空間モデルの提案を行った。これにより、構造化文書から言語に依存しない高次情報が抽出可能であることを示した。
|