• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2003 年度 実績報告書

位置や時刻を表す語句の時空間関連に基づくテキスト検索システムの開発

研究課題

研究課題/領域番号 14780331
研究機関広島市立大学

研究代表者

黒木 進  広島市立大学, 情報科学部, 助教授 (20225288)

キーワード位置情報 / 時刻情報 / 文書検索 / あいまい検索 / 時空間検索
研究概要

本年度は、文書検索システムの開発を中心に、以下の項目について研究を行った。
1.テキストの自動収集と形態素解析に基づく位置情報と時刻情報の自動切り出し
インターネット上のウェブサイトからHTML文書を自動的に収集するプログラムを作成した。収集した文書に含まれるテキストを形態素解析し、地名候補と時刻候補を切り出すプログラムを作成した。
2.位置と時刻を表す語句とその数値化
上記1で作成した地名・時刻候補抽出プログラムによって抽出された地名候補と時刻候補を地名辞書、時刻辞書とつき合わせて、それぞれを緯度、経度、日時に変換するプログラムを作成した。緯度、経度、日時をHTML文書に関するメタデータとして記憶できるようにした。
3.数値化された位置と時刻に関するインデクシング
数値化された位置と時刻を座標と考えて、時空間ハッシュ表を用いてインデクシングを行った。これにより、ハッシュ表のセル番号の計算と、セルに記憶された文書の検索の2回の操作により、時空間的な意味での点位置質問に答えることができる。
4.数値化された位置と時刻に関する近傍検索
問い合わせとして与えられた位置や時刻に関する近傍検索を行うプログラムを実装した。近傍検索を行うためには、問い合わせとして与えられた時刻や位置の含まれるセルを探し、その近傍のセルを順次探索すればよい。そのため、近傍のセルごとに並列処理を行うことができれば検索効率が向上する。そのような並列検索プログラムを作成した。
5.検索結果のランキングと時空間的な関係を反映した表示
地理的な近さと時間的な近さを基にして、文書のランキングを行った。また、地図やカレンダーを用いた整理と表示も行った。

  • 研究成果

    (2件)

すべて その他

すべて 文献書誌 (2件)

  • [文献書誌] 寺西由利香: "時刻や位置の近さに基づいた文書検索"第14回データ工学ワークショップオンライン論文集. 7 (2003)

  • [文献書誌] 塔野薫隆: "Modified PrefixSpan法を用いた頻出正規パターンの抽出を目指して"第15回データ工学ワークショップオンライン論文集. (発表予定). 6 (2004)

URL: 

公開日: 2005-04-18   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi